- 译本 >
- 科学的隐忧-汪婕舒译 >
- 第4章 不发表就死路一条
科学家们读些什么科学?
大多数科学家阅读的内容主要是技术文章,它们的长度大约在3到20页。它们在发表在学术期刊上之前,都经过了一个批判性的评议过程。全球一共有超过2.5万份同行评议期刊,每年总共发表超过100万篇论文。每位科学家只会阅读其中很小的一部分(可能只占万分之一左右)。你可能会觉得买早餐谷物麦片是一件苦差事,那么,请想象一下,超市货架把整个城镇都包围起来,而你需要从中选择一盒你想要的口味。更要命的是,这个数字每15年翻一番(每年增长5%)。与此同时,科技专利每年以相似的速度增长。面对这种情况,科学家究竟如何抉择呢?
对动物来说,决定如何对信息做出反应是一件极具挑战的事:出现在视野中的东西可能是可食用的,可能是致命的,也可能是潜在的交配对象。为了应对这种自然选择压力,我们巨大的前脑进化出了快速做出正确决定的能力。一个正在发育的年轻大脑能够训练它的神经元侦测出视觉图像中的闪烁,比如垂直的线条,或者步步逼近的黑影。这个专心致志的“工具箱”位于大脑皮层,它帮助我们在信息丰富的世界中做出快速决策。同样,科学家也面对着一个充满丰富细节的世界。不幸的是,科学家并没有进化出什么有用的工具来帮助他们做出选择。因此,科学生态系统中出现了一些别的东西来帮助科学家做决策。
在第2章中,我曾提到,德里克·德索拉·普赖斯在20世纪60年代进行了一个经典的研究。他发现,科研成果“从17世纪开始,每半个世纪增长10倍,在300年中增长了100万倍,这使得今天的发明创造与当初(17世纪)完全不同”。显然,正如马尔萨斯在几个世纪之前所警告的,这个过程在某个时刻必然会达到饱和。一些人认为,今天的科学家们之所以发表越来越多的论文,是因为他们像切香肠一样把他们的科研成果“切”成若干个不那么重要的小部分,然后逐一发表。还有人认为,科学家的整体效率越来越低,因为在今天,产出等量的成果需要花费比过去更多的时间和精力。不过,期刊和论文的整体涨势与全球科学家数量的增长趋势相比,并不夸张。
总体来看,全球总共有接近400万名学术型科学家(如图2-5所示),他们每年发表100万篇经过同行评议的论文。这个数据向你展示了科学界的生产力水平——平均来看,每位科学家每年创造的新知识相当于0.3篇论文(需要说明,这并不是人类知识增长的唯一方式)。一般而言,每篇论文拥有4名作者,不过每个领域不一样:粒子物理学领域有时能多达几百人,而数学领域的论文通常只有一个作者。在此基础之上,科学论文的产出是否达到饱和将取决于全球科学家最终达到的稳定数量。如果所有国家的科学家比例达到人口总数的0.4%,那么每年预计将发表600万篇论文。与今天相比,这几乎增加了一个数量级。如果按照当下科学家数量每年增长3.5%的速度来计算,这一目标将在50年后实现,差不多是两代科学家的时间。因此,我们依然有时间来适应。面对如此庞大的论文数量,大多数科学家可能会瑟瑟发抖,因为和我们所有人一样,他们感觉自己仿佛在信息的汪洋大海中游泳,稍不注意就会溺水身亡。
如何决定读什么?
面对如此巨大的数字,注意力分散是不可避免的。研究某个问题的科学家必须随时关注科研进展,同时,收集人们过去与该问题有关的科研成果,形成一套框架。有时他们会想用新方法来解决某个问题,但最后却发现,他们需要查阅各个不同子领域的研究成果,以考察他们如何使用这些工具。他们可能需要看看其他研究者最近都在用什么方法。有时,他们也需要查阅较早时期的人们对该领域的评价。
通常,研究者用他们想要解决的问题来决定他们要阅读什么内容,并用电子化的工具来搜寻过去发表的论文。在这个过程中,谷歌成了一个引人瞩目的资源。还有一些专门的科学文献工具也出现了,比如科学网。在这些网站上对某个问题搜索一番,网站就能“吐出”成千上万篇相关论文。想要在这个浩瀚的知识库中游刃有余地穿行,科学家们的搜索策略必须恰到好处,不能太宽泛,也不能太狭窄。即便能做到如此,他们搜出的相关论文的数量依然十分庞大,等着进一步处理。
想要整理这种庞大的搜索结果,一个方法是找出其他认为它们也很重要的人。在每篇论文的结尾,科学家们会明确地列出(也叫“引用”)其他人过去发表的论文。结果,这些论文之间的引用关系形成了一个网络,将各个研究联系在一起,可供直接分析。在电子系统中搜索出来的论文会自动根据后续被其他论文引用的次数进行排序。正如系谱树可以显示出进化如何随时间变化一样,在引用网络中也可以看到类似的分支过程——有些论文衍生出很多分支,也有一些论文则静静蛰伏,没什么动静。
科学家为什么阅读同行评议的期刊?
单个读者根本无法检阅这个错综复杂的信息巨网。人们想要轻车熟路地在其中“航行”,就必须高度信任这些信息的正确性,必须相信它们是尽善尽美的,也必须相信其中没有海市蜃楼或干涸的河流。这种信任是如何建立起来的呢?想要理解这一点,我们就必须回到科学论文的初生时刻。让我们来看看在17世纪,监管科学的英国皇家学会崛起之时,“同行评议”的概念如何被发明,如何向人们提供关于科学证据的标准(如图4-1所示)。尽管时过境迁,该系统发生了些许变化,但大体上还是保持一致。它夯实了科学生态系统的基石。
首先,科学家确定他们想发表的期刊,将自己的研究付诸纸笔,用适合该期刊的格式写成论文,向期刊编辑投稿。接着,这些论文会被分发给若干名与其论文作者没有联系,但在该领域具备专业技能的科学家审阅。这些“评议员”会将自己对论文的意见和评论发给编辑。编辑会隐去他们的姓名。根据这些评议员对论文的同意程度,编辑会联系论文作者,告知好消息或者坏消息,也就是“接受”或者“拒绝”。编辑们在向作者发送评议意见时,从不会泄露评议员的信息,因此这个过程被称为“匿名同行评议”。
有时候,评议员对论文的批评十分清楚,直截了当地拒绝发表。作者们仔细衡量评论(通常在一番哀叹)后,决定他们是做更多研究来反驳同行评议的批评,还是将原始论文直接投给另一本读者群不同的期刊。有时候,尽管评议员的批评十分尖刻,但编辑决定给作者一个修改和重新投稿的机会——评议员会再次审阅,看看他们之前提出的问题是否已经被解决了。尽管同行评议通常会惹恼和激怒提交论文的科学家,但毫无疑问,评议员的意见通常都具有建设性,能够帮助他们改进论文质量。他们是来自外部的声音,关心的是证据是否确凿,结论是否有理有据,是否有其他方法来解读同样的数据或理论。
图4-1 图4-1(a)、图4-1(b)显示了英国皇家学会讨论过程的变化。图4-1(a)描绘了艾萨克·牛顿坐在弗利特街鹤苑的椅子上(木版画,作者为J.夸特利,藏于伦敦维尔康姆图书馆档案馆)。图4-1(b)为现代向公众开放的夏季科学展览
尽管这个过程有时令人沮丧,但其结果通常既可信又可靠。由于评议者与论文作者并不相识,因此,他们的争议往往以事实为基础(而较少受到情绪的干扰)。这个可靠的讨论空间让评议员们能在权势(或其他科学家)面前畅所欲言、实话实说,而编辑则扮演中间人或裁判员的角色。
这个系统迄今已经运行了几个世纪,到目前依然表现良好。人们不断对同行评议存在的一些问题提出质疑,但除了一些小修小补之外,还没人能设计出更好的系统。一个常见的建议是降低匿名性赋予评议员的权力,因为评议员有时会因利益冲突而拖延论文的评议,或者拒绝一些好论文,只因它们可能推翻他们自己的观点或者破坏他们的名望。解决这个问题有一个方法,那就是在发表论文时,附上评议员的姓名,因为他们对论文的改进助有一臂之力,并扮演保证人的角色。与此同时,表现欠佳的评议员可以被科学界和编辑们留意到,并施以必要的措施。不过也有人担心,这种方式会怂恿评议员不分青红皂白地接受论文(以获得曝光度),从而减少对论文的严厉批评。还有人提出了一种稍有不同的评议机制,就是向评议员隐去论文作者,这样就变成双向的匿名。这种机制可以减少知名科学家的“名气效应”,而更关注科学研究本身。然而,这个机制实际操作起来很难。有时候,光从论文本身就能推断出作者是谁,因为许多作者在某个领域已经浸淫多年,他们的研究已经形成了一个系列,一目了然;与此同时,他们的科研风格甚至写作风格已为人所知,十分明显。又或者,他们的研究设备或方法十分独特,全世界只有他们一个团队在用,那么,作者是谁也就不言而喻了。因此,这种机制并非放诸四海而皆准。
我们真的需要科学期刊吗?
还有人提出了一个问题:我们真的需要科学期刊吗?科学家们完全可以只将他们的研究成果发布在数据库或者博客上,并授权给一些人来评论,这样为什么不可以呢?实际上,目前确实有一些开放的“档案库”,供科学家们发布最新论文(比如“arXiv”和“bioRxiv”)。在一些领域,这甚至已成为学术界获取最新成果的主要方式。然而,这种方式有一个问题,那就是它无法保证发表在档案库中的论文能否经得起评议员的严格审阅。因此,如果其他科学家想要使用这些论文,就必须仔细阅读,谨慎对待。但这是不可能的任务,尤其是因为新论文的数量巨大无比,每个人根本就是在自己评议所有这些新论文,判断它们的优点与弱点。每个人的观点都可能与期刊评议员相左。这种方式相当于每个人都在重复同行评议员的工作,极大地降低了系统处理信息的效率。
目前,有一个系统尚不存在,那就是科学家发表论文评论的系统。如果有这样一个系统存在,那么,我们将不仅阅读论文本身,还能阅读不同科学家发表的挑剔评论。这些评论可以帮助我们判断该论文的优缺点。随着时间的推移,论文将得到一个关于其正确性的打分,或者得到大家公认的改进意见。这种系统在实践上是可操作的,近年来已经有人进行了一些试验。但这种方式有一个常见的问题,那就是如何对不同的评论进行优劣排序,将那些见解深刻的意见从过于细枝末节、不屑一顾、疏庸愚钝的评论中过滤出来。这个任务的要求极高,不知谁能胜任。在这样的系统中,评论不可能匿名,因为每条评论都需要与个人信誉挂钩,还因为我们需要驾驭那些受人信赖的“高级人物”的言论。不过,缺乏匿名性也意味着评论中会掺杂着许多个人观点,挤压科学讨论的空间。这个现象在具有争议性的博客和网络新闻文章中非常明显,在互联网上几乎找不到任何一个讨论可以完全保持知识性和理智性(任意找一篇新闻文章,看看下面的评论就知道了)。如果你竟然找到一篇发表多年却没有任何人评论的论文,这可能意味着什么呢?它是错误的,或者十分枯燥乏味,或者其作者是处尊居显、手握权势的人物,没人敢对其发表不同意见。在现行的系统中,如果真存在这样的论文,至少它经过了同行评议。并且,正如我们将看到的那样,论文的重要性从它的发表之处也可见一斑。将论文发布在一个不分青红皂白、全盘接收的论文库中,的确能推动科学的“民主化”,赋予读者评判的权利,但这也使人们很难判断其重要性。因此,论文作者通常愿意在论文被公之于众之前经过同行评议的阶段,因为这可以帮助他们找出一些愚蠢的错误或者严重的问题,从而保护自己的科学名誉。
啄序等级有何用?
科学的海洋如此之大,很容易令人迷失其中。因此,对我(以及我的经费提供者)来说,如果能花钱请人来帮我们对科研项目的优先级进行排序,那就再好不过了。这样,当新发表的科学论文如雪崩一般袭来时,我就能轻而易举地挑出那些值得一读的文章,而忽略其他。一篇论文与我的领域越接近,我就越愿意仔细阅读;如果它与我的领域相去甚远,我希望能有一个值得信赖的人来帮我阅读,并为我提炼其中的主要观点。这正是学术期刊出现啄序等级的原因之一,它极大地帮助了人们决定读些什么内容。我们大可以依赖别人发布的评论来决定文章的“重要性”,但是,这种方法通常被变化无常的个人观点左右。实践证明,同行评议系统能公平地对待所有新研究,但同时,它也允许人们对论文的重要性进行讨论,评估它们可能产生的影响。
由此,在学术期刊的世界中,各学术期刊按其重要性得到了清晰的排序。每位科学家都希望自己的论文发表在重要的期刊上,越重要越好。虽说论文的发表之处并不影响人们对它们的获取,但是,期刊的排名越高,论文被人们阅读的可能性就越大,它可能产生的影响力也就越大,作者获得的尊敬也越多。如果两位论文发表数量相同的科学家在竞争同一个岗位,其中一位科学家的论文主要发表在高排名期刊上,那么,这在招聘时一定会被考虑在内。
当然,这个例子可能有些“歪曲事实”,但是,如果这两位科学家来自同一个领域,那这个例子完全符合逻辑。不过,这个选择也会受到其他因素的影响。其中一个因素是他们的性格。如果一位科学家的个性过于谦虚,那么,即便他做出了杰出的成就,也可能不会选择投稿,更不会夸大其词。另一个可能的因素是他们的精力,因为想要让论文在排名更靠前的期刊上发表需要花费很多时间,这会挤压他们做科研的时间。还有一些其他因素,比如运气(不过运气的影响在较长时间里总体上是平均分布的,因此,年轻科学家的运气可能不那么好,因为他们涉水尚浅)、雄心抱负(如果一位科学家有鸿鹄之志,选择投身于“疑难杂症”,那么,他做出的贡献虽然有用,但却微乎其微,因而很难发表在排名靠前的期刊上)、他们上司选择的方向(科学家可能因上级的指示而选择研究一些不那么热门的问题,从而只能发表在排名靠后的期刊上)、他们的写作能力(排名靠前的期刊对英语和表达水平要求很高)以及人格魅力(当论文面临竞争时,如果你的论文仅对疏离的科学事实进行生硬的科学记录,那很可能竞争不过其他人热情洋溢、妙笔生花的论文)。上述所有因素或许都能影响在两位科学家中二选一的决策,因此,这种期刊排名依然具有一定的意义。
维持排名就需要对有限的资源进行竞争。对期刊来说,“有限的资源”指的是每个星期(或者每期)接受的论文数量是有限的。可笑的是,这个限制目前是人为规定的,因为期刊印刷数量的影响因素(比如纸张克重、书脊装订以及传播媒介的物理形态)变得越来越无关紧要。人为强加的论文数量限制有两个作用。第一是为了读者的方便,因为它代表了期刊的价值和标准。比如说,在众多投稿中只选择少数“最好”的论文。第二是为了期刊的声誉,因为越难发表的期刊在人们心中的排名越靠前。
很明显,这些方面都是自我强化的。一本拥有极高声誉的期刊会极其严格地限制其发表论文的数量,这加剧了论文之间的竞争,进一步提升了期刊的声誉,增强了作者们将论文发表其上的欲望。可以预料的是,这些期刊接收的投稿数量的增长速度会远大于科学界整体的成果产出增长速度。这给期刊编辑提出了一个严峻的问题——是选择接收越来越多的高质量论文,还是选择保持原有的论文数量?如果一本期刊拒绝了太多质量上乘的论文,那么,其竞争对手就有机会接收并发表这些论文,从而提升自己的声誉或目标市场。显然,期刊之间的竞争与自然物种之间的竞争、商业品牌之间的竞争并没有什么两样,同样也拥有等级分层、利基市场、客户群和品牌建设。期刊通过品牌建设来设置“路标”。这一过程帮助科学家们决定他们要读什么内容。
深谙“高影响力”之道的期刊能够孵化出更多的期刊:从《自然》(Nature)中,诞生了《自然·物理学》(Nature Physics)、《自然·材料学》(Nature Materials)、《自然·纳米技术》(Nature Nanotechnology)等一大批期刊(如图4-2所示);从《先进材料》(Advanced Materials)中诞生了《先进功能材料》(Advanced Functional Materials)等期刊;从PLOS ONE中诞生了《PLOS生物学》,等等。这些期刊已经拥有稳定的收益流、编辑团队、读者群体和出版社,这些因素组合在一起,使得它们比新成立的团队更容易孵化出新期刊。同哺乳动物的家庭一样,这些期刊的“家庭成员”之间也自然存在着“母女竞争”的关系,互相竞争着资源与注意力。
期刊的多样化
将科学论文发表在不同期刊上还有一个作用,那就是帮助读者找到他们感兴趣的领域。在纸质期刊的时代,每当拿到一本期刊,我通常会迅速浏览一遍看起来有趣的文章,然后聚焦在少数几篇可能对我个人的科研项目具有重要推动作用的论文。想要提高效率,文章最好是按照主题分类。这种做法保持到了电子时代,因为如果一本期刊拥有品牌,那么,我们就能预期在这本期刊上会读到些什么内容。
图4-2 激增的知识。图4-2(a)是都柏林圣三一学院图书馆的照片,图4-2(b)是成立于1869年的《自然》杂志所孵化出来的新期刊
现在,各学科的子领域也拥有自己的期刊。一般而言,由于关注同一领域的作者拥有共同的语言与愿景,他们能迅速向彼此陈述清楚各自研究的细节。子领域的期刊也可能出现啄序排名。排名最靠前的期刊具有最高的竞争力和排他性。此外,每个更广的学科都拥有一本覆盖面更广,甚至排名更靠前的期刊,以便发表涉及多个子领域或者可能不止一个领域的科学家感兴趣的论文。隶属于某学科的不同期刊涉及的内容可能很广,但依然有其焦点或主题,比如解决某个涉及较广的问题,而不是其贡献的子领域。
在此之上,还存在一些旨在影响和跨越多个学科的期刊,其中诞生了少量出类拔萃的顶级期刊。它们鹤立鸡群,伫立于科学山峰的顶端,傲视群雄。在这样的期刊上发表论文成了每位科学家的梦想。我们稍后将会看到,这些期刊上发表的科学成果可以广为传播、家喻户晓。但同样,这种根据期刊来分类论文的方法,可以帮助科学家决定读些什么,以及如何评估论文提出的结论。如此而言,期刊的排名便是合情合理的。那么,排名是如何形成的呢?