- 译本 >
- 科学的隐忧-汪婕舒译 >
- 第4章 不发表就死路一条
哪个学科更重要?
如果我是一名分子生物学家,我的突破性论文发表在《自然》杂志的可能性几乎是一名物理学家的5倍。实际上,在《自然》杂志上发表的最常见的领域都是生物学。其顺序是生物化学或分子生物学(占42%)、遗传学、细胞生物学和动物学。而工程学只占突破性论文的7%。为什么会这样呢?
有人可能会认为,其原因是《自然》的编辑团队对领域有偏见。但实际上,这个现象在科学界并不罕见,《科学》杂志过去5年的数据几乎如出一辙。最合理的解释是,一篇论文想要让领域外的人认为具有高影响力和很有趣,它必须要推翻一些公认的知识,也就是要“惊人”。事后说起来,真正“惊人”的科学成果是十分少见的,因为一个新思想既需要契合过去被广为接受的事实,又需要与新的观测数据相符,才能被“塞”进现有的知识网络中。生物学中依然存在一些容许新范式发生的回旋空间,因此,发表“惊人”的论文对生物学家来说略微容易一些。而工程学的知识网络已经非常缜密和牢固,如果出现令人惊讶的新事实,它们往往只能在局部起作用,连接和填补已有领域之间的空隙,因为只有在这些空隙中,知识之网才不那么稠密和顽固,依然容许变化的发生。
多年来,论文在各领域中的分布一直十分稳定。在过去20年里,在《自然》杂志每年发表的论文中,40%为生物学或分子生物学,40%为基因或遗传学,30%为细胞生物学(这几个领域有一些重叠),而物理学则只占到可怜的10%。不过,这个过程中也发生了一些变化。比如说,植物学和动物学研究论文在20世纪90年代末期都出现了急速增长,但最近都有所下降。这是因为在这段时间里,用植物模型和动物模型来进行基因组学和蛋白质组学的研究取得了许多突破(比如,采用与卷心菜和芥菜相近的开花植物拟南芥,而动物模型则主要是老鼠),继而达到了饱和。化学论文也出现了飞涨,翻了一番,最近增长到了8%,这是因为在化学领域出现了一些开辟药理学和纳米科学新路子的研究。还有一些新的焦点出现在环境与生态科学。这个领域的研究论文在世纪之交增长了两倍,达到10%,反映出人们想要对全球气候变化进行定量研究的浓厚兴趣。几家欢喜几家愁。除了这些赢家,也有一些输家,它们的比例在下降,比如生物物理学、免疫学、神经科学和天文学。这些领域在过去曾有过巨大的发展前景,但现在还没能实现对高影响力期刊的这一承诺。在出版记录中的这些层级结构中,清晰地刻画出追潮流和赶时髦留下的印记。
我们还可以追踪不同子领域的论文之间的引用关系,绘制出引用关系的“地图”,从中看出不同领域之间的交互关系(如图4-7所示)。图中可以看出一些关系,比如说,分子生物学和药物学之间的联系十分紧密,物理学和化学之间也存在较多互相引用,形成了另一座坚实的桥梁。用这些引用数据,我们还可以对不同领域绘制出更加精细的“地图”,从而对各领域进行更深入的研究,了解各领域之间的交流随时间的变化趋势。
图4-7 不同科学领域之间的引用关系图(经美国国家科学院授权使用)
论文署谁名?
在论文撰写过程中,第一作者通常由一名资深科学家担任,一般也是促成或领导该研究项目的那个人。但通常情况下,全情投入某科研项目中的并不仅限于第一作者一个人,而是有很多人。比方说,粒子物理学的论文最多可达3 000名作者,占整个领域不小的比例。还有一些领域中,某个小进展可能归功于少数几名作者的论文,但它的出现离不开整个领域的努力,竞争对手与合作者都立下了汗马功劳。那么,如何决定谁应该被纳入正式作者的名单,从而提升他们的h因子呢?这个问题为科学界带来了许多情感伤痛,在科学家之间撕开了许多罅隙,在他们的集体智慧中造成了不可挽回的裂痕。
关于哪些人得以被列入作者名单,公认的推荐做法是将所有贡献足够大,能让他们就该论文与其他科学家进行辩论的科学家都列进去。但问题是,有时候一篇论文涉及的领域过于广泛,不可能每个参与者都掌握论文所有部分所涉及的专业知识。还有一种做法是只列出最重要的贡献者,但这是一个灰色地带——最重要的思想可能来自与竞争对手的会谈讨论,也可能来自过去某篇论文的审稿人意见,或者来自几年前的某个同事,或者来自一年前已经完成学业、另谋高就的某个研究生,又或者来自有许多研究者参与的小组讨论,但只有一个人将其落实。
因此,与其白纸黑字地列出所有作者的名字,不如附上一份长长的名单,按贡献大小排序,名字的颜色逐渐变浅,字体逐渐变小。这种方法可能还不具备实操性,但已经有一些期刊要求科学家写明谁做了哪部分工作。对功劳进行详尽的划分对相关人士及其职业发展固然很重要,但对科学知识之网本身来说却百无一用。平等对待所有贡献者能极大地鼓励合作。其缺点是每篇论文的作者名单将变得越来越长,由发表论文带来的名誉越来越贬值,人们将越来越过度关注影响因子的地位。
多少论文有人读?
科学家希望有人阅读他们的论文。大多数论文在发表的头两年只会被引用一次。发表10年后,物理学的平均被引数量是10~15次,生物科学是20~30次。迄今为止被引次数最多的论文是奥利弗·劳里(Oliver Lowry)写的一篇关于科学方法的论文(截至2017年,该论文被引用329 857次)——关于方法的论文通常能得到更高的引用。这篇论文讲的是如何根据从黄到蓝的颜色变化来测量样本中的蛋白质含量。除这篇论文之外,劳里几乎默默无闻。与此同时,在某些领域中,几乎一半的论文从来没有人引用。
近年来,一些详细的研究显示,科学论文的命运似乎有一个临界点。大多数论文都处于这样一个情形:如果它们的影响因子略高一点点,它们吸引的注意力也会相应地提升一点点。但是,存在一个特别的数字,假如被引数高于这个数字,论文被引用的可能性会远高于上述随机效应(如图4-8所示)。每个领域的临界点有所不同(通常在20~30)。这个现象意味着反馈的存在:一篇学术论文未来的被引次数与它过去的被引次数成一定的比例,普赖斯称其为“累积优势”。神奇的是,统计学模型在缺乏任何细节的情况下找到了这些规律(这本身就是一个典型的化简式科学成果)。看起来,当一篇论文在某科研社群中的曝光度达到一定的程度,在需要引用涉及某个子领域或某项技术的内容时,人们会选择只是提及该子领域或该技术,而不再详述任何细节。无独有偶,科学的新闻报道也同样依赖于一系列“模因”,我们将在稍后的章节中看到这一点。这种“择优连接”有一个副作用,那就是,富者更富。也就是说,已经拥有较多引用的论文在未来通常能得到更多引用(即便它们是错误的)。
目前,由于期刊可以通过互联网来访问,因此,他们可以记录论文被访问的次数,从而催生了“阅读量因子”这个指标。尽管存在许多混淆视听的因素,比如说搜索引擎发出的访问,或者因标题接近而不小心带来的下载量,但阅读量和被引量之间似乎依然存在联系。据估计,阅读量通常比被引量多出50~1 000次,不过这个数字依领域不同而变化很大。
图4-8 将科学论文按照被引数量排序,可以看出,极少数拥有极高曝光度的论文(灰色区域)吸引了许多引用,数量远超预期。这个现象只出现在被引次数最多的20篇论文中
那么,那些从未被引用过的论文呢?我们能不能提前识别出它们,节省资源,以投入“更有用”的科学项目?这种做法可能会误入歧途。详细但晦涩的论文能帮助后来的研究者避免重蹈覆辙,节省时间和资源。但这样的论文可能并不会被引用,比方说,在某些情况下,它证明某个想法是行不通的,因此并不会被引用。因此,海量的零引用论文对科学世界整体来说也是一个巨大的资源,甚至可能比那些被引数量极多、很快成为该领域众所周知的基础知识的少数论文还有用。
成功的论文何以成功?
一篇论文的影响因子越高,被人阅读的可能性就会越大,但它们包含的深奥细节就会越少。这似乎与科学一贯强调的重要原则——“可重复性”相矛盾。“可重复性”是指,拥有该领域同样知识的科学家实施同样的研究,应该会得到同样的结果。省略一些小细节可能会让企图重复该实验的科学家沮丧不已。诚然,科学家很少会真正重复彼此的研究,因为这会花费过多的时间与经费,并且重复他人的研究并不能带来任何名誉。因此,他们往往会选择以他人的研究为基础,开展新的研究。一篇优秀的论文会给出足够的细节。
一篇论文如何呈现其科学性也十分重要。有时候,即便一篇论文拥有绝妙的思想,但却被埋葬在长篇累牍的技术行话和消极文字中,极少能遇到一位无私的审稿人决定帮助论文作者将故事讲得栩栩如生,更加有趣。在这个电子阅读的时代,科学家读论文就像我们普通人读文章一样,最多只是迅速浏览。审稿人和读者都是先扫视一下标题和初步总结,然后浏览图表——图表通常可以被看作讲述科学故事的“漫画”,一篇论文的图表讲述一个完整的科学故事。因此,一篇论文必须在许多层面上努力,才能有声有色地传达它的故事。
科学写作中最重要的一点是清楚。近年来,英语成了科学知识的通用载体,这是因为从20世纪50年代开始,英语国家的科研经费持续增加,与此同时,科学开始了全球化的进程。然而,英语越来越多地被用于表达情感和社会交互,并形成了一些言辞激烈的口语文化。这些现象无不加大了人们用英语来传达科学知识的难度。写作精良、被审稿人交口称赞的论文读起来并不像惊心动魄的小说那般吸引人,但它们言简意赅、平铺直叙,没有复杂的从句,也避免生动的比喻。有些文字,虽然我很喜欢读,但它们还达不到“科学英语”的最低标准,必须忍痛割爱。如果科学家能将科学的表述方式作为第二语言来学习,而不是将他们过去人生中累积起来的语言习惯一股脑地倾倒到论文中,那么,他们的表达会更加高效,言辞会更加流畅。
传播科学知识很难,但现在我们有了高质量的图片和视频,科学传播无疑从中受益匪浅。如果一个科研团队拥有能将科学知识熟练“翻译”成视觉形式的科学家,那将扩大他们的读者群——论文的影响力越大,图片的角色就越重要。期刊编辑也发现,漂亮精美的图片往往能吸引更广泛的读者群体,而这部分通常并不在科学合理性的考虑范围之内。有些领域(比如天文学)提供了大量漂亮的图片,而有些领域(比如遗传学)对图片的处理方式则完全不同。经费充足的大型科学团队也能在这方面获益。不过,虽然精美的图片能提高论文发表在高影响力期刊上的可能性,但这些“装饰”是促进还是阻碍科学之网的发展,目前尚不清楚。
竞争驱动知识的获取
本章介绍了科学家浸淫在“不发表就死路一条”的论文文化中所面临的挑战。激烈的竞争存在于期刊之间、编辑之间、构造者与化简者之间(对影响力的竞争)、大型团队与小型团队之间、学科之间、科学事实之间,也存在于所有科学家之间,而以最后这个竞争最为残酷和激烈。过去,对科学成果的评估较为微妙。而如今,科学界几乎已经实现了全球化,使得一些国际化的指标(比如h因子和期刊排名)成了评估科学产出的主要标准。这些“后顾性”指标关注的是论文过去的被引数目,其最为看重的是科学持续不断的前进步伐。
为了更为完整地描绘科学的生态系统,接下来我将探讨它所支持的一些“食物链”。我将科学生态系统区分为五个互相重叠的“科学圈”(与生物圈类似),每个科学圈都拥有各自的主要活动和角色(如图4-9所示)。这五个科学圈分别是人、知识、转化、经费和媒体。图4-9展示了本章的主要内容,新知识进入出版物的过程由不同角色之间的箭头表示,主要角色是学术研究人员以及由他们组成的研究团队,还有学术期刊。这个世界与外界基本上是隔绝的,它的驱动力来自内部的竞争。在这个生态系统的各个部分,论资排名的现象都十分普遍。
图4-9 科学生态系统的知识“科学圈”中各角色(研究人员与期刊)之间的动态交互关系。每个部分都存在竞争(如图例中所区分),箭头表示最主要的影响
近年来涌现的各种啄序排名对科学家来说很重要,因为他们可以根据这些排名来决定读什么论文,帮助他们在信息的海洋中找到方向。但由于科学家数量的增长,当这片海洋变得越来越庞大,想要在不同的学科之间维持联系变得越来越困难。这个现象令人担忧。由于这种等级结构确实有用,它也加剧了期刊之间为吸引最激动人心的研究而展开的竞争,以及科学家之间为影响更多读者而展开的角逐。在本章中,我向你展示了这是科学生态系统中不可避免的一个方面,在那些不幸深陷其中的人的肩上无情地施加了竞争压力,而不管他们真正想要的是什么。我们将在后面的章节讨论这个现象对科学成就、科研经费以及什么科研项目得以开展有什么影响。但本书的下一章则是讲述科学家如何彼此影响。为此,我们将目光从纸笔写就的文字上移开,侧耳倾听一下科学中有哪些声音振动鼓膜。