第六章 当专家错了
即使所有的专家都一致赞同,他们也可能会错。
——伯特兰·罗素(Bertrand Russell)
不接受专家
2002年,一位杰出的历史学家指出,“不接受爱尔兰人”的标语在19世纪的美国广为流传是谬见。伊利诺伊大学教授理查德·詹森(Richard Jensen)说,这个标语是杜撰的,“受害者的谬误”在爱尔兰移民当中代代相传,直到成了难以撼动的城市传说。10年来,大多数历史学家都接受了詹森在这个话题上的学术研究。反对詹森论点的人被视作忠于政府的爱尔兰裔美国人而不予理睬——有时候被詹森自己忽视掉。
2015年的一个故事看起来就是专家之死的真实写照,一个八年级的学生丽贝卡·弗里德(Rebecca Fried)声称詹森是错的,很重要的一点是因为她用谷歌做过研究。她礼敬有加,但坚定不移。“在我出生前他就已经从事了几十年的学术研究工作,我最不愿意做的事情就是对他和他的工作表现出任何不敬。”她之后这样说。这听起来又像是一个早熟的孩子告诉一位经验丰富的老师——一位退休的历史学教授——他的作业没做好。
可是结果呢,她是对的,他是错的。这种标语的确存在,而且不难找到。
数年来,其他学者就和詹森的观点角力过,但他们的交锋从未跳出专业史料的丛林。同时,在学术界之外,詹森的主张很快被接受,爱尔兰裔美国人臆想自己受到不公待遇,而这恰好被当作一个例子被大肆宣扬。[当然,新媒体集团沃克斯(Vox)喜欢詹森的版本。]
然而,年轻的丽贝卡做了一件理性的事:她开始搜寻旧报纸资料库。她找到了这个标语,就像《每日野兽》之后报道的那样,“收集了少量的例子,之后是几十个,然后越来越多。她尽可能多地搜寻报纸资料库。然后她就想,先前已有人发现了吧?”结果,显然詹森和其他任何人都没有费心做过这个基本的事实核查。
詹森随后进行了反击,试图反驳这个八年级学生的发现,他说自己是对的,但他之前或许应该表述得更准确一些。正如《史密森学会》(Smithsonian)后来所做,关于詹森论点的辩论“可能还会继续在很多网站的评论区火热进行”,但弗里德的努力证明“任何有着好奇心和灵敏嗅觉的人都可以挑战历史学现状”[1]。弗里德女士现在已经上高中了,她的论文刊登在《社会史杂志》(Journal of Social Hitory)上。
20世纪70年代,美国顶级营养学家告诉美国政府,鸡蛋和很多其他食物可能是致命的。把奥卡姆剃刀(Occam’s Razor)应用到这里再简单不过了,有一条线从谷仓场院串到太平间。鸡蛋含有大量胆固醇,胆固醇会阻塞动脉,动脉阻塞会引发心脏病,心脏病会导致死亡。结论很明显:美国人需要在饮食中杜绝一切胆固醇。
他们也这么做了,然后意料之外的事情发生了:美国人体重大幅增加,开始死于其他食物。结果证明,鸡蛋没有那么糟糕,或者说至少没有其他食物那么糟糕。2015年,政府决定鸡蛋是可以接受的,甚至可以说是健康的。政府专栏作家(生产鸡蛋的佛蒙特州居民)杰弗里·诺曼(Geoffrey Norman)那时候写道:
很多这样[肥胖]起来的人认为他们是在遵循政府认可的饮食结构。当政府把鸡蛋放到饮食黑名单上,鸡蛋的消费量下跌了30%以上。人们必须要吃东西,所以就会用其他食物替代鸡蛋,而这些食物却让他们变胖。结果证明,他们不吃的鸡蛋并不会阻塞动脉并致死。然而他们用来替代鸡蛋的食物很有可能是导致2型糖尿病甚至更糟糕疾病的元凶。[2]
鸡蛋恐慌是由一连串错误研究导致的,其中一些研究可以回溯到差不多半世纪前了。当然,想要避免食用鸡蛋的人或许还会这么做。事实上,现在有研究显示,完全不吃早餐——长期以来科学家都在警告大家不要这么做——也没有像大家想象的那么糟糕。[3]
1982年,一名研究苏联的顶级专家休厄林·比亚勒(Seweryn Bialer)向赫赫有名的《外交事务》(Foreign Affairs)发出严厉警告:苏联(USSR)比当时看起来的要强大多了。
无论是现在还是未来10年,苏联都不会遭受一场系统性危机的阵痛,因为苏联拥有强大的政治和社会稳定性,这份能量尚待使用,足以让苏联承受最深刻的困难。苏联的经济,就像任何一个由聪明老练的专业人才管理的大型经济体一样,不会破产。它也许会变得低效,也许会滞胀,也许会经历一两年的绝对衰退,但是,就像它的整体体系一样,经济体系也不会崩溃。[4]
一年后,比亚勒获得麦克阿瑟基金会(Macarthur Foundation)“天才奖”。两年后,苏联共产党——很明显面临着系统性危机的阵痛——选择了米哈伊尔·戈尔巴乔夫(Mikhail Gorbachev)作为新的领导人。比亚勒的厉声警告之后不到8年,苏联不复存在。
在苏联解体前的最后几个月当中,麻省理工的一个教授斯蒂芬·迈耶(Stephen Meyer)在美国参议院外交事务委员会的听证会上做证。关注苏联的美国政治领袖担心苏联数千枚对准美国的核武器会带来安全问题。迈耶,作为他那一代研究苏联军事的顶级专家之一,告诉每个人要冷静:戈尔巴乔夫还能掌控大局。苏联“军事政变的迹象”,他向出席听证会的参议员保证,不过是一些“胡思乱想”。[5]
迈耶在1991年6月6日做证,9周后,戈尔巴乔夫在一次政变中被罢黜,发动政变的包括苏联国防部长和让人闻风丧胆的安全机构克格勃(KGB)[6]的领导。当坦克进驻到莫斯科大街的时候,场面一片混乱。但是,无论如何,苏联解体一年后,迈耶完全离开了俄罗斯和核武器的研究领域,转而研究生物多样性问题,为马萨诸塞州的渔业和野生动物部门服务,直到他2006年突然离世。
比亚勒和迈耶这种情况不是少数。正如历史学家尼克·格沃斯德夫(Nick Gvosdev)在几年后的观察所得,关于苏联,很多苏联研究专家都没有“对实际情况进行批判性分析”,而是按照自己的意愿去相信。两名国际关系学者注意到,其他每个人也都搞错了。“用自己的标准来衡量,[学术]职业的表现真是令人尴尬,”理查德·内德·勒博(Richard Ned Lebow)教授和托马斯·里斯·卡彭(Thomas Risse Kappen)教授在1995年写道,“现有的国际关系理论都没有认识到后来实际发生的改变是有发生的可能性的。”[7]
专家一直都是会犯错的。这种错误的后果有种种,有轻微令人尴尬的,也有浪费时间金钱的,极少数情况下,也会致人死亡,甚至带来国际性灾难。然而专家通常都会请民众相信他们的判断,要相信这样的错误只是偶然,专家会识别出错误并从中吸取教训。
日复一日,普罗大众别无选择,只能相信专家。我们生活在一个由社会机构和政府机构编织的巨网之中,这些机构的目的就是要确保职业人士能够各司其职。大学、评审机构、执照注册机构、认证机构、州检查员和其他机构的存在就是为了维护标准。总体而言,这些防护措施运作良好。比如,当我们读到一个不称职的医生害死一个病人的故事,我们感到震惊,那是因为在一个近百万医生日日安全行医的国家,这类故事实属不寻常。
然而,对职业人士的日常信任是一种平淡无奇的必然之事。这就像我们会信任日常生活中的其他人一样,包括我们会假定巴士司机没有醉驾,或者餐馆员工洗了手。当涉及公共政策,这里面的信任就不是一回事了:我们相信自己的医生会开出正确的药方,这不代表我们相信所有医药领域的职业人士能决定美国是否应该有一个全国医保体系;我们相信一个大学教授能教给儿子或女儿“二战”历史知识,不代表我们因此就相信所有历史学家能给美国总统提供战争与和平事务的建议。
做这些更宏观的决策是不需要执照或证书的,如果出错了也不用交罚款或停职。事实上,这里面几乎没有直接的问责制,所以普通人会担心专家的影响力,也在情理之中。在一个民主国家,由选举出来的官员接受——或拒绝——专家意见,这样就有问责制的成分了,这个话题我们留待下一章也就是最后一章讨论。不过,问责在事发之后。让某个人负责可能在道德上是令人满意的,但追究责任并不能修复损伤或恢复和平。总的来说,专家是如何犯错的呢?记者萨琳娜·齐托(Selena Zito)说过:“目睹专家不懂自己专业领域的问题,真是让人‘叹为观止’。”对于普通人来说,那就不只是一点点不安了。当民众遭遇专家失灵了怎么办?他们怎样才能保持对专家们的信任?类似的,当专家犯了错误,需要承担什么样的责任?专家如何修复与顾客——社会——的关系?
专家失灵的多种面孔
专家失灵有好几种。最无辜也是最常见的一种就是我们认为的普通的科学失败。个人甚至整个行业因为失误或领域自身的局限把重要的问题搞错了。他们观察一个现象,或是考察一个问题,想出理论和解决方案,然后进行检验。有时候他们做对了,有时候他们弄错了。整个过程里通常会遇到很多死胡同和失败的实验。有时候错误没有被发现,甚至被其他专家进一步加深。
这就是一代美国人是如何避免食用鸡蛋而增肥的原因;这就是为什么美国第一次试射卫星以发射台的巨大爆炸而告终;这就是为什么外交政策的顶尖专家推测德国的和平统一在未来几十年都不太可能实现,却不得不在庆祝的烟火绽放在自由柏林的上空时重新审视自己的观点。
科学也是在实践中学习的。美国在1945年发明了核弹,但世界各地的科学家和研究员却花了10年时间进行爆炸测试才对电磁脉冲有了更好的理解。电磁脉冲是核爆炸引起的一种隐性影响,会破坏电子系统。而公众直到1962年才知道电磁脉冲的存在,美国在太平洋的一次测试导致数百公里外的夏威夷路灯灭掉,电话故障,科学家们已经猜想到会有这种效应,但影响范围还是超出了他们的预估。
绝大多数人,包括专家,对这种失灵都是无能为力的,因为这就是科学和学术不可或缺的一部分。普通人对模棱两可的东西感到不适,他们要的是答案,而非警告。但科学就是一个过程,而不是一个结论。科学主题本身就是要根据一套细致的规则不断进行测试,在这个过程中,现有的理论会被更优的理论替代。民众不能期待专家永远不犯错,如果专家能达到这般精准,他们一开始就无须搞研究和做实验了。如果政策专家能未卜先知或无所不知,那政府就不会陷入赤字,战争也只有在疯子的煽动下才会爆发。
有时候,专家的失误也会带来有益的结果,但这种失误受到的对待与那些劳民伤财的错误却相去甚远。比如说,当科学家发明口服避孕药的时候,其实他们本来是要搞清楚如何帮助女性避免意外怀孕的。他们并没有想着要降低卵巢癌的风险——但很明显某些控制生育的药物达到了这个目的,而且效果显著。对某些女性来说,口服避孕药是有风险的,但对另一群女性来说,同样的药物或许能延长生命。当然,如果生育控制药物只会增加癌症风险,我们就会扼腕叹息又一次科学的失败,但这种积极的副作用在半个世纪前无人知晓,类似的情况还有很多。
类似的,有专家预测20世纪50年代末会发生全面的国际核武器军备竞赛,他们错了。但他们之所以会错,至少有部分原因在于他们低估了自己努力限制核武器扩散的效力。约翰·F.肯尼迪总统担心到20世纪70年代世界上会有多达25个核武国家。(到了2017年,只有10个国家跨过这道门槛,其中有一个国家——南非——还曾经声明放弃这种武器。)[8]肯尼迪的预测是基于最佳专家团队的建议,也不是不可能或不合常理的,但是,在这同一批专家所提倡的政策协助下,未来核武国家的数量降低了。
专家无法保证最终结果。他们无法承诺永远不犯错,也无法承诺不受人人皆有的缺陷所累,这些缺陷支配着一切人类研究。他们只能承诺制定规则和方法来减少犯错的概率,做到远低于普通人犯错的频率。如果我们接受专业人士的工作所带来的裨益,那也得接受不那么完美的事情,甚至可能是一定程度的风险。
然而,其他形式的专家失灵就更令人忧心了。比如,当专家试图把自己的专业知识从一个领域延伸到另一个领域,他们可能会犯错。这不仅是错误的触发器,也是令其他专家十分恼火的事情。有些情况下,当艺人——当然是他们那个领域的专家——把艺术和生活混为一谈,开始对一些复杂的问题发表看法,这就是明显的跨专业入侵了。
还有些时候界限没那么清晰,问题就变成了“相对专业”。一个生物学家不是医生,但总体而言,相较普通人,生物学家能更好地理解医学问题。当然,这也不是说生命科学领域的任何人对这个领域的任何问题总是比其他人更有见地。比如说,一个勤勉的人花时间阅读糖尿病相关资料,可能就比一个植物学家更精通糖尿病的课题。一个专业人士如果专业学识深入,但知识面窄,那在自身领域以外的问题上,也就未必比其他人更有才学。一个领域的教育和文凭并不能保证一个人精通所有领域。
然而,当专家留在自己的领域里,却不甘于诠释,开始预测,这就是另一个问题了。强调预测就是在破坏科学的基本规则——科学的任务是解释,不是预测——而社会作为一个客户要求预测多过解释。更糟糕的是,普通人很容易认为预测失败就表示专业知识毫无价值。
就这一点而言,专家面临着一个艰巨的任务,因为无论学者强调过多少次,他们的目标是解释世界,而不是预测离散事件,民众和政策制定者还是青睐预测。(即便专家内心很明白,往往还是乐意效劳。)这就是专家和客户之间自然但无法克服的紧张关系,大多数人喜欢预测问题并加以避免,而不是事后解释。一个诊断的承诺,即便带有揣测性质,也总比验尸的绝对确定性要更受欢迎。
最后还有彻底的欺骗和渎职。这是最罕见但最危险的一种。在这种情况中,专家为了自己的目的(通常是野心家妄图捍卫自己的次品)刻意造假。他们一方面希望民众不会抓个现行,另一方面则希望同行不会注意到,或是把他们的欺骗归类到诚实的错误。
这种最极端的情况是最好应对的,所以我们就从这里开始。
当专家存心不良
科学家在21世纪初经历了艰难的几年。科学期刊的论文撤回数量达到历史最高比例。学术欺诈或行为不端现在看来都成了日常。
专家欺诈不难定义,但难以识别。如果有研究者或学者伪造研究成果或冒充专家的人谎称自己获得某个领域的资格证书或执照,那就是明显的行为不端了。[科学家用一个非常全面的缩写“FFP”来形容这种行为,意思是“伪造(fabrication)、篡改(falsif ication)或抄袭(plagiarism)”。]这种行为不端可能难以辨别,因为这需要其他专家找到线索,普通人不具备剖析科学研究的能力,最多也就是可能凑近墙上的文凭证书仔细看看是不是真的。
有时候专家不是专家。人们对自己的文凭撒谎,而且做得厚颜无耻。现实中的“超级伪装者”弗兰克·阿巴内尔(Frank Abagnale)在20世纪60年代完成过这种大胆华丽的造假[之后事迹被拍成电影《猫鼠游戏》(Catch Me If You Can)],阿巴内尔的行为包括冒充飞机驾驶员和医生。还有一种更普遍但更微妙的欺诈,就是有些人的确是专家,但他们用伪造的荣誉或夸大其词来加强资历。他们也许会声称自己是某专业协会的成员,或参加过某专家小组或研讨会,或是受过勋或获过奖,或是其他伪造的修饰包装,这些人通常只有在一些契机导致其他人去查阅他们的记录时才会被抓包。
当真正的专家说谎,他们危害的不仅仅是自己的专业,还有客户——社会——的福祉。他们对专业知识的威胁有两种表现:一种就是欺骗所带来的直接后果;另一种就是当他们被识破时这种行为不端对社会信任的腐蚀。这就是为什么(除了对撒谎和欺诈的法律制裁以外)专业组织、学术基金会、智库、学术期刊和大学保留对这种恶意渎职的一些最严厉惩罚。
出乎大众意料的是,这些惩罚的确存在。很多美国人都误以为研究员和大学教师不可能遭到解雇。这不是毫无根据的观念,因为解雇一名终身教授的确很难。虽然很多教授的合同里都有“反公德行为”条款,但21世纪的社会准则已经把标准降到很低,一个教授在课堂或私人生活中的行为几乎很难触及那条红线,以至于让学校终止任期。像对学生进行人身威胁或完全不出现在工作岗位上这种明显会导致解雇的过错可能还是会触发解聘的后果,但就个人行为而言,通常几乎所有情况都会被忽略掉。
然而,学术行为不端仍然是很多学校的红线。学术自由保障了人们有权表达不受欢迎或与众不同的观点,但这不是给制造马虎草率或刻意误导人的研究开绿灯。比如,科罗拉多大学解雇了沃德·丘吉尔(Ward Churchill)——一个把纽约“9·11”恐怖袭击受害者比作纳粹的讲师——他们解雇他不是因为他是一个不近人情的蠢货,而是因为他的评论引发人们去关注他的“学术著作”,结果发现其中有部分抄袭。当然,丘吉尔声称自己是政治偏见的牺牲品。他把自己作为科罗拉多州雇员遭解职的事一直上诉到科罗拉多州最高法院,最后输掉官司。
毫无疑问,丘吉尔的履历之所以会被仔细查阅,是因为他的政治观点。丘吉尔就解职事件提起上诉也是基于这一点,辩称他的抄袭是一些无心的过失,只是因为他持有争议的观点,才被大家发现。但这样的立场本身就令人震惊:一定要发生把双子塔遇难者称为“小阿道夫·艾希曼”(little Adolf Eichmann)这样的事,就像丘吉尔所为,才能去仔细查阅一个教授的学术著作?声称抄袭被发现只是因为这个大学讲师用令人作呕的言论来费力博取关注,这样辩解很苍白。
丘吉尔一案从某种程度上来说是独一无二的,很重要的一点是因为它受到公众的极大关注。大多数学术界渎职的案例都未被公众察觉。2014年的同性婚姻研究,包含了大规模数据造假,是一个特例,并且因为其结论的潜在政治影响力而受到大量关注。大多数学术研究都不会像一个宣称可以说服人们走出恐同情绪的研究那么有趣,所以也不会得到同等程度的关注。
不过,关注度低,不代表这些案例不严重。2011年,一名博士后研究者拿着美国政府的拨款在哥伦比亚大学开展研究,结果被发现在阿尔茨海默病相关的细胞生物学研究方面造假。这个研究者同意三年内不接受任何联邦政府拨款,但在他的不端行为被发现之前,他的文章已经被其他科学家引用了不下150次。2016年,一名西班牙研究员也因为其心血管疾病方面的研究涉嫌欺诈而遭到供职机构解雇。
还有更戏剧化的案例,一个名叫安德鲁·韦克菲尔德(Andrew Wakefield)的医生发表了一个把疫苗与自闭症联系起来的争议性研究,2010年在英国被吊销医生执照。英国医疗部门表示吊销韦克菲尔德的执照不是因为他支持了一个充满争议的主题,而是因为他违反了很多基本的科学行为准则。英国医学总会(UK General Medical Council)发现韦克菲尔德“曾经在未获得伦理委员会批准的情况下对儿童进行侵犯性研究,侵犯了儿童的临床利益,没有披露经济利益冲突和不当资金”。[9]
和沃德·丘吉尔一样,韦克菲尔德的支持者辩称他是猎巫行动[10]受害者。但败坏名誉的研究和行为不端不是一回事。比如,主要的艾滋病否定论者之一彼得·迪斯贝格(Peter Duesberg)虽然面临指控说他涉嫌学术行为不端,但还留在加州大学伯克利分校,学校就这项指控在2010年对他展开了调查并驳回了指控。
然而,我们还是绕不过这个问题:大量出版的科学研究有问题,轻则不可靠,重则造假,而且数量多到不容忽视。说起来可能会对普通人聊可安慰,我们之所以知道这些行为不端在发生,是因为所有领域的科学家都供认不讳。2005年的一项调查问到科学家是否有过不诚实的研究行为,大约2%的科学家自认至少伪造、篡改或“修饰过”一次数据,14%的人说曾目睹同事有过此类行为。当被问及严重行为不端,但还没达到完全造假这样滔天大罪时,1/3的受访者承认他们涉及不那么明显但还是值得商榷的行为,比如忽略与自己观点冲突的发现。超过70%的人表示曾在同事身上见过同样的行为。[11]
大多数学术行为不端对普通人来说都是不易察觉的,因为太无聊了。大多数学术期刊的文章撤回都是因为一些冷门话题研究中的不起眼错误或失实叙述,这与人们在《永不妥协》(Erin Brockovich)或《局内人》(The Insider)这样著名的电影里看到的大型欺诈的戏剧性故事不同。相对来说,自然科学似乎麻烦多多,但这可能是因为这些领域的研究更容易检测。
的确,自然科学家可能会说他们的文章撤回是职业责任和监督的表现。具有最高影响力的科学和医学期刊——例如《新英格兰医学杂志》(New England Journal of Medicine)——文章撤回率较高。不过,谁也不确定是为什么。[12]可能是因为有更多人核查结果,如果是这样,那就是个振奋人心的趋势。也有可能是因为更多人走捷径渗入顶级期刊,如果是这样,那就是个令人沮丧的事实了。还有可能是在声名显赫的期刊上发表文章的效应:读者越多,越有可能被别人引用到研究中去,顺藤摸瓜,就会被人发现行为不端。
任何科学研究的黄金标准就是看能否被复制或至少被重构。这就是为什么学者会用注释:不是为了防止抄袭——虽然的确有这个作用——而是让同行能够跟随它们的脚步,看看他们能否得出同样的结论。如果科学家篡改数据,那他们的结论就很难被复制,因而会破坏,甚至伪造研究。
不过,这种查证首先要假设有人会费心去复制结论。普通的同行互审不包括重做实验,而是推荐人会在假定论文符合基本的研究标准和流程的情况下来阅读。他们主要是判断课题是否重要,数据的质量够不够高,文中的论据是否能支撑结论。
当然,像化学或物理这样的自然科学似乎更主张复制的要求,而像社会学和心理学这样的社会科学研究往往依靠的是受试者,因而也更难复制。至少自然科学家可以声称有更清晰的标准:如果有人说某种塑料在100摄氏度融化,那其他任何人只要有同样的材料和一个本生灯,就可以查证这个发现。当100个学生志愿者受邀参与一项研究或训练时,事情就变得困难多了。研究结果可能是一个实时的概况,或是某个区域的印象,或是偏离了原来的方向。研究的设计本应对这些问题做出解释,但唯一知道答案的方式就是试着复制实验。
这就是一个研究团队在心理学领域打算做的事。至少结果是让人意外的。正如《纽约时报》2015年所报道的,一项试图复制100项研究的“艰苦卓绝”的努力,其结果发表在三个顶尖的心理学期刊上,研究发现一半以上的结论都没能经受住重新检验。
这项分析是由心理学家完成的,其中很多人都是自愿花时间来复核他们认为重要的著作……经审核的研究被视为核心知识的一部分,科学家借此来理解性格、关系、学习和记忆的动态。治疗学家和教育者依靠这些发现来引导决策,但既然这么多研究自身都有问题,那这些著作背后的科学依据就不得不让人怀疑了。[13]
这样的结果令人担忧,但这算欺诈吗?差劲的研究不等于行为不端。在很多案例中,问题不在于在重做研究的时候导出了不同的结果,而是这些研究从本质上来说就是“不可复制的”,也就是说他们的结论也许是有用的,但其他研究者无法以同样的方式来重做这些人类调查。
事实上,心理学研究也许都不算是差劲的研究。另一群学者随后又检验了这个调查——毕竟科学就是这样运转的——并得出结论,用哈佛学者加里·金(Gary King)的话说,这就是“彻头彻尾的不公平,甚至不负责任”。金指出,当复制是一个极其重要的问题,应该让学者“魂牵梦萦”,“那要说所有社会心理学家都在胡编乱造就不对了”。[14]整个科学事业,包括对反驳的反驳,都在正轨上:在《科学》(Science)的扉页上,专家还可以继续评估所有的论据,并对其展开进一步分析。
那么,自然科学是不是比社会科学有更多的次品或赝品被揭露出来?也许不是。当癌症研究者试图复制自身领域的研究,他们也遇到了心理学家和其他专家同样的问题。Slate网站撰稿人丹尼尔·恩贝在2016年报道了一组生物医药研究,这些研究出现了与心理学研究同样的“复制危机”。他指出,据估计“多达一半的研究结果是建立在不可靠的基础上,在其他实验室可能是无法复制的。这些癌症研究不仅没有找到治疗方法,甚至都没能提供任何有用的数据”。[15]就复制而言,横亘在他们面前的障碍与困扰社会学家的如出一辙:凌乱、时间推移、无法精确复制第一次实验时的条件等等。
我们在这里讨论的有欺骗性研究,也有只是粗制滥造的作品,这个主题太庞杂了,很难切入,但学术界“复制危机”的源头不是只有纯粹的欺诈,还有完美复制在物质和时间上存在的限制,以及其他问题,比如对拨款的监管不足,学术机构有发表作品的要求(无论多微不足道),这些给研究者造成了巨大压力,学者们的论文或研究一旦出版,往往就会把从前的作品打包装箱,扔到一边。
社会科学和人类学方面的研究尤其难复制,因为它不是基于实验流程,而是专家对独立作品和事件的解读。一本文艺评论的书就是书如其名——评论。它不是科学。不过,专家的判断则需要关于这个学科的深厚知识。同样,研究古巴导弹危机不同于自然科学实验。我们无法反复重演1962年10月发生的事情,所以一个作者检视了古巴导弹危机的后果并写出文章,呈现的是一个专家对一次历史事件的分析。这样的研究结论可能漏洞百出,但这只是给进一步探讨提供了素材,算不上职业行为不端。
在社会科学和人类学中还有一些引人瞩目的完完全全的学术诈骗案例。2000年,埃默里大学历史学家迈克尔·贝里尔因为一本名叫《武装美国》(Arming America)的书获得了哥伦比亚大学享有盛名的班克罗夫特奖(Bancroft Prize)。贝里尔在书中声称揭穿了一个关于拥枪思想的谬论,据他说,美国人拥枪的思想不是植根于早期殖民时代的经历,而是受近一个世纪后的其他影响形成的。这项研究认为私人拥有武器在早期的美国并不常见,因此立即在读者中引起两极分化。
这个研究本来不会被人察觉,但因为探讨的主题是拥枪,控枪支持者和拥枪团体立刻就贝里尔的观点选边站,故而引来细致密切的审查。其他学者试图找到贝里尔研究所依托的信息来源,但他们的结论是贝里尔要么是误用了信息,要么是杜撰出来的。哥伦比亚大学撤回了班克罗夫特奖。埃默里大学也展开了调查,发现贝里尔的错误有一些可能是因为能力不足,但还有一些是学术诚信的问题,这一点无可回避。此后不久,贝里尔辞去了职位。最初合作的出版商也终止了这本书的出版,不过后来又被一家小型商业出版社重新发行了。
2012年,一个名叫戴维·巴顿(David Barton)的作者出版了一本关于托马斯·杰斐逊(Thomas Jefferson)的书。巴顿没有专业历史学背景,他之所以名噪一时,主要是因为他在福音运动中的声望。(2005年,《时代》称他为美国最具影响力的25个福音派传教士之一。)他的书赢得了保守派领袖的赞誉和支持,包括2012年总统参选人麦克·哈克比(Mike Huckabee)和由历史学家转型为政治人物的纽特·金里奇(Newt Gingrich)。
和贝里尔的枪支研究一样,巴顿的作品因为政治影响力和作者的声望受到相当大的关注。这本书的标题毫不隐晦——杰斐逊的谎言:揭露你一直相信的托马斯·杰斐逊。巴顿在书中说,现代历史学家不仅污蔑了杰斐逊的私生活,还忽视了他的很多思想其实是支持现代保守派观点的。考虑到杰斐逊是欣赏法国大革命的,而且他后来与自由主义者结盟(这与他的保守派死对头约翰·亚当斯正好相反),这个观点非常大胆。
大多数专业学者都不理会这本书,对他们来说,这本书就是一个业余历史学爱好者和一个非学术的宗教出版社的合作产物。无论如何,这本书的目标读者也不是学者,而是渴望读到这些内容的那群人。巴顿大获成功:《杰斐逊的谎言》登上了《纽约时报》畅销书榜。
这本书的准确性很快就受到质疑,提出质疑的不是某个研究型大学的无神论自由主义者,而是宾夕法尼亚州一个小型基督教学校格罗夫城市学院的两名学者。经过仔细审查后,巴顿的很多主张都站不住脚。这本书后来被历史新闻网(History News Network)读者票选为“最不值得信赖的纸质书”,但更具毁灭性的是这本书的出版商认为这本书实在是漏洞百出,所以终止发行。《大西洋月刊》撰稿人兼法学教授加勒特·埃普斯(Garret Epps)对这一事件做出尖刻的批评,他说:“巴顿的书大多是自助出版的,永远不会被撤回。但是基督教学者和一家基督教出版社的斥责是他永远挥之不去的羞耻烙印。”[16]
在所有这些案例中,欺骗和行为不端都被发现了。不过,普通人对于最后的清算并不太关心,这也合情合理。最根本的问题在于各领域的研究是否可信。
在某种意义上说,这是个错误的问题。一个课题的成败与否,几乎不会由一次研究决定。普通人不会去仰仗细胞研究的某一个项目的结果。如果有一组研究集结起来得到一种药物或一种治疗方法,而某一项研究隶属其中,这个研究本身也会触发一连串的研究来审视相关的安全性和效能。伪造一项研究还有可能,伪造数百项研究,并且制造出完全欺骗性或危险的结果,那就另当别论了。
同样,在公共政策方面,专家的权威不是靠一项研究确立的。即便一个学者因为一本书或一篇文章受到政策圈的关注,他/她的影响力也不是由科学复制作品的可能性决定的,而是由作品所提出的观点决定的。社会科学与自然科学一样,任何单项研究,如果没有其他专家的再次审查,鲜少会影响到普通公民的生活。
然而,任何领域的欺骗都会浪费时间,推迟进展。就像一组复杂的方程式中如果早早埋下错误,后面的计算就会陷入困境,欺骗或行为不端会耽搁整个项目,直至有人发现是谁搞错——或刻意欺瞒——事实。当然,如果这样的事情公之于众,随之而来的就是行为不端的范围和影响这一类法律问题,尤其是当这些项目花的是公众的钱的时候。
我以为你是读医学预科的
除了恶意欺骗或令人错愕的无能,专家失灵还有其他原因。专家最常犯的其中一个错误是一种假设:假设专家在某些事情上比大多数人都聪明,那么他们在一切问题上也比任何人都聪明。他们视自己的专业知识为一种许可证,可以插手任何事情。(还是那句话,我不能在这里率先批评。)他们先进的教育和经验就成了一种总体性保证,保证他们心如明镜,无论在哪个领域,他们都知道自己在做什么。
这些专家就像是经典喜剧《动物屋》里的埃里克·斯特拉顿(Eric Stratton)一样。当他在学生法庭上挺身而出捍卫他那个不守规矩的大学兄弟会时,他的朋友问他,知不知道自己在做什么。“放轻松,我是读法律预科的,”他向自己的兄弟保证。“我以为你是读医学预科的?”其中一个兄弟问道。“有什么区别?”斯特拉顿回答。
这种过度自信不仅使专家偏离自己的轨道,对自己专业相去甚远的问题发表看法,而且还会“夸大”自己在本专业内的能力和水平。专家和职业人士,就像其他岗位上的人一样,认为以前的成功和成果就能证明他们学识出众,他们会把自己的界限往外推,而不是说出每个专家都讨厌的那几个字:“我不知道”。没有人愿意表现得无知或是被人发现个人知识上的缺漏。普通人和专家都一样,会对他们一无所知的事情振振有词,但专家应该做得更好。
跨专业入侵的原因有多种,从无心的失误到才学上的自负。不过,有时候动机很简单,就是名声会带来机会。艺人是最糟糕的入侵者。(是的,在演艺领域,他们是专家。表演学校又不是化学工程师开的。)他们的名气让他们很容易接触到各种问题和争议,真正的专家和政策制定者会与他们合作,就是因为人们会习惯性地接名人的电话。
然而,与名人聊天和教育名人是有云泥之别的。这会造就一种匪夷所思的场景:一个领域的专家——娱乐圈——竟然去研究其他领域的重要问题。这种奇特的现象在美国相对历史较短,但也是在名人能在推特或个人网站上随意发表高谈阔论之前就已经存在的了。
比如,1985年,一名加州众议院议员托尼·赛洛(Tony Coelho)邀请女演员简·方达(Jane Fonda)、西西·史派克(Sissy Spacek)和杰西卡·兰格(Jessica Lange)到众议院农业委员会就农场问题做证。她们有什么资格?她们在那10年里受欢迎的三部电影中扮演了农场主妻子。当然,这整件事就是个噱头,当被问及为何要这么做的时候,民主党议员赛洛朝共和党总统罗纳德·里根开火(Ronald Reagan):“她们可能比白宫里的那位演员更懂农业问题。”当时他是这么说的。[17]
可是,这不是一次孤立的事件。多年来,名人开始投身到自己知之甚少的纷争中。他们推波助澜,制造假警报,改变数百万言听计从的粉丝的日常习惯。
一名加拿大的卫生政策专家蒂莫西·考尔菲尔德就是众多受够了的专家之一。他写了一本书,谴责名人对专业知识的侵犯,还专门提到一个明星:《格温妮丝·帕特洛的观点是不是都错了?当名人文化和科学发生冲突》。(我在第四章讨论过帕特洛关于女性护理的一些建议——我也很无奈。)正如考尔菲尔德在2016年的采访中表述的:
如果你问别人:格温妮丝·帕特洛提供的乳腺癌风险的信息可不可靠?大多数人都会说不。营养科学?大多数人都会持怀疑态度。但是因为她有如此强大的文化影响力,因为她把这股力量打造成自己的品牌,人们还是会认同支持她。
这里还有一个有效性偏见:名人无处不在。事实很简单,他们无处不在,他们的影响力可见一斑。你会在想起《人物》杂志上帕特洛的一张照片时谈论无麸质,但是谈论的内容却与数据告诉我们的事实完全不符。名人就是这样对我们的生活产生了巨大影响力。[18]
这并非无伤大雅。人们不愿意给孩子打疫苗,实际上就是因为《花花公子》的宠儿、女演员珍妮·麦卡锡(Jenny McCarthy)说她通过“谷歌大学”深入研究过疫苗。更多人会看到帕特洛和麦卡锡,而且接触她们那些愚蠢想法的概率,要多过我们去看——或者耐心听取——一个魅力逊色太多的肿瘤医师或流行病学专家。
行动主义是一个开放的民主社会里每个人的权利。但是,行动主义和一个名人滥用自己的名气是大相径庭的。普通人的行动主义需要对专家的观点选边站,然后去支持自己青睐的政策。可是,当名人用自己的判断取代专家的判断——实际上是在要求人们因为名气而相信他们——这无异于一个微生物学家对现代艺术指指点点,或一个经济学家争论起药理学。
有些情况下,专家会把手伸到别的领域,是因为他们插手的那个专业领域和自己的非常接近,这样一来,专业判断的跨领域延伸看起来就是合乎情理的。已经在自身领域取得成就并获得赞誉的专家尤其如此。这个社会变得越来越复杂,但是,一个天才能通吃所有领域的想法已经越来越说不通了——幽默大师亚历山德拉·佩特里(Alexandra Petri)曾经写道:“你对一个人说‘你发明了火炉,那你对税收又有什么看法?’还能得到一个连贯合理的答复,本杰明·富兰克林是最后一人。”[19]
例如,诺贝尔奖得主化学家莱纳斯·鲍林(Linus Pauling)在20世纪70年代的时候相信维生素C是一种特效药。他提倡服用大剂量的维生素C来击退感冒和任何其他小病。鲍林的主张没有任何实际根据,但就因为鲍林获得了诺贝尔化学奖,他关于维生素效用的结论在很多人看来就是将他的专业知识合理延伸到其他领域。
事实上,鲍林在倡导维生素的最初阶段并没有运用专业的科学标准。他最早服用维生素C是在20世纪60年代末,一个名叫欧文·斯通(Irwin Stone)的自称是医生的人建议他这么做。斯通告诉鲍林,如果他每天服用3 000毫克维生素C——建议每日服用量的50倍——那他就能多活25年。可是,斯通“医生”仅有的学位也就是一个未获认证的函授学校和一个脊骨神经医学院颁发的两个名誉学位。[20]
鲍林愿意相信这个概念,于是他开始贪食维生素。很快他就感受到神奇的效果。一个公正的旁观者可能会怀疑这是一种“安慰剂效应”——当你告诉别人某种药物能让他们感觉好一些,他们会真的感觉好一些,但因为鲍林对科学做出了卓越的贡献,他的同事很重视他的话,并开始检验他的主张。
结果没有一个维生素C实验能证明鲍林的主张,但鲍林不听。正如儿科医师兼宾夕法尼亚大学传染病专家保罗·奥菲特(Paul Offit)后来所写:“尽管一项又一项研究表明他是错的,鲍林还是不肯相信,继续在演讲、科普文章和著作中推广维生素C。当他偶尔在媒体面前看起来有明显感冒症状的时候,他就说自己是过敏。”
鲍林在整个20世纪70年代一直宣传自己的主张。他认为维生素能治愈一切疾病,包括癌症、心脏病、麻风病和心理疾病,以及其他各种疾病。他后来还建议大家研究维生素C在对抗艾滋病方面的功效。维生素生产商当然乐见一个诺贝尔奖得主成为他们的守护神。很快,维生素保健品(包括“抗氧化剂”,相当于那个时代的“无麸质”和“非转基因”)成了气候。
只不过,后来证明大剂量维生素其实是危险的,可能会增加患某些癌症和中风的概率。鲍林最终不仅损害了自己的名声,也损害了数百万人潜在的健康状况。如奥菲特所指,一个“赢得两次诺贝尔奖的人,他的正确是举世瞩目的”,“所以错也错得轰轰烈烈,以至于他可能算是世界头号庸医”。时至今日,尽管科学界按照恰当的方式检验并证明了鲍林的主张是错的,但是还有人认为吞下维生素的大药丸能击退疾病。
鲍林死于癌症,享年93岁。至于他是不是像斯通“医生”允诺他的那样多活了25年,我们就不得而知了。
有时候,专家会利用某个证书或成就的光环插手相去甚远的领域,从而影响重要的公共政策辩论。1983年秋天,纽约市电台播报了一个关于核军备竞赛的项目。20世纪80年代初期,冷战局势紧张,有几年情况最糟糕,而1983年就是其中之一。苏联击落了韩国的一架民航客机,美国和苏联在日内瓦就核武器展开的会谈失败;ABC制作了一部纪录片,讲述可能发生的核战争,名叫《浩劫之后》(The Day After),首播后成了那个时代收视率最高的电视节目。此外,大选年很快就到了。
我是当时的听众之一。那时我正在纽约读研究生,研究方向是苏联,准备在公共政策领域大展宏图。“如果罗纳德·里根再次当选,”我的电台里传来浓重的澳大利亚口音,“核战争是确定无疑的。”宣称核战争是无可逃避的,这话吸引了我的注意力,尤其是在那个时候,还没有什么正式的预测说里根在1984年大选中会遇到威胁。是谁这么笃定——都到了“确定无疑”的程度——我们会走向大决战?
说出这话的是一名女性,海伦·考尔迪科特博士(Dr. Helen Caldicott)。她不是物理学博士,也不是政府或国际事务方面的博士,而是来自澳大利亚的儿科医师。她对核武器的忧虑,据她自己回忆,是源自她读到内维尔·舒特(Nevil Shute)1956年的末日类小说《世界就是这样结束的》(On the Beach)。她后来说,如果孩子们所处的世界会在顷刻间灰飞烟灭,那她觉得治疗儿童疾病就没有意义了。她很快就成了武器控制和核政策辩论中一个有力的声音,尽管她几乎没有与这个主题相关的文凭或经验。
考尔迪科特习惯于对高度技术性的问题发表笃定的言论。她会就美国导弹发射井的响应力、民防措施和苏联外交政策机构的内部运作等议题侃侃而谈。她在美国居住了差不多10年,经常出现在媒体上,代表反核运动团体发声。
1985年,她出版了《导弹嫉妒》(Missile Envy)这本书,至此她的跨专业影响力达到巅峰。这本书里充斥着医学词汇,比如“诊断”军备竞赛。(章节包括“病原学”、“体格检查”和“个案研究”等。)书的标题就是个剧透:儿科医生在苏联和美国老年男性的灵魂里发现了冷战的心理学基础。她指出,美国的女人已经赢得了选举权,“手握选举权但实际上却无所作为”,像时任英国首相玛格丽特·撒切尔(Margaret Thatcher)这样的参政女性,考尔迪科特说,并不能“代表大多数理智聪明的女人身上的真实属性”。[21](考尔迪科特在纽约电台里说的话就更直白了:“玛格丽特·撒切尔,”博士宣称,“不算女人。”)考尔迪科特在20世纪80年代末回到澳大利亚竞选政治职位,失败了。
专家界这样的例子也比比皆是。最著名的例子,至少按照全球公众影响力来衡量,就是麻省理工学院的诺姆·乔姆斯基(Norm Chomsky)教授,一个受到全球数百万读者崇敬的人物。如果计算起来,乔姆斯基应该是在世美国知识分子中被引用最广泛的人了,他在政治和外交政策方面著作等身。然而,乔姆斯基在麻省理工学院的岗位是语言学教授。乔姆斯基被视为他那个领域的先锋,甚至是巨人,但他在外交政策方面的造诣,也不比乔治·凯南(George Kennan)[22]在人类语言起源方面的造诣更深厚。无论如何,他为公众所熟知的,更多的是他政治方面的著作,而不是语言学领域的作品。的确,这些年来,我常常碰到一些熟悉乔姆斯基的大学生却不知道原来乔姆斯基是一个语言学教授。
然而就像鲍林与考尔迪科特一样,乔姆斯基回应了公共广场的一种需求。普通人往往觉得自己在挑战传统科学或社会主流思想方面处于劣势,这样一来,如果有一个直言不讳的人带着专家认证这样的光环出来发表看法,人们自然会团结到他/她周围。医生可能应该关注一下维生素在人类饮食中的作用。可以肯定的是,当国家正在重新思索核武器的角色,公众应该参与进来。但是一个拥有化学学位的人或一个儿科住院医师,自身领域的资历并不会让他们的主张比任何其他在深奥领域自学成才的人更可靠。
公众对这种越界的行为相当容忍,这本身就是个悖论:一些外行人不尊重专家在专业领域内的看法和观点,另一些人却认为专业知识和成就是通用的,专家和知识分子可以对几乎一切事情发表权威看法。人们质疑家庭医生为其注射的疫苗安全性,却也会去买一本核武器方面的书,只因为作者的头衔里有一个有魔力的词——“医学博士”。
遗憾的是,当专家受邀对超出自身能力的问题发表看法时,很少有人会谦逊地记得自己有责任提出异议。我也犯过这样的错误,最终后悔不已。在一次扭曲的争执中,我已经坦白说我对现在受关注的这个问题认识有限,爱莫能助,但还有人坚持认为我完全有能力就这个话题发表评论。面对一个对我深信不疑的记者或学生,后者尤甚,我却要信誓旦旦地告诉他们,如果我假装权威回答他们的问题,是很不负责任的,这种感觉很奇怪。承认自己不是全知全能让人不舒服,但我们唯愿语言学专家、儿科医师和其他各路专家也勇于承认这一点。
我预测!
20世纪60年代初,绰号“神奇的克里斯威尔”(The Amazing Criswell)的演员经常出现在各种电视节目和广播节目中。克里斯威尔的任务就是做出各种离谱的预测,还要用夸张的戏剧化的语气说出“我预测!”他宣称过很多事情,比如纽约将会在20世纪80年代沉入海底,佛蒙特州会在1981年遭遇核弹攻击,丹佛市将被1989年的自然灾难夷为平地……克里斯威尔纯粹是在哗众取宠,但观众还是听得津津有味。不过,他没预测到自己的事业会在20世纪60年代末期跌入谷底,最终沦落到出演一些靠色情镜头博眼球的低成本电影里的小配角,电影导演还是他的朋友——传奇恐怖片导演埃德·D.伍德(Edward D. Wood)。[23]
对于专家来说,预测未来是个不小的麻烦。公众希望专家能给出预测,而专家却并不擅长此类事情。专家本来就不应该擅长预测未来。科学的目的在于解释,而不是预测。即便如此,有的专家还是会不自觉地被“预测未来”所吸引,就像有些专家喜欢越界指手画脚一样。
专家和外行都认为,既然专家能够比其他人更好地掌握一门学科,那他们也一定会在预测未来方面表现优异。这个想法在自然科学领域专家身上就更强烈一些,因为他们利用实验方法来决定实体世界在什么样的条件下能如他们所期望的那样运作。如果有意外发生,科学家就有了一个新的出发点来展开调查。正如已故科幻小说作家(生物化学教授)艾萨克·阿西莫夫所说,激发出最伟大的科学突破的词或许不是“我找到了!”而是“哎呀,有意思!”
然而,有些专家不但欣然给出预测,甚至还为此收取不菲的费用。比如说,民调员向政治候选人和媒体订阅用户出售自己的服务,而市场专家则为新的服务和产品试水。民调由来已久,1936年《文学文摘》(Literary Digest)预测阿尔夫·兰登(Alf Landon)会打败富兰克林·罗斯福(主要是通过调查自己的读者得出)。如今,研究民意成了一门科学,出现了相应的专家和期刊。有一些民调员是有党派立场的,会按照自己的意愿刻意引导民调结果,但大多数还是有统计学和方法论的学术背景,使得他们大体上可以做出相当准确的判断。
可是,当民调和市场调研出错,就会错得很离谱。可口可乐公司在20世纪80年代中期推出“新可乐”,这简直是个灾难,就连“新可乐”这个词也成了没能准确读取民意的迷因而广泛传播。最近,政治民调机构和专家在21世纪初的几次重要预测中都判断失误,包括2014年美国中期选举和2015年英国大选的结果。
事实上,对2015年民调员的调查发现,他们认为一连串的失误已经让自己名誉扫地。一些人觉得这是媒体偏见造成的(媒体喜欢报道失败,而不是成功),另一些人承认技术和人口结构的变化让民调更具挑战性,想要做出准确民调更难了。“比起民调准确,民调出错会是一个更有意思的报道。”民调专家芭芭拉·卡瓦略(Barbara Carvalho)告诉新闻网站538(这个网站也做民调)。但民调专家马修·托尔里(Matthew Towery)在2015年承认:“显然,过去三年有几次备受瞩目的惨败。”[24]
问题主要不是出在民调上——民调的准确度受制于人们的参与,而是人们期望从民调中看到什么。民调不是对未来结果的书面保证。很多事情,从不可预知的事件到广告,都会改变人们的想法。和其他各领域的专家一样,衡量一个人称不称职要看整体表现,要看专家能不能正视自己的失败。同样,伴随每一个“新可乐”的,还有成千上万成功的产品推出,以及准确的竞选预测。不过,事情总是这样,人们记住的还是那些错误的判断,尤其是当他们不喜欢这个结果的时候,对多如牛毛的成功案例却选择性失明。
人们对专家预测期待太高,但至少有一些专家愿意坚定地依靠自己的强大洞察力来出售预测。几十年来,政治科学教授布鲁斯·布恩诺·德·梅斯奎塔(Bruce Bueno de Mesquita)利用“正当软件”为公共领域和私人领域的客户预测国际大事。这30年来,连美国中情局都成了他公司的客户。中情局在1993年的一次调查中说,在数百次预测中,梅斯奎塔有两次“正中靶心”,这也是中情局的分析员成功预测的概率。
其他专家无法验证布恩诺·德·梅斯奎塔的说法,因为他的方法和模型是一种商业产权,受到保护,不会在出版的研究中公开。《纽约时报》2009年刊登的一篇简介中写道:
布恩诺·德·梅斯奎塔已经在学术期刊发表了很多预测,绝大多数预测都是为企业或政府客户秘密完成的,没有哪个独立的学术机构可以进行验证。“我们不知道他是10次里面对了9次,还是100次里面对了9次,或者是1000次里面对了9次。”哈佛大学教授斯蒂芬·沃尔特说。
中情局的研究表明,布恩诺·德·梅斯奎塔的预测准确率有90%,但沃尔特并不讶异。“这是一个中情局中层官员在说,‘这是个有用的工具’,”沃尔特说,“这不像是让布伦特·斯考克罗夫特(Brent Scowcroft)[25]说:‘说到布什政府时期,我们不会在不咨询布恩诺·德·梅斯奎塔的情况下就做出决策。’”[26]
尽管布恩诺·德·梅斯奎塔的准确性是不可知的,但更重要的一点是他的预测有一个健康的市场。对于处在危急关头的组织来说——生命或金钱危在旦夕,或者两者皆有——在冒险之前自然会贪婪地搜寻一切信息。一个声称能窥探未来的专家,总是比一个只能提供有限意见的专家吃香。
像布恩诺·德·梅斯奎塔这样的民调专家和顾问受雇预测未来,他们工作的价值几何,由客户决定。可是其他专家和公共知识分子也做预测,而且很多失败的专家预测严重破坏了公众对学者和专家的信任。如果有人没预见到苏联的解体——或是有人承诺说和伊拉克的一场大战很容易取胜——又去在一些生死攸关的大决策上出谋划策,公众的疑虑也是情理之中的。
如果我们先把“专家应不应该预测”的问题放到一边,我们就还剩下一个问题:他们的确在做预测,而且他们的预测往往差劲得令人咋舌。在一篇广为人知的关于“黑天鹅”事件——能改变历史进程的不可预知的事件——的研究报告中,纳西姆·尼古拉斯·塔利布(Nassim Nicholas Taleb)描述了整个预测行业里表现出来的“认知傲慢”:
可是我们表现得好像我们能预测历史事件一样,或者更糟,好像我们能改变历史进程一样。我们预测30年后的社会保险体系赤字和国际油价,殊不知我们连明年夏天的社会保险体系赤字和国际油价都猜不中。我们对政治和经济事件的错误预测堆积如山,简直荒谬,以至于我每次看到这些充满经验主义风格的预测,都要狠狠掐一下自己,看看自己是不是在做梦。[27]
塔利布警告说未来是永恒不确定的,这个观察很重要,但是他主张我们要接受预测是无用的,这就不切实际了。人类不会两手一摊,放弃任何一个运用专业知识进行预测以对冲风险的机会。
问题的关键不在于专家是否应该参与预测,他们就是会做的。他们生活的这个世界和统治这个世界的领袖,都会要求他们去预测。真正的问题在于,专家应该在何时预测,又该如何预测,以及在专家出错的时候我们应该如何应对。
2005年,学者菲利普·特劳克(Philip Tetlock)搜集了社会科学方面的专家预测数据,他发现了一个很多人心中的疑惑:“如果我们以半吊子预测爱好者、投掷飞镖的大猩猩和归类外推算法的表现为最低预测标准,并以此衡量专家的预测表现,也没有发现任何迹象显示,专业知识能转化成更强大的能力,从而做出‘精准’‘可靠’的预测。”[28]在预测未来方面,专家也没有比转动的轮盘赌强到哪里去。特劳克的发现让很多外行人证实了自己的猜测——专家并不知道自己在做什么。
不过,特劳克的研究触发的反应,就是典型的普通人误解专业知识的案例。特劳克自己也说:“激进的怀疑主义者乐见这样的结果,但是当我们在一些预测正确的专家身上找到整体一致性时,他们就开始觉得不舒服了。激进怀疑主义者让我们不要有任何期待……但我的数据显示,专家的预测表现中,随机的成分少一点儿,整体一致性的成分更多。”[29]
实际上,特劳克没有把专家和世界上的其他人进行比较,而是和基本的标准来比较,尤其是其他专家的预测。他研究的问题不是专家是否比其他人更擅长预测,而是为什么有的专家似乎比其他专家更擅长预测。这两个问题有着天壤之别。或者如詹姆斯·索罗维斯(James Surowiecki,《群体智慧》的作者)所指出的,说“认知多样化”是重要的,也就是许多观点好过一个观点,但这并不是说如果“你集结一群形形色色但极其无知的人,他们的集体智慧就会超过一个专家”。[30]
特劳克真正的发现不是专家比随意猜测的普通人强,而是和同行相比,有些专家似乎更善于将专业知识应用到假设性的推测之中。英国思想家以赛亚·伯林(Isaiah Berlin)曾指出“刺猬”和“狐狸”之间的区别,特劳克借此来区分知识广博的专家(“知道很多小事的狐狸”)和知识面较窄但深入的专家(“只知道一件大事的刺猬”)。有很多重要的作品是关于专家如何思考的,特劳克的研究就是其中之一,值得通读。不过,总的来说,他还有一些更引人入胜的发现,其中有一条可以总结为:虽然专家在从解释科学转移阵地到预测未来的时候遇到不少麻烦,但“狐狸”往往比“刺猬”表现得好。导致这一现象的原因有很多。
比如说,“刺猬”会过于投入到把自己的专业知识推广应用到专业领域之外的地方去,而“狐狸”却能够整合更多的信息,而且会在新的或更好的数据出现时改变想法。“‘狐狸’懂得自我批评和换位思考,”特劳克发现,“这使得他们不会过度沉迷于自己的预测,而“刺猬”——尤其是专业知识深厚的“刺猬”——容易深陷其中。”[31]
技术领域的专家是“刺猬”的最佳代表。他们不只在预测方面遭遇相当大挑战,在处理专业领域外的信息方面也是能力有限。深耕一个领域的人只会埋头在自己的专业里,所以他们会本能地想把自己的专业知识推广运用到其他问题上,不管他们的专业领域和亟待解决的课题之间多么不搭调。[32]有些专家自信满满,却往往给出错误预测,主要就是因为这些科学家像刺猬一样,专精于自己那个狭小但高度复杂的专业领域,很难接受和处理专业之外的信息。
人们从中也吸取了一些教训,不只是专家,还有那些评判甚至挑战专家预测的普通人。
最重要的是,失败的预测并不能成为我们评判一个专家的重要标准。专家在预测的同时也会给出警告(这是专家行事的一个重要特征),因为这个世界上充满不可预测之事,而且这些事会引发一连串的涟漪效应,像心脏病和飓风这样简单的偶然事件都有可能改写历史。无论这些警告多重要,普通人往往选择忽略,就像当地的天气预报说下雨的概率有70%,他们也会忽略掉。如果最后天晴了,应了那30%的可能性,他们就会认为天气预报是错的。
这样说不是替专家,尤其是专家这个圈子开脱,毕竟他们在很多事情上都预测失败。20世纪70年代,没有一个苏联专家预测到苏联到了1991年会解体,而持相反观点的专家——认为苏联解体几乎是不可能的——态度日益坚定,这是一次相当大的判断错误,应该让这个领域的专家痛定思痛。(遗憾的是,并没有。20年来,大多数研究俄罗斯的专家逃避检视彼此的错误。)
可是,预测失败并不会剥夺专家在知识上的立场,他们依然可以宣称比外行懂得多。普通人不应该妄下结论说,专家的一次判断失误就意味着所有人的观点都是同等重要的(或同样无意义的)。民调专家内特·西尔弗(Nate Silver)因为精准地预测2008年和2012年大选结果而声名鹊起。西尔弗承认自己在2016年对共和党总统候选人唐纳德·特朗普(Donald Trump)的预测是基于一些有问题的假设。[33]虽然特朗普的胜选让他和其他人大感意外,但西尔弗对其他竞选的分析预测依旧可靠。正如专栏作家诺亚·罗斯曼(Noah Rothman)后来所写:“特朗普已经证明政治专家耗费毕生心血研究的种种规则在今天都失灵了。但是人们还是会坚持说‘我们关于政治的一切认知都是错的’,也不肯说出‘我对政治一无所知’这句话。”[34]
因为一些专家的预测比其他专家差,就要让他们为此负责,则是另一回事了。但是预测问题的措辞用简单的是非选择题,然后指出普通人和专家预测正确的概率是一样的,这是对专家角色的根本误解。事实上,问出这样无法分出高下的问题,也是在帮专家脱身。有一个关于英国公务员的老笑话,这个公务员在外交部度过了漫长的职业生涯,跨越20世纪的大半时间,然后退休了。“每天早上,”这位经验丰富的外交人员说,“我去见首相,然后向他保证今天不会发生世界战争,我很高兴地注意到,在我的40年职业生涯中,我只错过两次。”仅凭猜中和猜错的数量来看,这位老人的表现相当优秀。
专家提供建议和给出预测的目的不是为了在掷硬币中获胜,而是为了指导我们针对未来的各种可能性做出决策。如果在1980年提出这个问题:苏联在2000年之前会不会瓦解。这就是一个是非选择题。如果问题是“在2000年到来前的几十年里,如何最好地迎来苏联的和平解体,并且改变这件事的可能性(降低其他事件的概率)”,那就是截然不同的问题了。
鉴于我自己有研究俄罗斯(苏联)的背景,一个警惕的读者此时可能会想,我是不是也是预测错误的苏联问题专家之一?我是不是就是坐在教室后面随便说说而已呢?问得好。
我没有就苏联解体做出错误的预测,但那只是因为我从一开始就没有错的机会。我在1988年底完成研究生学业,那时候苏联解体的进程已经很清晰了。我等了10年,才做出一个关于俄罗斯政治的极大的错误预测。我知道预测失败的危险,因为我有这样的经历,我必须对此负责。
我在2000年初写道,一个新的俄罗斯领袖的崛起,一个名叫弗拉基米尔·普京(Vladimir Putin)的当初名不见经传的官员,可能会一路带领俄罗斯走向新时代。当然,我错了,而且大错特错。
对于普通人来说,这没那么重要,也不应该重要。当有人极力劝说我对普京做出一个判断(我们研究俄罗斯事务的很多人都面临这种状况),我交出了一个肯定的观点,而不是给出一个需要更大耐心但更无趣的看法:现在说还为时尚早。可是,在努力剖析今日俄罗斯的时候,我20年前的预测滑铁卢是否就贬低了我今日的分析和建议,使之无效呢?在探讨普京的动机时,我是不是不再能超越一个博闻广识的普通人了?
关于普京的认知,我错了,但有一个事实未变,普通人想要解释俄罗斯政局的复杂性,或者想要教一门相关的基础入门课程,还是心有余而力不足。我和其他专家为什么会搞错是个重要的问题,不只是因为这让我们去回顾自己的推论,并且展开辩论和自我纠错,这是专家这个群体的义务。很多人对普京持悲观态度,但其中有些人不过是条件反射的恐俄心理,或者只是猜测,这两种对制定政策都没有帮助。一个不了解情况的判断,即便是对的,也不如一个虽然错了但条分缕析的观点有用,后者可以用来剖析、检验和纠正。
修复关系
专家预测失败的时候,专家和外行都有各自的责任。专业人士必须承认自己的错误并公之于众,然后努力纠正。外行人在要求专家做出预测时必须更加小心谨慎,而且搞清楚预测失败和学术欺诈之间的区别。
总的来说,专家会检讨自己的错误,但不是在公众可能会看到的地方进行。普通人不会去读医学期刊或一篇社会学文章的数据分析。坦白说,我怀疑大多数专家和学者或许宁愿普通人不去读,因为普通人不会明白他们读到的大部分内容,而他们努力关注专业辩论的行为,可能反而会对公众造成更多的困惑,而不是启迪民智。
这种时候就需要公共知识分子——为专家和外行搭建沟通桥梁的人——承担更多的责任。如果只有医生来解释新的医疗方法——让医生把专业知识转化成通俗语言是很难的,或者让记者来解释——记者没有科学背景,无法评估复杂的科学主张,那给公众的知情服务就很糟糕了。这样一来,就会给一些业余人士、唯利是图的人、江湖骗子和阴谋论者——通常是在互联网上——留下钻空子的机会。
公共知识分子常常会被讥讽为“负责科普的人”,这样的指称其实有几分道理。这个世界可能不需要第二个比尔·奈(Bill Nye,“科学人”)对全球气候变化指手画脚。就因为互联网的时间和流量都多的是,一些前官员或职位较低的退休军官也要去凑个热闹占个时段发表自己的深刻见解,外交政策圈已经不想再看到这样的事情了。但是,如果公众和专家之间的差距越拉越大,专家只能和专家对话,而那些将来会影响公众生活的决策,公众却无缘参与了。
说到这,公众要发挥一个最重要的作用,他们不仅要了解与他们息息相关的问题,还要了解帮他们出谋划策的那些人。举个例子,特劳克就提倡要仔细检查专家的履历,以此来督促他们给出更好的建议,这样专家们才会“有动力去比一比谁能提供更有价值的知识产品,而不只是去迎合那些志同道合的人”。[35]
可是,只有当人们愿意拨冗关注,翻出不良专家的履历才有意义。如果人们还是被动地接受电视屏幕上传来的信息,或者如果他们只会主动搜寻愿意相信的信息,其他都不重要了。普通人应该扪心自问,比如他们究竟想对这个主题了解多少?他们是否真的愿意去面对一个会毁掉自己信仰的事实?他们应该更用心地问问信息来源,他们必须考虑到给他们出主意的专家的背景。
如果一个普通人真的愿意相信维生素C可以治疗癌症,那无论专家的研究背景和预测多么纯正,都不如一个放出药品图片的网站有影响力。如果一些资讯匮乏的民众真的相信入侵一个国家(或与邻国之间建一堵墙)会解决美国的问题,大批的专家文章对他们来说都无关紧要。普通人也必须为自己的知识——或无知——承担起更多的责任:我们没有借口说这个世界太复杂了,信息来源太纷繁了,然后痛心疾首地说政策都是把控在那些藐视公众观点的不知名专家手中。
公众还需要带着一定程度的怀疑精神和谦逊态度去对待专家意见。正如哲学家伯特兰·罗素在1928年的文章中所写,外行人在评估专家观点的时候,必须充分调动起自己的缜密逻辑:
我所倡导的怀疑精神包含这些内容:(1)当你同意专家的观点时,并不能就确定相反则不对;(2)当你不同意专家的观点时,一个非专家也不能就此断定哪个观点是对的;(3)当专家们都认为现有的背景知识还不足以给出一个正面的观点,普通人最好也暂时不要做出判断。
只知道专家就什么内容达成一致还不够。同样重要的是,要接受这个一致意见的局限性,不要去引出更多的结论,专家的观点只有这么大的支撑力度,超重就不行了。
另外,普通人还要接受一个事实:专家不是政策制定者。专家给国家领导人当顾问,他们的话语比普通人有影响力,但他们不是做出最终决策的人。在一个民主社会,即便是美国这样高度规范和制度化的国家,很少有专家是独立的决策者。只有政治人物,下至市议会,上至白宫,才对我们生活中最重要的决策——从毒品到威慑——有最终发言权。如果普通人拒绝认真履行自己的公民责任,也不去了解对自己来说重要的问题,民主将会变异成技术官僚制度。让普通人惶恐的专家统治将会变成现实。
普通人要运用专家的意见,要把专家放在合适的位置上——公仆,而不是主人,专家也要接受自己的局限性。如果人人都是专家,那民主便无法发挥作用。的确,专家有肆意膨胀的自负心理,认为即便他们忽视选民,也能管理好一个民主国家。可是,普通人也有一种无知愚昧的自恋心态,认为他们即便不听信知识水平更高、经验更丰富的专家意见,也能维护好一个庞大先进的国家。
如何找到平衡,并缓解当今社会专家和客户之间日益令人不安的抵触情绪,是下一章——最后一章的主题。
[1] Helen Thompson, “Teen Schools Professor on ‘No Irish Need Apply’ Signs,” Smithsonian.com, August 5, 2015.
[2] Geoffrey Norman, “Do I Dare to Eat an Egg,” The Weekly Standard online, march 16,2015.
[3] Peter Whoriskey, “The Science of Skipping Breakfast: How Government Nutritionists May Have Gotten It Wrong,” Washington Post online, August 10, 2015.
[4] Seweryn Bialer and Joan Afferica, “Reagan and Russia,” Foreign Affairs, Winter 19821983, 263.
[5] Stephen M. Meyer, “Testimony before the Senate Foreign Relations Committee,” in Theodore Karasik, ed., Russia and Eurasia Armed Forces Review Annual 15, 1991(Gulf Breeze, FL: Academic International Press, 1999,) 348.
[6] 克格勃,全称“苏联部长会议国家安全委员会”,简称КГБ,是1954年3月至1991年11月期间苏联的情报机构。——译者注
[7] Richard Ned Lebow and Thomas Risse Kappen, “Introduction,” in Richard Neb Lebow and Thomas Risse Kappen, eds., International Relations Theory and the End of the Cold War(New York: Columbia University Press, 1995).
[8] 这10个国家是美国、俄罗斯、英国、法国、中国、印度、巴基斯坦、朝鲜、以色列(未公开宣布)和南非(声明放弃)。当初制造核武器的南非种族隔离政府倒台的时候,南非就解除了核武器。
[9] W. Ian Lipkin, “Anti-Vaccination Lunacy Won’t Stop,” Wall Street Journal online, April 3,2016.
[10] 猎巫行动,原指搜捕女巫与巫师或施行巫术的证据将被指控的人带上宗教审判法庭。今日此类事件被视为一种道德恐慌及政治迫害。——译者注
[11] 见Richard Van Noorden,“Political Science’s Problem with Research Ethics,” Nature online, June 29, 2015; Brian C. Martinson, Melissa S. Anderson, and Raymond de Vries,“Scientists Behaving Badly,” Nature 43 (June 9, 2005): 737-738.
[12] Carl Zimmer, “A Sharp Rise in Retractions Prompts Calls for Reform,” New York Times online, April 16, 2012.
[13] Benedict Carey, “Many Psychology Findings Not as Strong as Claimed, Study Says,” NewYork Times online, August 27, 2015.
[14] Quoted in Rachel Gross, “Psychologists Call Out the Study That Called Out the Field of Psychology,” Slate.com, March 3, 2016.
[15] Daniel Engber, “Cancer Research Is Broken,” Slate.com, April 19, 2016.
[16] Garret Epps, “Genuine Christian Scholars Smack Down an Unruly Colleague,” Atlantic online, August 10, 2012.
[17] “Actresses’ Role in Farm Issue Stirs Criticism,” Los Angeles Times online archive, May 3,1985.
[18] Jessica Goldstein, “Is Gwyneth Paltrow Wrong about Everything? This scientist Thinks So,”ThinkProgress.com, April 21, 2016.
[19] Alexandra Petri, “Dr. Carson, This Is Not Brain Surgery,” Washington Post online,November 5, 2015.
[20] 这段描述引用自Paul Offit, “The Vitamin Myth: Why We Think We Need Supplements,”Atlantic online, July 19, 2013。
[21] Helen Caldicott, Missile Envy (New York: Bantam, 1985), 235: Helen Caldicott, If YouLove This Planet (New York: W.W. Norton, 1992), 156.
[22] 乔治·凯南,美国外交家和历史学家,普利策新闻奖获得者,遏制政策始创人。——译者注
[23] 还有一种说法在各路文章中流传:这么多年来,克里斯威尔有一个预测竟准得让人毛骨悚然。他在1963年3月清楚地告诉电视主持人杰克·帕尔,肯尼迪总统不会参加1964年的总统竞选,因为1963年11月他的身上将发生一件事。不过,这可能又是一个城市传说,至少在有人翻出旧录像带或屏幕录像(如果有的话)之前,都当不了真。
[24] Carl Bialik, “Most Pollsters Say Their Reputations Have Worsened,” FiveThirtyEight.com,December 28, 2015.
[25] 布伦特·斯考克罗夫特,美军出身,曾在共和党的福特政府和老布什政府担任负责国家安全事务的总统助理。——译者注
[26] Clive Thompson, “Can Game Theory Pridict When Iran Will Get the Bomb?” New YorkTimes Magazine online, August 12, 2009.
[27] Nassim Nicholas Taleb, The Black Swan (New York: Random House, 2010), xxiv-xxv.
[28] Philip E. Tetlock, Expert Political Judgment (Princeton, NJ: Princeton University Press,2005), 20.
[29] Tetlock, Expert Political Judgment, 20.
[30] James Surowiecki, The Wisdom of Crowds (New York: Anchor, 2005), 31.
[31] Tetlock, Expert Political Judgment, 21.
[32] 参见Tetlock, Expert Political Judgment, 101-103。
[33] 参见Tina Nguyen, “How Nate Silver Failed to Predict Trump,” Vanity Fair, February 1,2016.
[34] Noah Rothman, “Why They Think Trump Can Win in Nov?,” Commentary online, April 27, 2016.
[35] Tetlock,Expert Political Judgement,23.