第三变量问题

字数:952

导致另外两个变量之间产生误导性关联的第三变量,有时很容易看出来。如果我告诉你,一年365天里,在美国的所有海滩度假区,冰淇淋的销售数量与溺水人数之间存在相关。冰淇淋卖得越多,溺水人数越多。在这里很容易看出,相关的产生并不是因为人们的胃里塞满了冰淇淋,而这让他们下水后发生溺水。相反,是第三变量即气温使两个变量发生关联。在炎热的日子里,吃冰淇淋的人很多,游泳的人也很多,而游泳的人越多,溺水的人也就越多。

相关证据的局限性并不总是像冰淇淋和烤箱的例子这么容易识别。当因果关系在我们看来显而易见时,当我们带着强烈的预设偏见或者当我们的理论取向支配了我们对现象的解释时,相关很容易被视为因果关系的证据。

20世纪初,美国南部有数以千计的人罹患并死于一种叫作糙皮病的疾病。糙皮病被认为是由一种“不明来源的”微生物引起的传染性疾病,主要症状是头晕、嗜睡、脓疮、呕吐和严重腹泻。当时有证据表明这种疾病与卫生条件有关。毫不意外,这样的证据给许多美国糙皮病研究学会的医生留下了深刻的印象。在南卡罗来纳州斯帕坦堡,没有糙皮病的家庭似乎都有自来水管道和良好的排水系统。相反,糙皮病患者家中的排水系统都比较差。这种相关与这样的观点恰好吻合:由于糟糕的卫生条件,传染性疾病通过糙皮病患者的排泄物传播开来。

约瑟夫·戈德伯格(Joseph Goldberger)医生对这种解释表示怀疑,他在美国卫生局局长的指示下对糙皮病开展了许多研究。他认为糙皮病是由不良饮食引起的。许多患者赖以生存的是碳水化合物含量高、蛋白质含量极低的饮食,其特点是玉米、玉米粉和玉米糊很多,而肉类、蛋类、牛奶很少。戈德伯格认为,污水处理条件和糙皮病之间的相关在哪个方向上都无法反映因果关系(和“烤箱-避孕”的例子一样)。他认为之所以会出现相关,是因为拥有卫生管道的家庭通常经济条件也好,经济上的差异反映在他们的饮食上,其食物中含有更多的动物蛋白。

但是,请等一下!为什么戈德伯格的因果推论就一定是对的呢?毕竟,两派人马都只是坐在那里,根据相关性数据推论糙皮病的原因。戈德伯格用的是糙皮病与饮食之间的相关,其他医生用的是糙皮病与卫生条件之间的相关。为什么医学会的医生们不能说戈德伯格的相关同样也具有误导性呢?为什么戈德伯格能够合理地推翻由于污水处理不当导致传染性微生物随患者粪便传播的假设呢?戈德伯格的理由之所以成立还与我刚才没说的一个细节有关:戈德伯格吃下了糙皮病患者的排泄物。

【看书累了吗?休息一会!更多新书关注(微信:xueba987)粟渺学社:为终身学习者赋能 2020年10月】

为什么戈德伯格的证据更好


第5章 相关和因果:用“烤箱法”避孕为什么戈德伯格的证据更好