随机分配与操纵共同定义了真实验研究
我们这里并不是说斯诺的方法毫无可取之处。但科学家的确喜欢更直接地操纵实验变量,因为直接操纵变量能产生更有力的推论。想想斯诺的两组被试,一组由兰姆博斯公司供水,另一组由南沃克-沃克斯霍尔公司供水。该社区供水系统的混合性,可能保证了两组被试的社会地位大致相同。但是,斯诺采用的这类实验设计的缺陷是:它是由被试决定自己属于哪一个组的(自我选择)。他们早在几年前就与两家自来水公司的其中一家签订了供水合同,从而完成了自我选择。我们还必须考虑为什么一些人与这家公司签约,而另外一些人与那家公司签约。是由于其中一家的价钱比较便宜,还是某家公司的广告宣称自己的水有疗效?我们不得而知。关键问题是,因为产品宣称的特性而选择该产品的人,在与健康相关的其他方面,是否也有所不同?对这一问题的回答是:有这种可能性。
诸如斯诺这样的实验设计无法排除那些更难以察觉的虚假相关,这类虚假相关不像与社会经济地位明显有关联的相关那样容易识别。这就是为什么科学家倾向于直接操纵他们感兴趣的变量。当操纵变量与一种叫作随机分配的程序(在随机分配中被试不能决定自己进入哪种实验条件,而是被随机分配到某一个实验组)相结合时,科学家就能够排除那些归因于被试本身特征的解释了。随机分配可以确保不同实验条件下的被试在所有变量上基本一致,随着样本量的增加,随机分配可以抵消一些偶然因素。这是因为被试的分配是由一个无偏随机化装置决定的,而不是个人的明确选择。请注意这里的随机分配与随机取样是不一样的,第7章将讨论两者的区别。
随机分配是一种将被试分配到实验组和控制组的方法,这样实验中的每个被试被分配到其中一组的概率相同。掷硬币就是一种决定被试分配到哪一组的手段。在实际实验时,最常用的是由电脑生成的随机数字表。通过使用随机分配,研究者试图在研究之前平衡两组的所有行为变量和生物学变量,甚至包括那些研究者没有进行专门测量或考虑到的变量。
随机分配的效果如何,取决于实验中被试的数量。正如你所料,被试越多越好。也就是说,分配到实验组和控制组的被试数量越多,在操纵自变量之前两组在所有的其他变量上就越匹配。使用随机分配可以确保在被试分组时没有产生系统偏差。这两组被试在所有变量上均会得到很好的匹配,但即使存在一定程度的不匹配,随机分配也消除了偏向实验组或控制组的可能性。如果我们把注意力放在“重复”这一概念——重复一个实验的所有关键特征,看能否得到相同的实验结果——或许更容易理解随机分配如何消除系统偏差这个问题。
设想一下,一个发展心理学家想要做一个实验,探讨丰富早期体验对学前儿童的影响。随机分配到实验组的儿童在学前日托期间参与心理学家设计的丰富活动,随机分配到控制组的儿童在同样的时间里只是参加一些传统的小组游戏活动。因变量是儿童入学一年后的学业成绩,看看实验组儿童的成绩是否优于控制组儿童。
像这样的实验就会用到随机分配,以确保在实验开始时,两组在所有可能影响因变量的无关变量上都基本保持一致。这些无关变量有时被称为干扰变量。这个实验中可能的干扰变量包括儿童的智力测验分数和他们的家庭环境。随机分配会使两组在这些变量上大致均等。但也有例外,尤其当被试人数很少时,两组仍然可能存在差异。例如,如果随机分配之后,实验组儿童的智力测验分数是105.6,控制组是101.9(尽管恰当地使用了随机分配,这类差异还是有可能出现),我们就会担心,实验组在学业成就上的优势是由于实验组儿童的智力测验分数高,而不是由于他们参加了丰富体验的活动。这里就能看出重复验证的重要性了。后续研究进行随机分配之后,两组仍然可能存在智商差异,但是随机分配程序避免了系统误差,从而确保这种差异不会总是偏向于实验组。事实上,无系统误差这一点所确保的是,在大量的类似研究中,智商差异偏向于实验组和控制组的概率是相等的。在第8章我们将讨论如何使用这个实验来形成聚合性的结论。
因此,随机分配程序有两个优点。第一,在任何一个实验中,样本量越大,随机分配越能确保两组在所有无关变量上相匹配。第二,即使在匹配不那么完美的实验中,由于随机分配不会产生系统误差,只要研究可以被重复,我们仍然可以得出令人信服的结论。这是因为,经过一系列这样的实验,两组间干扰变量造成的差异就会抵消。