操作主义者将概念和可观测事件联系在一起
那么,如果不是来自语言上的讨论,科学概念的含义又来自哪里呢?恰当使用某一科学概念的标准是什么?为了回答这些问题,我们必须讨论操作主义。它对于科学领域中的理论建构至关重要,尤其对评估心理学中的理论主张有重要作用。
尽管操作主义有多种形式,但是对于科学信息的消费者来说,从最广泛的角度去思考操作主义是最有效的。操作主义就是这样一种思想:科学理论的概念必须以某种方式建立在可观察事件的基础之上,或与之相关联,而这些可观察事件是可以被测量的。将某个概念与一个可观察事件相联系,会使这个概念公开化。操作性定义将这个概念从特定个体的感觉和直觉中分离出来,并允许任何能够实施可测量操作的人对其进行检验。
例如,把“饥饿”这个概念定义为“我胃里的啃咬感”就不是一个操作性定义,因为它与“啃咬感”这种个人体验相联系,因此不能被其他观察者感知到。相比之下,包含可测量的食物剥夺时间或一些生理指标(如血糖水平)的定义是操作性的,因为它们包含了任何人都可以进行的可观察的测量。同样,心理学家不能满足于将“焦虑”定义为“我有时会产生的不适感和紧张感”,而是必须通过调查问卷和生理指标测量等一系列操作来定义这个概念。前面那个定义仅限于个人对身体状况的解释,他人无法重复。后者将这一概念置于科学的公共领域。
重要的是要认识到,科学中的概念是由一组操作定义的,而不是由单个行为事件或任务定义的。相反,几个略有不同的任务和行为事件被用来聚合于一个概念上(在第8章我们将会更多地讨论聚合性操作)。例如,教育心理学家根据诸如“伍德库克阅读能力量表”[3]之类的标准化工具所测得的成绩来定义“阅读能力”这个概念。该量表包含一整套的任务,其阅读能力总分由几个分量表测得的能力指标组成。这些分量表测查的技能稍有不同,例如阅读一篇文章、想出一个合适的单词在文章中填空、写出一个词的同义词、独立拼读一个较难的词,等等。在所有这些任务上的表现共同定义了“阅读能力”这个概念。
操作性定义促使我们认真地、实证性地思考(根据对真实世界的观察)我们希望如何定义一个概念。试想我们要给一个看起来相当简单的概念“打字能力”下一个操作性定义,这么做是为了比较两种打字教学方法的优劣。思考一下你必须要做的所有决定。当然,你想要测量打字速度。但是要打多长的一段文章呢?只有100个词的文章可能太短,而10000个词的文章又似乎太长。那么到底多长才算好呢?打字速度要保持多久才能与我们对打字能力这一理论构念的最佳设想相匹配呢?用什么类型的文章来测试呢?它是否应该包含数字、公式和不常见的间距?我们如何处理错误?在测量打字能力时,时间和错误似乎都应被考虑在内,但究竟应该用什么公式将这两个指标结合起来呢?我们是赋予时间和错误相同的权重,还是一个比另一个更重要?寻求一个好的操作性定义会迫使你认真考虑所有这些方面;它会让你对如何将打字能力概念化进行非常透彻的思考。
我们要学会培养对操作性定义的细节进行深究的习惯。认知科学家丹·莱维丁[4]给我们举了一个倡议团体的例子,该组织声称:在10~18岁的学生中,70%的人是性活跃的。首先,10~18岁是一个很大的成熟度范围。而且,从数学的角度看,这么高的百分比意味着年仅10岁和11岁的青少年中肯定有相当比例的人是性活跃的。这让我们对“性活动”这一概念是如何被操作化定义的又多了几分好奇。要知道如何解释这一高比例,我们需要真正深入地探究宣传这一统计数据的团体究竟是如何定义“性活动”这个概念的——但对此我们将略而不谈,因为这不是一本限制级的书。
畅销书作家迈克尔·刘易斯在他的《思维的发现》(The Undoing Project)一书中描述了多年前,美国职业篮球联赛(NBA)的休斯敦火箭队如何试图开发比以往更好的方法来评估一名球员的表现。例如,他们不是仅仅计算一个球员拿到篮板球的数量,而是用篮板球数除以篮板球机会的数量(也就是说,他们测量的是成功抢到篮板球的比例)。他们从统计每场比赛的得分、抢断、篮板球等数据,转为以每分钟为基础来计算[5]。火箭队想做的实质上是开发出比以前更好、更精细的球员影响力操作性定义。他们的努力表明,更好的操作性定义通常更加具体。
最后,让我们考虑一下美国食品药品监督管理局(FDA)所面临的任务,它必须决定对于各种食品来说,什么是“不可接受”水平的污染,而非“不可避免的缺陷”[6]。像FDA这样的联邦机构不能主观地对待这些事情。它需要对其检查的每种食物中的污染物作出判断,而这些判断需要严格的操作性定义。因此,举例来说,它提出了如下的操作性定义[7]:番茄汁中“不可接受”的污染水平是每100克有10个以上的苍蝇卵;蘑菇中“不可接受”的污染水平是每100克有5个或更多2毫米或更长的蛆虫。令人作呕,但值得称赞的是可操作!