社会学习

字数:5665

早期的学习理论主要在实验室以非人类的动物为研究对象。例如，巴甫洛夫、华生和斯金纳的研究就基于对动物的艰苦细致的观察和实验。在这些实验中获得的学习理论原则被推广到各种各样的人类行为研究中。在许多情况下，这是一个有效的程序。很少有心理学家会对强化概念是当今心理学建构的最好原则之一而横加质疑。

但是，心理学家也建议，由于所有的人类行为都是习得的，也可以利用获得行为的原则（即学习）来改变行为，这样就衍生了大量的行为治疗或行为改变技术。利用学习理论

的原则建立改变或维持目标行为的情景，就会在治疗上大获全胜！这种简单且容易操作的

程序和方法对许多医生和刑事司法体系的专家尤其有吸引力，可保证犯罪行为矫正一揽子计划很快在各种各样的矫正机构中普及，包括收容未成年人的机构。病人、囚犯（和未成年人）会因好的行为受到奖励，比如可以抽烟、去小卖部购物或额外的淋浴权利等。如前所述，奖励物品有时其实是最基本的生活必需品，如一条毛巾或可睡觉的床垫。但当我们在处理人类复杂的行为时，过度简单是很危险的。人类的确会对强化和惩罚做出响应，基于学习原则的行为治疗可以改变行为的某些因素。而且，人类可以有经典条件学习方式，但是人类在敏感性上仍存在着个体差异。当我们忽视人的差异因素，而过度重视环境或外界对行为的决定因素时，可能就会忽略一个极重要的层面—人类在很大程度上是问题的积极解决者，能够观察、编码、解释和基于环境所提供的材料做出决策。因此，内部因素和外部因素在人类行为中的作用都很重要，这是社会学习理论的本质。社会学习理论认为，为了更好地理解犯罪行为，我们必须仔细研究人的观念、思想、期望、素质和价值观。每个人都有他对这个世界的理解，而且会以那种理解而生活。

为了解释人类行为，社会学习理论家非常重视认知过程，认知过程是我们通常称为思考和回忆的内部过程。经典条件反射和操作条件反射都忽视了有机体在感受刺激的时间和对刺激做出反应的时间差内发生了什么，“如果我们只要利用可观察的行为就可以解释事实真相，为什么还要担忧内部心理过程错综复杂呢？”社会行为主义者质疑说，反射学习的观点对人类行为提供的是一幅不完整的画面。

社会学习这一术语反映了该理论强有力的假设：我们主要是通过观察周围的人怎么做和倾听周围的人怎么说来学习的，周围的人即社会环境。实际上，社会学习理论家认为，社会环境对大多数人的行为获得是最重要的因素。人类基本上是社会的生物。当然，这些理论家更认同强化是维持人类行为的必要因素。例如，犯罪行为也许最初是通过接触和观察获得的，但它是否能够维持下去，将取决于强化（操作条件反射）。举个例子，如果一个男孩看到了他崇拜的某个人（即偶像）从当地的运动品商店偷东西，那么这个男孩就可能也尝试去偷点东西。然而，他是否会继续偷窃取决于个人强化或他赋予偷窃行为的价值。如果没有发生强化（他没能偷出棒球，因为有人走进了商店；或者他发现他偷的运动短裤不合身），那么偷窃行为很可能会退出其反应库（消退）。如果行为带来了令人厌恶的结果（遭到了惩罚），这更会禁止或压制他未来的相似行为，但这种压制和禁止不可能持续很久。

很多心理学家都归属于社会学习理论流派。另外，社会学学科也有自己的社会学习流派。我们将首先关注两个代表人物的作品，他们是心理学家朱利安·罗特（Julian Rotter）

第四章·犯罪行为溯源：学习和情境因素

93 和艾伯特·班杜拉（Albert Bandura），他们是以社会学习理论视角对犯罪行为的研究贡献

最大的两位学者。期望理论

朱利安·罗特（Julian Rotter）以把人的注意力吸引到对行为结果的期望（认知）的重要性上而闻名，包括从中得到的强化。换言之，在做任何事情之前，我们都会问：“我以前在这种情形中会怎么做？这次我再这样做又能获得什么？”按照罗特的观点，一个具体的行为是否会发生取决于我们的预期和我们对结果的看重程度。为了预测某人是否会以某种方式行事，我们一定要评估其预期和其对行为获得奖赏的看重程度。人们通常会有一种“类化预期（generalized expectancy）”现象，即在类似或相近的处境中有稳定的一贯性表现（Mischel，1976）。因此，期望理论认为，人的表现水平基于其对以特别方式行事所能获得的结果的预期。

人们带着对行为结果的类化预期进入某种情境是研究犯罪的一个重要假设。把罗特的理论运用于犯罪行为，当人们参与违法行为时，他们期望获得地位、权力、安全、情感、物质利益或生活条件的改善。例如，暴力犯罪人可能因为能获得某种利益才选择以那种方式行事：系列杀人犯也许认为杀死所有“放荡”的女人是上帝给他的使命，只有这样做他才能取悦上帝；对自己孩子进行身体虐待的父亲可能会认为孩子应该服从他的意志或者学会敬畏大人：对家暴丈夫投毒的妇女是想改变自己的生活遭遇。仅仅给暴力的人贴上“冲动”“疯狂”“缺乏自我控制力”等简单的标签，无法囊括行为的其他基本因素。尽管自我调节和道德发展人人都有，从事违法行为的人在审时度势之后还是选择了他们自认为的在那种情形下最有效的行为方式。通常，人们从事暴力行为是因为那种方法在过去成功过（至少他们认为是成功的）。也有少数情况是，只是观察到某人通过使用暴力手段获利，就开始效仿。这就是我们在下面要讲的班杜拉的社会学习理论的榜样示范作用。

社会学习中的模仿

一个人仅仅通过观察他人就可能学到行事方式，并不需要直接的强化。班杜拉（1973b）在社会学习理论中介绍了这种观点，他称之为观察学习或榜样作用。榜样是指那些标志性的人物，他们为大家提供了在某种社会环境下该如何做事的示范。如，一个小孩也许会通过模仿影视演员而学会如何开枪，然后通过玩玩具枪来反复演练和调整，形成自己的行为模式。如果其同伴也玩枪，这种行为就很可能被维持下来，而且彼此影响、互相强化。即便儿童没有扣动过真枪的扳机，但他们通过观察别人，对用枪杀人有了近距离的接触和认识。这也就是美国几乎每个成年人或大孩子都知道如何开枪的原因，即使他们从来没有真正地“瞄准，然后扣动扳机”。当然，射击要达到安全和精准的程度就复杂多了，但通过模仿学习（也称榜样作用或观察学习）已经获得了基本的射击知识。这样，行为模式就存在于我们的行为库中，即使我们的行为从未得到过直接强化。

按照班杜拉的观点，榜样在模仿者心目中的地位越高就越受尊敬，他们对模仿者的影响就越大。相关的榜样包括父母、老师、兄弟姐妹和朋友伙伴，也包括文学人物、影视明星等象征性榜样。摇滚明星和运动名将都会被许多青春期少年效仿，这也是这些公众人物会出现在推销智能手机、品牌内衣、减肥计划和反抵押贷款等广告中的原因之一。这些知

名人物也会出现在公益广告中，如进行禁毒宣传，或告诉观众家暴行为并不是恰当的行为。

有趣的是，有些公益广告经常抓不住问题的关键。在观察学习中，榜样的所言远没有他的所为有效。对于公众人物参与或被指控参与家庭暴力、虐待动物、药物滥用、强奸、攻击、逃税、非法赌博的公开报道，会给旁观者这样的错觉—这些行为是符合规范的行为，这些报道会抵消由公益广告推广的关于公众人物的任何积极信息。

如果观察者看到榜样们收益丰厚（如不仅名望大增，每年还有数百万美元进账），就更有可能模仿观察到的榜样行为了。如果榜样的行为遭到了惩罚，他的行为就不太可能被模仿。因此，按照社会学习理论的原则，如果娱乐明星和运动明星因犯下上述罪行而被定罪处罚，就会警醒世人，他们的行为也不会被模仿。相反，如果他们得到的惩罚很少或服刑期很短，而且还就其经历写了一本畅销书，或者最终竟然获得了一份报酬丰厚的职业运动员签约协议，观察者就不会认为这是一种惩罚了。班杜拉与罗特一样，都认为某人一旦决定实施新学来的行为，是否实施或是否维持该行为就取决于当时的情境和对潜在收益的预期。这种潜在收益可能来自外部（他人的赞扬、经济获益），也可能来自内部（自我实现和自我强化）。

班杜拉的早期研究大多指出，攻击行为和暴力行为是通过榜样学来的。因此，我们将在第五章中再回顾该理论。在这点上，大量的实证研究结果为他的理论提供了强有力的

支持。在一个经典研究中，学前儿童观看了一部成年人袭击充气塑胶娃娃的电影，随后就出现明显的模仿行为；而对照组的儿童观看的是服从或接受类的影片，其行为就明显不同

（Bandura＆Huston，1961：Bandura，Ross＆Ross，1963）。许多研究者采用了不同样本进行同一程序的研究，也得出了相似的结论，由此印证了这样的假设：不管是成年人还是儿童，观察攻击行为均会导致他们的敌意（Walters＆Grusec，1977）。该研究已经扩展到媒体暴力和暴力电子游戏对行为的影响上（Dodge＆Pettit，2003）。尽管这些领域的研究结论还不能令人完全信服，但越来越多的证据表明，观察者不仅会在行为上模仿被观察者的暴力行为，而且在整体上会变得更具敌意、更富攻击性（Anderson＆Prot，2011；Bryant＆Zillmann,2002;Huesmann,Moise-Titus,Podolski,& Eron,2003)。

正如班杜拉与罗特所探讨的，社会学习在某种程度上给斯金纳的观点赋予了人性的内容，因为它为理解人脑中发生的事情（尤其是其中的认知过程）提供了线索。它把我们的注意力吸引到行为的认知方面，而经典条件反射和操作条件反射仅仅关注环境。社会学习理论的学者们在社会意义上使用环境，环境不仅包括外部环境，而且涵盖内部环境。斯金纳派的学者们则更愿意把相关刺激限定在外部环境中。

不同接触强化理论

罗纳德·埃克斯（Ronald Akers，1977,1985；Burgess＆Akers，1966）提出了违法行为的社会学习理论，试图整合斯金纳的行为主义理论、班杜拉的社会学习理论、犯罪学家埃德温·H．萨瑟兰（Edwin．H．Sutherland，1947）的不同接触理论。埃克斯把他的理论称作不同接触强化（DAR）理论。简言之，该理论指出人们是通过社会环境中的人际互动而学会了违法行为的。

为更好地理解不同接触强化理论，我们必须首先了解萨瑟兰的不同接触理论的精髓，这一理论在犯罪社会学领域独领风骚40余年。该理论在萨瑟兰的《犯罪学原理》（第三版，Principles of Criminology，1939）中首次被提及，1947年被再次论述。尽管萨瑟兰在1950年仙逝，但该理论在唐纳德·R.克雷西（Donald R.Cressey）之后对原版本的修订本中完整地

第四章·犯罪行为溯源：学习和情境因素

95 保存了下来（Sutherland＆Cressey，1978；Sutherland，Cressey，＆ Luckenbill，1992）。

社会学家萨瑟兰认为，犯罪行为或违法行为与所有其他行为的学习过程是一样的。关键因素是与谁交往、交往的时间长短、交往的频率、交往对于个人的重要程度以及交往在个人发展中发生的时间早晚等。按照萨瑟兰的观点，在我们的亲密个人群体中，我们学会了对违法的界定，理解了规范的意义（信息和价值），了解了人们对违法行为持支持或反对的态度。一个人之所以变成未成年违法犯罪者或成年犯罪人，是因为“其内心支持违法行为的声音远远盖住了反对违法的声音，这是不同接触理论的原则”（Sutherland ＆Cressey，1974,pp.80-81)。

但值得注意的是，犯罪行为并非总是由与“坏伙伴”或犯罪分子接触而产生，关键因素不是接触本身，在接触中传递的信息才是。而且，从“坏伙伴”那里得到的违法的信息和价值观必须远远超过传统合法的信息和价值观，才能使人受到违法犯罪行为的影响。所以，萨瑟兰认为，即使与犯罪团伙接触得很少，也会发展出犯罪行为。例如，在守法人群中—像父母—若是隐晦地或直接在孩子面前表现出“欺骗不是问题”，或者传递了一种“每一个人基本上都有过不诚实”的信息，那么其孩子即使不与违法的人接触，也会发展出犯罪行为，这是极为重要的一点，在本章稍后对道德脱离的探讨中，将重申父母的道德价值观对孩子的影响。尽管如此，现代的不同接触理论强调的是与违法朋辈或群体的接触对违法行为有重大影响（Williams＆McShane，2004）。不过尚不清楚的是，是犯罪行为发生在前，还是不良接触发生在前（Williams＆McShane，2004）。

萨瑟兰的理论很受社会科学领域的学者们青睐，其原因正如前段时间有位作者所写：“该理论试图构建一个逻辑严密、系统形成的人际关系链条，使得犯罪行为和普通的、习得的行为一样合乎情理和容易理解，而不必求助于生物学或心理学对于违法的假设”［Vold，Theoretical Criminology（New York：Oxford University Press，1958），p．192］。然而，该理论也是有歧义的（如怎么测量和评估一个人的交往），正因为这一特点，它起初并没有吸引更多的实证研究（见Gibbons，1977，pp．221-228）。同时，正如萨瑟兰和克雷西（Sutherland＆ Cressey，1974）所承认的，该理论并没有具体指出何种学习（如操作条件反射、经典条件反射、榜样作用等）是重要的，它也没有充分考虑学习过程中的个体差异。但是，在一些社会学家眼中，不同接触理论依旧有其魅力，依然能够吸引他们对该领域的研究兴趣（Hunt，2010;Williams&McShane,2004)。

埃克斯（Akers，1985）试图借用斯金纳的理论和社会学习理论原则对不同接触理论进行重新整合，以纠正和弥补其存在的问题和缺陷。他认为，大多数违法行为是按照斯金纳的操作条件反射理论的原则习得的，而经典条件反射理论的作用次之。而且，违法行为的强度则是个体过去实施该违法行为时得到的强化数量、频率和概率三者的直接函数。斯金纳理论中的强化术语既可以是正强化也可以是负强化。

在埃克斯的观点中，最关键的是他界定了社会强化和非社会强化在违法行为的形成中的作用。在二者之中，社会强化是最重要的。“大多数与违法行为相关的学习是社会互动或社会交换的结果，在社会互动或社会交换中，他人的言语、反应、仪态和行为使得强化成为可能，并为强化提供了环境”（Akers，1985，p．45）。尤其值得注意的是，大多数社会强化是通过参与群体活动、群体认同标准和符合群体期望的象征性奖励和口头奖励完成的，例如，做事若符合群体标准或亚文化标准，则给予“好样的”“干得好”之类的溢美之词，或者

将拍打一下他的后背、击掌相庆或送上一个灿烂友好的笑脸等作为强化。非社会强化主要

指的是生理学因素或物质满足因素，这可能与一些犯罪（如毒品犯罪或盗窃犯罪）有关。

违法行为和反社会行为最可能源于他人的社会强化结果，尤其是同辈群体。这些同辈群体自有一套标准化限定，对行为的好坏、对错、公平或非公平有着一套规矩。这种规矩会被群体成员内化，然后对什么是合适的行为、什么行为最有可能被群体认同做出指导。在此意义上，标准化限定的操作就像辨别性刺激—在亚文化群体或同辈群体中相互传递的一种社会信号—可预示某种行为在特定的背景下会被奖赏还是被惩罚。

按照埃克斯的观点，有两类辨别性刺激在促成违法行为方面发挥着作用。首先，积极的辨别性刺激是某种行为被亚群体支持和赞扬的信号（包括口头的和非口头的）。遵循正强化原则，这并不奇怪：积极参与的个体可从群体的支持中得到社会强化。第二种社会信号也被称作中性化的辨别性刺激或合理化的辨别性刺激，即对社会整体警告的某种不当或非法的行为进行中性化解释。按照埃克斯的理论，中性化或合理化的辨别性刺激是将“他人会谴责、本人起初也认为属于坏行为的行为解释为也算正确、正当、甚至可原谅、必需的行为，是两害相权取其轻的行为，或者归根结底称不上是真正的违法行为”（Akers，1977，p．521）。“每个人都要付出代价”“我控制不了自己”“每个人都在做”或“她罪有应得”等，这些解释都是将负面刺激转换为中性刺激的最真实的写照。

人们越是把自己的行为界定为积极的或至少是中性的或正当的，他们就越可能从事这些行为。如果违法行为（主流社会的界定）比守法行为（同样是主流社会的界定）得到了更多的强化，而且它能够被解释出合理性，违法行为就很可能被维持下来。实质上，我们的行为由我们内化的标准指导，而且期望通过各种来自他人的社会信号予以强化。

埃克斯认同班杜拉提出的榜样作用，视其为最初获得违法行为的必要因素。但违法行为的持续性将取决于大量的发生频率和对个人有影响的社会强化作用，即在与他人的交往中得到的强化。

埃克斯的社会学习理论也遭到了外界的批评。一些学者认为，它是一种循环论证，很

难理清：行为出现是因为它得到了强化，但其得到强化也是因为出现了这种行为。科恩豪泽（Kornhauser，1978）认为，没有实证研究可以支持该理论。在1980—1990年，埃克斯本人及其研究同人发表了一些研究支持其理论，尤其是毒品滥用方面的研究（如Akers＆Cochran，1985；Akers ＆ Lee，1996； Krohn，Akers，Radosevich，＆ Lanza-Kadue，1982）。如同萨瑟兰（Sutherland）的不同接触理论，埃克斯的理论在犯罪社会学界享誉甚高（Chappell&Piquero,2004)。

行为主义挫折导致的犯罪