第1章 你好,读者们
我热爱技术。小的时候,我的父母给我买了一套金属模型玩具。我用穿孔的小金属片搭建了一个(对我而言)相当巨大的机器人。这个机器人由微型电池供电的电动机驱动。当时的我想象力特别丰富,我自顾自地认为,一旦搭建好这个机器人,它就能像我一样轻松地在房子里走来走去,这样的话,我就能拥有一个机器人新朋友。我会教这个机器人跳舞,让它跟着我在房子里转悠。它还能跟我玩捡东西的游戏(这连我的宠物狗都不会呢)。
我花了好几个小时,待在家中二楼走廊的红色羊毛地毯上,一边做白日梦,一边组装机器人。我用玩具套装里小小的儿童扳手拧紧了几十个螺母和螺栓。当我准备插入电动机时,最激动人心的时刻到来了。我和妈妈专程去商店购买了与电动机适配的电池。回到家,我迫不及待地跑上楼去,将裸线连接到齿轮上,接着启动机器人。我感觉自己就像莱特兄弟一样,造出了划时代的机器,满怀着它即将改变世界的无限憧憬。
没有任何动静。
我检查了线路,按了几次开关。我重新安上电池,依然没有动静。机器人没有运行,我不得不去求助妈妈。
“妈,快上来帮帮我!机器人运行不起来呀!”我悲伤地说。“你试过重新打开开关吗?”妈妈问。“我试过了。”我说。
“你试过重新安一下电池吗?”她问。“试过了。”我沮丧地说。
她说:“我来看看。”我握住她的手,把她拉到楼上。她摆弄了一下机器人,整理了电线,又打开和关闭几次开关。最后,她无奈地说:“应该是坏了。”
“为什么会坏?”我问。她本可以直接告诉我电动机坏了,但妈妈希望能给我一个“完整的解释”。她告诉我,电动机损坏了,紧接着向我解释了全球供应链和装配线,并提醒我,我也见过工厂的运作方式——因为我喜欢看《芝麻街》这个电视节目,里面有巨大的工业流水线批量制造蜡笔的场景。
妈妈解释说:“制造东西的过程中随时可能出现纰漏。肯定是他们制造这台电动机时出了点问题,没检测出来,最终封装在了玩具套件中。没事,咱们重新跟他们要一个能用的电动机就行了。”我和妈妈按照说明书上的提示拨打了售后电话,玩具公司的好心人给我们寄了一个新电动机。大约一周之后,新的电动机到了,我插上电源,机器人终于运行起来了。不过,虽然机器人运行正常,但和我预想的相差太远。它只能在木地板上缓慢移动,在地毯上会卡住。这样的机器人没办法成为我的新朋友。几天后,我把机器人拆了,制作了套件中的另一个玩具——摩天轮。
在搭建这个机器人的过程中,我学到了几样东西。我学会了使用工具来摆弄新技术,而且摆弄技术的过程很好玩。我发现我的想象力非常丰富,但是技术上的限制导致我的想象往往无法达成。我还学会了如何拆解零件。
几年后,当我开始编写计算机程序时,我发现早年从搭建机器人中收获的经验,可以很好地运用在计算机代码领域。我能设想极其复杂的计算机程序,但计算机实际可以实现的往往令我失望。我遇到过很多意外状况,有时候程序无法运行,只是因为计算机内部的某个部分发生了故障。但我坚持不懈,仍然热衷于构建和利用技术。我有大量社交媒体账号。我曾经做过一个烹饪项目,改造了一个炖锅,制作出一个能够加热25磅[1]巧克力的装置。我甚至设计过一个计算机系统,专门用来自动给我的花园浇水。
不过,最近一段时间,我对技术将拯救世界这一说法持怀疑态度。长大以后,我时不时听到别人谈论技术的美好前景,说技术可以如何改变世界,让世界更美好云云。1991年9月,我开始在哈佛大学学习计算机科学。就在几个月前,蒂姆·伯纳斯——李在欧洲核子研究组织(CERN)的粒子物理实验室创办了世界上第一个网站。大二那年,我的室友买了一台NeXT电脑。这台黑色方形电脑跟伯纳斯——李在欧洲核子研究组织用作网络服务器的电脑是同一款,挺好玩的。这个室友在我们的宿舍里安装了高速网络,我们就用他那台价值5 000美元的电脑查阅电子邮件。另外一个室友当时刚出柜,由于波士顿的同志酒吧对他那个年纪的小青年来讲有点过火了,他就用这台电脑上网逛在线公告栏,结识男孩子。那时候,要说未来人们会在网络上处理所有的事情,是很可信的。
在我们那个年代,年轻的理想主义者很轻易相信的另一件事,是我们在网络上建立的世界要比现实世界更美好、更公正。20世纪60年代,我们父母那一代年轻人相信,他们辍学或者群居在嬉皮士公社,就可以让世界更美好。我们看着这代人渐渐“改邪归正”——群居公社显然不是解决之道。如今,轮到我们上场了,“赛博空间”这一全新的未知领域就是我们用以让世界更美好的东西。我提起这两个时代的关联,不仅仅是一种隐喻。弗雷德·特纳在《数字乌托邦:从反主流文化到赛博文化》一书中曾提过,当时互联网文化的兴起深受20世纪60年代新公社主义运动的巨大影响。[2]《全球概览》(Whole Earth Catalog)杂志的创始人斯图尔特·布兰德在1995年《时代》周刊的一期特刊《欢迎来到赛博空间》中发表过一篇题为《一切都归功于嬉皮士》的文章,列出了反主流文化和个人计算机革命之间的种种联系。[3]早期的互联网是那么活色生香。
到了大三,我学会了制作网页,搭建网络服务器,还能用六种不同的编程语言写代码。对一个主修数学、计算机科学或者工程学的本科生来讲,这点能力再普通不过了。但是,对一名女性来讲就不是了。在这所拥有两万名研究生和本科生的大学里,我是主修计算机科学的六名女生之一。不过,在计算机系,我只认识两个女生,其余三个女生也不知是真的存在还是谣言。我常感到孤立无援,学校里那种死啃教科书的教学方式让本就占少数的女性愈加容易放弃STEM(科学、技术、工程和数学)职业。我可以看到这个体制内部正发生的问题,无论是对我还是对其他女性来说都是如此,但我无力解决。后来,我转到了别的专业。
毕业之后,我成为一名计算机科学家。我的工作内容是制作一个模拟器。做这个模拟器,就好比让100万只蜜蜂提着机关枪同时发动攻击。把这些“蜜蜂”部署好,就能测试出软件在发布之后能不能抵挡得住这样的攻击强度。这份工作很不错,但我并不快乐。我再一次感到孤独,我周围看起来没有同类,没有人像我一样说话,也没有人和我兴趣一致。于是,我辞职,去做了记者。
几年之后,我以一名数据记者的身份回到了计算机科学界。数据新闻学是一门在数据中挖掘故事,用数据来讲述故事的学科。身为数据记者,我写代码是为了从事调查性新闻工作。我也是一名教授,这样的定位很适合我。这样一来,在我的工作中,性别均衡状况也较以往更好了。
记者被教导要始终存疑。我们当中有这么一句话:“哪怕你母亲说她爱你,你也要去确认一下。”这么多年以来,我听过许多人反复说着一些关于技术光明前景的话,却看到数字世界在复制着现实世界中的不平等。比如,女性与少数族裔占技术人才的比例从未显著上升。互联网成为新的公共领域,但朋友和同事们报告说,他们在网上受到的骚扰比以往任何时候都多。我的女性朋友们会在线上交友网站和使用App时收到强奸威胁和淫秽图片。杠精和垃圾账号把推特搞得乌烟瘴气。
于是,我开始对那些看好技术文化前景的说法存疑。我逐渐发现,人们谈论数字技术时对技术的看法,跟数字技术实际上能做到的事情并不同步。其实,我们使用计算机所做的每一件事情归根结底都是数学。我们能利用技术干什么、该干什么,有一些基本的限制。我认为,我们已经达到了极限。在美国,人们太过热衷于使用技术来处理所有的事务——招聘、驾驶、付账、选择约会对象等等,不一而足。这原本没有什么不好,但正因如此,人们反而把标准放低了,不再对新兴的技术有高要求。
我们这种将计算机技术应用到生活方方面面的集体热情,催生了大量粗制滥造的技术。这种粗劣的技术并未如人们所愿改善生活,反而给人们的日常生活造成了阻碍。如今,诸如查找新朋友的电话号码或最新的电邮地址之类的小事变得非常耗时,因为人们将通信录的记录工作交给了计算机,并且解雇了所有原本负责更新通信录的人。如今,再没有人负责检查并确保机构目录中那些联系信息的准确性,因此要与人取得联系比以往任何时候都要困难。作为一名记者,在工作中,我通常需要联系很多不认识的人。这在今天变得非常困难,也比以往昂贵。
俗话说,当你只有一把锤子时,所有东西看起来都像钉子。电脑就是我们手中的锤子,是时候停手了。不要蒙上眼睛一头冲向数字化的未来。对于何时使用技术、为何使用技术,是时候做出更好、更深思熟虑的决定了。
本书正是由此而来。
本书将指导读者理解使用技术的边界。理解技术的边界,其实就是理解人类的成就与人性交叉的前沿。那个前沿更像是一个悬崖,再往前走一步,就十分危险。
世界上了不起的技术应有尽有,有互联网搜索,有能够识别语音指令的设备,还有能和人类比赛下围棋、玩问答游戏的计算机。我们大可以为这些成就而自得,但最好不要忘乎所以。别以为有了出色的技术,就可以为所欲为。我在大学课堂上教的基本的知识点之一,就是运用技术要遵从一些基本限制。我们知道,运用数学和科学知识来做事情都是有基本限制的。其实,技术也不外如是,如何运用技术也应该有所限制。倘若只用计算技术的眼光看待世界,或仅利用技术来解决重大社会问题,我们往往会犯一系列可预见的错误,阻碍人类的进步,加剧社会的不平等。本书主要探讨人类运用技术应有的边界和外部限制。理解这些基本限制,能帮我们更好地做决策,而且有助于我们站在社会的立场上进行集体对话,讨论我们能用技术做什么,以及我们应该如何做才能让世界真正变得对所有人来说都更美好。
我将以记者的身份参加这场关于社会公平的集体对话。我从事的专业是数据新闻学,也叫作“计算新闻学”(computational jour nalism)或“算法问责报道”(algorithmic accountability reporting)。所谓算法,是得出某个结果的计算程序,它好比食谱,是某种菜式的烹饪方法。有的算法会越来越多地被用于替人们做决策。有时候,我们需要编写代码来研究这些算法是否妥当。其他时候,我们得盯着那些粗劣的技术或错漏的数据,并随时发出警告。
我在本书中想要发出的一个警告是针对一种错误的假设,我称之为“技术沙文主义”(technochauvinism)。它认为技术是所有问题的解决方案。数字技术自20世纪50年代以来一直是科学界和政治界中一个非常普通的组成部分,在80年代进入了人们的日常生活。尽管如此,如今市面上各种复杂的营销活动还是让大部分人相信,技术仍是新事物,仍具有潜在的革命性。(其实,科技革命早已发生,如今技术就如同家常便饭一样普通。)
技术沙文主义者脑中常常伴随着其他一些类似的观念。他们通常也信奉安·兰德式精英主义、技术自由意志主义政治哲学之类的观念。他们赞美言论自由,却对网络骚扰问题视而不见,他们认为计算机可以将所有问题都提炼成数学问题,因此比人类更“客观”或“公正”。他们甚至有一种坚定不移的信念,认为人类只要更多地使用计算机,并且妥善地使用它们,社会问题就会消失,还能创造出一个数字化的乌托邦。而事实绝非如此。从来不曾有过一项新技术能够让我们远离与人类本性相关的根本问题,将来也不可能会出现。既然如此,为什么人们还坚持相信,我们的前方有一个充满阳光的技术时代?
我当初是怎么开始思考起技术沙文主义这件事的呢?有一天,我和一位20多岁的朋友闲聊。他是一名数据科学家。谈话间,我提到费城的学校里课本短缺的事情。
“那为什么不直接使用笔记本电脑或iPad呢?改用电子版教材不就好了吗?”我的朋友问,“高新技术不是已经把所有事情都变得更快速、更便宜、更美好了吗?”
我把他训了一顿(在后面的章节中,你也会被我唠叨)。但是,他说的话始终萦绕在我的心头。他认为技术就是解决一切的答案,而我认为技术只有在能解决特定问题时才是正确答案。
不知何故,在过去的20年中,许多人开始认为,计算机总是做得对,而人类总是出错。我们开始提出诸如“计算机比人类更好,因为它们比人类更加客观”之类的说法。计算机变得越来越普遍,在我们生活的方方面面无孔不入。有时候哪怕机器出了问题,我们都会以为是自己的问题,而不会认定是那些计算机程序中成千上万行的代码出了问题。实际上,任何一名软件开发者都会告诉你,有问题通常都是机器的问题。可能是机器设计得太粗劣或未经严格测试,或者是使用了廉价的硬件,或者机器对实际用户如何使用系统有很深的误解。
如果你的观点跟我那位数据科学家朋友有相似之处,那你可能会对我的观点持怀疑态度。也许你很爱玩手机,也许你总是听别人说计算机是未来的趋势。我知道,我也经常听说。但我所希望的是,在我讲人们创造技术的故事时,你能听得进去,并且能以这些故事为基础,对我们拥有的技术和创造技术的人进行批判性的思考。本书并不是技术手册,也并非教科书,而只是一本有目的的故事集。有一些是我自己经历过的编程故事,每一次经历都是为了理解技术的基本原理和当代的高科技。而这些项目会串成一个链条,为反对技术沙文主义建立了一个论据。在这个过程中,我将解释计算机的技术原理,并且解构计算机技术所服务的人类系统。
本书的前四章讲述计算机的若干基本原理以及计算机程序的构造方式。如果你已经对硬件和软件的合作原理了如指掌,或者说你已经会写代码了,那么关于计算的第1~3章对你来说也就不在话下,你可以翻到关于数据的第4章。前4章非常重要,因为所有的人工智能都建立在同样的基础上,包括代码、数据、二进制和电脉冲。关于人工智能,首先要知道什么是真实的,什么是虚构的。超级人工智能,就像影视作品《疑犯追踪》和《星际迷航》中那样,都是虚构的。没错,凭空虚构是非常有意思的,它能够激发人们产生一些诸如机器人统治世界之类的绝妙创意。但这些都不是真的。本书会遵循真实的数学、认知科学和计算科学的概念来展开,而这些概念又无一不严格处于人工智能的学术范畴之内:知识表示与知识推理、逻辑学、机器学习、自然语言处理、搜索、规划、力学和伦理学。
在第一个计算冒险(第5章)中,我做了一项调研,以了解为何教育改革已经进行了20年,学校仍然无法让学生都通过标准化考试。这不能归咎于学生,也不是老师的错。最大的问题是:那些设计出重要的州和地方考试的公司,在设计考试之余,还出版了一些附有考试答案的教材,但低收入学区的人根本买不起这些教材。
我编写了一个人工智能软件来协助调查,这才发现了上述棘手的情况。近年来,机器人记者经常上新闻,因为美联社正在使用机器人撰写常规的商业和体育报道。我的人工智能软件并没有装在机器人体内(也没有必要装在机器人体内,尽管我并不反对这种做法),也不会帮我写任何报道(我也不会帮它写)。相反,它是老式人工智能的一个全新应用,可用来帮我挖掘一些新视角。在这项调研中,我意外地发现,哪怕在高科技的世界中,最简单的解决方案(给孩子一本书)仍是相当有效的。我不由得会想,既然我们已经有一个便宜而高效的解决方案,为什么还要花那么多钱让技术进入课堂。
在下一章(第6章)中,我会简单讲述机器的历史,并且着重讲两方面的内容。其一,我要重点讲述人工智能之父马文·明斯基的故事。其二,我要探讨20世纪60年代的反主流文化如何塑造了今天(本书写于2017年)人们对互联网的信念,其影响之深远可谓无以名状。我的目的是让读者知道,当年一些具体的人物为了实现梦想和目标,在深思熟虑后做出许多选择,从而打造出我们今天所享有的科学知识、文化、商业修辞,甚至是技术的法律框架。比如说,今天的互联网没有国界,就是因为当初许多创造互联网的人认为他们能够超越各国政府,创造出一个全新的世界——就像当年他们群居在嬉皮士公社,试图创造出一个全新的世界那样(但那一次失败了)。
我们在思考科技问题的时候,最好不要忘记另一块文化试金石,那就是好莱坞。人们梦想用技术来实现的事情,多半受到了电影、电视节目和书本中一些画面的启发。(还记得我小时候做的机器人吗?)当计算机科学家谈到人工智能的时候,我们会区分广义人工智能和狭义人工智能。广义人工智能是指好莱坞版本的人工智能。这种人工智能能够控制机器人管家,理论上会获得意识,并最终控制政府,还有可能变成现实版的终结者阿诺德·施瓦辛格。各种可能的后果,想想都恐怖。大多数计算机科学家都非常了解科幻文学和影视作品,我们也都非常乐于谈论关于广义人工智能的各种虚构的可能性。
在计算机科学界,人们早在20世纪90年代就已经放弃了对广义人工智能的研究。[4]广义人工智能现在叫GOFAI(Good Old Fashioned Artificial Intelligence,老式人工智能)。狭义人工智能才是我们真正拥有的东西。狭义人工智能是纯粹的数学。它没有GOFAI那么刺激,但高效得惊人,我们可以用它做许多有意思的事情。不过,这个领域的语言表达非常混乱。机器学习是一种流行的人工智能形式,它不是GOFAI。机器学习是狭义人工智能。这个名称本身就很令人困惑。哪怕是我,都会以为“机器学习”这个短语表示计算机产生了意识。
它们的重要区别在于:广义人工智能是我们想要的、我们所期待的,也是我们想象出来的,它是梦想;而狭义人工智能是我们真正拥有的,它是现实。
接下来,在第7章中,我会给“机器学习”下定义,并且通过预测哪些乘客在“泰坦尼克号”失事事件中幸存,来展示机器学习的方法。机器学习的定义非常重要,知道这个定义才能理解第四个研究项目(第8章)。我将在第8章中细说这个项目,我会乘坐一辆自动驾驶汽车,并且解释为何自动驾驶校车一定会撞车。2007年,我第一次乘坐自动驾驶汽车,当时还是在空旷的机场上做的测试,而那位计算机化的“驾驶员”差点把我害死。从那时起,技术已然先进了不少,但自动驾驶技术依然无法像人脑那样工作。控制论机体的时代远不会这么早到来。我会细数人类关于技术取代人类的幻想,并且探讨这样一个问题:承认技术并不如我们所希望的那么有效,为什么那么难?
第9章是一个跳板,我们要探讨为何受欢迎的东西不等于好东西,以及这种误解(机器学习会使这种误解长存)为何可能很危险。第10章和第11章也是编程的冒险。在一次横穿全美的黑客马拉松巴士旅行中,我开了一家比萨计算公司(它很受欢迎,但仍需改进)。我还试图为2016年总统大选构建人工智能软件,以改善美国的竞选财务体系(它设计得很好,但不受欢迎)。在这两种情况下,我都构建了可以运行的软件,但不如预期那样运行。软件的失败非常有教育意义。
本书旨在赋予人们在技术世界中更加坚强的力量。我希望人们理解计算机的运行原理,这样他们就不会被软件吓倒。我们都有过这样的时候,比如有的事情本来很简单,但技术交互不知为何让它变得复杂,我们都曾在面对这种事情时感到无助和沮丧。就连被称为“数字原住民”的我的学生这一代,在面对数字世界时也常感到困惑和无所适从,也常抱怨数字世界的粗劣设计。
倘若我们想光靠计算技术来解决复杂的社会问题,那么我们所依靠的“人工智能”,其实根本就不智能。要明确一点,我所说的“不智能”是计算机,而不是人。计算机根本不在乎它自己或者你能干什么。它会尽其所能来执行指令,然后等待下一条指令。它没有知觉,也没有灵魂。
而人总是聪明的。只不过,当聪明而好心的人对使用计算机做决策的毛病视而不见,或是狂热支持使用计算机完成所有事情——包括不适合使用计算机来做的事情,他们就变成了技术沙文主义者。
我认为我们可以做得更好。只要了解计算机的运行原理,我们就有能力对技术提出更高的质量要求。我们可以要求技术系统真正帮我们更省钱、更快速并且更好地完成任务,无须再忍受那些说好了要改善使用体验,却将事情搞得无比复杂的系统。我们可以学会如何应对技术的下游效应,这样才不会在复杂的社会系统中造成无心之失。此外,我们还可以大胆对没有必要的技术说“不”,这样我们就可以过得更好、更互联,也能更切实享受技术给我们带来的更多好处。
[1] 1磅≈0.45千克。——编者注
[2] Turner, From Counterculture to Cyberculture.
[3] Brand, “We Owe It All to the Hippies.”
[4] Dreyfus, What Computers Still Can’t Do.