22.2 云计算的本质
云计算是什么?最早提出云计算的三家公司因为它们的核心商业模型和利益不同而在看法上相差巨大。
我们先来看IBM 。在PC 时代以前, 计算机行业,尤其是IBM , 制造的都是(大型)主机分时系统。当时的主机(可以理解成服务器)非常昂贵,所有用户同时通过终端(可以理解成今天的PC机)分享主机的计算和存储。一个用户可以通过连到主机上的任意终端访问他自己的信息, 得到所需的服务, 因为这些信息和服务都不在本地终端上,而在主机上。当然,在同一主机的这些终端用户很容易共享信息,只要他们的权限许可。但是,不同主机之间的通信功能很弱, 不同主机用户也几乎不会共享信息和服务。至于用户能得到什么服务则完全是被动的,因为软件和服务完全由计算机厂商(当时还没有独立的软件公司)提供。
1979 年IBM 推出18M-PC , PC 时代正式开始,之前苹果的PC 只能算是一个序幕。这项革命性的发明反而差点耍了IBM 的命,因为在PC 时代,计算机的用户从企业普及到个人,而个人使用计算机的方式将不再是通过终端共享价格昂贵的大型机的资源, 而是每个家庭拥有自己单独的计算能力相对弱,但是价钱上承担得起的个人电脑。由于微机的性价比要比大型机好很多,它反过来侵蚀大型机的企业级市场。随着主导个人计算机的微软一英特尔体系(WinTel)的出现,IBM退到了二线。当然,此时不同的人使用着不同的微机,他们的数据和信息是很难共享的, 软磁盘和后来的USB 盘成了大家传播信息的途径,同时也带来了病毒的泛滥。微机时代的另一个问题是不同微机上有不同的软件,同一个软件的版本可能也不相同, 使得大家在某一台计算机上做的工作,很难在另一台上继续进行。
我本人就有过两次因为对方计算机上没有相应的软件和版本不对而很尴尬的事。一次是在IBM 做报告,我事先将我用微软PowerPoint 做的胶片传给IBM 的同事,遗憾的是他们因为是微软的竞争对手,一层楼里只有一两台计算机上装了Office ,于是浪费了很多时间在计算机之间将讲稿倒来倒去。另一次是在国外,由于Office 的版本不对,也无法打开我的讲稿,于是我只好用备份的真正的胶片,在投影仪上放映。
随着互联网的出现,尤其是在宽带上网和搜索引擎普及以后,人们获取和交换信息变得方便许多。在2000年以后,运营几万台服务器的大型数据中心的出现,使得计算资源和能力有了共享的可能,而这些大型数据中心之间采用高速光纤网络连接。这样全世界的计算能力就如同天上飘着的一朵朵云,它们之间通过互联网连接。人们可以通过互联网享用一个甚至是多个大型数据中心的计算和存储功能,而自己家里的PC 机则渐渐降级为一个重要性不大的终端。这样,在表面上似乎又回到了当年IBM 大型机的分时共享模式,只是一台大型机被一个大型数据中心取代,大型机到终端的专线被互联网取代,而用户从大型企业普及到每一个人。被微软压制了多年的IBM 当然希望通过这个转变重新谱写它的百年传奇。IBM 服务的对象依然是企业级用户,它的商业模式是卖云计算的服务器。这是IBM 对云计算的理解。它不具有自己对外使用的数据中心, 因此至少目前无法提供对外的服务。
作为一家互联网公司,更具体地讲是一家电子商务公司的亚马逊对云计算的理解和IBM 完全不同。亚马逊早期除了卖书以外,另一项主要业务就是通过它的开放市场,允许小商家把自己的商品放到亚马逊上卖。当然,不同的商家卖的东西不同,店铺的设计、交易的方式和提供的服务也不同,这些商家大多有自己单独的网站。对于中小商家,自己建立和维护这些网站从成本上讲是非常不合算的。于是,亚马逊开始给它们提供网站托管( Web Hosting )的服务, 建立了一些通用的交易平台,帮助这些商家托管它们的网上商店。为了满足为数众多的商家网站托管的需求,亚马逊建立起向己的数据中心。这时,亚马逊发现,它不仅仅可以为商家提供网站托管服务,还可以为任何需要建立网站的公司提供。这样,任何一个想通过互联网提供服务(包括电子商务) 的公司和个人都不需要自己建网站,而只要租用亚马逊的计算资源即可。这就是亚马逊理解的云计算,它和IBM 的理解完全不同,但是没有矛盾。IBM 可以作为它的服务器提供商,如果亚马逊觉得价钱合适的话。
Google 是最早开发云计算技术的公司,它最初的目的是为了其大计算量的搜索服务。但是随着它自身业务的扩大,以及它和微软竞争的日益加剧, Google 逐渐将原本运行在用户自己本地计算机上的各种应用软件搬到了服务器端。最早是日历(Calendar),这在微软是其Email 组件Exchange 的一部分。Google 通过统一的账号系统(云计算的关键技术之一) 将它的电子邮件( 即Gmail )和日历打通, 并通过简单的自然语言理解,使得电子邮件中任何和约会有关的事情都很容易地加到日历( GoogleCalendar) 中。当然,所有这些信息都存在服务器端,而且是和用户终端无关的,这样只要用户能上网登录,就能随时获取自己日历的信息。不久,Google 又推出了离线的电子邮件和日历服务,实际上就是做了一个微软Exchange 的替代品。做到这一步。 Google 还只是在追赶微软上补了些课而已,看不出丝毫云计算的意思。但是,接下来Google 做的几件事让人渐渐看清楚了它的云计算思路。
首先,它把本来运行在客户端的许多应用软件的主要功能,包括图片处理和分享的Picasa ,类似Office 的字处理、表格处理和讲稿演示( Presentation )搬到了服务器端,或者说云端。虽然这些应用与PC 上进化了十几年的同类产品相比非常的初级,包括我本人开始都怀疑它们是否可以完全取代个人电脑上的那些软件。但是, 它的发展和普及速度却大大超出人们的预期, 首先这些简单的、免费的替代品能完成这些复杂的同类产品90% 以上的功能, 基本上能满足95% 的用户的需求。实际上Photoshop 和Office的那些复杂功能连很多计算机专业的人不经过训练都不会用到。要知道买一套正版的Photoshop 和Office 是很贵的,对于个人用户,一套Photoshop 的价格从200 美元到上千美元,而一套Office 的价格也在100美元到300 美元左右,视功能而定。对于企业级用户,成本更高,是每年收使用费的。其次,也是非常重要的, Google 的这些在线的应用软件分享数据和信息的功能要比原来基于个人电脑上的同类产品强得多。如果一个小组几个人一同起草一份文档, 用Google 的Docs 比微软的Office 要方便许多,虽然前者的排版不如后者漂亮。这个分享功能成为了Google 基于云端应用和服务的卖点。
在Google Docs 问世前,如果一个人要和朋友或同事共享你的文件或讲稿,他要么用电子邮件的附件发送给别人,要么拷贝到磁盘或USB 盘上, 然后将物理的磁盘和USB 盘交给别人。如果他要将在办公室里没有写完的文档拿回家写,那么也要拷贝到某个载体上带回去。这样虽然麻烦而且不安全,但是还勉强可以工作。然而如果想在差旅时检查一下他的日历有没有更新,或者同事是否对他的文挡提出了修改意见, 那一般只好等到了目的地,用自己随身带的笔记本找到上网的地方才能t作,而使用别人的电脑是不安全的。在Google Docs 问世后,我们日常大部分办公的需求,从文档到日历,基本上都可以随时随地访问,由于文档本身存在服务器端,因此从哪怕是公共的计算机上访问它也是安全的。正是由于这些方便性,弥补了Google Docs 在功能上的不足。
和IBM 与亚马逊都不同。 Google 强调的是对用户的服务。虽然它自己也生产服务器, 而且产量不低(相当于全球第四大服务器厂商),但是它无意进入服务器的市场。虽然Google 一度试图进入亚马逊的网站托管市场,搞了Google Site 这样的服务,但是因为不成功,也就没有坚持。总的来讲,这三家各有各的特点和市场,基本上是互补关系而不是竞争关系。把他们的想法合起来,就可以得到云计算的本质了。
首先, 云计算保证用户可以随时随地访问和处理信息, 并且可以非常方便地与人共享信息。我们不妨看这样一个实际的场景:营销员比尔匆匆忙忙地飞到外地签合闷,由于走得匆忙,和客户的会面还没完全安排好,自己寄给客户的合同也没有得到反馈,客户答应在他到达目的地以前给他答复。比尔在飞机场等候转机,想看看自己的日程表,了解一下用户是否确定了会面的时间地点, 并且看一看合同书是否有了反馈信息。以前他需要在自己的笔记本电脑或手机的日程在上输入自己的日程,然后在机场查看自己的电子邮件或短信,把用户传过来的时间安排抄到自己的日程表上, 再通知用户他接受了这个安排。之后,再查看一下电子邮件,看看邮箱里有没有反馈回的合同附件。如果有,他在自己的笔记本上编辑完,再用电子邮件发给对方。现在。他可以通过一个智能手机, 比如苹果的iPhone或Google的GPhone,通过机场的WiFi,上网并登录自己的日程表和文件账户。如果客户安排好了会面的时间地点,客户会在比尔的网上日程表中直接加入一项活动,通知他见面的详细安排,如果比尔觉得合适,直接点一下确认的国标即可通知对方同意,比尔可以把自己起草的合同书变成一个客户共享的文本, 可以直接在上面写上自己的意见或修改合同,当比尔在机场再次打开这个文本时, 他就看到了客户修改的版本。 并且是在这个共享文本上直接编辑修改的。客户只要在网上,就可以在同一时·间看到比尔修改后的新版本。等比尔到这目的地时。 不仅行程已经安排妥当,而且已经和客户进行了预先的交流,合同的谈判就会顺利得多。接下来,如果要做报告,也非常简单。
因为所有的文件都是存在云端,也没有兼容的问题,只要客户给他提供一个投影仪就好。如果他要演示什么大系统(比如语音识别的系统) ,并不需要带很多用于演示的服务器,只要通过一个浏览器就可以调动在数据中心的多台服务器完成演示。
第二, 云计算保证用户可以使用大量在云端的计算资源,包括处理器CPU和存储器(内存和磁盘)而不需要自己购置设备。打个比方来说明这一点,这就像我们不需要自己在家里的院子里打井取水,在家里的厨房里用一台柴油机发电一样,而是用水电公司提供的服务。它的好处是让全社会的计算资源得到最有效的利用,同时让每个使用计算资源的人和公司成本尽可能低。以一个中型网站或电子商务公司为例,它需要几百台服务器和足够的带宽。以前,它需要自己订购服务器后,租用数据中心,在自己的服务器上安装操作系统和Apache 之类的服务器,然后雇自己的网络管理工程师和运维人员,才能为用户服务。这里面有十几个重要的决定要做,包括数据中心的选择,这些服务器的选型,服务器的布局,操作系统的选择,带宽的选择,容灾的处理,等等。该公司还要雇佣不少运营的人员,才能维持服务的正常运行。为了保证服务的流畅,该公司服务器的峰值计算能力必须是它均值的3-10 倍,加上容灾备份,这样服务器的使用率其实不高。因此,算下来这个公司的运营戚本是很高的。实际上,目前中国的中小型互联网公司的平均运营成本比大公司(腾讯、百度等)高,中国的大公司比美国的Google 和亚马逊高。很大程度上就是资源的利用不充分。如果,这些中小公司租用计算资源,那么它的平均运营成本要低很多。而且由于这些提供云计算服务的专业公司的运维和信息安全的管理更容易做到高质量和有效, 因此,对用户来讲,服务质量能够得到保障。事实上,在美国,很多财富500 强的公司,比如美国第二大连锁店Target ,他们的网站和电子商务都是由亚马逊提供Hosting 服务的。
同时,很多跨国公司,他们的电子邮件和文档系统都是由Google 提供服务的。
对于个人或没有计算资源的单位来讲, 云计算可以让他们完成以前根本完成不了的任务, 一个很好的例子是图像处理。了解这个专业的人都知道,图像处理是计算量非常大的任务。未来的某天,公安局刑侦科得到了一张嫌疑犯的照片,他们要通过计算机从上千万张图片中找到和嫌犯长相相似的人的档案。这一千万张照片,可能存在几十个城市的公安分局里。以前要完成这件事,先要把嫌犯的照片通知到各个公安分局,每个公安分局还要派专人去计算中心处理和匹配照片,这样的难度使得这项任务几乎不可能完成(即使这些照片存在同一个计算机系统中,匹配一千万张照片的时间也可能是几个月甚至更长的时间, 因为图像处理很花时间。嫌疑犯可能已经逃脱) 。现在有了云计算,这一千万张照片虽然在物理上分布在不同的计算中心,但是对于全国各公安分局来讲,感觉上都在自己的机房里。
同时, 云计算的工具可以把计算工作并行地安排到互联网上闲置的服务器中,几分钟就可以完成任务。