大数据商业的共同点——尽在数据流中

字数:1019

在上述大数据应用的案例中,存在着一些普遍的规律,这些规律可以通过数据流(Data Flow)的一致性体现出来。我们不妨分析一下在上面的几个案例中数据是如何流动的。

首先,大量看似杂乱无章的数据点,从很多不同的地方(可以是不同的人、不同的公司,甚至是不同的采样点)收集上来,这些数据在生成时常常是彼此独立的,而且在收集上来之前是原始的、未加工的、无目的的。无论是亚马逊上顾客的购买行为,Netflix上用户收看电影的行为,还是Google用户上网搜索或者做其他事情的行为,事先与这些服务的提供商都是没有沟通和商量的,而且彼此是独立的。这些大量独立的数据聚合在一起,才能得到客观而准确的统计结论,比如网页搜索和结果之间的相关性,不同商品之间的相关性,或者不同电影之间的联系等。在这个过程中,各种数据如同百川入海一般汇聚到一起。

图4.7 大数据收集、处理和建模的流程

其次,由于这些数据在产生和收集时是没有特定目的的,因此怎样使用它们需要视特定的应用而定,比如Google在网页搜索排序中使用的数据,与它在给用户搜索提示时使用的数据不同,虽然它们都是从同一个来源收集到的。由于大数据的多维度特征,使用者可以根据自己的需求进行筛选、过滤和处理。同时,由于在收集数据时事先没有太多的目的性,从这些数据中能够得到什么结果事先也无从知晓,最终从数据中得出什么结论就是什么结论。

在上述过程中,数据的流向是从枝末的局部到整体。而当我们利用从大数据得到的规律指导商业行为和其他行为时,数据的流向则是从整体到局部,如图4.8所示。

图4.8 在大数据的商业应用中,数据通常要完成两个方向的流动

前面的几个例子无一不是先从大数据找到普遍规律,然后再应用于每一个具体的用户,并且影响到每一个具体的操作。以抓毒品种植和偷漏税为例,警察局或者税务局首先需要根据大数据了解用电或者纳税普遍的模式,然后要准确地估算出每一个地址正常的模式,这样就能够发现每一个异常的情况。对于互联网公司的那些应用也如此,那些公司可以对每一个用户提供不同的服务,甚至做到每一次的服务都不相同。比如电商公司在用户浏览打印机或者电动牙刷时,如果发现他们在阅读产品介绍和评价,那么可能用户尚未完成购买,推荐相应的产品给用户是合理的;而当用户完成购买后,再搜索或浏览这些产品,推荐给用户打印机墨盒或电动牙刷头等耗材,就比推荐那些耐用产品本身更合理了。经常在亚马逊上购物的人对这一点会有体会,不仅不同的人看到的网页内容是不一样的,而且同一个人今天和昨天看到的内容也是不一样的,尤其是在完成一些购买行为之后。这种精细到每一次交易,甚至每一次内容展示的服务,在过去是想都不敢想的,但是靠大数据今天这已经变成了可能,而且它还代表着未来商业的趋势。


巨大的商业利好:相关性、时效性和个性化的重要性把控每一个细节