第三个10年:“大数据”先机不可错失.doc

第三个10年:“大数据”先机不可错失

作者:韩雪

来源:《中国民商》2013年第07期

随着智能手机、GPS、可便捷携带的计算设备的迅速普及,我们的行为、活动甚至是生理数据的细微变化,都被记录了下来,连成了一条条或有规律可循的轨迹。以此为基础,“反馈经济”(feedback economy)等新经济、新商业模式也正在加速形成。一个大规模生产、分享和应用数据的大数据时代正在开启。

大数据,顾名思义,就是数据量规模巨大到用“海量”都不能形容其万一。我们不再以GB 或TB 作为数据的计算单位,而是以PB、EB、ZB 或者YB 来衡量数据规模。对此,我们可以用直观的方法,来解释这些远离我们认知常识的字母,比如2PB 相当于全美学术研究图书馆藏书资讯内容,5EB 相当于至今全世界人类所讲过的话语,1ZB就如同全世界海滩的沙子总数,1YB 相当于7000 个人类体内的微细胞总和等。

未来,数据将会像土地、石油和资本一样,成为经济运行中的根本资源。在以数据和网络为基础的大数据时代背景下,互联网与现实世界的疆界越来越模糊,借此发展起来的物联网、移动互联、3D 打印技术等将带来的人类社会的巨大变革,当然也包括难以想象的巨大商机。

数据爆炸与移动互联

在解释“大数据时代”的意义前,也许我们要先明白三个问题:

第一,怎样证明我们进入了“大数据时代”?

1998 年全球网民平均每月使用流量是1MB,2000 年是10MB,2003 年是100MB,2008 年是1GB(相当于1024MB),2014 年将是10GB。全网流量累计达到1EB(即10 亿GB)的时间,在2001 年是一年,在2004 年是一个月,在2007 年是一周,到了2013 年仅需一天,即一天产生的信息量可刻满1.88 亿张DVD 光盘。根据互联网数据中心的报告显示,2011 年全世界创造了1.8ZB(大约为1.8 万亿GB)的数据。这相当于3 亿人按照每分钟发3 条微博的速度,不停地写上2.6976 万年。在未来十年,这样的数据大爆炸速度会进一步加快。报告预测,到2020 年全球数据使用量将达到35.2ZB,2023 年前后全球的数据规模将是现在的50 倍。

第二,什么造成了这样的“数据大爆炸”?

其实大数据现象在物理学、天文学、生物学、环境生态学、自动控制等科学领域和军事、通讯、金融、医疗、甚至是城市建设等行业早就存在,比如按照一个8Mbps(兆比特每秒)的摄像头一小时产生3.6GB 数据来计算,一个安装了几十万个交通和安防摄像头的城市,每月将

产生几十PB 的数据量;比如医院里一个病人的CT 影像往往多达2000幅,数据量约为几十GB,国内每年门诊人数多达数十亿,并且这些数据信息需要长时间保存。

但真正加速数据爆炸的原因是互联网和移动互联的快速发展。互联网用户数量和平均在网时长的高速增长,互联网内容由单一文字形式到图片、语音、影像等多媒体形式的变化,以及网络终端由台式机扩展到平板电脑、书刊阅读器、手机和电视等移动互联的发展,都是数据量暴增的主要原因。

如今,谷歌公司每天要处理超过24PB 的数据,这意味着其每天的数据处理量是美国国家图书馆所有纸质出版物所含数据量的上千倍;Facebook 每天更新1000 万张照片,人们在网站上点击“喜欢”按钮或者写评论的数量大约是30 亿;谷歌的子公司YouTube 每月接待多达8亿的访客,平均每秒钟都会有一段长度在1 小时以上的视频上传。

“全球用户拥有50 亿台手机,其中20 亿台为智能电话,这相当于80 年代,把20 亿台IBM 的大型机放在消费者手里。”全球最大的企业软件公司甲骨文的总裁马克·赫德说。可以想象一下,如果我们的肉眼能看到数据传输的“线”,那么50 亿台手机、超过10 亿台电脑,随时随地都在向分布在全球各地的服务器发送数据,这是一种怎样的景象?

第三,如果大数据现象早就存在,为什么“大数据时代”现在才来临?

原因很简单,就像《大数据时代》一书的作者维克托说的那样,大数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,绝大部分都隐藏在表面之下。互联网时代,特别是社交网络、电子商务与移动通信普及,将人类社会带入了一个庞大的数据海洋,传统的计算机根本无法处理如此大量、且不规则的“非结构数据”,直到云计算出现。它使人类发掘数据价值、征服数据海洋成为了现实。

伴随着这种变革的发生,我们现在所认知的、熟悉的一切社会模式可能都会被颠覆。传统的、包括互联网企业在内的科技企业必然会被推到迎接“大数据时代”的最前端。

Web 3.0,定制网络无所不在

我们用一个例子来说明从Web 2.0到Web 3.0 的进化:当你最近准备健身或减肥,为此你准备了5000 元预算,你觉得自己最应该减掉腹部的赘肉,但因为工作太累,强度太大的运动你承受不来。借助目前的互联网技术,你不得不多次搜索以便找到最适合你的健身选择:首先要选择有针对性的运动项目,确定哪个更适合自己;然后可能要通过搜索引擎访问若干个网站,选择交通方便的健身场所或者效果明显的家用健身器材;最后,你也许要花上数个小时比较价格和服务质量,以便最终做出决定。

但当互联网进化到Web 3.0,你只要发出一个很简单的指令,剩下的事情都可以交给互联网:它会通过可穿戴式传感器获得你的身体数据,通过数据库资料分析出你的偏好运动类型来

相关文档
最新文档