日 报周 报杂 志 人民网
人民日报海外版 2012年10月20日 星期六

蕴含财富密码 成为国家战略

大数据:信息时代的狂飙突进

谢佳沥

《 人民日报海外版 》( 2012年10月20日   第 08 版)

  国金证券制作的关于大数据结构类别示意图

  美国政府宣布“大数据研究和发展倡议”,推进从大量的、复杂的数据集合中获取知识和洞见的能力,这标志着大数据已经上升至美国国家战略。

  IBM连续宣布收购两家数据分析公司Varicent(瓦里森)和Vivisimo(维维斯莫)。惠普向全球发布面向大数据应用的系列解决方案。腾讯发布面向营销的大数据战略,将调动腾讯7亿活跃账户数据去服务门户,来打造基于用户社交关系链的“下一代腾讯网”。天猫携手阿里云、万网联合推出“聚石塔”平台,为天猫、淘宝平台上的电商及电商服务商等提供数据云服务……

  以上种种让人们意识到,在互联网和通信技术飞速发展20年后,一个属于“大数据”的时代,真的来了。

  大数据时代翩然而至

  “如果说IBM的主机拉开了信息化革命的大幕,那么‘大数据’才是第3次浪潮的华彩乐章。”著名未来学家、当今世界最具影响力的社会思想家之一托夫勒在《第三次浪潮》一书中的话正在演变成现实。

  IDC(国际数据公司)在2011年6月的报告显示,全球数据量在2011年已达到1.8ZB,在过去5年里增加了5倍。1.8ZB是什么样的概念?1ZB等于1万亿GB,1.8ZB也就相当于18亿个现在市面上常见的1T的移动硬盘。

  “大数据”是什么?

  “目前,大数据定义五花八门,还没有一个严格的说法。”中国人民大学信息管理学院副院长孟小峰说,“若仅从数据量上粗略说的话,100PB以上的数据方能称为‘大数据’。”业界目前将大数据的特点总结为四个“V”,即多样性(Variety)、体量(Volume)、速度(Velocity)和价值(Value),其中前两个特征,反映出数据本身的特点,而后两个特征,则反映出了人们对于更高效地处理数据,并获取价值的需求。

  近几年,IBM、甲骨文、EMC、惠普等IT巨头掀起了一股“大数据”市场的收购热潮,共花费超过15亿美元用于收购相关数据管理和分析厂商。这使得“大数据”成为继“云计算”之后又一个在IT界乃至金融界炙手可热的名词。 

  孟小峰表示,大数据产业刚刚萌动,其发展趋势不可限量,潜在的应用前景非常可观。比如在数字化时代,各色人等有意无意留下的数据“足迹”越来越丰富,这是一个真实的大数据。数据足迹是有社会意义的,蕴含着社会结构,数据足迹及其结构本身就是社会结构和过程的一个环节,不断塑造着新的社会秩序和关系。

  大挑战中蕴含大机遇 

  不论企业还是个人,如果你在与数据相关的任一方面很拿手,那么恭喜你,在“大数据”时代,你听到的将是机会的敲门声。

  “大数据将成为未来互联网经济的石油。”IDC中国负责互联网与新媒体研究的高级分析师周林在第四届中国云计算大会上表示,“在不远的将来,吸引用户贡献数据的能力、持有大型数据的能力以及将大数据集通过分析转化为业务价值的能力,将构成互联网企业的核心竞争力。”

  IDC在今年4月发表的一份报告称,大数据技术与服务市场销售量将从2010年的32亿美元增长到2015年的169亿美元,其年均增长率会是一般IT市场的7倍。能够利用大数据的公司将会在竞争中占据极大的优势。 

  在大数据的“浪潮”中,企业要想抓住发展契机,就需要拥有对应技术的人才。“现在业内非常缺乏数据科学家、数据分析师等相关的人才,因为这需要有很强的数据理解能力,很强的数据逻辑分析能力。建议感兴趣的学子不妨朝着这方面发展。”微软全球资深副总裁、微软亚太研发集团主席张亚勤日前如是表示。

  “大数据”时代同时也意味着一个科技进步的机会。

  “科技界应高度关注大数据研究这一新的发展方向,从大数据应用中发现挑战性的科学问题,推动以大数据为基础的新兴技术和学科发展。”中国工程院院士、中科院计算技术研究所首席科学家李国杰日前在接受媒体采访时说。

  当然,汹涌的大数据“浪潮”,同样给企业带来诸多挑战。

  随着产生、存储、分析的数据量越来越大,用户个人的隐私受到前所未有的挑战。用户享受着互联网带来的海量信息的同时,是否意识到自身的隐私被曝光于公众眼球下?

  对此,腾讯网总编陈菊红解释道,“腾讯并不会提供给客户直接的用户数据,而只是提供例如‘球迷’、‘歌迷’这样的人群分类信息。此外,腾讯对用户数据实行分层保护,底层数据和基础用户信息则绝不会商业化。”

  中国企业决战大数据

  “与国外大数据的热火朝天相比,国内企业参与这一领域的并不多。国内IT企业尤其是软件企业在布局大数据方面,已经落后。”中国软件网、海比研究总经理曹开彬在接受媒体采访时说。这主要是国内企业在数据库、数据仓库、商业智能等领域基础薄弱。不过,他指出,国内企业在这方面仍有机会,但需要找准行业切入点。

  事实上,一些嗅觉灵敏的公司已在此领域开始了行动。

  腾讯网于今年7月3日凌晨,启用新版首页,同时,腾讯网络媒体事业群宣布启动门户、微博、视频、无线的跨平台深度整合战略,其目的正是着力将下一代腾讯网打造成大数据时代的智慧门户。

  陈菊红表示,进入大数据时代后,腾讯将从这些海量数据中挖掘、分辨出用户的行为模式、兴趣偏好等,更准确地向用户推荐合适内容。比如在伦敦奥运会期间,用户可以通过“跨栏”的微博标签找到刘翔的奥运新闻和点评,而一旦用户收听了刘翔的微博,就可以在访问门户时看到刘翔的专题和赛事视频。

  一个星期后,天猫“聚石塔”平台推出,通过这一平台,商家除可享受基础云技术如虚拟主机及云数据库,数据推送、数据集成、资源弹性升级等云端服务外,还可以在后期享受强大的物流、订单、账户权限等开放与升级。

  “这是阿里集团数据分享战略的再进一步。通过开放的电商云工作平台将整合电商生态系统的全链路数据,帮助商家提高运营管理效率、降低成本。”天猫总裁张勇表示。

  随着“大数据”时代的悄然来临,数据的重要性将愈发凸显。IDC最新的研究预计,到2020年,世界上的数据存储总额将达35ZB(1ZB等于1万亿GB)。

  未来数据到底有多重要?孟小峰的观点让人印象深刻:“在不远的将来,数据的积累也许会成为国力的标志。”

 

  链接:计算机存储单位一般用B,KB,MB,GB,TB,PB,EB,ZB,YB,BB来表示,将来还会有更大的存储单位。它们之间的关系是:位bit (Binary Digits):最小的存储单位。字节byte:最常用的单位。1KB(Kilobyte)=1024B,1MB (Megabyte)=1024KB,1GB(Gigabyte)=1024MB,1TB(Trillionbyte)=1024GB,1PB(Petabyte)=1024TB,1EB(Exabyte)=1024PB,1ZB(Zettabyte)=1024EB,1YB(Yottabyte)= 1024ZB,1BB(Brontobyte)=1024YB。  

  (陈  怡编辑整理) 

幻想:打开科学殿堂的钥匙(观潮亭)
大数据:信息时代的狂飙突进
北航编织民族飞天梦
责编:张保淑 邮箱:zbszhang@yahoo.com.cn