友情链接
日 报周 报杂 志 人民网

阿里巴巴、百度、曙光……

IT大佬们的大数据“计划书”

《中国经济周刊》 记者 孙冰 | 北京报道 《 中国经济周刊 》(

    阿里巴巴:未来将是数据公司

    很多行业都想借助大数据提高决策准确度、提升业务水平,但首先遇到的问题便是数据量还不够大。相比之下,有一些公司足可以称得上是超级“大矿主”了,只是矿山性质不同:百度拥有最大的网页搜索数据,阿里巴巴拥有最大的电商数据,腾讯拥有最大的社交数据。

    阿里巴巴集团主席马云在多个场合都表达过阿里巴巴的“三大战略”,即平台、金融、数据,在他的计划中,阿里巴巴最终将会是一个数据公司。

    这一点从阿里最近几年接二连三的大手笔并购中已经初见端倪:新浪微博、陌陌带来的社交数据,高德带来的地理数据,UC浏览器带来的移动浏览数据,虾米带来的音乐数据,还有墨迹天气、友盟、美团……这些几乎涵盖了人们互联网生活的方方面面。再加上阿里巴巴原本拥有交易数据和信用数据,俨然一张让人充满无限遐想的“大数据拼图”。

    2012年,阿里巴巴设立的首席数据官(CDO),由后来接任马云担任CEO的陆兆禧担任。在今年年初,阿里巴巴在进行公司架构战略调整时,又专门成立了数据委员会,“这个部门会为阿里集团所有事业部提供数据支持。”阿里巴巴集团数据委员会首任会长车品觉告诉《中国经济周刊》,这位大半生痴迷于数据的香港人肩负着为阿里巴巴寻找开启大数据之门钥匙的重任。

    据车品觉介绍,淘宝的“千人千面”计划是电商大数据最突出的代表,通过数据挖掘实现精准化的营销和产品推送。同时,阿里金融也是大数据衍生产品开发的一个范例,利用云计算和大数据的技术和思想,阿里金融实现了高效和创新。

    9月,阿里巴巴先后与中国电信、民生银行合作,联手鏖战大数据平台。凭借大数据优势,阿里巴巴再次加重了其在云计算、互联网金融上的砝码。

    “数据是一种信仰。”车品觉说。

    百度:“深度学习”大数据

    百度拥有中国最大的网民行为数据库,覆盖95%的中国网民,日均响应50亿次搜索请求,搜索市场占比达80%,日处理数据量达100TB。同时,百度还构建了百度联盟,60万联盟合作伙伴每天有50亿次的日均行为产生,一起构成了巨大的数据基础。

    数据规模越大,处理难度也越大,但对其进行挖掘可能得到的价值更大。宝洁公司数字媒体与创新平台经营部市场总监陈万峰回忆,2012年百度帮助宝洁对旗下重点品牌“玉兰油”做了一次大数据分析,结果发现与其他竞争品牌相比,消费者在“玉兰油”关键词后跟着“适合几岁”的比例明显偏高,这意味着玉兰油的年龄定位比较模糊。为此,宝洁及时调整了营销策略,还顺势推出了一款针对25岁人群的细分产品,结果市场反响非常好。

    当然,这只是百度大数据的初级梦想。百度魔图推出的“PK大咖”功能成为时下最为流行的App(应用),上线10天便成为苹果iOS免费应用的首位,它能够帮你找到和你最像的明星,这背后其实就是百度对图像识别的阶段性成果,即超越文字搜索的多媒体搜索,包括语音、图像和视频等。

    余凯是百度技术副总监、多媒体部负责人,中组部“千人计划”国家特聘专家。多媒体部门是去年百度新成立的部门,这位曾在NEC美国研究院担任研究部门主管和在斯坦福大学执教人工智能课程的数据科学家,现在主要带领整个部门从事语音、图像等方面的研究,这些都是未来大数据重要应用,而语音、图像和视频都是非结构化数据,处理和分析难度更高,但非结构化数据将是未来大数据的主流。

    今年年初,李彦宏成立了深度学习研究院(Institute of Deep Learning)并亲自任院长,还亲自出马去招揽人才,而这一切目的是通过大数据“深度学习”出互联网的未来。

    “我们目前最关注的是大幅度提高语音识别的准确率,把图像、视觉搜索变为可能。”余凯告诉《中国经济周刊》,“深度学习是模拟人脑神经元的机制,我们希望利用它实现人工智能的梦想,业界顶尖公司达成了一个共识:大数据+深度学习缺一不可。我们有海量数据,里面有丰富信息,用一个简单模型不足以把丰富信息提取出来,所以我们要用深度学习模型,把里面数据的价值给找出来。”

    曙光:造“云”掘金

    坐拥金山但却还在啃馒头的人还是大有人在,于是,有一些人就在做“帮你挖金山的人”,比如布局云计算许久的曙光。

    “曙光所谓的大数据战略,实际上源于曙光的云计算战略。4年前,曙光发布云计算战略,现在,国内拥有云计算中心最多、行业云最多、城市云最多的公司,曙光绝对算一个。”曙光公司总裁历军告诉《中国经济周刊》,这也是曙光掘金大数据的重要资本。

    如果说云计算为数据资产提供了保管、访问的场所和渠道,那么如何盘活数据资产,使其为国家治理、企业决策乃至个人生活服务,则是大数据的核心议题,也是云计算的延伸和升级。

    今年5月30日,曙光正式对外发布了其大数据战略——“平台一体,智汇应用”,同时还推出了曙光大数据的核心技术和产品:XData大数据一体机。这也被视为大数据是曙光从硬件设备供应商向解决方案和服务提供商过渡的重要战略转变。

    “如果把大数据比作一种工具,那么这种工具可以帮助企业实现盈利,帮助包括政府在内的各行业,制定更合理、更有针对性的政策,通过加工实现数据的增值。”历军说。

    据记者了解,曙光的大数据服务内容,更多的是针对不同的行业客户提供定制式的大数据解决方案。而中国银联、中国移动、中国电信、中国农业银行、上海同济大学等早已是曙光大数据服务的客户,此外,在交通、医疗等领域,曙光也已有诸多实际案例。用历军的话来讲,曙光的大数据战略及解决方案,属于先做后说型,这样外界才会觉得曙光务实。

    按照历军的计划,曙光会首先帮助客户进行 “数据落地”,即先把数据高效、低成本地存起来;第二步是“分析简化”,化繁为简,基于我们当前的数据处理、数据标准化的软件系统,进行一个分析、简化、编制,让它更有序;第三步是“价值新生”,即应用开发,根据我们顾客的需求,为它量身定制非常适合这个行业应用的一体化的系统,实现业务集成化和决策智能化。

    “随着我们技术、理解的不断增强,过去我们看不到的一些金矿,会逐渐显现出来。”历军说。

掘金大数据
中国的大数据优势:数据规模+数学传统
IT大佬们的大数据“计划书”