|
大数据要落地需破除三大障碍
http://www.cww.net.cn 2013年6月13日 09:56
大数据无疑是今年时髦的词汇了。不管是云计算、社交网络,还是物联网、移动互联网和智慧城市,都要与大数据扯上关系。各种与大数据有关的会议、文章、书籍铺天盖地。有人谈论大数据时代的公民生活,也有人谈论大数据时代网络反腐。仿佛一夜之间我们就进入了大数据时代。 大数据火爆,引发思想启蒙 国际上,大数据还真是热火朝天,各方都在积极行动。一方面,政府积极介入推动。2009年,联合国启动“全球脉动计划”,借大数据推动落后地区发展。2012年1月,世界经济论坛年会把“大数据、大影响”作为重要议题。美国从开放政府数据、开展关键技术研究和推动大数据应用三方面布局大数据产业。美国在开放政府上非常积极,通过Data.gov开放37万个数据集,并开放网站的API和源代码,提供上千个数据应用。除了推动推动本国政府数据开放,美国倡导发起全球开放政府数据运动, 已有41个国家响应。美国政府还投资两亿美元促进大数据核心技术研究和和应用,把大数据放在与集成电路、互联网同等重要的位置,从国家层面推进。 另一方面,资本市场也对大数据钟爱有加。2012年4月,大数据分析公司Splunk高调IPO,引发投资者关注。12月初,为企业市场提供Hadoop解决方案的创业公司Cloudera在E轮融资中获得6500万美元融资,估值约为7亿美元。近期,高盛联席主席斯科特·斯坦福说:“投资大数据及其运用回报率最高”。大数据领域的企业并购热度也在上升,单笔平均并购金额方面,大数据超过云计算位居IT领域榜首,在总并购额上也位居第二。 在各方力量的推动下,大数据科研和产品开发逐渐活跃起来。一个新概念的兴起,最初往往会有人快速地“新瓶装旧酒”。已经存在好多年的商业智能、数据仓库等技术被重新包装,以大数据系统的面目出现在市场上。这也使人困惑:到底大数据与传统数据分析技术有什么差别?可以说大数据最重要的特征是将数据处理的对象扩展到互联网级别(Internet Scale),技术上的进展主要包括:1)单数据集达到PB级别;2)非结构化占主流;3)几天至数秒内完成高速处理。技术形成了批处理、流处理和交互分析三种计算模式:离线批处理(Batch Processing)技术以MapReduce和Hadoop系统为代表,实时流处理(Stream Processing)技术以Yahoo的S4系统和Twitter的Storm系统为代表,交互式分析(Interactive Analysis)技术以谷歌的Dremel系统为代表。 大数据的火爆,也带动了国内学术界、产业界和政府对大数据的热情,但笔者觉得更大意义在于唤醒了人们对数据的重视。今年以来,中国计算机学会、中国通信学会先后成立了大数据委员会,研究大数据中的科学与工程问题,科技部的《中国云科技发展“十二五”专项规划》和工信部的《物联网“十二五”发展规划》等都把大数据技术作为一项重点予以支持。这些举措着眼长远,短期难以看到效果。但这种热潮的确触发了一场思想启蒙运动,使得“大数据是资产,不是包袱”、“要拿数据说话”等观念逐步深入人心,改变了以往不重视数据积累,不相信数据分析等认识。有了这种思维模式的改变,大数据的应用就有了希望。 空谈误国,拒绝被大数据忽悠 炒作归炒作,但真正可以落地,或者已经落地的应用有哪些?在哪里?联合国“全球脉动(Global Pulse)”今年5月发布的报告,给出了用Twitter预测大米价格、用谷歌趋势(Google trends)跟踪登革热疫情等生动案例;美国中央情报局官员也披露大数据在帮助他们追捕恐怖分子方面立下功劳;有人声称成功利用Twitter预测了本届美国大选。这些听起来很炫的案例在各种场合被人们反复引用。各大咨询公司和解决方案提供商也都会尽力挖掘大数据的应用场景。但实际看到的大规模应用案例除了互联网搜索引擎、电商和社交网站,以及少数国家的政府网站外,其他领域还并不多见。国内应用案例就更是凤毛麟角了。 [1] [2]
来源:工业和信息化部电信研究院 作 者:魏凯编 辑:王熙
猜你还喜欢的内容
文章评论【查看评论()】
|
企业黄页 会议活动 |