邬贺铨：我们需要国家大数据战略_云计算

邬贺铨：我们需要国家大数据战略

通信世界网 http://www.cww.net.cn	2013年12月16日 14:46
标签：大数据邬贺铨

“不要被大数据(Big Data)的‘Big’误导，大数据更强调的不是数据大，而是数据挖掘。”在日前举行的第十届国家信息化专家论坛上，中国工程院院士、中国互联网协会理事长邬贺铨指出，大数据需要更强调数据挖掘利用，而针对目前存在的技术应用、人才、安全隐私等问题，最关键的是要有国家大数据战略，使其成为转变经济增长方式的有效抓手。

大数据的价值好似沙里淘金

NBA从上世纪80年代开始将球员在赛场上的表现数据化，经过30多年的积累已经达到可辨别每一个球员在场上的弱点，方便教练进行针对性战术安排。目前30家NBA球队俱乐部已有半数聘请了数据分析师，他们的平均胜率达到59.3%，而没有进行数据分析的球队仅有平均40.7%的胜率。这就是大数据的价值体现。

大数据的价值究竟从何而来？邬贺铨认为，数据大与价值大未必成正比。例如将一个人每分钟的身体数据记录下来，对了解该人的身体状况是有用的，但如果将他的每毫秒的身体数据都记录下来，数据量将较前者高6万倍，与按每分钟记录的数据相比，其价值并不能增加。大数据的价值在于样本数的普遍性。统计一个人每分钟的身体状况数据与统计60个人每小时的身体状况数据相比，可能后者在统计上更有意义。大数据往往是低价值密度。大数据中多数数据可能是重复的，忽略其中一些数据并不影响对其挖掘的效果。因此可以说大数据的价值好似沙里淘金和海底捞针。

微软的研究发现，Facebook 90%的Hadoop任务数据集在100GB以下，Yahoo平均为12.5GB。北京公交一卡通乘客每天刷卡4000万次、地铁1000万人次，每天累计的数据是MB级，一年下来也不到TB级，充其量只是中数据，但对这一数据量的挖掘显然就能得出北京人群使用公交的出行规律，对于优化北京公交线路的设置有足够的价值。因此邬贺铨指出，事实上小数据也值得重视，对未到TB级规模的数据的挖掘也有价值。

网络的数据并非都可信

Google的流感指数在2008年H7N1流感爆发时给出的预测比美国疾控中心早两周发布，与其数据相似度0.9。美国纽约州2013年1月流感流行状况十分严峻，政府发布了“公共健康紧急状态”的通告，大众媒体的广泛报道，影响了谷歌用户的搜索因为，导致Google的流感指数估值出现了假阳性，远高于疾控中心的统计数值。在谷歌流感指数的启

发下，纽约罗切斯特大学利用Twitter的数据进行了尝试，可以提前8天预报流感对人体的侵袭状况，而且准确率高达90%，不过Twitter的使用者大部分是年轻人，而季节性流感的袭扰对象多为抵抗力较弱的老年人和儿童，因此基于Twitter的微博判断流感有片面性。

邬贺铨由此指出，网络的数据并非都可信。网络数据中真伪混杂，特别是微博传播不实消息散布很快，而微信圈子内的消息不易监控，对信息内容管理提出挑战。过去往往认为“有图有真相”，事实上图片可以移花接木、张冠李戴、时空错乱，或者照片是对的，可是文字解释是捏造的，这样的事情已经屡见不鲜。鉴于“谣言转发500次就是传谣”，一些网站规定所有帖子不论是否真实一律对转发自动封顶不超过499次，从舆情收集效果看，人为的截尾导致失去真实性。

他也指出，传感器收集的数据并非都是可信的，特别是历史上该传感器的数据与同类的其他传感器报出的数据差异很大时，该数据就应弃用。既然数据会有重复而且并非都是全部有用的，因此需要进行数据过滤，这对简化存储和提高可信性都是有意义的。还可以利用异构多源数据来提高可信性，收集多源异构的数据有利于对数据的理解。例如通过城市交通监控系统可以实时掌握交通流量，如果加上政府数据和网络数据，就可能知道发生交通拥堵的原因。

要重视数据的挖掘利用(王熙)

【作者：洪黎明
来源：人民邮电报

·大数据对于视频行业的启示和价值

·大数据时代下跟不上步伐注定要退出历史舞台

·山石网科携多方案助力联通云计算与大数据会议

·赛思信安大数据一体化解决方案精彩亮相 2013中国存储峰会

·大数据发展之源：合作创新共赢

·大数据服务电子商务行业拉动信息消费快速增长

·大数据发展之源：合作创新共赢

·大数据方兴未艾，数据中心迎来变革

·大数据落地速度会比想象快

·行业大数据前景可期平台化方案推动“从数据到服务”创新

文章评论

昵称：验证码：

原创
72小时排行
猜你喜欢

1		掰开大象腿：终端“新入者”如何求得生机

2		虚拟运营商棋局：迪信通瞄准线下转售第一

3		华为2013年营收超385亿美元利润增长32%

4		工信部：3G用户达3.86亿手机月均流量达100.3M

5		工信部：8M以上宽带超20% 手机月均流量突破100M

6		国产终端厂商强势抢占3G市场产业整合迈入4G

关注通信世界网

官方微信

	“cww-weixin”(或扫描下图二维码)，即可于获得独家的CWW视点分析、最新的通信资讯。

专家观点

	中移动员工看移动苹..
	从引入机型来看，符合中国移动4G终端要“进得来、出得去”的LTE发展策略。

信息社会研究所所长王俊秀：百度拓展移动安全正..

中移动员工看移动苹果联姻：进得来出得去

最新专题

通信百科
HDMI接口乐视超级电视多芯光纤保偏光纤千兆无源光网络硬判决室分入侵专用控制信道平坦衰落选择性衰落 Slow Fading BD_ADDR Iu-BC 菲涅耳区 “383”改革方案——电信业十八届三中全会“383”改革方案 TOSA ONT 光器件光模块全波光纤 MBGP 逻辑强隔离 HOMEPLUG AV MU-MIMO 3GDT dislam 透传 NAV IPRAN wps LTE-Advanced

方案精选
热门技术

	爱立信TD-LTE方案助力中国..
	12月4日，工信部正式发布了4G商用牌照，我国三大运营商均获得TD-L..

爱立信TD-LTE方案助力中国加速迈入4G时代

基于华为OceanStor高端存储的虚拟化容灾解决方..

人民邮电出版社
工业和信息化部
人民邮电出版社图书专营店
中国通信企业协会
中国通信学会
中国互联网协会
无线电频谱管理中心
工业和信息化部电信研究院

中国通信标准化协会
中国移动通信联合会
中国邮电器材公司
中国电信
中国移动
中国联通
中国信息协会信息服务网络委员会
爱购服务器之家

新浪科技
搜狐IT
腾讯科技
凤凰网科技
人民网无线频道
中国通信网
移动Labs
中华电子网
通信产业网
企业网

In-Stat
IT价值联盟
中国软件资讯网
通信人才网
慧聪通信网
CTI论坛
CIO选型网
CTO技术网
美通社
赛立信竞争情报网

CRS通信学社
ZDNet至顶网
和讯科技
博趣·兴趣门户
呼叫中心频道
运营与增值
信天下企业短信
新电子
OFweek光通讯网
中云网

】