首页 >> 通信技术 >> 要闻 >> 正文
 
2014大数据热点话题与趋势解读
http://www.cww.net.cn   2013年11月5日 14:45    

世界范围的信息化变革使得几乎每个行业都面临着大数据问题。为了有效地应对大数据带来的全方位挑战,同时充分利用这一前所未有的大好机遇,国内外的产业界、科技界甚至各国政府都在积极布局、制定战略规划。2012年3月,美国政府宣布了2亿美元的“大数据研究与发展计划”,对大数据的研究上升为国家意志。欧盟也出台了类似的举措。在这样的背景下,中国计算机学会于2012年10月成立了CCF大数据专家委员会,意在探讨大数据的科学与技术问题,推动大数据学科方向的建设与发展,同时构建面向大数据产学研用的学术交流、技术合作与数据共享平台。

CCF大数据专家委员会希望通过对大数据热点问题的探究,充分认识和了解大数据的关键性挑战和独特价值,更好地把握投入方向,对学术界、产业界、用户有指导价值。通过大家的共同努力,真正突破解决这些问题,共同获得大数据的巨大价值。

大数据的热点问题:

1.数据科学与大数据的学科边界

这一问题综合了两个问题,即大数据的基本内涵与数据的科学问题。前者关注的是大数据的基本定义和基本结构。迄今为止,什么是大数据,在产业界、学术界并没有形成一个公认的科学定义,大数据的内涵与外延也缺乏清晰的说明。大数据区别于其他数据的关键特性是什么?IBM提出了3V的说法,即volume(体量大)、variety(模式多)和velocity(速度快)。尔后又有人提出了另一个V,即value(价值),表示大数据虽然价值总量高但其价值密度低。另外,大数据是否就意味着全数据,还有待进一步讨论与澄清。最后,还需要为动态、高维、复杂的大数据建立形式化、结构化的描述方法,进而在此基础上发展大数据处理技术。后者关注的是数据界与物理界、人类社会之间的关联与差异,探讨是否存在独立于应用领域的数据科学。如果存在数据科学,其学科问题的分类体系又是什么?目前已有的共识是,大数据的复杂性主要来自数据之间的复杂联系。另外,新型学习理论和认知理论等应当是数据科学的重要组成部分。

2.数据计算的基本模式与范式

大数据的诸多突出特性使得传统的数据分析、数据挖掘、数据处理的方式方法都不再适用。因此,面对大数据,我们需要有数据密集型计算的基本模式和新型的计算范式,需要提出数据计算的效率评估方法以及研究数据计算复杂性等基本理论。由于数据体量太大,甚至有的数据本身就以分布式的形式存在,难以集中起来处理,因此对于大数据的计算需要从中心化的、自顶向下的模式转为去中心化的、自底向上、自组织的计算模式。另外,面对大数据将形成基于数据的智能,我们可能需要寻找类似“数据的体量+简单的逻辑”的方法去解决复杂问题。

3.大数据特性与数据态

这一问题综合了三个候选问题,即大数据的关系维复杂性、大数据的空间维复杂性和大数据的时间维复杂性问题。大数据往往由大量源头产生,而且常包含图像、视频、音频、数据流、文本、网页等等不同的数据格式,因此其模态是多种多样的。主要来源于多模态的大数据之间存在着错综复杂的关联关系,这种异质的关联关系有时还动态变化,互为因果,因此导致其关联模式也非常复杂。大数据的空间维问题主要关注人、机、物三元世界中大数据的产生、感知与采集,以及不同粒度下数据的传输、移动、存储与计算。另外,还需研究大数据在空间与密度的非均衡态对其分析与处理所带来的理论与技术挑战。而大数据的时间维问题意图在时间维度上研究大数据的生命周期、状态与特征,并探索大数据的流化分析、增量式的学习方法与在线推荐。最后,研究大数据的离线与在线处理对时效性要求。

[1]  [2]  [3]  
关注通信世界网微信“cww-weixin”,赢TD手机!
来源:赛迪网   编 辑:高娟
分享到:
       收藏   打印  论坛   推荐给朋友
关键字搜索:大数据  
猜你还喜欢的内容
文章评论查看评论()
昵称:  验证码:
 
相关新闻
即时新闻
通信技术
最新方案

企业黄页
会议活动