|
中国科学院院士怀进鹏:对大数据的思考和认识
http://www.cww.net.cn 2013年4月11日 15:24
什么是大数据?有很多不同的认识。但是一个社会的观点处理不了的数据是大数据,而且找到更有效的方式。大数据很热门,人们也定义了思维的特征,不仅量大传播快。数据处理本身带来的价值计算机信息技术重要的内容。我们分析用户在线的习惯,从而做好商业促销和网络。在商城里可以通过一年、半年的购物习惯来摆设商品的位置。不同对数据的分析在商业价值的利用以及在研究方面都有很多。比如说以单词匹配来找错误。 大数据分析处理当中,由于计算存储能力给带来的新的机会。医药方面,也有大量数据处理的结果。数据处理有价值。未来五年之内,大数据发展势头越来越高。同时,分析了当前企业当中目前大数据已经投资的30%和将要投资的企业主要分布和行业特点。进一步推动全球大数据需求和处理方面的投入。 究竟大数据价值在哪里?开普勒和牛顿同样是天才科学家,只是牛顿名气比较大。开普勒基于他所得到的数据计算出来行星的位置,准确程度即使到今天现代科学仪器仍然相差不远。也导致了大数据科学研究的四种模式,实验科学、理论科学、计算科学到数字科学。这里研究有很多问题,虽然计算机信息技术是人造科学。但是在反应出自然的科学当中,也开始有这类问题。 这类问题有什么?数据和应用是多样的,复杂度高。有不同的表达方式,和原来结构化数据有本身的差异。如何获取、建模、存储、查询、共享、分析?并且把杂乱无章的表现出来,本身很重要的问题。 数据如此多、变化如此快,怎么挖掘出有价值的东西。大数据不是每个人海里捞针,沙漠里找到黄金,这是大数据价值。 五年前facebook数据库存15个TB已经非常重要,三年之后每天有70TB而且压缩过的数据放到数据仓库。它是一个社交网,带来的困难。而且基本上面临的问题是100个节点到1000个节点,甚至更大,传统的不能用。导致了一些新的变化。 十二年前,有一篇很好的论文,一定的数据量的情况下算法的好与坏决定了量。在大数据面前很多样,采样选样的精确性,不精确的计算带来很多新的问题。在处理问题的时候,发现最优的算法和最简单的算法,数据规模很大的时候简单的算法更好。 因此,在这个领域当中,传统的数据库,算法和结构是过去软件的特点,现在发生了新的变化,这些变化要做什么?有很多问题。由于时间关系这里只给一点,过去算法是要采样,尝菜,炒菜没有熟尝一下。算法要有新的方式,不是传统的东西。另外,还有还原方法,还原用最简单的方法。 计算对于系统的要求也有很多,以前是操作系统和数据库。在结构化处理方式成为产业化推动应用的最大支撑。未来同样会出现新的数据处理,而它的数据处理应用能力将会有更大的变化。我想大数据下是有价值的,价值背后也有很多技术和科学问题,如何从单独专业到一个新的购物中心的发展,未来互联网运营和服务模式也会发生变化,这样变化会带来机会。这样的发展就是大数据当中作为学术界研究数据表示的问题。算法设计、系统问题以及挖掘和处理,也包括现在的智能搜索,以及利用众多的智慧完成。 有很多新的机会,由于时间关系不多讲。大数据我个人认为是产业,是资源,更是科学。发展与推动和应用是相关的,需要形成一个产业链共同推动,所以也期望在大数据发展当中,互联网公司、应用公司以及学术界能够在知识需求当中来推动和带来中国在数据科学和产业当中的发展。 我要向各位汇报的就是这些,谢谢各位! 来源:腾讯科技 编 辑:王熙
猜你还喜欢的内容
文章评论【查看评论()】
|
企业黄页 会议活动 |