|
Platform MapReduce帮助企业应对“大数据”挑战
http://www.cww.net.cn 2011年11月15日 12:02 通信世界网
无论是结构化数据还是非结构化数据,它们在深度与广度上都飞速地增长着,企业能否有效管理并挖掘利用这些数据将决定信息化建设的发展走势。Platform MapReduce可以帮助企业从容应对“大数据”挑战。
这是一个数据爆炸的时代!IDC在最近的一次调研中,对数据的增长做了一个粗略的估计:到今年年末将有1.8万亿字节的数据存放于50亿个文件中,IDC据此估计,到2015年将产生7.9千万亿兆字节的数据。 数据量太庞大了,即使是最快的IT系统也跟不上收集数据的速度。而所有的这些信息需要筛选、处理并集成,最后进行分析,才能为企业带来价值。因此,如何把这些数据转变成有用信息成为企业亟待解决的问题。 “大数据”问题的由来 一直以来,IT人员都是通过面向批处理的数据仓库架构来提供及时的数据分析,但在今天,随着数据量的激增和新数据类型及其所需的数据处理方法,这种架构已经不堪重负了,这是因为,现有的数据仓库是为结构化数据构建的,非结构化数据并不适合这种架构模式,但实现的情况是:80%的数据是非结构化的。移动和修改海量的非结构化数据将耗费大量的人力物力,因而无法将非结构化数据转换成必要的结构以方便抽取。 除此之外,为了满足新兴的业务需求,IT部门还需要采用新的方法来访问、处理和分析多种类型的非结构化数据及相关架构,并且应当以企业级的高标准来完成。如果没有一种灵活的企业级方法来访问、处理和分析非结构化数据并据此作出明智的业务决策,那么没有内在价值的数据会让IT部门不堪重负——这就是我们今天面临的“大数据”问题。 企业级“大数据”解决方案 根据2011 TDWI的一份调查,34%的企业开始使用大数据分析来帮助制定决策。MapReduce无疑是解决“大数据”问题最受关注的新一代技术。MapReduce提供了在计算集群下分布处理大数据的软件框架,利用MapReduce解决方案,开发人员可以开发出运行在分布式集群上,能够并行处理海量非结构化数据的程序。 一个企业级的MapReduce应该提供以下功能: l 能够在整个企业范围内部署和运行数据抽取和分析程序。 l 管理和监控大规模环境。 l 包括一个负载管理系统以确保服务质量,并根据业务目标,确定应用的优先级。 l 可为多个MapReduce用户和业务部门提供服务,可能还需为其他分布式处理提供服务。 l 具备一定的灵活性,可根据特定的应用需求来选择合适的存储和文件系统。 由于在性能和扩展性方面存在不足,现有的MapReduce解决方案还难以满足企业通过MapReduce对庞大的异构数据集执行分布式计算需求。 为了满足将MapReduce应用迁移至生产环境的需求,全球领先的集群、网格、云中间件和云管理平台提供商——Platform公司已经将其企业级的工作负载管理功能引入到“大数据”领域。 [1] [2]
编 辑:高娟 联系电话:010-67110006-853
文章评论【查看评论()】
|
企业黄页 会议活动 |