首页 >> 通信技术 >> 技术滚动 >> 正文
开源框架Hadoop发布新版本
通信世界网 http://www.cww.net.cn 2014年3月5日 08:08
标签:Hadoop
 

分布式计算开源框架Hadoop近日发布了今年的第一个版本Hadoop-2.3.0,新版本不仅增强了核心平台的大量功能,同时还修复了大量bug。

新版本对HDFS做了两个非常重要的增强:

支持异构的存储层次

通过数据节点为存储在HDFS中的数据提供了内存缓存功能

借助于HDFS对异构存储层次的支持,我们将能够在同一个Hadoop集群上使用不同的存储类型。此外我们还可以使用不同的存储媒介——例如商业磁盘、企业级磁盘、SSD或者内存等——更好地权衡成本和收益。如果你想更详细地了解与该增强相关的信息,那么可以访问这里。

类似地,在新版本中我们还能使用Hadoop集群中的可用内存集中地缓存并管理数据节点内存中的数据集。MapReduce、Hive、Pig等类似的应用程序将能够申请内存进行缓存,然后直接从数据节点的地址空间中读取内容,通过完全避免磁盘操作极大地提高扫描效率。Hive现在正在为ORC文件实现一个非常有效的零复制读取路径,该功能就使用了这项新技术。

在YARN方面,令我们非常兴奋的事情是资源管理器自动故障转移功能已经进入尾声,虽然在2.3.0这个版本中该功能还没有被发布,但是极有可能会包含在Hadoop-2.4中。此外,2.3.0版本还对YARN做了一些关键的运维方面的增强,例如更好的日志、错误处理和诊断等。

MapReduce的一个关键增强是MAPREDUCE-4421。借助于该功能我们已经不再需要在每一台机器上安装MapReduce二进制程序,仅仅需要通过YARN分布式缓存将一个MapReduce包复制到HDFS中就可以了。

当然,新版本还包含大量的bug修复以及其他方面的增强。例如:

YarnClientImpl类中的异步轮询操作引入了超时

修复了RMFatalEventDispatcher没有记录事件原因的问题

HA配置不会影响节点管理器的RPC地址

RM Web UI和REST API统一使用YarnApplicationState

在RpcResponseHeader中包含RPC错误信息,而不是将其分开发送

向jetty/httpserver中添加了请求日志

修复了将dfs.checksum.type定义为NULL之后写文件和hflush会抛出java.lang.ArrayIndexOutOfBoundsException的问题

如果想要了解更多的信息,请点击这里。不得不说的是,整个社区在Hadoop-2.3.0版本的发布过程中再次发挥了非常重要的作用,他们提交了很多非常重要的内容。

最后,让我们展望一下2.4版本中将会包含的一些非常令人兴奋的功能:

HDFS将会支持ACL

关键的运营能力,例如HDFS支持滚动更新,使用ProtoBufs序列化/反序列化FSImage

YARN资源管理器自动故障转移功能

YARN通用应用程序时间轴和历史服务,使得在YARN中开发和管理新框架及服务变得非常容易 

通信世界网

 

来源:企业网
相关文章
 
文章评论
 
    昵称:  验证码:

 
关注通信世界网
 
 
官方微信
“cww-weixin”(或扫描下图二维码),即可于获得独家的CWW视点分析、最新的通信资讯。
 
 
专家观点
邬贺铨:成立网络安..
今日上午,国家信息化专家咨询委员会副主任、中国工程院院士邬贺铨做客人民..
 
 
最新专题
  • 1

  • 1

  • 1

  • 1

通信百科
 
华为引领全球100G波分商用..
从GSM到TD-SCDMA,再到TD-LTE,数据IP类业务在基站回传..
 
 
 
新浪微博 腾讯微博 微信 rss
人民邮电出版社
工业和信息化部
人民邮电出版社图书专营店
中国通信企业协会
中国通信学会
中国互联网协会
无线电频谱管理中心
工业和信息化部电信研究院
中国通信标准化协会
中国移动通信联合会
中国邮电器材公司
中国电信
中国移动
中国联通
中国信息协会信息服务网络委员会
爱购服务器之家
新浪科技
搜狐IT
腾讯科技
凤凰网科技
人民网无线频道
中国通信网
移动Labs
中华电子网
通信产业网
企业网
In-Stat
IT价值联盟
中国软件资讯网
通信人才网
慧聪通信网
CTI论坛
CIO选型网
CTO技术网
美通社
赛立信竞争情报网
CRS通信学社
ZDNet至顶网
和讯科技
博趣·兴趣门户
呼叫中心频道
运营与增值
信天下企业短信
新电子
OFweek光通讯网
中云网