当前位置:首页 >> 通信学报 >> 2011年7月 >> 云计算应用 >> 正文
基于MapReduce虚拟机的Deep Web数据源发现方法
通信学报
2011/8/2 11:27
数据源发现  MapReduce  Deep  Web  虚拟化技术  云计算  
[本文摘要]
为了提高Deep Web爬虫发现和搜集数据源的效率,提出了一种融合MapReduce和虚拟化技术实现Deep Web海量数据挖掘的并行计算方法。基于MapReduce架构提出了一个Deep Web爬虫模型,通过链接过滤分类、页面过滤分类、表单过滤分类等3个MapReduce过程找到Deep Web数据源接口,并利用虚拟机构建单机集群进行性能测试。实验结果显示该方法可以实现大规模数据的并行处理,有效提高爬虫数据源发现的效率,避免网络及物理资源的浪费,验证了云计算技术在Deep Web数据挖掘方面的可行性。
本文属于通信世界网付费阅读文章,请您先登陆注册)通信世界网,并交纳相关费用之后,您将获得阅读此文的权力,详情请阅读通信世界网付费项目说明
特别提示:请在您的电脑上安装 Adobe Acrobat Reader 阅读器,以保证您的正常浏览。
如有问题,请咨询:010-81055499
相关阅读
 
新浪微博 腾讯微博 微信 rss
人民邮电出版社
工业和信息化部
人民邮电出版社图书专营店
中国通信企业协会
中国通信学会
中国互联网协会
无线电频谱管理中心
工业和信息化部电信研究院
中国通信标准化协会
中国移动通信联合会
中国邮电器材公司
中国电信
中国移动
中国联通
中国信息协会信息服务网络委员会
爱购服务器之家
新浪科技
搜狐IT
腾讯科技
凤凰网科技
人民网无线频道
中国通信网
移动Labs
中华电子网
通信产业网
企业网
In-Stat
IT价值联盟
中国软件资讯网
通信人才网
慧聪通信网
CTI论坛
北极星电力网
CTO技术网
美通社
赛立信竞争情报网
CRS通信学社
钉科技
和讯科技
博趣·兴趣门户
呼叫中心频道
运营与增值
信天下企业短信
新电子
OFweek光通讯网
中云网
关于我们 | 广告服务 | 在线阅读 | 企业专区 | 企业黄页 | 在线订阅 | 工作机会 | 联系我们 | 友情链接 | 本站导航
Copyright ©1999-2012 By cww.net.cn. ICP许可证号:[京 09082226号-10号] 电信与信息服务业务经营许可证101190号