|
360违反Robots协议 遭互联网专家质疑
http://www.cww.net.cn 2012年9月3日 16:11
上线不久的360综合搜索最近风头正劲,但也麻烦不断。一方面,通过360浏览器上传用户数据,造成用户隐私在搜索结果中泄露,引起了网友的强烈反弹。同时,由于违反robots协议,直接抓取未经授权的信息数据,也遭到了法律专家和业内人士的纷纷质疑。 百度工程师赵明华在30日的微博中图文并茂地指出 “360如何侵犯百度知识产权”。他说,最集中的表现就是,360搜索不顾“robots协议”肆意抓取百度数据。查阅百度百科、维基百科信息显示,搜索不仅是一项技术性很强的互联网应用形态,同时也需遵循国际通行的道德准则——robots爬虫协议。搜索引擎的原理是通过一种爬虫spider程序(又称搜索蜘蛛、搜索机器人等),自动搜集互联网上的网页并获取相关信息。而鉴于网络安全与隐私的考虑,每个网站都会设置自己的Robots协议,来明示搜索引擎,哪些内容是愿意和允许被搜索引擎收录的,哪些则不允许。包括百度、谷歌、雅虎在内的搜索引擎都会遵循robots协议。这就好比,一个正常的人去到别人家里,需要先敲门,得到许可以后才能进入客厅。除非有主人的进一步许可和邀请,否则你不能擅自进入内室,或者在别人家里四处溜达。考虑到很多内容源网站禁止搜索引擎抓取的网页中大多涉及存放在服务器上的后台数据库、用户稳私、密码等信息。这意味着,360无视内容源网站robots.txt协议中的设定,将导致存放在服务器上的不该被搜索到的隐私信息被搜索到,甚至直接在搜索结果中展示出来。 互联网知名人士洪波指出,360这种违反robots协议的行为,如果不能从法律和政府监管上及时制止,那360今天违规抓取的是百度内容,明天就可以随便抓取含有大量隐私的人人网的社区信息,其他网站和搜索引擎都可以效仿,被京东屏蔽的一淘还可以抓取竞争对手的的商品信息。以此类推,整个互联网行业将大乱。 也有行业专家表示:360由于缺乏搜索的基因,存在技术和模式上的先天缺陷,不仅搜集、存储能力、以及对搜索结果优化能力缺失,更为严重的是,从互联网发展的规律来看,靠着违背通行规则、损害他人和用户利益的所谓捷径,必然无法持久。同时 搜索引擎一直是个充分竞争的市场,有新的挑战者加入对用户是个好事,但通过践踏行业规则的方式挑起不正当竞争,最终只会将更加伤害用户的利益。 360违反Robots协议 遭互联网专家质疑end--> 发布日期:2012-09-03 13:36 来源:begin-->今晚网end--> 字号:[ 大 中 小 ] begin--> 上线不久的360综合搜索最近风头正劲,但也麻烦不断。一方面,通过360浏览器上传用户数据,造成用户隐私在搜索结果中泄露,引起了网友的强烈反弹。同时,由于违反robots协议,直接抓取未经授权的信息数据,也遭到了法律专家和业内人士的纷纷质疑。 百度工程师赵明华在30日的微博中图文并茂地指出 “360如何侵犯百度知识产权”。他说,最集中的表现就是,360搜索不顾“robots协议”肆意抓取百度数据。查阅百度百科、维基百科信息显示,搜索不仅是一项技术性很强的互联网应用形态,同时也需遵循国际通行的道德准则——robots爬虫协议。搜索引擎的原理是通过一种爬虫spider程序(又称搜索蜘蛛、搜索机器人等),自动搜集互联网上的网页并获取相关信息。而鉴于网络安全与隐私的考虑,每个网站都会设置自己的Robots协议,来明示搜索引擎,哪些内容是愿意和允许被搜索引擎收录的,哪些则不允许。包括百度、谷歌、雅虎在内的搜索引擎都会遵循robots协议。这就好比,一个正常的人去到别人家里,需要先敲门,得到许可以后才能进入客厅。除非有主人的进一步许可和邀请,否则你不能擅自进入内室,或者在别人家里四处溜达。考虑到很多内容源网站禁止搜索引擎抓取的网页中大多涉及存放在服务器上的后台数据库、用户稳私、密码等信息。这意味着,360无视内容源网站robots.txt协议中的设定,将导致存放在服务器上的不该被搜索到的隐私信息被搜索到,甚至直接在搜索结果中展示出来。 互联网知名人士洪波指出,360这种违反robots协议的行为,如果不能从法律和政府监管上及时制止,那360今天违规抓取的是百度内容,明天就可以随便抓取含有大量隐私的人人网的社区信息,其他网站和搜索引擎都可以效仿,被京东屏蔽的一淘还可以抓取竞争对手的的商品信息。以此类推,整个互联网行业将大乱。 [1] [2]
来源:今晚网 编 辑:高娟 联系电话:010-67110006-853
关键字搜索:360
猜你还喜欢的内容
文章评论【查看评论()】
|
企业黄页 会议活动 |