通信世界网讯(CWW) 于2014年3月10日启动报名的首届阿里巴巴大数据竞赛开赛一个月以来,报名队伍数突破6400支,已经成为目前全球最大的算法类竞赛之一。截止4月10日,阿里巴巴大数据竞赛总参赛人数近1.5万人。其中港澳台参赛队伍超过120支,海外队伍超过80支。
此前,从1997年开始已举办了15届的KDD CUP一直以来是世界范围内最大规模的数据竞赛,该竞赛依附于美国计算机协会数据挖掘及知识发现专委会主办的ACM SIGKDD国际会议(简称KDD)。作为数据挖掘研究领域的顶级年会,2012年的KDD CUP数据竞赛曾经吸引了国内队伍参加,但全球范围内参加的队伍数不超过1000支。
据悉,阿里巴巴大数据竞赛是由阿里巴巴集团主办,在阿里巴巴大数据科研平台——“天池”上开展的,基于天猫真实推荐业务场景与海量真实用户的访问数据的推荐算法大赛。整个竞赛过程持续九个月,将于十一月中旬结束。参赛选手不仅可以通过大赛接触到真实的天猫用户行为数据,还有机会被邀请到天猫,与天猫推荐算法团队的工程师们一起设计双11的个性化推荐产品。
阿里巴巴天池项目负责人王一婷对面向学术界免费开放天池平台的目的解释说,目前高校和科研机构在使用数据时,往往面临两个困扰,一是数据陈旧不鲜活,缺乏有价值的真实的商业数据,二是缺乏具有强大功能的计算平台来支持复杂的数据处理。天池平台将向学术界提供免费的科研数据和开放数据处理服务,帮助大数据科研领域的发展。“我们搭建一个大数据科研平台,并向科研界提供数据和计算服务,在有安全措施保障的情况下,让学术界神样的理论与工程界的实际应用产生碰撞、擦出火花,促进大数据科研的发展——这个平台就叫做天池平台”,王一婷表示。
据介绍,阿里巴巴天池平台是基于阿里集团自主研发的ODPS海量数据离线处理服务的大数据开放平台,向学术界免费提供科研数据和开放数据处理服务(Open Data Processing Service, 简称ODPS)。ODPS以RESTful API的形式提供针对PB级别数据的批量处理能力,主要应用于数据分析、海量数据统计、数据挖掘、商业智能等领域。
|