【赛迪网专访】在两会期间,大数据再度成为热点名词。央视专题报道中也单独开辟了“两会大数据”的栏目来分析民众对哪些议题更为关注。这说明,信息化手段分析民生数据已经开始被政府和新闻单位认可和采用。在此期间,来自英特尔软件和服务事业部(SSG)的两位中国区高层主管与IT媒体同仁见面,就大数据问题展开深入讨论。
在英特尔工作19年的何京翔,先后在英特尔信息技术咨询服务部、英特尔实验室、英特尔架构事业部和英特尔软件与服务事业部担任过各种领导角色,曾见证英特尔X86服务器从0份额到94%市场占有率的奇迹。在英特尔以芯片硬件为主的巨大光环下,他就任的软件与服务事业部似乎被掩盖了,但他相信,SSG部门也会从“无名英雄”成长为行业瞩目的巨人。
说起英特尔的软件基因,其实有很多人不知道英特尔在开源社区的所贡献。据何京翔介绍,在开源社区,英特尔可以称得上是一家最大的开源软件公司,是Linux最大的贡献者之一。在安卓开发上跟谷歌有很多合作;包括现在流行的Hadoop大数据,英特尔是Hadoop社区的一个重要贡献者;还有云计算方面的Open Stack云平台管理项目,英特尔也是前十名贡献者之一。
英特尔的“软实力”还体现在组织架构上。在全球,英特尔软件与服务部门共有6000名员工,如果SSG是一个独立的机构,足以跻身于全球5大软件公司之列。在中国,SSG有2000名员工,其中60%是软件工程师。他们分别在北京、上海和深圳各分支机构,其中位于上海的亚太研发中心集中了主要研发能力。工程师们的主要工作,一方面是作为全球的研发网络的一部分,同时也面向中国市场机会的做本土解决方案。
具体来讲,英特尔SSG部门的工作重心主要体现在四方面:第一,优化英特尔平台,如何体现英特尔平台的安全性、可靠性、可管理性,如何体现出平台的优势;第二,开发英特尔平台潜能,如何将英特尔平台在安全上、可管理性和硬件特有的功能发挥出来;第三,通过开源软件的方式,跟开源软件生态系统广泛合作,让他们把英特尔硬件的特点体现出来;第四,集成端到端的解决方案,通过英特尔软件、硬件平台的协同设计,为用户提供一个良好的解决方案。
此外,英特尔SSG部门除了支持英特尔硬件平台以为,还有很多独立开发的软件产品。其中,Hadoop发行版,Intel Data Center Manager管理软件,Intel Cluster Studio等等;还有英特尔先后收购的国外知名软件公司,目前仍在以独立的身份运作并出售相关软件产品,如McAfee,Wind River、Apeona、Mashery等公司。
何京翔说,英特尔的“硬实力”无疑将帮助英特尔软件发挥更大的优势。从大数据角度来说,数据渠道是“端到端”的概念。在前端,英特尔的PC业务是强项;后端以数据中心为例,目前有90%以上的服务器是基于英特尔架构的,这使得SSG部门开展软件业务有很好的硬件平台基础。
英特尔大数据并不抗拒非IA的数据来源
很多数据并非仅来自英特尔架构的设备,尤其在智能终端设备上,ARM占据绝大多数的份额,那么由这些设备采集的数据是否还在英特尔大数据范围之内?
何京翔表示,“关于数据采集,英特尔不排除用其他的非IA架构的数据源。包括现在的苹果,前端是基于ARM的iPhone,但是后端都是IA的架构。对数据源来讲,英特尔没有排他性。”另外他补充道,“如果前端是英特尔架构的设备,后端是英特尔数据中心的服务。他们之间从安全性上讲,比其他平台的体验更好;可管理性方面更优,这些方面我们是有成功案例的”。
中国大数据软件技术和应用完全有可能领先全球
英特尔公司数据中心软件部中国区首席技术官苗凯翔在介绍大数据重要软件产品Hadoop发行版的由来时,对中国智慧非常有信心。原因是,Hadoop发行版在中国提前7个月先于全球发布并落地应用,完全依赖于在中国的Hadoop开发团队和中国移动、联通这样的客户需求,催生了Hadoop发行版必须要先于全球在中国发布。
何京翔说:“在大数据时代,我们中国工程的技术人员,绝对不落后于欧美的开发者,从应用上讲,甚至中国有领先的机会”。
互联网公司其实软硬不离英特尔
众所周知,互联网公司在本质上来说就是一个极具创新力的软件公司,他们除了采购英特尔的硬件产品外,英特尔软件似乎对其没有吸引力。在阿里等互联网公司切入智慧城市的项目,也许还会与英特尔形成一定的竞争关系。
何京翔说,英特尔与互联网公司的合作方式不同于其他系统集成商。90%以上的互联网公司使用的硬件都是英特尔架构的。卖硬件给他们,并不表示与软件毫无关系,他们仍然需要英特尔的软件部门的帮助。原因是硬件的更新频率远高于操作系统,而互联网公司硬件升级换代一直走在前端,他们需要英特尔的软件工程师的支持帮助其优化,保证在新硬件上所有应用跑得最佳。谷歌、亚马逊、百度、阿里巴巴都是合作非常密切的客户。
关于互联网公司切入大数据领域,积极参与一些项目。何京翔表示,英特尔乐见其成,并不感到畏惧,并且非常希望互联网公司能把这些项目最终落在英特尔平台上。
究竟谁能摸到大数据的金矿?
预计到2020年,全球将出现500亿个终端设备,产生40ZB的数据量,世人惊叹大数据绝对是金矿!事实上,你知道金矿埋在哪儿吗?目前,认知大数据宝藏是非常困难,对于大数据价值的开发和利用存在很多矛盾。有时,我们知道这些数据有价值,却苦于没有方法或技术来挖掘;有时,我们根本就不知道哪些数据能产生哪些价值,就更无从说起开发和利用了。英特尔SSG认为,对于一个问题的定义,然后到架构,再到应用开发,是需要非常资深的数据工程师或者算法师来完成,因此这类职业未来将非常火爆,现在这类人员的能力差别也是很大的。
目前,很多英特尔的合作伙伴都在研究如何让那些数据活起来,使其互相之间产生关联,从而得出一个对行业有意义的结论。何京翔表示,挖据大数据价值需要生态链和全行业的共同努力,而非一家公司可以做到的。
英特尔认为其生态链有三大组成部分:以国有四大银行及三大运营商为应用典型的终端用户占据生态链的重要一环;系统集成商、应用开发商、解决方案提供商等合作伙伴更“接地气”,他们是英特尔软件与服务事业部2014年生态链的重中之重;另外,OEM等各硬件组件供应商一直是英特尔生态链持续稳定的环节。目前,大数据生态链组建处于刚刚起步的状态,英特尔在挑选合作伙伴时,重点会考虑他们是否有足够的行业知识,是否有自我创新能力和生存能力。 责任编辑:孙姗姗
|