中移动齐骥:大连接时代的大数据能力建设与行业创新应用

责任编辑:孟月 2017.06.15 15:04 来源:通信世界全媒体

通信世界网消息(CWW)为充分挖掘运营商大数据的金矿价值,促进通信大数据的发展,人民邮电出版社联合信息通信大数据产业联盟于2017年6月15日召开第二届中国信息通信大数据大会 ,在会上,中国移动苏州研发中心大数据产品部总经理助理高级工程师齐骥作了以“大连接时代的大数据能力建设与行业创新应用”为主题的演讲报告。

齐骥_副本.jpg

中国移动苏州研发中心大数据产品部总经理助理高级工程师 齐骥

齐骥:

刚才张总这边介绍的有一点点需要再澄清一下,我们这个单位的名字叫中国移动苏州研发中心,目前来讲我们中移动内部的三个独立法人机构,是属于独立的研发机构。非常高兴来到今天这个场合,在座的各位专家应该都是对大数据这个领域非常了解的,我其实真正说接触大数据这个行业应该时间蛮长,但是大数据这个名词可能是最近这几年才出现的。今天的题目是大连接时代的大数据能力建设与行业创新应用,我把我们进近年做的一些初步的工作,说不上有多么先进,跟大家分享一下,那么主要是分成两个部分。

第一部分是大连接成就大数据,为什么这么讲呢?因为在运营商来讲实际上连接和数据本身它就是我们一起来研究,但是在大连接这个时代大数据跟它实际上就是成为了一盘棋,它们是一个相辅相成的关系,那么随后第二部分我会介绍几个我们近期的在行业领域的应用。我们首先来看一下数字化时代它的一些信息的重要特征。李克强总理也说过,不管是推进政府的简政放权放管结合,还是推进新型的工业城镇化农业现代化,都要依靠云计算和大数据,为什么这么说呢?数字化时代,实际上它的基础设施就是基于云管端的普遍连接,它是最重要的一个信息流通的模式,那么依托大数据平台创造的一系列智能化软件化定制化的服务是数字信息服务时代最主要的生产方式。我们可以回想一下计算机的时代,就是有输入输出设备,有中央计算单元,还有内存。在目前的数字化时代,我们认为实际上一个数字化服务,它的体系架构就是云、管和端,那么我们作为运营商实际上最强的,我们最有控制力的这部分实际上是管的这部分,也就是连接的这部分。我们如何依托于这个中间强有力的管道去向上方的云的服务去发展去控制下层的智能的终端设备是我们未来面临的一个主要的问题。

那么也正是看到了这一点。中国移动发布了大连接战略,这是我们在2016年到2020年的一个战略的规划,愿景是成为数字化创新的全球领先的运营商,目标是收入增速高于世界一流的运营商它的平均水平,然后连接数能够翻番,这个已经是一个目前看来比较保守的一个估计了。大连接战略的内涵就是做大连接规模,做强连接应用。我们可以看到大连接战略以来已经取得了比较显著的成果,具体来讲就是我们有一个四轮驱动的战略,所谓的四轮驱动就是传统的移动的市场,还有家庭市场,还有集团客户市场,最后一个是新领域市场。那么在传统的市场方面,我们目前已经是遥遥领先。在家庭方面我们也是这两年发展得非常快,家庭客户已经突破了7000万,在集团市场,我们的目标是三分天下,现在看起来还有一点点差距,但是也正在迎头赶上。

那么我们来看一看中国移动所谓的大数据助力大连接它到底有哪些数据,包括前面也讲到有一些日志数据,它这些都是自然会产生的,那么中国移动作为全球最大的运营商,在国内是拥有63%的移动用户,然后百分之二十八以上的固网客户,它的数据量是非常大的,它实际上非常类似于我们在海面上看到的冰山,那么用户能看到的实际上是海面以上的部分,就是业务层面的数据。业务层面的数据包括一些外部的互联网业务,也包括我们内部的一些自有业务,包括微信,微博等等这些,还有我们自有的包括咪咕的一系列还有互联网公司的一系列的业务。但是实际上这并不是中国移动目前面临的大数据的主体,真正的海量的数据是在海面以下,比如说用户的账单详单他的通话记录上网记录等等,包括一些客服的语音信息,包括电子渠道的信息,这个体量是很大的。除此之外,网络域的数据就更大了,还有体量最大的是叫DPI数据,实际上他本来是为了去优化网络的质量减小网络延迟,但是目前它更多的用到了用户的行为分析以及上网的一些习惯上面。

不光是我们拥有海量的数据,我们这个数据所蕴含的价值也是非常高的,可以主要从这么几个方面来去看,一是场景化,比如说我们的数据能够体现用户在消费场景以及特定群体效应的方面的一些状态。还有个性化,就是我们移动系统的实名验证的数据,实际上是带有很多用户个性属性信息的,再有就是位置化,比如说刚才说到它实时化的位置,然后还有实时化规范化等等特点。我们其实可以对比一下互联网公司,它也拥有海量的数据,但是实际上跟运营商的这个数据之间应该是一个互补的关系。从而我们也对大数据有我们运营商这个角度的理解,作为运营商来讲,他实际上想做好大数据,要从业务数据算法和平台这几个方向入手。首先,这个数据是产生于业务,包括内部的一些业务和外部的业务,外部的业务其实主要是行面上的一些应用了,金融政务互联网旅游交通等等。这个业务产生的数据之后要通过算法对这些数据进行分析和挖掘,那么其中就有结构化数据的方法和费用化数据方法,那么这里边也会涉及到很多自然语言理解人工智能相关的技术。近期比较火的深度学习也是在算法这个层面要发挥作用,那么所有的这些算法数据和业务都是依托于一个大数据的平台来去运营的。我们这个中国移动设计的大数据平台实际上是包含了两域四层的架构,从采集到存储计算到上面的能力层,再到上面的工具和应用都是有完整大数据的体系。

从我目前看到的情况来看,大数据实际上以前并不是运营商刚需的能力。但是逐渐来讲,随着连接数的增大,随着目前传统业务所能够输出利润的进一步减弱,大数据实际上已经成为运营商的一个刚需了。所以我们为了迎接这样的挑战也是采取了一些举措。首先是在组织架构方面成立了中国移动苏州研发中心,就叫中移软件。他的职责是规划大数据管控和运营。我们是2014年注册成立,但是之前实际上在北京的中央研究院已经有十余年的积累,目前的人员已经超过700个人。85%以上都是研发人员。大数据平台技术主要是依托于开源的软件来搭建的,这样做的主要目的实际上就是采用开放的架构,能够吸引更多的人才。在数据管理方面我们也是有这种开放的态度,对标互联网行业大数据中心,集中的去运营和管理自有数据,也提供一些数据合作的机会,希望能够把握一些发展。

这里边涉及到的软件比较多。我就不一一细讲了。跟我们实际上现在大多数互联网公司或者是其他友商采取的架构应该是比较类似的,这里边重点要说一下的是应用层里边,实际上也是结合咱们今天的会议的主题,我们已经开展了电信领域的大数据应用还有政务领域的金融领域的然后舆情商情知识库,工业大数据,还有旅游以及交通的这些大数据应用,我等会具体的去讲几个例子。那么除了要自己去坐好相关的研发和运营工作之外,我们要依托于生态链的发展去进一步加强跟外部厂商的合作,那么目前已经有50多家业内的大数据企业跟我们开展了合作。同时我们也积极参与了大数据的行业协会,目前已经成为工信部的副理事长单位。特别需要提一下,就是说我们实际上虽然作为中运营商的研发机构,但是我们还是有信心把这个核心技术做好。

我们接下来看一下第二个部分,大数据繁荣行业创新。首先,刚才也说过它蕴含着巨大的价值。我觉得我们未来实际上大数据的产业膜肯定远远不止一百亿元,实际上人工智能必须得依靠于大数据的,它才能够训练越来越好,实际上这都是相关的产业,我们现在发现在商贸行业旅游交通行业公安行业都可以扩大我们大数据的应用范围。比如说我们这里边列举一个某工业企业大数据应用的例子,由于商务方面的原因,我就不透露具体是哪一家了。目前所有的行业都面临着数据的抓取使用以及展现的问题,比如说以全国的建筑行业为例,我如何去获取第一手的开工的数据,实际上之前依靠于政府部门的统计,数据往往是不足够真实的,国务院也发现了这个问题,某工程机械企业实际上在国内的挖掘机或者是工程机械市场上占有了比较大的比重,国务院实际上就跟他们有一个合作,通过它的挖掘机以及工程机械上的物联网的探头传感器去获取每一天甚至是实时的工地的开工情况,通过相当于是一个大数据的手段来获取第一手的开工的信息,那么同时对于这个工厂本身来讲,它也可以依托大数据的手段去采集传感器的数据,对整个工程机械的油耗它的健康状况或者说它的故障预测进行一个全方位的判断。据我了解,不光是工程机械,像我们现在的电厂,凡是具有这种大规模机械的工厂区都有这方面的需求,这是一个非常巨大的市场,以前我要去维保一个设备,我可能就是按照厂商的说明书每隔半年我要换一个什么,每一年要检查个什么,但是如果有了这个大数据的技术,有了物联网的传感器,我们就可以实时的去监控机器的健康状况,然后通过历史的一些日志数据对它做训练,然后去预测它出现问题的概率,然后提前把备件运到,不是去硬性的按照某一个周期去保养,就是我们在工业方面的一个例子。

那么纺织行业其实也是一样,他们之所以能够成功,实际上就是能够获取第一手的用户需求,并且把这些需求变成结构良好的数据反馈到设计师,然后再由设计师把设计出来的图纸能够快速地加以实现,然后通过物流网络去发送到世界各地。我们客户的思路其实跟他也是一样的,只不过在理念上我觉得还要更进一步,就是说它实际上是通过去抓取互联网上尤其是淘宝以及微博上的一些用户对衣着方面的一些取向的信息,然后去分析什么样的款式什么样的面料,然后在什么样的季节去适合去推广,去做这样的一个超前的产品的形势预测。那么这个案例我们也是依托于中国移动的数据挖掘平台来实现的,这是第二个纺织行业的例子。

同样在交通的领域,我们为了支持保险公司或者是车的4S店做销售,会基于这个车载的一些盒子去分析车辆碰撞的视频数据行驶里程数据,还有地域分布驾驶风险等等这些信息做评估,这个都是大数据时代我们基于传感器传上来的数据以及运营商的网络才能够实现的一些功能。那么再比如说还有基于位置的监控预警系统。2014年上海在跨年的时候发生了踩踏事件,从那以后各个地区的政府可能对这个实时的用户的人流监控都给予了更大的关注度。跟我们合作的客户实际上也是有这方面的需求,我们是实现了因为中国移动它的这个用户覆盖面是比较大的,而且用户基本上是全天24小时而来,所以通过运营商的统计得到的人流分布应该是更为精准。那么能够主动发现未知区域的用户激增,然后把这个区域设为关注的区域之后就可以对该区域的人数变化,话务量已经上网的活动进行全方位的监控,同时我还可以结合互联网上面的舆情信息去自动的发现一些热点的地区,比如说某个地区要开演唱会了,或者说某个地区要举办大型的活动,我就提前去把这些区域设为我的关注区域,有利于去更好的分析人口的流向。

下面一个案例是舆情通,实际上是一个比较传统的互联网应用,我们运营商为什么也要做这个应用,是因为我们具有一些互联网或者是专业的舆情单位不具备的优势,像广快准全就不说了,那么除此之外,我们运营商还拥有大量的DPI的数据,对于确定舆情的传播路径以及获取舆情的领导者等等都非常有帮助,这也是很多个政府机构跟我们合作的一个主要因素,除了能够获取互联网上的舆情之外,我们还能够获取特定用户的舆情传播的相关的信息。

那么最后一个案例是在旅游领域的应用。这实际上跟我们前面的位置类的应用也是类似,只不过是侧重在旅游这个领域,希望能够实现智慧旅游,那么它提供的功能主要是通过景区的流量分布以及旅客的来源分布等等,为景区推广以及游客的出行做出一些指导,还有就是说能够定期的去输出一些行业的发展的报告,目前也是在国内有很多地方已经成为我们客户,那么以上就是我今天的分享,谢谢大家。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容