周华:数智 实现数据价值加速迸发

责任编辑:甄清岚 2018.10.18 15:59 来源:通信世界全媒体

通信世界网消息(CWW)10月18日,联通大数据举办的“U10大数据价值峰会”在北京召开。联通大数据公司副总经理周华与与会嘉宾共享了有关联通大数据能力实践和业务布局的相关内容。周华透露,联通大数据已经在31个省建立培养了1000个数智服务的专家,同时有超过6万名从省到市到县一级的数智营销经理,此外,预计到今年年底联通大数据收入增长率能够超过300%。

image.png

演讲全文如下:

周华:各位来宾、各位领导、各位大咖们,大家好!我叫周华,我演讲的题目是数智实现数据价值加速迸发。

去年9月份中国联通大数据刚刚成立,金秋十月它是收获的季节,也是盘点一年收获的季节,我想关注联通大数据公司的朋友们肯定很关注这一年联通大数据公司到底做的怎么样?我给大家汇报一下。

首先我们已经有超过400个员工,当然这也包括我们的两个合资公司的同志们,同时我们已经在31个省建立培养了1000个数智服务的专家,得益于我们纳入了政企体系,同时我们可以有超过6万名从省到市到县一级的数智营销经理,我们这个庞大的营销体系就是在我们李广聚总经理带领之下的一个团队,实现了我们这么大团队力量的一个迸发。

干的成绩怎么样呢?285%,这是在9月份同比去年我们联通大数据收入的一个增长值,现在基本上没有任何悬念到今年年底能够超过300%。

再一个在数方面,当然也是秉承联通大数据的特色,就是在连接融合造就了大数据,我们到目前为止,这是市场部同志表示的方式,其实有超过200KB的数据量,这在任何一个大数据企业里面都是一个海量的数据。其实我们的数据目前我总结是分为两个维度,第一个是我们联通自身的数据,我们有4亿的自身用户数据、个人手机用户数据和过往用户数据,第二个我们有超过1亿个物联网连接数据,我相信在5G的推广中,物联网连接数据会快速的超过手机用户的数据。第二方面我们通过合作伙伴,整合和超过10个行业的合作伙伴,以及大概50个数据合作方共同打造,后面会讲具体合作的案例,数据包括有政府、电商、金融、旅游的数据等等。

智,我们是在技术算法加速驱动的智能,这里总结了四个,平台的智能、运维的智能、算法的智能和安全的智能,平台的智能我们已经有超过6000个节点,如何让这些节点智能化的调度、智能化的为服务提供相应的能力就需要我们平台的智能。第二个运维的智能,我们每天处理的数据量超过100T,如何发现巨量的数据有没有出故障,某一个节点、某一个省的数据今天传送有没有问题,每天来的数据是不是合乎我们的规范,如何发现这个问题?一定要有智的处理。再举一个例子,我们的安全智能,在刚刚国资委举行的央企网络安全优秀解决方案评选里面,联通大数据公司大数据的安全解决方案获奖了,这也是代表大数据这个行业唯一获得的一个奖项。其实很简单,ABC也是基于我们的AI、大数据和云形成的四个智能能力。

有数、有智,刚才赵总讲到了我们推出了数智中台,传统的大数据公司都会有数据中台,我们联通的数智中台有什么不一样呢?我觉得数据中台一般会根据一个企业的历史、组织架构,乃至文化的不同,可能它的数据中台包含含义不一样,我们的特点是我们的数智中台不包括具体生产平台部分,为什么呢?我也在想为什么我们这个平台会不包括那部分?其实传统的一般数据中台都会把数据的采集、加工、清洗等等都会含在整个平台里面,而我们没有。我总结确实有很多企业,特别是大企业本身就需要有数智中台这个体制去把散落在各个地方的数据整合起来,但是联通因为历史原因,我们是在几年以前就已经把全国各省的数据已经完整的整合起来了,这个路我们已经不需要了,这是一个历史原因的特点。我们把生产平台只是当成了一个标准生态能力,只是下面一个基础能力而已。

第二个,我们的数智中台是在基础平台之上,通过不同的技术把数据聚合,再把它标准化,完了以后形成服务层的能力。举一个例子,其实这也回到了大数据的本源,就是数据的重用,可能大家也知道大数据是金矿,是不是每一个模型都需要像一个矿工一样到最底层把矿挖起来,然后把矿要清洗,还得把矿石粉碎,再形成提炼等等过程,是不是每一个大数据的算法,或者合作伙伴来的时候,都要像我们一样定义我们的矿工,我们就是大数据的矿工,都像我们一样灰头土脸的干这个事情,我觉得我们不需要。我们把前期辛苦的苦活脏活做完,把矿石的清洗、粉碎、筛选做完,再形成一个金粉,或者一个金矿、金条放在数智中台里面。再有任何的应用、产品、合作伙伴来的时候就很方便的从数智中台里面直接调取我们的模型去使用,这就是我们数智中台的理念。我定义数智中台是实现数据价值的纽带。

我们数智中台就是大数据平台之上,大数据平台已经有这些标准的能力,已经实现了数据的采集、交换、共享和生产,在此之上我们数智中台分成了三个中心,智能模型中心、智能服务中心、智能应用中心,这个逻辑很清晰,首先我们是把标准化的模型形成好之后放到服务模型中间去,再根据不同的应用提供相应的服务能力,在此之上就是通过不同的应用给开放者,或者给我们自身内部的产品人员、产品经理,或者是我们的合作伙伴提供相应的应用,我后面会举两个例子来阐述一下我们的数智中台是怎么运作的。

第一个是举我们旅游人群模型,大家看这边,首先第一步一定要有基础数据,基础数据就是包括景区数据,景区的范围大概是怎么样的区域,第二个是基站工参,第三个是信令数据。第二步把景区的围栏进行圈定,哪些基站是在这个景区里面,包括把整个景区囊括。第三步就是实时位置计算,第一个可以统计出整个景区里面到底有多少人是在这个景区范围之内,第二个我们还要算一下其实有的人不是在这个景区去旅游的,他有可能只是从这个景区区间经过,我们怎么算出过境人群,还有一部分人不是旅游,他可能本身工作居住在这个景区范围之内,我们把这部分人也统计出来,过境人群和常驻人群需要我们机器学习的方法去学习,每个地方、每个景区的特点都可能会不一样,我们怎么学习出来这个景区,或者这个地方范围内相应过境人群的特点,或者常驻人群的特点,把这样的数据统计出来。再有一步就是进行剔除,这两个我们认为是景区的异常人数,剔除完之后就形成真正最后的到底有多少人到这个景区来旅游的人,他的轨迹是什么样子,包括他的指数等等。整个这个过程我们说用了聚类算法、逻辑回归算法、K均值算法,形成这个模型之后就放在数智中台,可能在很多运用场景都可能用到这个模型。

在服务中心里面有三个具体的服务中心都是怎么个特点,第一个是点查询的服务中心,它的特点是点查询能够毫秒级的反应,它在一个应用场景里面对企业数据的查询,或者个人用户的查询,它的要求就是实时性很强,很快速的反应,具体是单点的数据。包括实时广告的投放也会遇到这么一个服务中心。第二个服务中心是交互式的探索服务中心,它的应用场景是针对人群的一个分析,比方说对用户群的筛选,对用户群的画像以及对用户快速定位场景的服务,它的要求特点是对多维度的,可能是指标灵活重构,而且是很快速交付的可视化的这样一些特点,通过这种方式提供服务。第三个服务中心叫实时流的数据服务中心,这个基于运营商的数据特点,不仅是视频流,包括电话流、短信流、位置流,它的应用场景就是像一些需要统计一段时间,比如说5分钟、10分钟这个人的轨迹,或者是一些重点区域的监控,一段时间之内他的一些数据,或者旅游有没有变化,像实时事件实时感知的服务、突发事件的预警服务、人流轨迹的服务跟踪的时候都会用到这种服务方式,它的特点就是对流数据采集以及热力图可视化洞察、分钟级场景支撑。

刚才赵总发布了我们的U型架构,这个U型架构我们是怎么落地的呢?刚才我整体感觉第一首先我们有数智中台,在数智中台之上形成了两个产品体系,一个是数据产品,一个是智的产品体系叫智能方案,数智产品体系有数盾风控、数言舆情、数达营销、数赢洞察等等,智里面包括智游、智融、智安,这样两套产品体系。通过数智+赋能的方式给三个方向提供了我们相应的服务,包括2G、2B、2C。如何给这三个方向提供服务呢?运用于N个应用场景,一个平台两套产品体系三个方向N个应用场景,大家有没有觉得这个逻辑有点熟悉?道生一、一生二、二生三、三生万物,我们也是在做的过程当中突然发觉整个机制那么合乎我们祖先们定下来的这么一个逻辑,我只能感叹中国文化的博大。我们就形成了1+2+3+N的整个服务体系。

后面我会举一些例子,第一个阐述一下我们数智+如何服务于N个万物各个应用场景,第二个我们也是怎么来落地刚才赵总讲的三个战略,首先第一个是数据资源的聚合战略,我讲的案例是数智+政务,这个案例我们给高新区产业园区打造的产品,它实现区域内产业发展全景式的展现,首先聚合数据,一方面是联通的数据,这方面更多是我们的物联网感知数据和我们人的数据,人就是360度画像的数据,第二是区域经济数据,区域经济数据包括两块,第一块是政府手上的数据,通过政府的共享交换采集上来的各个数据,第二部分是各个企业自身的数据,在整个这些数据融合之后,我们打造了整个这样一个应用,重点包括这几块,对于产业园区的领导来说第一关心招商,第二关心企业的发展情况,第三如何更好的为辖区的企业提供服务,第四整个产业园区运行的情况,整个指标我们形成了八大类136个指标,可以为他所使用,我们这个也是国内首个针对双创企业生长率一个动态的评价体系。

第二个案例也是讲数智资源聚合,这里讲数智+金融,这是针对小额消费贷产业,融合了双方基础数据标签之后,联合建模的产品,这是我们和京东共同打造的产品。简单的模型设计逻辑是这样的,京东首先本身是有信贷逾期的一些用户样本,把这些样本脱敏之后给到联通,联通拿到样本进行用户匹配,匹配过程中筛选出这部分用户在联通里面他的模型大概会是什么样,比如说这个用户是不是经常会换手机号,比如说他的手机号换完之后是不是基本上没有打电话,比如他的手机号码联系过之前我们已经认定为可能违法,或者是黑卡的号码等等,通过这样一些模型计算完之后得出联通的信用分,反过去再给到京东,京东叠加上他对这部分用户打个标签,最后形成了京联信用分,目前这个信用分已经在京东信贷平台上使用,我们对它进行了测试,它的KS值基本能达到0.2247,大家都知道传统的是一般超过0.2是不错的模型,最好能够达到0.3332。

下一个我想讲的是我们如何做创新应用的牵引者?这个讲的是数智+航旅,我们很早以前有个旅游类的产品,我们把这个产品进行了拓展,拓展到航空机场,这是聚焦机场范围内能够识别出出行旅客的来源、目的地、游客属性,包括他的驻流类模型,包括他的同行人,他是不是过境游的游客,还有如何对这部分游客进行引导,而且还有一个特点,大家可能知道境外的游客到了国内之后70%以上都是落在了联通的网上,就是因为3G时代的时候联通用W支持,这是目前通用的,自然而然到国内之后就会落到联通网上,我们国际友人的用户数在我们网上是最多的,我们对国内国际游客的分析,省内省外中转的分析,包括对智慧信息的服务,包括数据分析等等,已经在各个机场形成了标准的产品。

再一个实践创新应用的牵引者,就是我们和腾讯打造的产品,我们定义为数智+互联网,这是融合了两家,一个是通信侧,一个是互联网侧数据打造的产品,其实我们两家之前一直是受一个困扰,就是通信诈骗,在通信诈骗这个时代的时候,我们两家都有很多的合作,那个时候没有产品级的合作,但共同帮着国家和公安部门打击通信诈骗,现在金融诈骗越来越猖獗之后,我们自然把这个应用场景进行了扩展,打造成金融诈骗这个场景下的一个产品,我们的数据优势有腾讯和联通的数据。第二个我们有黑卡的数据,腾讯有黑号的数据,包括覆盖的设备等等,这是典型的应用了业内常说的一句话,就是数据不出门、模型多跑路,数据都在双方的数据库里面保存,通过模型在双方算完之后形成一个结果。目前我们已经每天能够检查出病毒木马超过300万个,每天检出的恶意ABK250万个,覆盖的安卓手机是90%,IOS覆盖了60%。

再有一个创新应用的牵引者,我想举的例子是数智+商业,其实联通我们更多的数据维度大概是左边这个圈,就是我们有人的社交关系和个人属性,包括位置这样的属性,其实我们还缺的是货和场的数据,货无外乎这个产品销售价格、制造成本、品牌商品分类等等,场就是卖场,或者销售的产品,包括商圈的围栏、商品价格、交通设施等等,我们是重构了人、货、场商业的三要素进行了一个场景的应用,通过相应的画像、模型和算法打造出针对商业不同的应用。举了三个例子,比如说第一个我们为某地产公司进行人流洞察,帮助他去筛选拿哪块地更好。第二个我们对健身人群的数字营销,我们通过这样的模型去算哪些用户、哪些人可能是健身的爱好者,我们对他进行精准的营销。第三个这也是某市大悦城给它做的一个运营,运营大悦城的客群和它的会员之间的关系运营。

在产业生态建设者这块我们是怎么做的呢?我这块举的是数智+产业,联通大数据公司是有投资权,我们如何在产业里面整合更多的资源共同推广呢?我们成立了两家子公司,我们有两家子公司,其中一家跟西班牙电信成立了合资公司叫做智慧足迹,它的定位提供领先的位置大数据服务。第二个这个确实是我们今年刚成立的公司,是跟成都市政府成立的联通高新大数据人工智能科技有限公司,它的定位是共同加速政务大数据产业发展。我们目前联通还在旅游、金融等方面也在资本层面进行探索,在更多的层面通过资本去撬动能够形成产业的加速。

讲了那么多,我们如何把我们整体这些体系落地呢?我们今天发布一个双百计划,我们希望能够招募100个合作伙伴跟他做数据的开放共享,利用我们的数智中台。另外,我们也希望招100家合作伙伴能够做智能合作应用的合作,希望在座的各位嘉宾能够积极的参与。

数智+,为建设数字中国加速,谢谢大家。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容