云从科技张立:大数据邂逅AI 产生的“化学反应”

责任编辑:田小梦 2018.10.18 17:43 来源:通信世界全媒体

通信世界网消息(CWW)10月18日,联通大数据举办的“U10大数据价值峰会”在北京召开。云从科技高级副总裁张立与与会嘉宾共享了云从科技线下、人工智能和大数据的应用场景。

演讲全文如下:

张立:很高兴来到这里参加今天联通大数据的第一届U10大数据价值峰会。云从科技作为联通大数据的合作伙伴,我们在一起眉来眼去有一段时间了,实质性的进展也有很多,今天希望借这个机会给各位进行分享。刚才腾讯马总分享了整个腾讯现在对于产业的看法和未来的布局,这是一个巨人的肩膀,云从作为创业公司来讲,腾讯的未来也是我们的目标,接下来在我的题目里,可能会非常的结合线下、人工智能和大数据的应用场景给到大家。

人工智能时代到来是毋庸置疑,人工智能的概念逐渐的进入了大家的视野,但是人工智能本身不是一个新的概念,从它出现到现在有60多年的历史,但是人工智能沉睡了50年,它出现60年,但睡了50年,这里面有三起三落,在过去的几十年里面受限于技术、学术的发展和研究,让人工智能无法在真实的场景下找到一些合适的结合点。我们说随着20多年来,互联网、大数据、云计算一系列的发展让人工智能开始走入了我们的视野,重新进入了学术圈的眼界,也进入了工业界的眼界。我们在2016年阿法狗比赛之后掀起了人工智能浪潮,到2017连7月中下旬国务院发表了把人工智能作为国家战略,这个时间非常之短,短到只有一年的时间,短到学术界和工业界没有做好任何的准备,它和互联网+规律不一样,互联网+从上世纪90年代磨损到国家提出落互联网+,其实它是经过了一定时间的发展,但是人工智能不是,人工智能短短一年就变成了国家战略。

为什么会是这样?在我们从业者来讲,云从科技是2015年成立的,也是在大的行业背景下成立的,短短3年时间我们自身在实践和探索的过程当中,我们也发现人工智能为什么会得到国家这么大的重视一个最大的原因,因为它对于实体经济的融合,我们现在讲数字经济,在讲更多的人工智能、大数据、云计算,所有这些都离不开实体经济,怎么样让数字经济跟实体经济向结合带动我们的产业升级,从原来吃的饱、穿的暖变成吃的好、穿的好,怎么样可以让经济发展从速度变成质量,这个一直以来是国家在看的怎么做产业升级,当人工智能时代到来的时候,国家认为说这个技术的发展是可以带来整个产业的发展,而且整个人工智能从上游到下游的产业链非常之长,这也是为什么人工智能难的地方。

我们在看到这么多年来发展,到底技术作哪些沉淀?我们回到1997年IBM深蓝国际围棋的挑战赛,那个时候我们算力,从算力的角度来讲,计算机的浮点运算才能达到11.8亿次的运算,20年后到了2016年太湖之光(音),现在可以达到9亿亿每秒钟,它的算力大量提升对于整个的技术实现成为了可能性,再到去年看到李世石和阿法狗下棋,我们都知道这是人工智能技术,实际上在人工智能六大领域里面,李世石和阿法狗下旗用的是视觉和图像识别技术,这里面处理了海量的数据,这个本身证明了现在的人工智能技术不足以去仿生,不足以真正像人脑一样学习和思考。

虽然技术上面现在还有一些欠缺性,但是不妨碍人工智能现在的各种应用场景的应运而生,在倪光南院士今天早上的致辞提到虽然中美在基础科学研究上中国和美国有差异,但是在应用上面中国并不输美国,不仅从国内人工智能产业发展,不管从投资也好,还是各种创业公司也好都能看到。最近几年我们可以看到大量的人工智能论坛,包括语音,包括图像识别,包括一些国际比赛,可以看到中国的华裔科学家大放异彩,在海外代表美国来参赛的,或者发表论文的很多都是中国人,为什么呢?因为中国人的数学能力非常强,这就是为什么中国在人工智能领域,不管在论文数,还是专利数,现在都已经跟美国目前的增长程度并驾齐驱。

我们再来看国内的应用,刚才马总也提到,包括腾讯在公司的应用,包括云从在国内的应用,我们可以看到比如说人脸识别应用,比如说在机场、地铁、银行,现在不用再掏身份证,直接刷脸可以办业务,另外无人驾驶出现,无人驾驶的出现也是大量用到了传感器和图像识别的技术,再来看智能对话,智能语音对话技术,虽然我们说有语音识别,但是实际上现在真正做到的人机交互语义的理解还不够,怎么样在自然语言理解能够实现突破,能够真正让机器和人对话?现在也在看到智能客服,我跟联通大数据的同事聊过,他们希望有更多人工的客服转成机器的客服。另外,在智能个人助理,未来的时代我们说可能是一个颠覆的时代,就像刚才马总说的生产力的发展一定会去改变生产关系,会影响到生产资料,未来颠覆生产力的颠覆、技术的颠覆出现可能会去颠覆未来整个生产关系,将来我们每个人,我们曾经畅想过未来是什么样子的,今天我是个物理的张立站在这里跟大家分享,但是有可能他是我的一个虚拟助理在这里为大家演讲,甚至我们说永生是有可能实现的,因为当你的躯体离开了物理世界的时候,你的数据资产,你所有的经验和知识留存在这个世界上,你是可以实现永生的,有很多的应用场景逐渐进入了我们的眼睛中。

AI遇到大数据会发生什么呢?我们自己现在很多人讲云从是一家做人工智能的公司,我们自己很清楚,在我们的人工智能技术里面大量的用到大数据的概念和技术,其实我们回到看美国,包括谷歌、facebook,他们在做大数据的时候,大数据团队越来越用到我们的神经网络,一提到人工智能就离不开神经网络,为什么呢?因为现在所有的人工智能技术还是通过数据驱动的,也就是说当它没有办法用规则引擎、常识去判断的时候,它所幸听到黑箱子里一个浩瀚的神经网络里面把数据喂进去就会告诉你数据之间的关联,在大数据时代来临的时候,这个大数据概念从互联网开始就有大数据时代,在大数据时代海量数据出来的时候是如何把这些海量数据的线性关系和非线性关系找到呢?他们之间更深层次的规则是找不到,如果传统的规则模型做不到的时候,用什么样的技术可以做到这点,这就是在大数据3.0时代,我们通过神经网络技术可以通过海量的数据把他们之间的关系找到。在整个大数据的内容上面,我们说它真正的价值在于数据本身关联的价值,这个也是我们在做整个实践过程中间逐渐发现的。

我们再来看,目前在AI领域和大数据相结合的过程中间,涌现出来了一些应用场景,包括互联网搜索、生物特征识别、汽车无人驾驶、选举结果预测、智能客服系统,这些都是人工智能和大数据相结合的应用场景,在这些应用场景中,如果把它分开来看,我们认为有七大领域是现在已经有一些落地场景的,比如说视觉AI的落地,AI图计算知识图谱、用户风控评级、智慧选址、异常检测、用户评级、留客营销,其实这些概念我们是不陌生的,但是当AI元素加入进来之后,他会去补充原来在大数据挖掘过程当中一些不足,他可以补充它的一些短板。

我们再来看,在视觉领域方面,这里用到大量的是非结构化的数据,大量的信息数据来自于结构化数据,当海量的数据一些传感器起来之后,我们今天也听到联通在支持2000亿传感器的设备,如果说将来所有的传感器部署上来,将来整个地球的影像部署出来,带来的海量数据全部是非结构化的数据,包括语音、视频、图像,这些非结构化数据怎么样能够快速的变成我大数据里的一个个节点?这就是现在在实践中做的,这里包括OCR的识别,在人脸识别这边我们可以看到一些应用场景,用户健身、刷脸支付、活体识别、刷脸支付等等,还有REID技术,这边我稍微讲一下,它是跨境识别,当我看到联通大数据赵越总的时候,我看到她的脸就认识她,就能识别出来,当我摄像机看到赵越总的时候就能够识别出来,如果赵越只给了我一个背景能不能认出来,或者说当赵越总从我们现在会议现场回到联通大数据办公室的时候,整个轨迹我能不能找出来,当然我们可以通过联通传统的技术,可以通过手机信号查,如果说我们在一些特殊的区域是不是可以把这个轨迹通过视觉的角度把它找出来、识别出来,现在在REID技术目前的商业化场景中,已经可以从识别人脸到识别人体,我们说其实在这块最有想象力的就是好莱坞,好莱坞在各种谍中谍里面出现的关键技术里面,除了虹膜、指纹、人脸,还有姿态,如果你的姿态识别、人体识别出现问题,他也会认为这是一种攻击和欺诈。

再来看一下我们的AI图计算,云从在这边也有很多的应用场景,比如说我们最近在跟邮政做一些路径AI优化的处理,怎么样让更多的包裹来自于不同目的地、发生地的包裹,怎么优化它的路径,通过节点的价值评级怎么去做,这个非常适合于AI技术,AI在学术里面有用到了两大网络,一个是价值网络,一个是局部最优解,当它绝对没有一个标准的100%的最优解,只有局部最优解,这就是我们给出来风险模型、用户评级给的是一个比例,而不是一个绝对值。另外在知识图谱建立这块,刚才提到黑产,怎么样把这些欺诈的行为通过电话信息、关系人的信息把黑产的信息识别出来建立起来,这边我们建立了包括黑产的名单扩展,价值客服的扩展,如果识别出黑产的人,还有欺诈性质,和目标客户有价值的客户,它的技术用的都是一样的。

另外就是用户的风控评级,我这边不说了,刚才前面几位嘉宾都有提到,用户评级将来你去做一些用户画像,怎么样为用户提供更好的体验,为我们的商户提供更好的营销手段。还有我们在这边提到的AI异常检测,这个很有意思,电信诈骗的检测,这里还有一个路径异常检测,我们知道很多现在有入室盗窃,嫌疑人在开始实施犯罪之前会做踩点,他在一个小区里他的不规律进出,你通过手机信号没有办法辨别,如果通过单元楼之间不规律的进出,单元楼有门禁,可以知道你这样的轨迹是异常的行为,他就会发生报警。我们除了治安层面,还做了其他比较民生化的服务,我们这个是在福建的时候有一个老旧小区真实的场景,很多家里只有一个老人,孩子出去工作了,老伴不在人世了,年纪大了之后,当他在家里发生一些异常,比如说摔倒、中风的情况,家里人不知道,我们配合当地的派出所做了异常行为的检测,把老人进出小区的时间、轨迹做建模,当这个老人今天的轨迹跟日常的轨迹不一致的时候会报警,片警会上门,一个片警管辖的范围很多,这个我们当时发生一件事情,这个老人在8点钟买菜的时候没有出现,系统就报警了,片警到家门就发现出现了轻微脑震荡。AI未来会为我们国家的和谐能够助力。

还有留客营销,这个也是我们客户提出来的,我们说属于你是我的会员,没有关系你只要来我就知道你,如果你还不是我的会员怎么把你留下来,这就是一个留客管理,就是从非会员转到会员的过程,你怎么样促成这个?这个我们在大型的商户正在做的一些项目。还有智慧选址,因为云从在银行现在是第一大供应商,我们在银行这边,包括商超涉及到选址的问题,上次在北京开会的时候有位嘉宾说,我这个店铺要不要选在这里?应不应该选在这里?如果今天在这条道路上摄像头捕捉到行人的信息、性别的信息、年龄段的信息,属于二次元的就要放一个二次元的门店,如果属于偏老龄化应该摆什么样的店在这里,这个可以帮助我的商家做选址的工作,这些都是我们现在在做的一些应用。

我们看到了一些应用场景,当然有一些是云从现在在的,也有一些我们可以看到在市场上面其他的合作伙伴在做的。云从在整个过程中间怎么和人工智能、大数据结合的呢?云从科技是2015年3月成立的,我们来自于中科院旗下的一家公司,为什么我们的总部在重庆?我们从重庆绿色智能研究院出来的,如果各位最近有要去机场有出行的机会,去首都机场去上海、广州等等,你在安检口用到的人证合一的设备就是云从科技提供的,我们是来自于中科院旗下的人工智能公司。我们目前规模达到了千人规模,不到3年的时候,今年是我们公司非常大发展的一年,整个公司不管从产值、营收,还是人员上面翻了几番,我们看的是PE值,到互联网是看的用户数,人工智能估值为什么这么贵?我今年7月份去美国硅谷参加高峰论坛,人家问我说为什么人工智能估值这么高?人工智能企业估值是按照科学家来算的,一个科学家一千万美金,意味着在一个人工智能企业里面必须拥有大量的科学家,你说在过去可能互联网时代商业模式创新,但是到了人工智能时代没有核心技术有点寸步难行,包括像腾讯、阿里达摩院都在建自己的研究院,这些研究院都在从实验室的技术到真实商业行业下的产品落地,这种不断地应用的验证会同时反推技术研究,这就是倪光南院士讲的,为什么中国的技术研究虽然跟美国有一段距离,但是我们不怕,我们肯定能赶上来,不是莫须有的自信和虚荣,而是因为当你的应用起来之后,你会反推你的技术研究进一步突破,这就是为什么在今年国家成立了中国脑计划,包括今年5月份南方中心在上海的成立,包括北方中心的成立,开始做大脑的研究,为什么要做这个研究?怎么样让现在真正的人工智能真正做到类脑,包括芯片的架构,倪光南院士是芯片这块非常有影响力的专家,在芯片领域也是一样,现在的芯片机构怎么样从传统的架构支撑未来真正到类脑仿生的芯片架构,这个也是脑科学需要研究的。中科院的好处在于不缺科学家,这个是对我们特别大的助力,本身科学院士出来的人是偏理论体系的,中科院出来创业的最大痛点不在于缺不缺少学术,中科院体系出来创业的公司最大的痛点在于没有商业的概念,没有销售的概念,不知道怎么通过一个学术身份的转换,从科学家跟B端的企业沟通解决方案、产品落地,这个是很大的落差,你怎么样让一个技术迅速做产学研落地,今天政法大学的教授在会议室简单聊了一下,他说很多大学在做产学研产这块,做得不好,不好的原因在于大家羞于谈钱、利益,在商业环境下不可能没有这些,科学家创业最大的痛点不在于技术,而在于你是不是快速的适应这个环境,并且接纳它,让自己的技术能够找到产业的突破点。在这点上,云从做得还不错,虽然我们才三年,目前的成绩单还可以。

很多人一直认为云从是人脸识别的企业,为什么人脸识别领域在中国可以落地呢?因为中国有14亿人口,同时中国在数据安全性上面可能会放的比美国宽松,这就是为什么在中国人脸识别会大行其道,也成就了一些独角兽企业。做了人脸识别之后,那只是一个眼睛,你去认识了马总、赵总,那只是一个眼睛,你只是看到说我认识这个人,但是不代表五官,你听得懂他吗?接下来我们要做的是人机交互,人机交互做了之后要形成闭环,你收集到这么多大的数据,通过传感器收集到各种各样的数据,那么多海量的数据,最终要有一个中央处理器,那就是人脑,我们要研究人脑科学。人脸识别是商业化落地目前场景最丰富的,人脸识别是人工智能计算机视觉里面的一个应用场景而已。

为什么谈到人机交互?今天刚才马总说的,包括产业每一次变革都是因为新的技术,一个生产力新的技术出现,带来了整个生产关系的变化,我们再来看其实就像当时的微软出现,改变了对操作系统的习惯让人更加能够接受,鼠标的出现也是,移动的触摸屏出现让人机交互手段又发生变化,在接下来什么样的人机交互技术可以出现?我们相信在未来只要出现HCR技术都有可能带来产业新的颠覆和变革。

我们一直认为人脸是个入口,我至少能够建立了解你的入口,这个就是我们做的脑科学研究,云从现在将近1000人的规模里面,我们科研团队在600到700人非常庞大,这就是回到刚才美国人问我们的问题,为什么这么贵?因为我们有那么多的科学家,科学家的春天来了,因为现在科学家到企业来任职之后你会发现真的需要高薪,特别学术研究很多时候你是不知道未来在哪里,不知道哪一天能够落地场景,就像60年前人工智能这个概念出来,不知道60年后才变成它的春天,学术研究很多时候会带有一种风险。

另外,我们跟国内很多包括上海交大、中科院、大脑研究中心建立了联合实验室,同时我们也跟美国一些高校共同研究。

这个就是我们现在云从核心的技术,云从的核心还是算法为核心,通过算法来走到产品,再通过产品形成解决方案,最终我跟我的B端客户卖的一定不是算法,卖算法就不对了,一定卖的是解决方案,你跟银行、公安客户说你的算法多牛逼,对他来讲那是不够的,你要告诉他我的技术在哪个场景中帮助你解决什么问题,这就是为什么产业链特别长,很多人说云从的产品是什么?云从的产品有硬件、算法、软件、平台,所以它整个的研发投入也非常之大。另外在云从的整个国际上比赛中获得了7次冠军,今年1月份云从是国内第一家发布3D结构光(音)的人工智能公司,今年3月份跨境识别评测的分数公开跑了之后连续半年没有国内和国外任何团队超过,所以这个也是现在我们从整个学术这块和应用场景这块云从还是投入很大的。

这个也是我们占的市场份额,包括银行,国内将近80%的银行是云从的客户,我们日均比对2.16亿人次,跟腾讯千亿次的概念还有差别,另外我们在跟公安部有5个系统,同时支持了27种公安的解决方案,在机场目前国内的75%民用枢纽机场都有云从的技术,周华讲的解决方案场景很多是云从现在正在做的。

这边就讲个具体的例子,背景是因为随着互金整个行业的重新清洗新规的出台,现在P2P公司陆续跑路,带来强监管的要求,现在云从也在开始逐渐要来自己做这样市场做这件事情,因为市场仍然存在,所以今年我们重点就在做的是风控模型,我们现在在银行整个风控的体系已经陆续在建了,风控最简单,就是资金和资产的撮合,你能够找到资金方、资产方,并且让资金方能够以最低的自风险把资金带给需要带的人,这么简单银行就做不了吗?银行只做头部客户,银行和互联网不一样,很多企业做不了,所以它的风险体系是不完善的,这就是为什么现在即使很多互联网金融P2P公司跑路了,但是银行在这块市场在这里,但是还需要时间,当然四大行没有问题,但是很多中小银行需要大量风控的模型,这也是今年我们在重点打造的,因为现在银行目前80%的银行是云从的客户,现在银行反过来会要求云从成立联合实验室做这个事情,我们今年推出来的浸入式的风控模型,专家看到这个模型不是黑盒子,丢了一堆数进去出来一个结果,大家不敢信,如果今天给他一个工具丢出来结果的时候他是不敢相信的,我们提出来让整个专家参与整个模型推理的过程,这个交互也是我们现在刚才提到的就是人机交互的场景落地,同时在专家这个体系也会打消专家的顾虑,技术永远是人类的好朋友,在这里不是取代专家,就像云从永远不会取代公安一样,只是提供研判的工具和手段,给到专家,并且帮助他建立自己的体系。

这个就是我们在银行做的风控跟银行相融合的7个步骤,从资产准入到风险试算、合同生成和防控、贷后管理,到了贷后管理一定涉及到一些风险,包括催收等等,怎么样让后续的监管有效,让诉讼更加简化快捷,这个也是可以后续有很多可以合作的点。

最终我们帮助银行沉淀它的原始数据,包括过程中的数据,最终建立自己的知识体系,我们说回到今天讲的主题大数据,从数据到信息,最后一定变成知识,这样你的整个闭路才能够完备,同时我们也相信当AI技术进入了传统产业之后,你会发现有很多场景,这种场景是非常共同的,这就是今天为什么来到这里参与联通大数据的论坛,我们跟联通大数据有这样紧密的合作,套用曹总说的话,谁也离不开谁,谢谢大家。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容