通信世界网消息(CWW) 2017年2 月 21 日,MIT Technology Review中国地区独家合作伙伴“DeepTech深科技”联合IBM中国研究院、网易科技、人民邮电出版社,举办“《麻省理工科技评论》2017年全球十大突破性技术”中国大陆地区首发仪式。
在圆桌讨论会上围绕人工智能主题,嘉宾们做了积极探讨。参与讨论的嘉宾有:IBM中国研究院物联网及服务研究总监、IBM全球技术学院领导成员孙伟,科大讯飞研究院院长胡国平,驭势科技CEO,前英特尔中国研究院院长吴甘沙,乐视超级汽车自动驾驶副总裁倪凯,地平线机器人技术联合创始人&软件副总裁杨铭,华创资本创始人熊伟铭。
主持人(石岚): 我们都知道科大讯飞,凡是我去合肥,提到合肥创业最成功的企业,这个名字是一定会提到的。所以,在语音识别技术,在全球也都非常有影响力。
给您的问题是:强化学习在语音识别技术中的应用,机器自主学习能力是否有助于语音识别中“鸡尾酒会”,以及提升自然语言处理能力?
科大讯飞研究院院长 胡国平
胡国平:其实你这个问题挺专业的,是这样的。
过去这几年,深度学习在整个人工智能,特别是语音识别、图像识别领域取得了重大突破。
它核心的一条是,利用了深度学习和大数据这样一个技术,使得能够构建出非常复杂和强大的网络建模,保证了语音识别的正确率。
关于鸡尾酒效应,它从技术角度其实不是一个强化学习的概念,它还是单次的决策,当前的数字信号进来会有什么样的输出结果。
所以,现在对于讯飞来说,更多用的是其它技术,包括麦克风阵列的技术,包括在神经网络的构建中,如何能够有效的区分,哪部分是语音、哪部分是噪声的技术,有效分离,来实现在噪声环境下,包括在鸡尾酒效应下的这样一些语音识别的问题。
确实,现在语音识别在噪声环境下的识别率,已经跟近讲识别率,已经达到接近的水平。
当您刚才提到的另外一个倒是很正确的概念,就是在自然语言理解,特别是在自然语言对话方面,它也会涉及到当前的对话状态和在当前对话状态下,下一步应该采取什么样的对话动作,或者方式,去做出选择。而这,其实就是强化学习的概念。
强化学习,大的角度来说,它和深度学习,其实现在最准确的、比较成功的说法,应该叫深度强化学习,或者强化深度学习。它的核心概念,其实还是要用深度学习,包括AlphaGO,都要用深度学习的方式,去提取在这样的复杂状态下,应该采取什么样的动作一些关键特征。
在我们的对话系统里面,也会涉及到在当前的复杂状态下,包括机器和用户之间的对话,包括我们的客服系统里有的后台支持复杂状态下,对于机器而言,应该采取什么样更有效的动作,或者问法、回答,能够让整个对话进行的更加顺利。
所以总体来说,我们把强化学习更多用在对话和客服方面来做。
主持人(石岚):谢谢胡院长!作为研究院院长,回答还是非常专业的。不知道现场的观众有没有听懂?我知道有很多是投资界、媒体界和科技界的朋友,大家听懂了吗?能举个手吗?都没听懂?
接下来,嘉宾回答问题的时候可以用更加普适的语言,跟您开个玩笑,我相信大家都听懂了。
接下来一个问题,提给孙伟先。
IBM提到,我们已经进入到了认知时代,您作为认知互联网的专家,如何看待认知+互联网的技术趋势?有哪些重大发展机遇?
还有第二个问题:IBM目前已经将人工智能注入行业应用,有哪些对产业和生活有重大影响的应用?比如在汽车和制造业等领域。
IBM中国研究院物联网及服务研究总监、IBM全球技术学院领导成员 孙伟
孙伟:非常感谢石女士的问题。这个话题是非常有意思的,您谈到当前认知技术和物联网、互联网结合,到底有哪些新的发展趋势。
我本身长期在做这方面的工作,我试图用3点总结当前发生的一些特别有趣的新的变化。因为我们传统上讲互联网、物联网、人工智能,比较容易去把这个问题孤立来看。实际,很多新的发展机遇都是在跨技术,或者跨领域的融合上。当前来讲,我们看到也在推动的发展趋势,也就是体现在“融合”这两个字上。
1、就是我们讲的物联网技术,在很大程度上和我们的云计算、边缘计算,在做技术上的融合。云计算大家都非常理解了,边缘计算,实际上也就是说,怎么样能够使得在数据产生的所在地,有实时性的做及时的处理,而不是把数据送到我们的数据中心,或者云平台再去做处理。
这个边缘计算依托的非常重要的能力,就是边缘的设备上,需要有计算的技能和计算的能力,所以这也是为什么我们从IBM这个角度来讲,在推动边缘计算的技术,不光是人工智能的算法,需要在边缘设备里面能够发挥作用,同时我们在边缘计算的设备和硬件这个角度来讲,从芯片技术着手,如何去实现低功耗的,具备神经网络、数据分析、深度数据分析能力的边缘计算的硬件体系结构,这也是我们看到的非常重要的趋势。
这是第一点,如何能够把云计算、边缘计算、物联网、互联网做技术的融合。
2、也是一个融合,但是这个融合讲的是我们看到的数据层面的融合。因为我们现在所讲的大数据,当然互联网上,大家每天所接触到的社区媒体的数据,我们各种各样富媒体数据是非常重要的角度和纬度,但是在我们目前这样一个技术改变世界的环境里面,有非常多的其他纬度的,产生新型的大数据,比如说互联网各种各样的设备,包括结构化,无结构化,流类型的数据,批次性的,实时性的,各种各样的物联网数据。