“今天来了很多朋友,大家都有一个共同的理想,就是觉得未来互联网的产品和技术都要依赖于语义分析技术。今天我主要以百度一款基于自然语言处理技术的轻应用‘百度考霸’为例,说一下百度目前自然语言处理技术的现状。”6月28日,百度自然语言处理部高级研究员赵世奇博士在第51期百度技术沙龙上说。
随着移动终端的发展,当今业界出现了很多基于自然语言处理技术的产品。比如siri、聊天机器人、小冰等等,智能交互型的产品越来越多的得到人们的关注。本期的百度技术沙龙,赵世奇主要以百度考霸为例,为大家分享了自然语言处理、语义分析技术的话题和研发成果。
百度自然语言处理部高级研究员赵世奇说:“我希望自然语言对话式搜索成为一种趋势,能让用户在人机交互中解放双手、解放眼睛,只需要与搜索系统聊天即可实现信息和知识的搜索。”
不做傻系统,自然语言搜索实现智能
百度作为全球最大的中文搜索引擎,总是能给出最合适的技术来推动整个互联网产业的发展,在人工智能领域也不例外。
本期技术沙龙,赵世奇先是总结了一下目前自然语言搜索的现状,他以电影《钢铁侠》为例:钢铁侠里的机器人笨笨够辅助主人做一些事情,可即便是在科幻的电影里,它仍然不完美,所以它的名字叫“笨笨”,经常会听错会错义,不理解他的主人是怎样的需求。但是它随着不停的交互、成长和对话,最后它能够正确的理解主人需求,并且救了主人一命。
“现在我们的自然语言搜索也处在这样的境地,它比笨笨还笨了一些。但是随着我们持续的改进,我相信在不久的将来自然语言对话式的搜索,能够摆脱笨笨式的身份。”赵世奇表示。
另外,赵世奇强调,百度并不是想做浅层的智能交互,让机器人给用户讲笑话、说粗话、讲黄段子,变成一个调侃式、调戏型的工具和对象。他们希望在选定的领域里,能够做的很深入、很具体、很多样。用户可以随便问这个领域里的任何问题,机器可以深度的理解、深度的交互和深度的满足用户。
机器与人对话,特色技术打造灵活机制
在百度技术沙龙上,赵世奇向大家展示了百度在2014年高考前夕刚上线的一款轻应用——百度考霸。
“百度考霸是一款通过自然语言交互的方式来进行志愿填报信息搜索的轻应用。它集成了很多自然语言处理技术或者是语义分析技术,比如推理式改写的通用机制、指代消解省略补全、概念澄清技术、交互生成技术等等。”赵世奇介绍道。
随后,赵世奇详细介绍了这些技术起到的作用。
推理式改写简单的说,就是把人们随意说出的口语句子,改写成计算机数据库能够理解的问题,使改写后的查询更容易解析索到优质结果。比如我们一般的口语习惯会问“630分能考上什么大学”、“想学计算机去什么大学好”,通过推理式改写,系统改写后的句子是“分数线小于630分大学”和“计算机好的大学”。
而省略补全技术是为实体知识库提供了指代消解和省略补全的候选对象,并且可以付诸验证指代消解和省略补全所得结果的合理性,因此本方法资源配置成本低、领域迁移性强。
概念澄清技术则可以提供模糊需求条件下或指代消解过程中的需求澄清。比如,用户询问“山大怎么样”,就需要系统澄清“山大”这个概念——是山西大学还是山东大学。
自然交互式搜索备受追捧
在整个分享环节,赵世奇不断强调,自然语言处理技术一定是要为用户解决需求的,而不是娱乐用户的。“不能满足客户需求的交互式搜索都是耍流氓!”赵世奇调侃道。
整个分享涉及很多深度理解、深度交互、深度满足的知识。赵世奇强调,这里面最主要的是知识驱动,如果有了大规模的知识库之后,很多事情其实都是围绕着知识库来展开的。无论是语义的解析,还是需求的满足,都可以围绕知识库展开。所以自然语言交互式搜索,其实是NLP技术集成的体现,这中间涉及到大量的技术的融合和联合的过程。
“今天听了赵老师的分享,我才知道原来通过自然语言处理技术,系统可以做推理查询这样复杂的交互,很长见识。”一位百度技术沙龙的现场听众表示。
这次的百度技术沙龙主题分享,由于赵世奇老师的分享信息量非常大,而现场只给了他四十五分钟的演讲时间,所以在技术沙龙结束后,现场很多人都感到意犹未尽。上百名听众把赵世奇老师团团围住,要求他多讲一些自然语言处理方面的技术知识。大家对于自然交互式搜索的前景都十分看好。
百度技术沙龙是全国最早的技术开放交流活动,由百度组织策划,至今已经持续举办4年,经历了51期。百度技术沙龙一直致力于以“技术开放”的心态,分享行业领先的技术理念和技术实践。目前,百度技术沙龙已经成为北京中高端技术人员的精神家园,百度技术沙龙希望日后能够有效推动中国互联网的技术发展与行业创新。
|