首页 >> 通信新闻 >> 信息发布 >> 正文
 
百度语音技术开放升级 发布语义理解助开发者享受最顶尖语音技术
http://www.cww.net.cn   2013年11月28日 14:21    

近日,百度公司面向开发者发布语音二期SDK,不仅增加了语义理解功能,让系统能真正的听懂用户的需求,还提供了更加灵活强大的API接口,帮助开发者更好的完成语音服务接入。此前,百度正式开放语音识别技术,提供包括跨平台的SDK、服务控制台等语音识别的底层技术系统供开发者使用。

业内人士分析:“语音交互技术是需要一个长期积累的专业技术领域,对于开发者来说,有着难以逾越的技术门槛,百度语音识别技术的开放解决了开发者的困难。”通过与百度语音合作,直接为开发者的应用增加创新的语音功能。同时,语音功能化繁为简,也令开发者更加专注自己应用的开发工作。

(去哪儿旅行App的百度语音功能界面,用户只需要对着手机说话,即可完成旅游出行搜索和预订。)

语义理解令用户使用更顺畅

此前,百度语音第一期SDK向开发者提供了长文本语音输入、语音搜索词识别,垂直领域识别等多方面的语音识别服务。并且支持“即说即得”技术,确保了用户体验的连贯性。在第一期百度语音SDK发布时,百度相关负责人曾表明将逐渐开放语义理解和TTS(语音合成)等多项面向开发者的服务。现在,第二期的百度语音SDK即携带语义理解功能姗姗而来。

语义理解即是对语义的理解能力,让机器能够理解我们所说的话。简单的理解就是,让机器学会人类的说话逻辑。 例如:“下载百度手机助手”这条指令, 通过语义理解模块的处理, 即被理解为, 用户的目的是下载App, 名称是“百度手机助手”。百度相关负责人称:“ 语音识别加上语义理解模块, 可以为开发者构建自然语言交互能力,让手机真正听懂用户,并执行用户想要的操作。”

据百度相关负责人介绍:“语义理解目前已开放包括天气、航班、地图、社交网络、手机设置、音乐、旅游等垂直领域。基本覆盖了目前主流的手机应用领域,未来百度语音还将对这些领域进行更深度的优化。”

百度语音SDK二期不仅具备强大的语义理解能力,还为开发者提供了更强大的API接口。最新的API接口支持开发者传入第三方语音数据,可将已经录好的语音数据识别为文本,以备后续调用。另外新的API接口还支持语音数据导出功能,可将用户所说的内容录入并通过回调函数返回给开发者,方便开发者分析和收集用户行为。

百度相关负责人表示:“第一期的百度语音SDK更多的是为了满足语音输入场景需求,第二期的SDK则是对语音交互的补充。使得开发者的语音交互更加智能,同时也提高了产品的执行率和可扩展性。”

二期语音识别率持续提升

语音识别率是衡量一款语音产品的重要指标,一款好的语音工具,需要有非常良好的语音识别能力,尤其我们的国家拥有非常复杂的语言环境,语音识别率更是考量一款产品好坏的硬性指标。百度语音识别率有着超越DNN技术的更贴近人类听觉认知系统的新型识别技术,带来语音输入相对错误率下降20%以上,近期还将持续提升。

世界语言中最难学的当属汉语,其复杂程度自不言而喻,加上各地方言和不同地域说话方式的不同,所以针对中文的语言识别的优化更是难上加难。百度相关负责人表示:“百度语音自成立以来,一直在不断优化语音识别能力,通过两年的攻坚和积累,百度语音识别率目前已经是业界领先水平。”

[1]  [2]  
关注通信世界网微信“cww-weixin”,赢TD手机!
来源:综合消息   编 辑:Daniel
分享到:
       收藏   打印  论坛   推荐给朋友
关键字搜索:百度  语音  
猜你还喜欢的内容
文章评论查看评论()
昵称:  验证码:
 
相关新闻
即时新闻
通信技术
最新方案

企业黄页
会议活动