|
百度免费开放语音识别技术 无条件助力开发者
http://www.cww.net.cn 2013年8月30日 14:56
2013年8月22日百度世界大会上,百度宣布语音识别技术及能力全面开放。此举为开发者提供了多层次的语音接口,将催生这一领域的蓬勃发展。在百度的引领下,围绕语音识别的全新体系和大数据生态将在不久的未来初露峥嵘。 过去的一年时间里,语音交互类应用并未像触控、手势识别等一样得到广泛的普及和应用,根本的原因有两个:一是语音识别准确率有待提升,尤其是技术对不同语言的支持,存在较大的差别;二是语音识别技术门槛较高,有一定的授权费用,阻碍了技术在应用端的落地。种种难题使得国内开发者在语音识别领域步履维艰,只有百度、腾讯等巨头互联网公司在相关的研发方面有所建树。 近一年来,百度在语音识别领域不断取得突破性进展,早已确立了其行业领先的地位,2013年百度世界大会上语音识别技术及能力的开放,更是实现了百度从“行业领跑者”到“生态构建者”的转型。 突破语音识别的瓶颈 百度云语音技术负责人贾磊在百度世界大会上表示,百度语音识别技术、引擎在识别准确率上获得了突破性进展,运用深度神经网络(DNN:Deep Neural Network)技术和自然语言处理技术NLP,使语音技术准确率提升了25%,用户体验得到大幅度优化。除了降低了错误率,百度语音助手在速度上也有大幅提升。不考虑网络环境,识别和响应速度提高了30%。 百度语音助手团队获得2013年百度Summer Party最高奖 目前,DNN技术已成为新一代语音识别的“主导者”。正因为这一点,百度语音助手开发团队在今年的百度最高奖角逐中脱颖而出,打破了该奖项始终被商业营销产品“垄断”的惯例。
三个层次,全面开放 与同类语音识别技术以授权费方式获取收入的传统方式不同,百度将面向开发者无条件开放整个语音生态系统。 而语音生态系统的开放包括三个层次,一是最底层的语音识别技术API的开放,囊括了合成技术、理解技术、认证技术、指纹技术等,开发者可以调用API接口实现语音识别功能;二是百度语音助手SDK,提供开发工具包,实际上是对语音识别标准化服务进行封装,识别结果做关键词抽取,搜索结果进行结构化数据返回,最终对接服务和应用。这一点是对应用开发者最具诱惑力的;第三点则是面向能力弱的开发者,百度语音助手直接安装在硬件上即可。 底层语音识别API,只有实力强的开发者具备。相比,第二层所释放的能量会更大,因为涵盖的范围更广泛,周边信息分类查询和导航功能,公交路线查询和导航,到站提醒、自动报站、盲人步行路线自定义、管理和导航,以及外部的旅游、餐饮、购物等几乎能想象到的场景,都可以封装成模块、组件,让开发者轻松调取,百度语音技术开放的原则,也从一个技术、工具真正过渡到包罗万象的语音识别应用生态,未来会接入更多的第三方应用,实现能够容纳从衣食住行到人的生活方方面面真正的助手。 [1] [2]
来源:通信世界网 编 辑:刘佳
猜你还喜欢的内容
文章评论【查看评论()】
|
企业黄页 会议活动 |