首页 >> 通信新闻 >> 滚动 >> 正文
 
百度的“语音”算盘
http://www.cww.net.cn   2013年11月6日 15:09    

SteveJobs于2010年花了2亿美元亲自将Siri收购,2011年10月随着Iphone4S一起发布。那一年,Siri成为Iphone4S仅有的几个亮点之一,而调戏Siri也成为了用户津津乐道的事情,Siri的到来,在中国掀起了一场语音识别技术的风暴。

Siri的原理,我们还是要吐槽下。它不是简单的语音控制软件,而是人工智能系统。换句话说,Siri=语音+智能机器人。Siri的语音技术采用的是Nuance提供的Dragon Dictation。

Siri人机交互的自然、快捷和智能等特征,很大程度上对传统的搜索引擎造成了威胁,尤其是移动互联网大环境下的搜索引擎。这些应用场景更加广泛,从之前的行业应用,到如今直接面向用户端,比如移动设备、车载设备以及互联网电视等。

国内的互联网巨头都意识到了这一点。特别是百度,在“狼性文化”重塑以后,他们意识到在移动端,搜索是有可能被APP或者其他的应用及入口分化。为了在未来的移动互联网和家庭互联网战场上,稳住阵脚,百度也在寻思新的方向,语音识别技术便是其一。

这里有段往事,百度曾找过号称“中国Siri”的科大讯飞合作,但是最终双方并没有合作起来。科大讯飞这家公司,也因为Siri而变得声名鹊起。不过,还是那句“基因决定论”,科大讯飞的商业伙伴主要来自行业客户,如通讯运营商、政府高校、金融机构等。移动互联时代,科大讯飞意识到了往C端去转,但是冗杂的体制和官僚化的作风,跟不上互联网公司的脚步。腾讯非常直接地在科大讯飞合肥的总部斜对面,盖了一栋大楼。其心,大家都懂得!

语音技术的产业化路径是从实验室开始、商业化、产品化、到最终平台化。与同类语音识别技术以授权费方式获取收入的传统方式不同,百度首先面向开发者无条件开放整个语音生态系统。不得不说,百度狼性学习还是卓有成效。10月,百度宣布语音识别技术及能力将全面开放。此举为开发者提供了多层次的语音接口,将催生基于语音识别技术这一应用领域的爆发式增长。

1

语音生态系统的开放包括三个层次,一是最底层的语音识别技术API的开放,开发者可以调用API接口实现语音识别功能;二是百度语音助手SDK,提供开发工具包,实际上是对语音识别标准化服务进行封装,识别结果做关键词抽取,搜索结果进行结构化数据返回,最终对接服务和应用;第三点则是面向能力弱的开发者,百度语音助手直接安装在硬件上即可。

其中第二点,对于开发者来说,是最具诱惑力的。说白了,利用这套技术,一些开发者就可以将其产品化、商业化了。

现在,百度语音技术已经应用在诸多领域。不只是国内,一些跨国企业开始和百度玩起了“跨界合作”,足显百度语音技术影响力。

百度的玩法总结而言就是从底层技术服务向平台化和接口化转型。将行业应用门槛集约为平台、接口服务,打开技术壁垒,从而将此前壁垒拦阻积累的势能转化为应用普及推广的动能。可以想见,在这种“开闸”动作之后,从移动开发创业者、到有志面向C端软硬件厂商将可以得到空前的创新、创享空间。

[1]  [2]  
关注通信世界网微信“cww-weixin”,赢TD手机!
来源:雷锋网   编 辑:高娟
分享到:
       收藏   打印  论坛   推荐给朋友
关键字搜索:百度  
猜你还喜欢的内容
文章评论查看评论()
昵称:  验证码:
 
相关新闻
即时新闻
通信技术
最新方案

企业黄页
会议活动