首页 >> 通信新闻 >> 信息发布 >> 正文
 
百度媒体云和开发者一起“云化视听新生活”
http://www.cww.net.cn   2013年9月2日 12:48    

8月31日,在“2013中国软件开发者大会”上,百度移动·云事业部研发经理陈彬表示,自百度媒体云推出以来,受到了开发者的追捧。近日,百度媒体云还向开发者开放语音、图像、视频三大技术服务,帮助开发者降低技术门槛和开发成本,助力开发者迈入移动互联新时代。

业内人士评价,媒体云在移动互联网时代对于开发者具有非常高的价值,百度所推出的媒体云,降低了媒体应用开发技术门槛,极大地节省运营成本,实现和开发者一起“云化视听新生活”。

语音技术的“生态构建者”

“百度媒体云是基于百度内部深厚的多媒体技术积累,通过开放语音、图像、视频三大云能力,以百度媒体云的方式在移动及碎片化终端时代为开发者提供整体的媒体解决方案。”陈彬这样给出了百度媒体云的定义。

8月22日的“百度世界2013”大会上,百度已经宣布向开发者免费开放百度整个语音生态系统,这主要包括三个层次:第一,最底层的语音识别技术API,方便开发者通过API接口实现语音识别功能;第二,百度语音助手SDK,使服务和应用直接对接;第三,硬件可以直接安装百度语音助手,帮助初级开发者成长。

“百度语音识别技术从发展到开放,成功案例已经比比皆是,比如在2012年底小黄鸡趣味自动聊天机器人,通过搞笑和无厘头的自动回复迅速走红于网络;订票助手通过百度语音识别技术,实现了订票全程语音化。保益盲人地图通过使用媒体云语音SDK,实现了通用语音识别、通用语音搜索,以及音乐、视频、地图、app、网站名等垂直领域的语音识别技术等各项功能。”陈彬说。

业内人士表示,语音识别技术及能力的开放,更是实现了百度从“行业领跑者”到“生态构建者”的转型。

图像技术开放催出“明星应用”

“百度图像技术的开放则向开发者开放人脸验证、检索、属性识别以及图像能力,陆续有人脸验证、人脸检索、人脸属性识别、图像处理四种技术能力开放,开放方式为人脸服务SDK、人脸服务API、图像处理SDK等三种方式。”陈彬说。

百度的图像技术,催生出许多明星应用。其中,“百度魔图PK大咖”功能就是凭借着人脸识别技术和强大的图像能力,在全球超过20个国家和地区的App Store摄影与录像应用软件中排名进入前五,用户量突破一亿大关。“百度作为一家搜索引擎公司,在自然语言处理,语音搜索,图片搜索,视频处理等领域有非常深入的研究及长期的技术积累,最近非常火的百度魔图PK大咖 ,手机百度的‘为你写诗’都是这些云能力的集中体现。”陈彬说。

陈彬坦言,近期人脸技术就会对所有开发者开放,目前已有多家合作伙伴接入,随着图像技术的开放,将有更多的开发者利用到图像的先进技术,从而开发出更多明星应用。

视频技术开放“惊呆小伙伴”

“视频是百度媒体云最先开放也是目前开放功能最多的方向,包括跨终端的T5播放内核及多屏互动SDK、视频云转码、点播及直播等,向开发者提供了完善的平台服务和解决方案。百度媒体云在极速播放内核、高效转码、实时传输及分发等方面具备核心技术优势,其中播放器SDK覆盖了主流平台,包括Android、IOS、Flash、HTML5等,Windows Phone版本也即将推出,在碎片化终端兼容性及稳定性上领先于国内其他播放器及MXPlayer等世界一流产品。”陈彬说。

他表示,尤其是视频LIVE直播服务,将会惊呆开发者小伙伴们,因为视频LIVE直播服务会把你的直播资源直接分享到他们的终端上,充分利用了媒体云实时上传、实时转码、实时分发、实时播放等SDK。中视里程创始人赵晓侠算是被惊呆的一个开发者“小伙伴”。赵晓侠已经与百度合作推出家用视频监控产品“i耳目”。他说:“通过利用百度媒体云、个人云存储等服务,我们只用了两个月就开发出i耳目。百度的技术框架,让我们节省时间和成本,非常便捷。”

[1]  [2]  
关注通信世界网微信“cww-weixin”,赢TD手机!
来源:通信世界网   编 辑:刘佳
分享到:
       收藏   打印  论坛   推荐给朋友
关键字搜索:软件    视听  
猜你还喜欢的内容
文章评论查看评论()
昵称:  验证码:
 
相关新闻
即时新闻
通信技术
最新方案
企业黄页
会议活动