首页 >> 通信新闻 >> 信息发布 >> 正文
 
探访微信模式识别团队:两盒烟 三个月 一诺千金
http://www.cww.net.cn   2013年9月26日 14:06    

为什么基础研究团队要整合到微信团队?陈波给出的答案是:“一方面微信是引领移动互联网潮流的产品,对视觉、听觉延伸的东西需求很大;一方面技术成熟,到了基础领域研究落地阶段,微信是一个比较合适的平台”。

目前微信模式识别团队有 40 多名成员,都是高学历多能人才。据陈波介绍,40 多名同事中,有 1/3 是博士,2/3 是硕士。还有一个类似比例是:整个团队 1/3 从事前沿技术研究,2/3 从事现有技术研究和产品对接。

关于团队的研究方向,陈波介绍主要分为语音和图像两个小组,语音研究对应的是手机上的麦克风,由博士生卢鲤带领 12 个人负责;图像对应的是手机摄像头,由博士生刘海龙带领 13 个人负责。“小组是比较成熟的方向。除了小组之外,我们也有其他研究方向”,陈波说,“包括文字识别、人脸识别、语义理解、视觉搜索、音频指纹检索等”。除了科学研究团队,模式识别中心还有一个工程团队与微信产品团队进行对接。

据陈波介绍,她的团队不是纯粹搞研究,不只会写 paper,还有很好的开发能力。他们没有专门的手机开发人员,都是自己搞 iPhone 开发,把 demo 秀出来;遇到产品问题,也要与产品团队共同解决。在招聘人才方面,模式识别中心也是把关严格,要求研究与工程能力兼备,所以团队过即使加入微信后也没有膨胀发展:团队成立之初是 2、3 个人,去年加入微信大家庭的时候是 30 人左右;加入微信后,现在团队是 40 人出头。相对于竞争对手,这仍然是一个精干的团队。

“两盒烟,三个月”,一诺千金

微信 5.0 加入自主研发语音识别技术,引起震动。很多人不相信腾讯能在一夜之间靠自己研发出这种高门槛、长周期、重积累的技术。行业龙头老大科大讯飞创业 10 多年还在不断完善这种技术——当然,讯飞在语义识别、云平台服务、串联产业链方面扎得更深。

但是,世界上没有奇迹,也没有“一夜之间”的传奇故事。

腾讯模式识别团队成立于 2010 年 9 月,前期图像技术成熟,较早落地。但它的语音识别技术起步晚,2011 年底才正式启动语音识别自研项目。显然,这个项目的启动受到了当年苹果发布 Siri 语音助手的影响,后者引发语音产业热潮——科大讯飞的股票迄今已经翻番。

到今年 8 月,语音识别自研项目历时一年半,模式识别中心终于攻克语音识别技术难题,并在微信 5.0 产品中正式亮相(“语音输入”功能)。由于模式识别团队属于研究型队伍,在前期主要集中于积累基础技术,加上腾讯的低调作风,才给外界造成“一夜之间冒出来”的感觉。

事实上,在此之前模式识别团队曾为微信开发多项人工智能技术。比如 2012 年 9 月发布的 4.3 版本中的通讯录语音搜索功能,2013 年 2 月发布的 4.5 版本中的语音提醒和“摇一摇”搜歌。但微信 4.5 版本中的“语音提醒”功能才引起外界对其语音技术的关注,一方面与微信受到的关注度相关——微信 1 月刚刚中旬宣布达到 3 亿用户,成为一个庞大的移动 IM 平台;另一方面“语音提醒”功能非常显眼,不像“摇一摇”搜歌或“扫一扫”那么隐蔽或难于理解。

关于微信 4.5 版本的“语音提醒”功能,外界所不知道的是,它差点无法在该版本中发布。最终顺利发布,这后面有一个“两盒烟,三个月”的故事。

去年 10 月 8 日,国庆长假刚刚结束,模式识别中心语音组组长卢鲤与团队负责人陈波到广州与张小龙交流工作。“张小龙希望语音提醒在 4.5 版本上,我说技术不成熟,做这个事情没把握。我说了半个小时,小龙一言不发,最后说‘那你们觉得需要多长?’我咬咬牙说起码得 6 个月。小龙又一言不发,走开了”,卢鲤回忆到,“他回来后,手里拿了 4 包烟,开会的人有 4 个人抽烟,一人一包,包括他自己。这烟我没抽过,我看了烟,又咬咬牙,说‘要不 3 个月’,他听了之后,把他手里那包烟也留给了我。”

[1]  [2]  [3]  [4]  [5]  [6]  [7]  
关注通信世界网微信“cww-weixin”,赢TD手机!
来源:通信世界网   编 辑:刘佳
分享到:
       收藏   打印  论坛   推荐给朋友
关键字搜索:微信  
猜你还喜欢的内容
文章评论查看评论()
昵称:  验证码:
 
相关新闻
即时新闻
通信技术
最新方案

企业黄页
会议活动