随着世界杯大幕开启,手机百度应景地推出了“世界杯刷脸吃饭”活动。据了解,该活动主打“刷脸打分换吃”,用户只需要自拍一张照片,系统就会使用百度人脸识别技术对照片进行分析并打分,凭借在这里得到的分数,用户可以领取相应的优惠券,用以在手机百度上的外卖消费。这一活动刚刚上线,就被网友直呼“酷炫”。有专家则认为,“世界杯刷脸吃饭”活动的推出意味着百度在图像识别技术领域已经达到了领先水平,而已有趋势表明,图像将成为继文字、语音之后,第三大成熟的移动搜索交互方式,百度在未来的移动搜索大战中已经占得先机。
背后的保障:百度领先的图像识别及人脸识别技术
我们实际试用了手机百度的“刷脸换吃”功能,操作起来非常简单,只要用轻应用“轻拍”自拍或上传一张自己的自拍照并圈出面部范围,系统就会自动开始识别分析并依照一定的规则对照片进行打分,然后给予一定的优惠券奖励。
看似简单的过程,背后其实有着非常高的技术含量。“刷脸”需要调用的是图像识别技术及人脸识别两项技术,人脸识别作为一种技术能力,是图像识别的分支。百度相关技术专家对此进行了详细解析:与挖掘明确的文字信息、分析语义不同,图像识别首先在识别上的难度就远高于前者。比如,在图像识别领域,如果一个邮筒跟一个垃圾桶长得很像,那么系统就很难识别出它到底是邮筒还是垃圾桶。所以,要识别一个东西是什么其实很难,视觉会遇到各式各样的干扰性信息,包括光照,远近,角度,形变,遮挡等。而复杂多变的人脸识别就更难了,需要在技术上实现对图像像素级的分析与运算。为此,百度专门研发了用于图像识别的深度学习网络,尤其是卷积神经网络,这也是百度大脑的重要组成部分。百度基于此开发出世界上最大的深度神经网络,有超过两百亿的参数。凭借这样的工程和技术能力,百度可以开发各种各样深度学习的算法,对语音、图象、文本做处理。
目前,百度的图像识别技术,结合深度神经网络,通过对图像像素级的分析和运算,已经实现了世界领先的识别精度和覆盖率。此前,百度基于该技术所开发的app“百度翻译”因为能够实现实物翻译而引发了一股热潮。而百度目前的人脸识别技术则可以精确定位和识别人的面部轮廓和五官,此前,百度也曾经推出过两款基于该技术的app——“百度识图”和“百度魔图”。此次的“刷脸吃饭”活动,是将图像识别技术及人脸识别技术相结合,首先图像识别是否是人脸,然后人脸识别技术再对五官进行分析,结合百度移动搜索的大量数据积累进行比对分析判别,最终才能给出美貌值打分。
图像识别是移动搜索的未来发展方向之一
智能手机及移动互联网的发展,为移动搜索行业带来了巨大的发展空间,而相关的搜索技术,也在悄然发生变化。在PC上搜索,我们更多地采用的是文字搜索,而在智能手机等移动设备上搜索,除了文字搜索以外,语音搜索以及图像搜索也开始逐渐流行。因为智能移动设备几乎标配摄像头,这就为图像搜索提供了很大的想象空间。
试想一下,未来的某一天,你在路边的广告牌上看到了一个美女,你想知道这个人是谁,若是采用传统文字的方式搜索,你可能需要付出很大的精力才能找到你想要的信息,而使用图像搜索就简单了,只要用摄像头拍下照片再使用百度的移动搜索,后台就会通过图像识别、人脸识别帮你快速找到你所要了解的信息并呈现在你面前;甚至,通过人脸识别技术,未来你的脸就是一个“凭证”,配上硬件的支持,就可以实现各种需要验证的功能,如在购物时直接刷脸支付代替你的信用卡、在下班回家时取代你的实体钥匙成为你开门的凭据等等。
只要想象一下这样的使用场景,你就会明白,百度为什么会在图像识别以及人脸识别领域持续发力了。
|