大数据发展到今天,人们应该采取现实主义的态度了。我不想要大数据预测未来,这或许与能量守恒和相对论是冲突的,但我却很想要让大数据为我的生活服务,让我的生活更便捷。例如,在想要找一部多年前看过的电影,却又忘了名字时,互联网大数据所支持下的产品能尽快为我找到,这个要求不过分吧。
要求不过分,但实现起来并不容易,要想让用户轻松找到自己想要的内容,必须是大数据发挥作用。而传统以内容购买、制作为主的视频网站,在这一点上做得不好,因为他们的利益诉求点在于位置推荐,即让用户看到他们想让用户看的内容,而非内容筛选,即让用户精准找到自己想要的内容。我第一次上央视做访谈后,视频明明就是被电视台上传至优酷了,但不管是变换多少关键词,怎么也找不到,这种使用体验对我而言是负面的。
在这方面有能力做得好一些的,是百度视频。这个业务与传统视频网站不一样,百度视频并不去制作内容,购买内容,引导用户上传内容,这些都不是他们的工作,百度视频只需做好一件事,就能获得超然的市场地位,这件事就是做好分类,让所有的视频都能被需求者精准地找到。
分类问题往往会被人忽略,但实际上却是解决很多问题的钥匙。把视频的点击量和受欢迎程度作出列表,或分出情感、动作、武侠、枪战等类别,是最传统的分类方式,技术上容易,单维度,任何人都能干。百度视频追求的,是要从用户行为、心理、习惯、品味、兴趣等多个维度对视频进行分类,从而让用户获得更好的使用体验。
百度视频中收录了数亿个视频,每天会收到上亿次的搜索和观看请求,这数亿个视频中99%都是长尾内容。我们知道,长尾内容是百度搜索崛起的关键因素,未来百度视频崛起的关键,也一定会是长尾内容。这种内容虽然都不是时下热门,你能让用户很方便地找到,对提升用户体验而言却意义重大。当下,《乡村爱情故事》到处都能看到,我没必要去你百度视频上看,但要找一部赵本山早期拍摄的鲜为人知的乡村电影,则必须去百度视频上找,哪怕多搜几次,至少能找到。
搜索和推荐结果的精准性每上升1%,在技术上的要求就几乎要提升一倍,这已是非大数据不能做的工作了。这里面涉及影视知识图谱,自然语言处理,机器智能理解用户意图等要素,并不是简单的分类可以解释。百度在贴吧和知道等平台的用户数据,也都需要调用,用户的身份和性别,也需要识别,这几乎是一种互动式的动态数据分析,需要有高超的技术实力和极强的系统设备加以支持。
百度视频在这一块,目前是领先的,也缺乏竞争对手。不过百度视频还可以做得更好,用户的实际需求还有很大程度没有满足。用大数据来改善视频搜索结果的准确性,进行准确的个性化推荐,是个诱人的方向。用户想找什么就能找到什么,简单输入一个或几个关键词即可,不必去百度搜索里找到其中一个词,再根据这个词去找别的元素,最终在百度百科中找到视频的名称,完成多次搜索后再返回百度视频进行最后搜索。这一系列过程形成的用户体验,自然是很糟糕的。不过,能看得出来,百度视频在解决这些问题方面,正在变得越来越好,未来前途无限。
如果百度视频能将现有视频搜索的精确度再提高10%,足以颠覆整个视频行业。用户不必记住搜狐买了纸牌屋,优酷上才能看万万没想到,几年前的生活大爆炸是哪个网站独播来着?只需去百度视频上搜一下就好,正如之前百度搜索给人们塑造的习惯一样,明明知道淘宝的域名是什么,却偏偏要在搜索引擎中搜一下,然后再点击搜索结果进入。
百度视频是个入口,如果能把大数据的威力发挥出来,在搜索和推荐的体验上更进一步,在用户习惯形成之后,百度视频就是所有视频的超级入口。这个入口与置身其下的视频网站,在逻辑上完全反了,颠覆意义十足。一个是推给你什么你看什么,一个是你想看什么看什么,硬给你看的,不一定是你需要的,只有自己真正想看的,才是实际需求。
在实现这一目的过程中产生的数据,也是弥足珍贵的,将会是百度视频在未来实现利益的最大资产。用户对某个主题的热衷程度,会被机器准确地识别出来,这些数据用来指导内容生产,会是非常准确的。
百度视频未来产生的数据,在判断内容的受欢迎程度和市场需求上,也会成为重要标杆。有这些数据在,传统影视业虚假离谱的调查报告就不太好意思拿出来了,那些娱乐圈里人为的炒作和误导性的市场预期与反馈,也将无处遁形。
当然,这一切都是基于一个期望,即百度视频能在未来充分利用好百度的大数据资源,恰到好处地运用在用户体验的改善上去,让用户习惯于把百度视频当做入口,精准找到自己想要的影视片,甚至精准找到UGC内容。这个目标实现起来任重而道远,但却是百度视频唯一的正确方向,也是大数据从漂浮状态落地的为数不多的落脚点。
|