相关性不是因果,相关搞成了因果,差不多和“迷信”就没有区别了。商业应用上,其实不太需要拼命挖掘因果。相关性是因果的前提,但是不等于因果。
大数据寻求的是海量数据,即全样本。全样本和抽样显然是不同的。过去的研究,由于操作性的关系,很难做到全样本,需要去抽样。大数据首先不是抽样,它获得的数据是全体样本数据,其次它不是在让用户回答问题,而是实打实地去获取用户的“行为”。最重要的一点,大数据分析和抽样分析的核心区别在于:前者是动态的,后者是静态的。一个随机抽样所形成的结论,其实是静态的,它只能说明在做那次调研时的一些相关性。当有新的用户(样本)加入时,很难再说明过去的相关性是否能够成立 — 除非你能找到真正的排除了各种隐形变量后的因果关系。但大数据的分析却是动态的,每秒都有可能产生一个新的结论。
大数据+视频 = 模式创新
笔者认为:大数据时代,视频行业的业务型态不会有大的变化,整个产业链的合作模式将会出现新的变化,产业链中的上下游界限将会变得模糊,重新洗牌的机会出现。
视频行业产业链
图 1 视频行业产业链构成
目前国内,整个视频产业链,可以大致认为由下列角色构成:
内容制作:视频内容的生产者,例如工作室,传媒公司、各大电视台等等,以及互联网UGC,和最近两年兴起的视频网站自制内容;
内容集成:视频内容的集成和销售者,例如各大电视台、视频网站等等;
内容分发:视频内容的传播者,例如各大网络运营商(包括有线运营商),通过有线,IPTV,OTT等方式传播;
用户:视频内容的消费者,通过多屏和在线,实现“随时、随地、随心”的“互动”和“个性化”视频体验,而不再是传统的“观看”
广告主:传统电视台的“金主”,在新的环境下,广告投放策略在逐渐由粗放的大面积覆盖转向更“精确”和“定向”营销
第三方机构:典型机构如Nielsen,多年专业收视率统计机构(抽样调查方式),最近开始引入twitter的社交网络信息综合评价视频热度
内容监管:内容消费的监督者,确保内容合法、有效等,例如国家新闻广播电影电视总局。
大数据给视频行业带来的影响
首先,在视频行业可能包含大数据的领域包括:
用户行为和反馈:目前全国有1.5亿有线数字电视用户,2000万IPTV用户,4亿多网络视频用户,数亿智能终端。如果将其收视行为和反馈都采集下来并进行分析,其体量必然十分巨大,理所当然是大数据的范畴,非常适合用于提供个性化服务,如相关推荐,定向广告;同时结合社交网络中的海量信息分析和引导,还可以用于内容制作和推广,票房预测,收视率统计和预测
内容分析和监管:国内目前每年有上万集电视剧投放,近十万小时电视节目上线和上千部电影进入市场。对上述内容的健康监管也是需要重点考虑大数据的应用。尤其是从“数字化”到“数据化”的转变,通过图像和语音识别,使得关注点不再仅仅是视频内容本身,而是其中蕴含的“信息”,从而挖掘其中“数据”带来的“价值”;另外,传统针对“内容”的监管是建立在单向传播的基础上,而结合用户行为,社交网络,甚至位置信息的新一代“舆情监控和引导”才是符合现在需求的。
|