余晓晖强调,建立规范的大数据流通信任体系刻不容缓。
“建立规范的大数据流通信任体系刻不容缓。”在日前召开的第三届世界互联网大会大数据分论坛上,中国信息通信研究院总工程师余晓晖抛出了这一观点。他认为,大数据蓬勃发展,数据流通市场前景广阔,建立规范的大数据流通信任体系迫在眉睫,行业自律将在其中发挥巨大作用。
余晓晖介绍,完整的大数据产业链结构包括数据产生、流通与应用环节。数据经过收集、加工、清洗,再通过交易市场来提供给应用方。其中,数据流通是打通产业链的关键环节,也是实现数据隐私保护的重要环节。在国外,数据流通产业始于2007年。随着大数据产业市场规模的迅速扩大,数据交易业务得到快速发展,涌现出微软数据市场、亚马逊公共数据集、甲骨文在线数据交易、富士通数据市场等一批知名数据服务商。这些公司有的专注于政府数据,有的提供多样的数据服务,形成了总体上丰富多样的数据交易市场。而在我国,数据交易产业却是刚刚起步。直到2015年4月,国内第一家数据交易平台——贵阳大数据交易所才正式上线。截至上个月,我国已经建成并运营的大数据交易所或交易平台已经超过10家。预计到明年年中,这一数字将达到15~20家。
大数据交易平台建设正处在井喷期,而且平台的变现能力正在得到稳步提升。余晓晖表示,流通环节的加强,使得我国的大数据从个人数据收集角度来讲,海量的数据收集难度比较大,收集过程中透明度也比较低。在数据分析过程中,通过对数据的深度挖掘分析,可以形成用户画像,将会给个人隐私带来威胁。而在流通环节,由于多方主体的介入,使得数据转移的控制力差,数据泄露的风险正在加剧。
余晓晖认为,由于缺乏统一的数据交易规则,数据交易也存在一些问题:一是数据的权属不明确,交易标的争议也很大。二是由于数据的定价模式不统一造成数据资产的评估也存在困难。三是数据安全问题比较突出。如何确保数据交易过程中不被泄露、窃取、篡改、复制是当前需要解决的重要问题。四是数据交易监管机构未明确。数据产业链正在逐步得到完善。
2015年国务院印发的《促进大数据发展行动纲要》中明确指出,“要引导培育大数据交易市场,开展面向应用的数据交易市场试点,探索开展大数据衍生产品交易,鼓励产业链各环节的市场主体进行数据交换和交易,促进数据资源流通。”余晓晖认为,这一文件从政策层面肯定了数据流通市场的地位。但数据资源交易机制和定价机制都还未明确,规范交易行为的举措都还在研究制定中。
余晓晖指出,目前建立规范的大数据流通信任体系主要需要解决的有三大问题:一是数据权属问题需要得到准确界定。从传统意义上来说,数据的所有权应当属于数据的原始提供者。但基于原始的用户数据,在去除个人身份属性之后的数据产权问题,如何划分数据主体、与数据控制者的产权边界,亟待业界统一认知。二是数据隐私保护问题需要大力规范。目前,基于大数据对用户的行为特征进行分析并得出用户偏好的营销行为已经广泛开展。然而,与此相关的个人隐私泄露问题也被广泛探讨。对公民个人信息的保护,与数据的获取和使用存在天然的不协调。这方面的法律法规亟须完善。三是数据流通各环节标准缺乏统一共识。一件商品越标准化,对其进行交易就越方便。然而,由于数据本身的属性,其清洗、分析、存储、定价等问题都存在一定特殊性。数据买方事先无法获知数据使用的效果,因而无法评判数据价格的合理性,导致数据买方需求不足。
在法律法规未完善的前提下,行业自律对建立大数据流通信任体系有着重要的意义。余晓晖认为,今年4月27日,在网信办、工信部的指导下,信通院联合大数据产业界54家核心企业,共同发起《数据流通行业自律公约》,标志着数据流通领域已经形成初步规范并达成行业共识。行业自律有助于营造公平有序的大数据生态环境,加强用户数据保护,促进数据交易、共享、转移等环节的规范有序,推动数据的价值开发。下一步,信通院将重点推进数据流通合规性的第三方评测与认证。目前,试点的测试工作已经完成,接下来将在全国范围内开展起来。