信通院:大数据应用 需构建合规的数据流通环境

责任编辑:孟月 2017.06.15 15:57 来源:通信世界全媒体

通信世界网消息(CWW)“电信大数据目前所面临一些挑战。首先,市场应用需求有待培育,数据教育缺乏规范性的管理,前景还是有待培育。第二,行业协同能力不足,应用拓展缺乏统一的协调规划。第三,数据安全标准仍然存在多方面的缺失,风险管控的压力大,从全领域电信大数据的安全规范仍然处于比较空白的状态。第四,电信企业的数据管理能力有待提升,技术短板仍然有些地方是较为突出,数据相对比较分散,从本身的数据管控还有大数据符合型人才的培养和培育方面存在一定的问题。”中国信息通信研究院技术与标准所移动互联网与大数据部工程师刘寒在会上表示。


刘寒_副本.jpg

中国信息通信研究院技术与标准所移动互联网与大数据部工程师  刘寒

刘寒:

我们院的名字叫做中国信息通信研究院,原来的名字叫做工信部电信研究院,名字是更改了,同时我们也是这个数据中心联盟和大数据发展促进委员会的运营单位,今天我讲这个题目叫做构建合规的数据流通环境,刚才大家已经把这个大数据应用讲的这么丰富多彩了,我不知道我这个主题是不是可能稍微有点严肃。下面这个是有我联系方式,如果说大家听完之后觉得我这个讲话内容还有继续交流的必要可以跟我联系。

首先分享一下我们之前编制的2017电信大数据应用白皮书上一些比较有价值的观点。我们是必须要承认电信大数据现在的价值已经被所有的用户所认同。新大数据它海量真实多样,三大价值特性非常的突出。据工信部2016年统计,固网家移动用户已经达到了15.3亿,基数和数据量应该是无法比拟的,登记率已经达到了95%,这个真实性也毋庸置疑的,但是从多样性来讲,运营商经过了这么多年的数据积累,包括结构化的用户的基本数据,然后半结构化这种用户访问日志的数据,还有非结构化的各种流媒体数据,然后在种类上就更加丰富,也可以看出这个运营商大数据多样性是非常突出的。第二个观点是说运营商它有基础设施,这种优势数据存储与数据传输的优势比较明显,其实从国内来看,三大运营商在IDC数据存储服务领域已经超过了这个市场份额的60%。从一些客户板块来看,他们其实也是希望跟运营商来进行这种项目的合作,也是经常会要求有一些网络带宽优惠,这个也是客户非常看重的,然后第三个就是这种电信级的这种数据安全保障,它已经成为了一种品牌,已经成为了一个行业的标杆,所以说这个也是用户非常认可的数据安全保障。

第二,我想说一下电信大数据的一些应用的特征,总结了一些国内运营商他们的一些在各个行业的应用案例,总结出这么几个特点,一是应用领域相对的集中金融交通应该是说成为这个行业的热点。第二个是应用的产品是逐渐的成熟,精准营销客流分析是他们主流产品,因为这些应用模式其实也比较清晰了。第三个就是内外部同步推进,但是目前电信运营商大数据是以内部应用更为广饭,在外部方面,其实由于一些个人隐私数据敏感数据,这种保护规定可能是在应用方面受到了一些相对限制。

然后我再说一下电信大数据所面临的一些挑战。首先来说,市场应用需求有待培育,数据教育缺乏规范性的管理,而我们说除了精准营销已经形成这种成熟的产品以外,其他行业其实目前并不是广泛的应用,都是处于这种大数据的阶段,所以说前景还是有待培育。另外一方面,从它本身运营模式和它平台的管理方面还是存在这个很很多需要改进的地方,所以说运营商可能在短期内也不会把自己的拥有的数据当成一种数据商品进行交易。第二个方面是这个行业协同能力不足,应用拓展缺乏统一的协调规划,但是无论是从三大运营商它们之间合作当然已经是有了这种部分的数据合作,还是从它们企业内部各个产品线各个技术主线各个领域这种数据的统一汇聚都是存在一定的障碍,应该说限制的这种数据协同的整体发展。第三个方面我们说是数据安全标准仍然存在多方面的缺失,风险管控的压力大,因为说电信运营商它所涉及的大量个人隐私的数据在用户数据安全和信息保护方面要求也非常严格,无论是国家的法律还是工信部的要求都是非常的严格。目前企业应该说还是以自身的这种安全管控为主,其实存在一定的风险性,然后从全领域的这种电信大数据的安全规范仍然处于相对来说比较空白的一个状态。第四点是电信企业,它的数据管理能力有待提升,技术短板仍然有些地方是较为突出,我们也说它之间连续数据也有这种流通上的这种数据壁垒存在,移动以省市级这个公司为主要的业务单位,所以说它的数据其实相对来说也比较分散,然后从本身的数据管控还有这种大数据符合型人才的培养和培育方面也是存在一定的问题。

其实我们在4月份工信部组织召开了一个大数据产业峰会,其实也是我们院在主办的,然后我们院独立第三方这种地位,所以大家可能跟我们合作积极性还比较高。然后我们也是征集了全国电信运营商的这种大数据应用的案例,首先第一个是中国移动的构建反电信欺诈合作体系,大数据服务按服务亿万民生,这个是由中国移动湖北有限公司发起,同时联合了福建上海浙江云南四川湖南七家这个省公司,结合大数据和机器学习的技术,构建了双识别模型和流处理的大数据系统,完成了通信大数据反欺诈系统的搭建。这个系统可以有效地识别多种主流的诈骗模式,从识别到实施拦截仅用两分钟,七省联合超过2000个节点以上的大数据集群整合了企业30余项基础IT数据资源,数据量超过了20pb,目前已经是每秒钟可以过滤1万次通话,每日处理量达到10亿以上。国家旅游大数据平台的融合了中国电信自有的客户数据,无线数据相当于数据等等,并结合了来自政府景区交通只有企业这种地图数据,提供了能够包括旅游大数据分析数据库接口、旅游大数据分析产品的服务,这个项目应该是国家旅游局是作为甲方单位。

第三个我们介绍一下中国联通的大数据精准营销平台。中国联通大最精准营销平台依托于中国联通大数据生产平台能力开放平台及丰富的标签筛选库,面向行业的需求,切实解决行业客户在精准营销中的痛点和难点营销平台,它的主要的应用目的是在于参与行业客户从潜客挖掘用户维系流程营销管理,并为行业客户提供包括线上线下一体化的专业触达服务,使行业客户后与用户之间的沟通更加流畅和便捷。数据流通个过程我们给它分为这么四个环节,包括数据源现在整个社会,我认为从大家搭出去一直提升来看,只要有数据,大家就会认为它一定会有价值,所以说这个数据它涉及到各个行业,包括像这种电信社保房产这些价值非常高的一些数据,从流通环节来看,相对来说是比较复杂一些流通环节,你可能有跨部门跨企业跨行业,甚至于跨国接这种数据流通,然后从数据流通的相关这种企业来看,有这种直接倒卖原始数据的,有进行统计分析,甚至还有这个做建模分析输出结果的,那么数据源应用环节都是隶属于各个行业,然后现在都属于交叉应用,最后作用到个人企业和政府的用户,然后来实现这个数据的价值。

那我们研究数据流通合规性的环境,我们就不可避免看政策要求和一些法律的要求。从法律风险来看,从数据源层面包括2012年的全国人大常委会关于加强网络信息保护的规定,还有电信和互联网用户个人信息保护规定,也就是工信部24号令,简而言之就是说三句话,规则明示公开,征得对方同意,确保信息安全。这是一个指导的精神。然后从2012年7月发布的十二五国家规划里边也是提出了开展移动智能终端软件网络化计算平台与支撑软件、智能海量数据处理相关软件研发和产业化的一些要求。在数据流通方面,相关立法对于数据的传输发布等作出了规定,关于促进信息消费的若干意见。其实我们的想法是这么一句话,叫做标准先行测试为辅,我们是这个数据中心联盟作为一个平台,以这个平台标准进行标准立项,平台标准的好处是,一是它的门槛较低,它参与的企业较多,能够更为真实的来反映企业的真实诉求。另外一个方面就是说它不是一个强制性的标准,它更多的是给企业的业务发展提供一些参考依据,来促进大数据应用的一个发展。而从我们的整个标准体系的框架,我们是想横向是以各个应用场景为主线,包括我们已经制定的征信产品及服务标准,金融风控产品及服务标准,数据流通中心数据处理业务及管理标准,这个是针对于数据交易中心的,还有目前我们正在制定的精准营销产品及服务标准,当然随着应用的不断扩大,场景也是在不断的增加。从纵向来看,我们主要是以安全管理机制、数据的使用规范,包括它数据的用户授权流程,数据的转移方式,它的接口还有一些审计的要求,我们也是根据这些要求来完成每一项不同场景规范的制定。从整个规范制定之后,我们也是根据企业的诉求进行了一个测试的环节测试,我们是以相关的场景标准为基础,同企业针对于被测产品和服务进行个性化的组织方式的定制。

我们测试手段主要有分为几种,第一个是对它整企业整个的安全文档进行一个审查,主要是审查里边的相关内容,然后第二个是对企业的整个安全操作进行审查,包括他的一些人员权限保密机制。第三个我们也是开发一套日志的检测工具,是部署在企业能够获取它业务应用业务培训过程中能够获取它又应用内容的一些日志信息,然后对日志信息进行一个统计分析,看它是否有一些它对用户承诺的东西没有提供给用户,或者是一些违反相关规定的涉及到个人信息隐私泄露的这些数据,这也是我们测试工具的作用。最后我们也是以工信部电信院的检测专用的名义出具一份测试报告,最后的评审是以我们院和被测方所共同认可的行业专家进行评审的方式来进行打分。

那么我们说在进行标准制定和整个测试的工作当中,我们不可避免地要涉及两个问题,一是通用性法律法规,我们也主要参考像刑法修正案里边关于个人信息的一些相关规定。但是涉及到各个行业场景的时候,我们就是不得不去再次参考这个行业相关的规定,比如说我们在电信行业,我们自然就会参考运营商也是目前执行最为彻底的工信部24号令电信和互联网用户个人信息保护规定,当然里边也是明确说了不得出售或者非法向他人提供相关的各人信息,然后之后我们在做征信场景标准的时候,我们也是参考的征信业的管理条例,请问第13条说的是采集个人信息应当经信息主体本人同意,未经本人同意不得采集,但是依照法律行政法规规定公开的信息除外。然后,我们在制定金融风控标准的时候,尤其是在非银支付场景下,我们也是参考了人民银行的非银行支付机构网络支付业务管理办法规定支付机构应当确保协议内容清晰易懂,并以显着方式提示客户注意。所以我们从每个场景标准来看,它主要内容分为这么几个部分,第一个部分是安全管理,分为三个部分,第一个小部分是安全管理文件,第二个是安全组织机制,第三个就是接触这种生命数据的人应该具有保密机制。

第二大项是涉及到不同场景,这种数据使用的总体原则是数据采集和使用,不超出合理的范围,当然这个只是一个原则行的,然后从实际的我们是将数据划分为三类,第一类是禁止对外转移的数据,第二类是可以按照是否分级分数直接对外转移的数据。第三类是在用户授权的情况下可以查询的统计数据和一些相关的原始数据。之后,对于每一种被测的业务需要有它的业务说明,主要是它业务的功能,业务的整个流程业务的输入数据和它的输出结果的是什么样的,其他的相关规则是包括它使用方的用户下载的权限,然后是否有这种用户不得存储数据这种规定,然后是否这种日志保存的期限和内容还有其他的审核机制。宗教信仰等这些数据是禁止转移的,就在日志保存方面,根据这个业务的不同,它也是分不同实现的业务保存。

在授权机制方面,我们主要是对用户授权协议的内容和流程进行的一个规定。那么认为目前整个的授权流程应该是说大部分是以面向客户的一次授权之后,其他在这个流通当中各个主体,他们在背后通过协议去规范和规避各自的责任和风险,在服务能力方面都是企业自主提供的,因为现在这个大数据整个应用市场还是比较丰富的,所以说企业可以根据他们自己的产品特性来提供一些相关的服务能力的展示。这就是我今天讲的内容。谢谢大家。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容