在线科技郑义:工业互联网的大数据可信存储

责任编辑:朱文凤 2020.10.28 14:09 来源:通信世界全媒体

通信世界网消息(CWW)2020年10月28日,“2020第三届中国(黄石)工业互联网创新发展大会”在湖北黄石隆重召开。北京首都在线科技股份有限公司副总裁郑义作主题为“工业互联网的大数据可信存储”的演讲。

演讲如下:

大家好,我叫郑义,来自北京首都在线科技股份有限公司,我们公司是一家成立20多年的老企业,我们一直关注于中国互联网、中国网络服务以及中国的云计算。首云是云计算对外服务品牌,整个首云是专业的公有云提供服务商,我们在市场上面跟阿里、腾讯共同支撑着中国互联网整个后面的云计算以及存储。今天我们站在这里,也是代表着首云再次转型,或者在新领域的拓展。

这上面展示的是首云有完善云计算解决方案,大家能想到的所有云计算都能够提供,给大家支撑所有的底层业务。也是因为有这样长期经营的经验,我们在很早的时候就开始投入存储平台的研发,大概15年的时候平台上面的数据增长,已经可以看到未来5-10年数据爆发是已经证明的发展趋势。我们平台上日以继夜在增长的数据,也证明了几年前的预估。现在平台上有非常多的互联网企业,中国互联网企业强一百强,大部分应用都是我们在后面提供运算和支持的,这里面包括抖音、快手、优酷,大家能想到的互联网应用都有。

互联网企业更多是以前的经验,通过这些经验我们得出来的是什么呢?就是关于大数据增长带给我们整个业务或者整个设备的挑战。我们平台的数据增长是不敢想象的,能看到的是全球所有云平台上,大部分数据没有被访问,仅限于我们做的互联网。其实,我们抬头看外面很多行业或者今天我们在这里看工业互联网,首先具备的是数据爆发非常大的一点,所有这些传感器,所有这些业务,每天都在产生数据的收集。这些数据的收集,势必带来数据飞速的增长,数据增长以后通过短期的处理,这些数据怎么办呢?带出来真正的概念就是什么叫大数据,这也是以前一位院士的总结,我觉得总结得非常好,也很简练把大数据总结出来了。真正的大数据是什么?是今天大家可以想象到的所有应用、所有软件都不能处理的数据,它没有规律,它没有任何关联性,但这些数据又很重要。我们看不懂这些数据,是因为我们现在不知道怎么用它。这两年跟工业的很多沟通,包括跟造车企业,也是我国新型造车企业的老板,生产一辆车在产线上,每辆车上有5个G的数据,这些数据都需要存储。两年前第一辆车上市的时候,这些数据都存在存储平台上个,前期有质量控制对数据的需求,但是这些数据在后期能产生什么,他不知道,他现在要把这些存下来,大数据未来就像金矿一样,挖出来企业后期发展需要去的方向。比如说某个故障或者某个需要召回的大通病产生了,他要回溯企业当时设计时候出了问题,还是材料出了问题,还是生产出了问题,都是实际在生产工业中看到了。我所有的论点都落在,其实整个工业互联网后台已经产生了很多的累计数据,这些数据都不是我们今天谈到的平台应该去承载的。今天我们谈到的平台,行业的解决方案,都是要快速给大家结果,而我们今天站在这里,要向大家讲的东西是说,这些结果以外产生的数据才是大家的宝藏,因为这些宝藏在以后能够推着我们向前走,可能到工业4.0或者工业5.0的时候,给全社会真正的价值。

我们现在做的就是怎么样把这些数据存下来,无疑大数据存储数据量极大,每个城市、每个省都需要大量级的存储平台。要求的安全性又特别高,其实我们在近期业务当中也跟各个行业做沟通,有的行业已经意识到这个问题,甚至十年前在买存储,试图把企业数据存起来,但是这些存储在5年以后就开始产生损坏,这就代表着我们当时的观点,数据的长期存储要通过服务化才可以完成,任何一家企业,任何一个服务平台,私有的没有办法完成这件事。其实很简单,就跟银行一样,咱们有点钱存在家里的衣柜没有问题,但是有一两百万放在家里,存十年,有没有利息是一方面,另一方面真的安全吗?所以长期存储,一定要服务才可以解决。

我们这几年做的,就是立足于为数据的爆发,为中国社会将来数据沉淀提供一个新时代的产品,提供大家用得起,真的敢去用,真的敢去想,我要把数据存下来,一辈子放在那里。今天数字的社会,所有人都在提数字化转型,其实我们自己已经实现了,手机摸出来,孩子的照片,这些数据存在哪,你有想过吗?你手机丢了,有多少数据找不回来?有没有一家公司,有没有一家平台,真的帮你做到,这是我们现在在做的,也是整个公司的愿景,用极低的成本把照片存下来。

我们做的叫冰山大数据存储,具备海量的存储能力,要保证数据的隐私性,要保证这些数据长期的一致性,要保证这些数据的高可用,都是自己或者企业或者小的技术团队没有办法去解决的。最后,还有就是我今天谈的很重要的一点可信,我拿银行举了例子,数据的存储和银行不一样,银行是你在一个分行存了100块钱,马上就解耦,某某人存了100,这100是数字。对于我们所面临的用户数据,每家企业的数据,每个政府的数据,可能包含了病例,可能包含了某片政务数据,你今天买了房子,这些数据是不能被修改的,我们怎么保证今天我的客户存进来,未来还给他100%就这个东西,没有经过篡改,没有经过任何平台的修改,让用户真正相信。最后就是可信,是这个平台非常重要的一点,后面会具体讲。

可信是可视+可证,可视是向客户展示出来,存在我这里发生了什么。另外是从进来到出去,中间所有的过程都要展示给用户,让用户的手段去证明,这是我们这套平台要具备的。

我们现在自研了文件系统,这个比较专业的,我们有一系列的数据容错方案,实现数据高可用,可以存无限文件的平台,最后是可信的实现,也顺应习主席说的,研究以及让区块链技术真正产生商业应用、商业成绩的指导,我们也是在这两年花了非常多的精力,通过区块链的形式,因为区块链天生具备的是溯源、公开,数据谁都可以看到,我们用这个形式去实现可信的证明。今天不是很技术的会,后面有的东西不会再展开讲了。

大体上我们的结构是这样的,数据存储和区块链分成两块,各自处理,各自达到最好的性能,区块链不在业务流程里面,但区块链所有的公链信息都在公链上,用户开始就可以看到数据在我们平台怎么存的,我们对它进行了什么样的处理,所有的数字签名有没有被改过,向我们用户证明存储数据的可信度,区块链里面的信息客户是可以保存的,丢了也无所谓,因为这个东西在公链上,这是区块链很重要的特性。真实的数据放在我们的仓库里面,我们的仓库有核心节点,也有用户级别的节点。我刚才说我们是公有云,但是这套产品不单单以公有云的形式存在,这是我们站在这里的原因之一,致力于为各省各市建数据库存整个城市或者整个省的沉淀数据,这些数据离用户更近,离应用更近,性能更好。我们通过区块链的形式,让使用我们平台的所有用户,对属于安全性的问题放心。

区块链的结构不讲了,每个块里面放什么,怎么做分发。验证的这块,也是比较技术的,基本上这两个东西怎么互验的,怎么相互进行文件或者签字的对比。讲一下案例,我们在某个省已经做了很大的部署,大概有200P的部署,是省级平台,上面包括了刚刚我们谈到的工业互联网,也谈到了里面的政务,包括公安、智能交通、智能医疗,以及应急,我刚才看隔壁那位是应急部门的,这些都是沉淀数据,我们这套平台是把所有生产平台上的数据,生产以后存到我们仓库里面。我们上个月交付了20P,马上会扩容,这里面也要谈到我们的模式,我们是云计算公司,所以我们交付这个平台,我们的模式是按照云的方式交付的,我们不要求用户一次性买断,用户买多少我不多少,用户从不用那刻起我把设备拉走马上停止计费,把过去云上面的东西用到真正能落地的产品上来,通过这样的方式让用户没有负担,根据他的增长用这套平台。而我们这套平台跟大家所有脑袋里面想到的存储平台比起来,我们可以做到价格1/5-1/8,看你买哪家的存储。

第二个案例也是在某个省,这是跟联通合作的,帮他们承接数据长期的归档,有些数据要长期回溯。整个数据存储,我们做的是两套平台,因为要求在本省做多地备份。我们平台的模式就是在用户端私有的平台,可以用我们的核心节点做数据的保护,也可以根据用户的要求在两个场地或者两个地域做保护,这些都是可以支撑用户最终应用的形态。

第三个案例我觉得很有意思,天津去年做的试点,这个试点应该要在明年往全国推,是关于教育安全的。之前有个社会事件,某某幼儿园出现的恶性事件,政府发现这里面有很大的问题,让天津市做试点,要求教育局把所有幼儿园的视频全部实时拉到教育局的存储平台,所以他们拿个区出来做试点,这个平台我们交付了8个P,还需要进行扩容。这8个P够幼儿园存半年,他们现在希望存更长时间,这样的话解决安全性问题,起到的作用是不让数据丢失或者逃脱监管的情况再次出现。

我们这套平台,今天在这里针对工业互联网,其实我更多是开拓性的,给大家开拓思维,大家可以想像以后沉淀数据用什么样的方式去存。我们需要告诉大家的是,这是我们希望能够帮各位解决的问题。至于下一步,我们希望能够尽快帮助黄石落地城市级的数据归档中心,为大家提供我们的服务。

谢谢大家。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容