通信世界网消息(CWW)目前大数据技术和产业正处于蓬勃发展过程中,越来越多的厂商已经意识到数据作为企业核心资产的重要意义,也有意愿向该领域的系统建设投资。但是大数据产业在发展过程中也存在着以下问题。
技术驱动而非需求驱动,导致系统对客户实际业务的帮助不大:很多客户只是听说大数据能解决很多问题而配置了大数据系统,但并不知道怎样用大数据帮助自己解决问题。同样,很多厂商只是具备一定的大数据技术,并不深入了解客户的业务,所以也很难开发出真正能帮助客户解决问题的大数据应用。
垂直化的应用开发方式导致系统开发成本高周期长:目前行业内大量的大数据应用仍采用按项目垂直化的开发方式,项目之间缺少积累复用,每个项目几乎都是零基础的重新开发,造成系统开发周期长、成本高、质量难以保证。
大数据处理分析平台具备五大特点
针对以上问题,结合自身在大数据技术领域的深厚实力和多年积累的行业应用软件研发实施经验,大唐电信以“平台+行业应用”的形式,推出了针对政务、社区、交通、水利、运营商等行业大数据市场的整体解决方案。该方案以面向多行业应用的大数据处理分析平台为基础,基于该平台提供的大数据管理与分析能力,并结合各行业自身的业务需求,提供面向多个行业的大数据分析应用,如图所示。
图 大唐电信大数据处理分析平台
大数据处理分析平台是一个能够提供支撑大数据存储、处理与分析、展现、管理能力的基础平台,其主要功能包括大数据实时采集和预处理、大数据分布式存储、大数据高性能应用处理、多模态(表格、文件、对象及数据流等)数据的综合管理,高维度检索和可视化展现,以及大数据行业分析模型。平台覆盖了大数据生命周期中的采集、存储、计算、挖掘、管理等处理环节。
大数据处理分析平台具备灵活、多模态的大数据采集及管理,低成本、高性能的大数据存储,满足多层次需求的大数据分析与可视化服务,高可用、弹性可扩展的分布式系统部署,以及良好的可管理性和用户体验五大特点。
大数据行业应用案例不胜枚举
基于大数据处理分析平台所提供的大数据管理与分析能力,大唐电信已研发了针对政务、社区、交通、水利、运营商等行业的大数据应用,并得到了成功推广。
其中互联网及宽带测速平台已在某部级单位完成了应用示范。该系统采用分布式架构,应用层和数据层网状分布,目前400个左右的监测点位于系统的分布式末梢,北京数据中心是网状核心,负责核心数据处理和业务分析展示。
该平台网站已经面向公众开发,目前测速用户人数超过5万,平台涉及到的主机和设备400余台。在数据量方面,中心平台主动采集部分数据量1.2T/月,省平台主动采集部分数据量0.5T/月,被动数据量29G/秒。对于被动采集部分,因数据量太大,基础数据不保留,保存5分钟汇总数据3个月,数据库中放置天粒度以上的分析数据。
而高速公路交通大数据分析平台已在某省高速公路管理局得到了应用。系统采集与整合高速公路交通路网运营的海量业务数据,目前系统处理的数据包括微波车检数据6亿条/年、ETC数据1.5亿条/年、MTC数据2亿条/年、高速路况数据10万条/年,以及路面、机电养护和其他业务数据1000万条/年,视频与图像数据80PB/年。预计在未来2~3年内,该软件平台存储、处理的结构化数据量约在2000~3000亿条左右,非结构化数据量约在160~240PB左右。
未来,大唐电信将不断优化大数据处理分析平台的能力,并结合行业需求推出更多的大数据应用方案,为我国大数据产业的发展做出自己的贡献。