伴随着巨大网络流量涌来的各类数据,其价值的重要性已日益突出。按照Gartner预测,到2020年大约75%的企业都将大数据分析融入其日常经营决策中,未来大数据分析将成为企业经营的一项基本能力。
大数据技术的应用,起到的是实实在在的效果。根据Sysbase的统计分析,电信行业通过在运营中应用大数据,人均产值提升了17%,而在行业价值贡献方面更是排在了所有行业的首位。在电信行业收入增幅日趋放缓的今天,这样的产值增幅令人鼓舞。
通过构建行业大数据分析系统让运营商具备了大数据分析处理的技能,但这只是在大数据时代获得成功的基础;运营商还需要从企业战略和经营思维层面改变,发现新的机遇和模式并付诸实施,才能真正将自己所掌握的大数据资产和大数据技能转变为企业价值。
需求变化快挑战大数据应用
在很多行业尤其是电信行业中,大数据的“大”并不仅仅指的是数据的体量,在应用层面,大数据的真正挑战是来源于其需求变化快,如果缺乏一个灵活、可扩展的基础架构和运营平台作为基础,企业就很难真正挖掘大数据价值。
对此,中兴通讯股份有限公司中心研究院副院长陈坚称,要满足企业对数据价值挖掘的需求,基础架构与运营平台至少需要满足四个特征。
一是平台在架构上需要具备可伸缩性。不仅模块具备可裁剪性,而且系统的规模也具备可扩展性。这样,系统初始建设时可以按需建设,将初始投资压缩在可接受的范围,然后,系统随着业务量增长而扩展,以架构的可伸缩性,兼顾初始投资与业务增长的平衡。
二是必须具备数据的开放能力。无论是在平台上开发各类业务,还是与第三方进行数据交换,都要求平台具备数据的开放能力。
三是要具备集成与被集成能力。如果大数据系统是主系统,则需要具备集成原有生产的能力;如果大数据系统是辅助系统,则需要具备被原有生产系统集成的能力。只有这样,大数据系统才能无缝地与原有系统对接,在不干扰原有系统稳定运行的前提下,提高生产力。
四是要有一套强大的统一管理系统。当前开源系统,以及多厂家系统在一起集成时,面临的一个很大的困难与问题,就是统一管理的问题。所以一个大数据平台必须具备统一管理开源软件模块,以及所集成的第三方软硬件的能力。只有具备统一管理能力的平台,才是一个真正可用的平台。
直面非结构化数据的分析难点
大数据处理的技术,特别是云存储与云计算技术的成熟应用,为大数据的存储与处理提供了技术可能性。企业可以利用生产系统以及管理系统中产生的大量数据,一方面可以对自己的生产活动进行更为准确的预测与指导,从而提高企业生产活动的准确性;另一方面还可以利用通过对数据价值的挖掘,产生新的业务。
中兴通讯针对电信大数据进行了专家级的建模,其大数据平台DAP2.0可以利用云存储与云计算的技术,对海量的数据进行存储、挖掘分析,以帮助企业充分开发数据的价值。
但现阶段大数据的数据分析被认为是难点,尤其是非结构化数据的分析。对此,陈坚表示,当前对结构化数据的处理技术相对成熟,但对非结构化数据的处理上,的确是难点。不同的非结构化数据,往往需要不同的技术去处理,才能让这些数据产生效益。目前,中兴DAP平台对非结构化数据处理有很大的投入。例如,在电信领域自研DPI硬探针,可以解析电信信令、上网记录等电信领域的非结构化数据;在安全领域,通过图像算法,可以从运动图像中做车牌号码识别、以及人脸识别等等。
大数据平台的特色
一个功能完备的大数据应用平台可以极大地简化数据处理与分析的繁琐,并能更有效地挖掘各类数据的价值。中兴通讯中心研究院总工王德政总结DAP2.0大数据平台时提到三个有别于其他系统的“不同”:一,DAP2.0采用货架式架构,采用企业总线ESB的技术,可以灵活地对各个组件模块进行裁剪与拼装,满足“集成”与“被集成”的两种角色要求,在不影响生产系统稳定性的前提下,与原有生产系统无缝集成,引入大数据系统;二,DAP2.0在数据分析挖掘层面的智慧生成的特征,可以提高企业活动的准确性,DAP2.0通过针对性的挖掘算法改进,可以做出超越人类专家经验与直觉的智慧建议,提升人类活动准确性,提高社会生产能力;三,DAP2.0具备平台特性,聚焦于数据的存储、处理时效、以及挖掘算法,可为上层应用解决大数据应用的技术难点与障碍,上层应用可以根据自身的需求,快速地进行定制开发,以很短的时间周期与研发成本推出新的大数据应用,未来,DAP2.0还可以对第三方开放,支撑第三方的大数据业务开发。
大数据平台的功能与特色,只有在实际应用中才能体现出真正价值。
据王德政称,当前各家运营商已经认识到电信数据所蕴含的价值,并都已经在做积极的尝试,进行各类大数据平台的建设,并在其上规划各类业务规划。例如,中国移动的资源池建设、中国电信的号百公司等等。
但当前电信行业大数据工作虽然取得很多的进展,与IT界的大数据相比,仍存在着聚焦不清晰、业务目标较模糊的问题。例如,电商的大数据聚焦于电子商务领域的精准营销,社交网站对SNS的数据做深入挖掘分析。王德政坦言,电信领域的大数据项目往往是很多目标的混合体,在资源有限的情况下,如何同时达到这些目标,则是当前电信大数据领域面临的问题与考验。
|