凌晨2:00,某跨国公司运维机房内,IT运维人员们正在紧张地排查分析视频会议系统为何无法正常使用,按计划当天上午9:00 CEO要召开一个高层的视频会议,所以视频会议系统必需要在上班前恢复正常,运维人员面临着巨大的压力。您是否对这样的场景似曾相识?正如网络上流行的一首打油诗 “锄禾日当午,不如运维苦,对着破电脑,一调一下午”写出了IT运维人员的心声。
随着网络规模越来越大、网络中承载的业务类型越来越多样化,当用户业务体验受损时,IT运维人员往往难以判断是业务系统的问题,还是网络引起的问题,更不用说定位具体什么问题导致用户体验变差,运维人员很多时候都在忙着“救火”。如何掌握业务质量情况,如何实现网络故障快速精准定位,这些已经成为网络运维领域急需解决的问题。
影响用户业务体验的因素有哪些?
如果想准确定位业务体验变差的原因,首先需要了解哪些因素会对用户业务体验有影响,这样才能做到知己知彼百战不殆。除了人们熟知的网络通断、带宽不够会影响业务体验外。还有很多其他因素也在影响用户的业务体验,例如:设备老化丢包、网络配置错误、光纤劣化丢包、网络攻击、流控失效等等,但却由于缺少有效的检测方法和技术而被人们长期忽略。
当网络中传输数据类业务时,即便网络出现了丢包,TCP报文会重传,用户会感觉到网络访问比较慢,但并不会造成严重影响。而高清视频、语音等实时类业务对网络质量提出了更高的要求,以高清视频业务为例,要求丢包率小于10-6 ,也就是说一旦100万个包里面丢一个包,就会出现视频马赛克,而且用户也能立刻体验到。为了保证视频类业务的正常使用,有些大型企业往往会单独建立一张视频会议专网。
业务质量难检测,网络故障难定位的根本原因在哪里?
伴随着互联网的快速发展,IP网络已经成为信息承载的基石。大家都知道 IP网络是一个面向无连接的网络,采取“尽力而为”的转发模式,这成就了IP网络的大规模部署和发展,为今天丰富多样的互联网业务提供了基础保障,但这同时也是造成业务质量难检测,网络问题难定位的根本原因。
IP网络中传输的只有数据报文,没有任何与业务相关的信息,可以说网络与业务完全割裂,这是造成业务质量难检测,网络故障难定位的根本原因所在。当您在视频会议中出现马赛克,体验变差时,网络却无法快速感知到业务质量变差并反馈给IT运维人员来进一步解决。只有当您实在无法忍受并将问题报给IT人员时,他才知道网络出现了问题,但基于现有的网络质量检测技术IT人员也很难快速定位出产生问题的具体原因。面对IP网络无连接特性而带来的质量检测难题,现有的网络质量检测技术还未能很好的解决
“尽力而为”转变为“尽在掌控”的敏捷网络,带来全新运维体验
基于以上的分析,我们就在考虑,能否为无连接的IP网络增加一个主动的质量感知机制。当网络上运行的业务出现问题时,网络能够感知到并将故障点信息快速反馈给IT人员。这就好像我们人体一样,身体有一个自我感知和反馈的系统,当受凉感冒时,会通过发烧、头痛等症状告诉你身体内出现了问题,你需要去看医生或者吃药来进行进一步的治疗以防止病情加重。网络也同样需要这样一个机制。
华为利用专利技术解决了IP网络质量难检测,故障难定位的问题。华为敏捷网络利用iPCA(包守恒算法,Packet Conservation Algorithm for Internet)技术,为面向无连接的IP网络增加了一个主动的质量感知机制,即保留了IP网络面向无连接的特性,也实现了网络质量主动感知,从而可以全面提升网络质量检测和故障精确定位能力,降低网络运维成本。
|