|
||||||
|
网络系统方案的可靠性测试
http://www.cww.net.cn 2011年1月14日 10:52 通信世界网
作 者:H3C王慧升
网络系统测试的振荡系数常用经验值为30%,即加载在测试系统的协议表项和流量在已设定的参数基础上,周期性上下浮动30%。并可根据需要调整以观察不同频率条件下的振荡结果,例如可分别以5分钟、10分钟、30分钟、1小时为一个周期。以路由条数为例,路由振荡导致整个网络系统中各个节点大量发布、删除路由信息,并引发流量路径的迁移,给予测试系统更大的不稳定性压力。实际测试时,还需要根据行业客户应用特征网络对系数进一步分析,灵活调整。例如,互联网行业客户,普遍存在搜索类业务突发,对流量振荡的要求更高。 振荡的模拟可通过业界常用测试仪器较为方便实现,本文不再赘述。 2 网络系统告警管理功能、系统故障定位手段能力评估 网络系统必须具备系统风险预警功能和便利的故障定位维护功能。 网管系统对网络的实时监控,预先告警功能主要包括网络节点CPU、内存、端口流量、端口状态等参数的监控告警。当占用率或者端口流量持续超过阈值,即可触发告警,使管理员提前预知风险,进行分析维护。 系统故障定位手段为事后维护。一旦网络系统产生故障点,网络管理系统需记录网络切换事件,方便快速帮助管理员找到故障点,并保存故障信息和系统状态,便于后期缺陷复现定位。 维护类测试以功能测试为主,通过打入攻击CPU的流量、制造流量拥塞等方法构造各类预警条件,通过shutdown或者重启设备等命令行,插拔端口、关闭电源等手段检验网络系统对故障点的定位和告警信息是否完备。若设备支持可维护性测试特性,还可通过设备软件的可维护性测试命令,构造设备节点系统软硬件故障,查看系统保存的故障状态信息是否完备,以复现定位缺陷。 测试时,同样需在大压力复杂条件下执行,以检测告警、故障信息是否得到高优先级处理。 3 单点故障情况下系统自动恢复时间 网络系统在出现单点故障情况下可快速恢复是高可靠网络设计的重点。恢复时间的要求在各类行业和各网络层有差异。目前,网络系统平均恢复时间低于500ms已经逐步成为主流要求。 与网络切换相关的各种组网模型故障模拟主要包括:链路故障、节点设备故障、单板故障、节点设备主备倒换、主备设备倒换、设备升级等。各类故障还需进一步细分,例如节点设备故障包含:设备命令行执行软件重启,设备断电、设备上电、主备控板全部拔出/插入等等。 为精确计算各类故障导致的网络中断/恢复时间,组网如图1所示,测试方法如下:
图1 网络系统恢复时间测试示意 1、基于网络测试环境,接入测试仪器,将流量发生器端到端接入网络系统。仪器端口分别连接网络系统的接入层和出口,以保证被测流量路径贯通整个网络。 2、在测试仪器的Port A端口设定速率稳定的流量,目的地址为Port B端口。在Port B端口设定速率稳定的流量,目的地址为Port A端口。由于上下行路径迁移时,上下行的路由等各类协议的热备表项不同,涉及的协议收敛也可能不同,所以务必设定双向流量,以检测上行和下行流量路径的恢复时间。
编 辑:石美君 联系电话:010-67110006-818
文章评论【查看评论()】
|
重要新闻 通信技术 企业黄页 会议活动 |