1、交换设备运行基本参数检查的评估标准

检查分类

检查项目

检查方法

评估标准

基本参数

设备、端口状态

外观观察

1、端口状态指示灯状态:绿色闪烁,如果为橘色确认该协商状态是否与实际相符

 

主备引擎/线卡指示灯

(箱式设备)

外观观察

1、主备引擎、线卡状态指示灯:绿色常亮为正常

 

告警指示灯

外观观察

1、告警指示灯正常不亮,如果告警指示灯红色常亮确认告警内容,需要及时进行故障处理

 

电源运行状态

观察电源指示灯

1、关节节点设备确认有冗余电源

2、电源指示正常为绿色常亮,模块电源如果fail指示灯红色常亮,表示电源故障

 

风扇运行状态

show fan

观察风扇运转

1、不允许出现stop状态

2、听:风扇运转无异响,

3、手感觉气流:用手感觉交换机的抽风口是否有风的气流流动。

 

温度状态

show tempeture观察温度

1、查看温度是否超出warning温度,交换机运行温度应该低于50摄氏度

 

模块运行状态

ruijie#show version slots

1、模块正确识别

2、模块软件版本与主设备或者管理引擎版本一致

3、模块状态指示灯为绿色常亮

 

2、交换设备关键性能参数检查的评估标准

检查分类

检查项目

检查方法

评估标准

关键性能参数

CPU正常

ruijie#show cpu

 

1、正常交换机CPU平均利用率小于40%

 

Flash空间大小

Ruijie#dir

dir/flash里最好有配置文件的备份/os的备份,flash的利用情况不能低于总量的70%

 

系统启动文件是否修改

Ruijie#show mainfile

1.设备启动文件是否有变更,启动文件名至少与flash里有一个文件名一致

 

系统协议报文处理情况

show cpu-protect su

show cpu-protect mboard

show cpu-protect slot 1

show cpu-protect slot 2

show cpu-protect slot 3

show cpu-protect slot 4

show cpu-protect slot 5

show cpu-protect slot 6

show cpu-protect slot 7

show cpu-protect slot 8

show cpu-protect

show cpu-p type arp

show cpu-p type ospf

show cpu-p type ospf3

show cpu-p type bpdu

sh cpu-protect type  hop_limit1

sh cpu-protect type  ttl1

sh cpu-protect type  ttl0

sh cpu-protect type ipv4-icmp-local

sh cpu-protect type unknown-ipmcv6

sh cpu-protect type unknown-ipmc

sh cpu-protect type ip4-packet-local

sh cpu-protect type ip4-packet-other

1、drop列,没有大量丢包,则无需关注;

OA_S8606VSU-ACTIVE#sh cpu-protect mboard

 Type                Pps       Total     Drop

 ------------------- --------- --------- ---------

 tp-guard             0         0         0       

 arp                  52        149793040 0  

2、drop列有大量丢包,但不持续增长,则无需关注,只能说明之前网络有不正常过

---------------------------------------------------------------------------------------

3、有丢包,且有持续递增丢包,需要关注,是网络隐患点;

4、没丢包,但是某协议报文送CPU处理的速率很高,超出一般标准,比如ospf送cpu处理达到200pps;

 

内存正常

Ruijie#show memory

正常设备内存利用率小于60% (CMII-lite内存利用率小于85%)

 

系统时间

Ruijie#show clock

Ruijie#show ntp st

Ruijie#show sntp

1.全网设备保证时间一致,注意时区。

2. 全网建议使用NTP或者SNTP进行时间同步。

 

MAC地址表

ruijie#show mac-address-table count

ruijie#show mac-address-table

1.查看MAC学习数量,是否到达设备的指标

2.正常不应该存在大量连续MAC,如果有需要查找该MAC是否网内真实MAC(服务器区虚拟化服务器场景可能会有,需注意)

 

ARP地址表

ruijie#show arp counter

ruijie#show arp

ruijie#show arp incomplete

1.确定单台设备ARP数量,ARP数量是否达到设备临界值(ea卡8K,ec卡16K)

2.收集ARP信息,如观察刀一个MAC对应多个连续的IP,或者一个IP对应多个MAC地址,此种情况都属于异常情况

3.每网段未解析用户控制在5%以下,不应该存在连续未解析的ARP信息,如果未解析ARP过多,则需要通过抓包分析排查扫描/攻击等异常的地址情况;

 

 

IPV6 邻居表项

ruijie#show ipv6 neighbors statistics

1.查看设备IPv6邻居表项占用的设备资源(配合ARP表项计算设备性能指标)

例如:5750,5750E都是8KARP表项,在支持2K IPv4/v6用户的情况,表项会大于2k(v4 arp表项)+2K×2(v6 nd表项)=6k,此种情况下考虑用户扩容;

 

ACE使用

ruijie#show access-list

ruijie#show ip access-group

1.获取设备ACL配置,供后台评估ACE容量是否面临短缺或是否可优化

 

生成树状态

ruijie#show spanning-tree

ruijie#show spanning-tree summary

1.检查Stp是否开启,拓扑变化次数

2.接口STP的状态,根桥信息是否和网络设计符合

 

异常、告警日志

ruijie#show logging

ruijie#show run

1.通过Show logging查看一段时间内设备是否存在重大异常的log日志,比如协议兼容,重启等错误提示,对比《syslog总表》制定相应处理策略。

2.检查设备日志功能是否开启,是否符合日志配置的标准。

 

接口状态

ruijie#show interfaces states

ruijie#show interfaces counters

ruijie#show interfaces counters rate

ruijie#show interfaces counters sum

ruijie#show interfaces counters errors

1、查看接口状态,是否与业务相符,没用接口是否shutdown、是否有异常errordisable情况。

2、 观察Undersize packets、Oversize packets 、collisions、Fragments           Jabbers 、CRC alignment errors 、AlignmentErrors、FCSErrors 是否有数值且不断增长,如果有可能需要检查线路、模块。

3、查看接口的收包发包数量和数率,判断是否与实际网络情况符合

4、查看接口数据的单、广、组播报文的组成情况,没开启组播情况下,广播和组播数量级应该各UP接口数量级相似;

5、观察接口的错误报文统计情况。

 

系统无复位

ruijie#debug support

ruijie(support)#show exception

ruijie(support)#exit

1、检查历史异常复位信息,正常无信息输出,如果有异常信息,通过4008111000反馈异常记录信息;

 

 

3、S2924G、S2927XG、S2951XG交换机内存利用率很高

由于这些型号交换机本身内存才64M,所以看起来利用率可能会达到80%以上,但是不影响正常使用。

 

4、S2600G-I内存利用率75%咨询是否有问题

S2600G-I交换机的内存只有128M,根据设备配置的功能多少的差异性,正常情况下就能到达60%-80%左右,如果客户现场出现内存利用率过高的问题,建议每隔一段时间show memory观察(如每隔1天show一次),看是否会有持续增加情况,如果内存没有持续增加,那么没有问题(交换机系统本身对内存有个释放回收的过程),如果内存有持续增加(例如增加到90%几),可在debug support模式收集如下信息,给后台分析。

Ruijie#show memory

Ruijie#debug support

Ruijie(support)#show memory

Ruijie(support)#show pool

Ruijie(support)#show skbuff

Ruijie(support)#show memory

Ruijie(support)#show pool

Ruijie(support)#show skbuff

Ruijie(support)#exit

Ruijie#show memory