1、交换设备运行基本参数检查的评估标准
检查分类 |
检查项目 |
检查方法 |
评估标准 |
基本参数 |
设备、端口状态 |
外观观察 |
1、端口状态指示灯状态:绿色闪烁,如果为橘色确认该协商状态是否与实际相符 |
|
主备引擎/线卡指示灯 (箱式设备) |
外观观察 |
1、主备引擎、线卡状态指示灯:绿色常亮为正常 |
|
告警指示灯 |
外观观察 |
1、告警指示灯正常不亮,如果告警指示灯红色常亮确认告警内容,需要及时进行故障处理 |
|
电源运行状态 |
观察电源指示灯 |
1、关节节点设备确认有冗余电源 2、电源指示正常为绿色常亮,模块电源如果fail指示灯红色常亮,表示电源故障 |
|
风扇运行状态 |
show fan 观察风扇运转 |
1、不允许出现stop状态 2、听:风扇运转无异响, 3、手感觉气流:用手感觉交换机的抽风口是否有风的气流流动。 |
|
温度状态 |
show tempeture观察温度 |
1、查看温度是否超出warning温度,交换机运行温度应该低于50摄氏度 |
|
模块运行状态 |
ruijie#show
version slots |
1、模块正确识别 2、模块软件版本与主设备或者管理引擎版本一致 3、模块状态指示灯为绿色常亮 |
2、交换设备关键性能参数检查的评估标准
检查分类 |
检查项目 |
检查方法 |
评估标准 |
关键性能参数 |
CPU正常 |
ruijie#show
cpu |
1、正常交换机CPU平均利用率小于40% |
|
Flash空间大小 |
Ruijie#dir |
dir/flash里最好有配置文件的备份/os的备份,flash的利用情况不能低于总量的70% |
|
系统启动文件是否修改 |
Ruijie#show
mainfile |
1.设备启动文件是否有变更,启动文件名至少与flash里有一个文件名一致 |
|
系统协议报文处理情况 |
show
cpu-protect su show
cpu-protect mboard show
cpu-protect slot 1 show
cpu-protect slot 2 show
cpu-protect slot 3 show
cpu-protect slot 4 show
cpu-protect slot 5 show
cpu-protect slot 6 show
cpu-protect slot 7 show
cpu-protect slot 8 show
cpu-protect show cpu-p
type arp show cpu-p
type ospf show cpu-p
type ospf3 show cpu-p
type bpdu sh cpu-protect
type hop_limit1 sh cpu-protect
type ttl1 sh cpu-protect
type ttl0 sh cpu-protect
type ipv4-icmp-local sh cpu-protect
type unknown-ipmcv6 sh cpu-protect
type unknown-ipmc sh cpu-protect
type ip4-packet-local sh cpu-protect
type ip4-packet-other |
1、drop列,没有大量丢包,则无需关注; OA_S8606VSU-ACTIVE#sh
cpu-protect mboard Type
Pps
Total Drop
------------------- --------- ---------
--------- tp-guard
0
0
0 arp
52
149793040 0 2、drop列有大量丢包,但不持续增长,则无需关注,只能说明之前网络有不正常过 --------------------------------------------------------------------------------------- 3、有丢包,且有持续递增丢包,需要关注,是网络隐患点; 4、没丢包,但是某协议报文送CPU处理的速率很高,超出一般标准,比如ospf送cpu处理达到200pps; |
|
内存正常 |
Ruijie#show
memory |
正常设备内存利用率小于60%
(CMII-lite内存利用率小于85%) |
|
系统时间 |
Ruijie#show
clock Ruijie#show
ntp st Ruijie#show
sntp |
1.全网设备保证时间一致,注意时区。 2. 全网建议使用NTP或者SNTP进行时间同步。 |
|
MAC地址表 |
ruijie#show
mac-address-table count ruijie#show
mac-address-table |
1.查看MAC学习数量,是否到达设备的指标 2.正常不应该存在大量连续MAC,如果有需要查找该MAC是否网内真实MAC(服务器区虚拟化服务器场景可能会有,需注意) |
|
ARP地址表 |
ruijie#show
arp counter ruijie#show
arp ruijie#show
arp incomplete |
1.确定单台设备ARP数量,ARP数量是否达到设备临界值(ea卡8K,ec卡16K) 2.收集ARP信息,如观察刀一个MAC对应多个连续的IP,或者一个IP对应多个MAC地址,此种情况都属于异常情况 3.每网段未解析用户控制在5%以下,不应该存在连续未解析的ARP信息,如果未解析ARP过多,则需要通过抓包分析排查扫描/攻击等异常的地址情况; |
|
IPV6 邻居表项 |
ruijie#show
ipv6 neighbors statistics |
1.查看设备IPv6邻居表项占用的设备资源(配合ARP表项计算设备性能指标) 例如:5750,5750E都是8KARP表项,在支持2K
IPv4/v6用户的情况,表项会大于2k(v4 arp表项)+2K×2(v6 nd表项)=6k,此种情况下考虑用户扩容; |
|
ACE使用 |
ruijie#show
access-list ruijie#show ip
access-group |
1.获取设备ACL配置,供后台评估ACE容量是否面临短缺或是否可优化 |
|
生成树状态 |
ruijie#show
spanning-tree ruijie#show
spanning-tree summary |
1.检查Stp是否开启,拓扑变化次数 2.接口STP的状态,根桥信息是否和网络设计符合 |
|
异常、告警日志 |
ruijie#show
logging ruijie#show
run |
1.通过Show
logging查看一段时间内设备是否存在重大异常的log日志,比如协议兼容,重启等错误提示,对比《syslog总表》制定相应处理策略。 2.检查设备日志功能是否开启,是否符合日志配置的标准。 |
|
接口状态 |
ruijie#show
interfaces states ruijie#show
interfaces counters ruijie#show
interfaces counters rate ruijie#show
interfaces counters sum ruijie#show
interfaces counters errors |
1、查看接口状态,是否与业务相符,没用接口是否shutdown、是否有异常errordisable情况。 2、 观察Undersize
packets、Oversize packets 、collisions、Fragments
Jabbers 、CRC alignment errors 、AlignmentErrors、FCSErrors 是否有数值且不断增长,如果有可能需要检查线路、模块。 3、查看接口的收包发包数量和数率,判断是否与实际网络情况符合 4、查看接口数据的单、广、组播报文的组成情况,没开启组播情况下,广播和组播数量级应该各UP接口数量级相似; 5、观察接口的错误报文统计情况。 |
|
系统无复位 |
ruijie#debug
support ruijie(support)#show
exception ruijie(support)#exit |
1、检查历史异常复位信息,正常无信息输出,如果有异常信息,通过4008111000反馈异常记录信息; |
3、S2924G、S2927XG、S2951XG交换机内存利用率很高
由于这些型号交换机本身内存才64M,所以看起来利用率可能会达到80%以上,但是不影响正常使用。
4、S2600G-I内存利用率75%咨询是否有问题
S2600G-I交换机的内存只有128M,根据设备配置的功能多少的差异性,正常情况下就能到达60%-80%左右,如果客户现场出现内存利用率过高的问题,建议每隔一段时间show
memory观察(如每隔1天show一次),看是否会有持续增加情况,如果内存没有持续增加,那么没有问题(交换机系统本身对内存有个释放回收的过程),如果内存有持续增加(例如增加到90%几),可在debug
support模式收集如下信息,给后台分析。
Ruijie#show
memory
Ruijie#debug
support
Ruijie(support)#show
memory
Ruijie(support)#show
pool
Ruijie(support)#show
skbuff
Ruijie(support)#show
memory
Ruijie(support)#show
pool
Ruijie(support)#show
skbuff
Ruijie(support)#exit
Ruijie#show
memory