1、故障现象

端口聚合不成功或者是聚合配置后链路不通。

 

2、故障可能原因

1) 物理链路故障;

2) LACP协商不成功;

3) 报文流与在均衡因子匹配部分无变化;

4) 两端双工、速率、传输介质不一致;

 

3、故障处理步骤

步骤1:检查聚合两端的配置保持一致

如果本端配置为静态AP聚合,对端也要配置为静态AP聚合;

如果本端配置为动态LACP聚合,对端也要配置为动态LACP聚合。

Ruijie#show run int gx/y   //查看聚合成员口配置

 

步骤2:检查聚合成员口是否存在链路故障

Ruijie#show interface status//查看聚合成员口的端口状态是不是up的。

如果成员口不是up的,检查物理端口的连接情况。确保成员口是up。如果条件允许,更换其他成员口,确认聚合成员口是否能够up,排除成员口有物理故障。

聚合成员口up后,确认故障是否消除,如果故障消除,则结束定位。

如果替换后故障仍未解决,请收集信息,拨打4008-111-000寻求进一步处理。

 

步骤3:逐个shutdown成员口,每次只保留一个成员口up,测试是否能恢复通信

注意:该点需要在客户业务允许的情况下方可操作,可能导致该聚合口连接业务中断,若客户允许也建议在业务低峰期操作;

 

4、故障信息搜集

4.1)基本信息收集:

--------如下在特权模式下收集(ruijie#)----------

show aggregateport 聚合端口号 load-balance //聚合端口号需要根据实际情况填写,如聚合口2,show aggregateport 2 load-balance

show aggregateport 聚合端口号 summary  //聚合端口号需要根据实际情况填写,如聚合口2,show aggregateport 2 summary

show running-config

show int 成员端口号//成员端口号需要根据实际情况填写,如show int g0/1

show int ag 聚合端口号 //聚合端口号需要根据实际情况填写,如聚合口2,show int ag 2

show lacp summary

show log

 

4.2)收集如下调试信息(若telnet收集无输出,还需console口接入设备收集)

注意:底层信息风险性较高,收集不当可能导致设备死机,需要重启交换机才能恢复,请联系4008111000工程师协助收集

S3760e设备

ruijie>enable

ruijie#terminal monitor

ruijie#config t

ruijie(config)#logging on

ruijie(config)#logging console

ruijie(config)#exit

ruijie#sd

-----如下在sd模式下收集(Ruijie(sd)#)----

sh console on

sh show c

sh show c         

sh show c         

sh getreg user_trunk_hash_select

sh getreg iuser_trunk_hash_select

sh getreg hash_control

sh dump chg port_trunk_mac_limit_control_2

sh dump chg port_trunk_mac_limit_control_1

sh dump chg source_trunk_map

sh dump chg trunk_group

sh dump chg trunk_bitmap

sh dump chg nonucast_trunk_block_mask

sh dump chg vlan

sh dump chg vlan_stg

sh dump chg egr_vlan _stg

sh dump chg port

sh dump chg egr_vlan

sh console off

exit

 

s29e设备

ruijie>enable

ruijie#terminal monitor

ruijie#config t

ruijie(config)#logging on

ruijie(config)#logging console

ruijie(config)#exit

ruijie#sd

-----如下在sd模式下收集(Ruijie(sd)#)----

sd

sh console on

sh show c         

sh show c         

sh show c         

sh getreg hash_control

sh dump chg nonucast_trunk_block_mask

sh dump chg trunk32_config_table

sh dump chg trunk_bitmap

sh dump chg port_trunk_egress

sh dump chg trunk_group

sh dump chg vlan

sh dump chg vlan_stg

sh dump chg egr_vlan _stg

sh dump chg port

sh dump chg egr_vlan

sh console off

exit

 

s5750设备

ruijie>enable

ruijie#terminal monitor

ruijie#config t

ruijie(config)#logging on

ruijie(config)#logging console

ruijie(config)#exit

ruijie#sd

-----如下在sd模式下收集(Ruijie(sd)#)----

sd

sh console on

sh show c         

sh show c         

sh show c         

sh getreg hash_control

sh getreg user_trunk_hash_select

sh dump chg nonucast_trunk_block_mask

sh dump chg trunk_bitmap

sh dump chg port_trunk_egress

sh dump chg trunk_group

sh dump chg source_trunk_map

sh dump chg vlan

sh dump chg vlan_stg

sh dump chg egr_vlan _stg

sh dump chg port

sh dump chg egr_vlan

sh console off

exit

 

26I/57E

ruijie>enable

ruijie#terminal monitor

ruijie#config t

ruijie(config)#logging on

ruijie(config)#logging console

ruijie(config)#exit

--------如下在特权模式下收集(ruijie#)----------

debug ssp rem

   ap dump gml

   ap dump lml

 

打开ap的代码调试开关,重现bug

#debug ssp ap all

该调试信息收集5分钟左右,期间要重现故障现象

注:该调试命令有刷屏的可能性,执行前需同客户确认清楚,是否核心业务,如果出现无法管理是否允许重启设备等。

关闭调试开关

#no debug ssp ap all