请详细阅读操作文档,结合实际情况进行配置:

        若操作不当将可能导致网络卡顿甚至断网等异常情况。

        若网络中存在业务的情况下,请同步客户风险并征得客户同意后再操作。

        若您不清楚造成的影响或对操作不熟练,请不要操作,请联系专业的锐捷售后工程师进行评估后再决定是否操作。

一、环路监控原理介绍 



1、   极简X方案的防环,是在接入汇聚设备上,继续采用RLDP   协议来检测环路。但是可能存在其他厂商交换机无法转发   RLDP   报文,或者广播报文太多导致   hub   死机无法转发   RLDP   ,最终导致环路可能无法     检测出来。  

2、   极简X新增引入一种基于端口未知名广播,未知名单播,未知名组播报文报文速率的检测机制,当超过端口阀值水线,即判断为出现环路,也就是基于环路的流量特征来识别环路,而不依赖与具体的某个协议的交互来检测。  

3、   极简X的自动防环检测是在   ONC   上面一键开启的,要求接入汇聚是特定型号   S57H,S29XS/EV3   ,ONC   通过   netconf   下发配置,自动在每台设备端开启   RLDP   以及风暴控制报文检测环路的功能命令。  

注:

4、   设备端开启环路检测后轮询并统计每一个端口的未知名单播、未知名二层组播报文、未知名三层组播报文和广播报 文的表项(轮询周期暂定   4   秒),当某个端口连续三次轮询都触发检测水线时,则判断为是环路端口。目前环路检测默认水线为: 汇聚   S57H   设备为   8000pps   ,接入   S29XS/EV   设备为   5000pps    

5、   出现环路,会将广播域内带宽消耗限制在一定范围内,对其他广播域不会造成带宽上的影响     限制了环路的影响面,可以保证交换机在检测到环路后,将信息通告给控制器的可靠性。      

二:使用介绍

环路检测作为SDN的附属功能,无需授权即可使用,但一般不单独部署,可与SDN其它方案共用。设备纳管完成后,ONC一键整网(需设备支持)开启环路检测功能。20秒内检测出环路端口并下发策略; 解除环路后,shutdown策略下,7分钟内恢复环路端口状态,ONC环路告警消除;warning策略下,3分钟内恢复环路端口状态,ONC环路告警消除。

开启环路检测前提:开启后,环路检测只在ONC上添加的设备类型为业务接入、业务汇聚设备上生效。

主动检测:基于锐捷私有RLDP协议

被动检测:统计端口风暴流量(广播、组播、未知名单播),超过默认阈值后(57H:8000pps, 29XS:5000pps),判断为环路,下发对应策略。实际网络中,可能出现下连接口未环路,但ONC检测出环路,此时就要排查下联终端是否存在中毒或者攻击流量(show int g0/1 counter,查看流量统计)。特殊需求场景,即接口风暴流量是实际业务产生,且超过默认阈值,则接口下使用storm-loop-rate ratelimit(单位pps)手动CLI修改(该配置不会被ONC同步还原)。

二、配置解析

1、  ONC开启环路监控

策略:告警或shutdown端口,业务汇聚设备支持shutdown策略,仅接入业务设备支持(S29XS/E-V3/57H/S5310)

企业微信截图_15643816763339.png

注:

选择策略为shutdown access(即发生环路后,只对业务接入的access类型的接口shutdown),shutdown hybrid(即发生环路后,只对业务接入的hybird类型的接口shutdown),shutdown access-hybrid(即发生环路后,只对业务接入的hybird或者access类型的接口shutdown),shutdown具体接口类型根据客户环境而定,一般选择shutdown access,不推荐选择warning策略。 点击确认后,基于整网开启环路检测。


开启环路检测后,ONC下发到设备端配置如下:

shutdown策略:

全局配置:

loop-detect enable shutdown access-mode    //shutdown策略

rldp enable

rldp error-recover interval 90   //90秒检测恢复


接口配置:

rldp port loop-detect warning     //主动检测,基于RLDP

storm-loop-detect enable    //被动检测,所有支持rldp命令的物理口开启检测端口风暴流量

注:shutdown策略下,接口检测到环路后会出现配置:loop-detect apply shutdown-port,环路解除后,该配置自动删除。


warning策略:

全局配置:

loop-detect enable    //warning策略

rldp enable

rldp error-recover interval 90   //90秒检测恢复


接口配置:

rldp port loop-detect warning     //主动检测,基于RLDP

storm-loop-detect enable    //被动检测,所有支持rldp命令的物理口开启检测端口风暴流量


ONC下发的配置,禁止手工cli删除或修改,如果下发的配置被删除或修改,ONC也会定时30分钟同步还原配置。接口下rldp port loop-detect warning这条命令只是显示作用,无论选择什么策略,都是显示warning这条命令。

 

3、ONC展示环路告警

拓扑直观展示环路设备,端口

企业微信截图_15643818882412.png  

   

4、     环路时设备端同步产生的告警日志

*May  1 00:18:07: %LLDP-4-ERRDETECT: Port GigabitEthernet 0/27 detected loop, please check the network.

*May  1 00:18:10: %RLDP-3-LINK_DETECT_ERROR: Detected loop error on interface GigabitEthernet 0/27.warning.


5、手动shutdown环路接口,onc的提示还会存在?

1)waring策略下,环路解除,设备端3min内检测到环路解除,通告控制器环路已消除,控制器消除告警信息;  

2)shutdown策略下,环路解除,设备端7min内检测到环路解除,通告控制器环路已消除,控制器消除告警信息;  


6、shutdown/warning环路接口后,关闭onc的环路检测开关,即不进行环路检测了,但这个提示还会在?  

1) 控制器端解除环路信息有两种触发方法,一是设备端通告消息给控制器,二是控制器与设备端对账(1H对账一次),所以关闭环路检测,也会关闭环路检测与设备端对账,告警信息不会解除,等到环路检测再开启的时候,对账或者设备端主动通告会更新环路告警信息。  

2)告警的消除只依赖设备环路恢复通告,或者控制器定时对账后消除。  



三、注意事项:

1. 无论选什么策略,业务汇聚设备只支持warning策略;trunk口只支持warning策略

2. 业务接入、汇聚设备不能配置风暴控制功能,如有,则必须删掉。

3. 演示场景下,如果觉得环路恢复、ONC告警消除时间太长,可全局配置loop-detect shutdown-recover-time修改恢复时间,但仅限演示场景。

4. 如果交换设备上开启了STP协议,发生环路时,可能出现stp先将环路端口shutdown,导致环路检测方案无法检测到环路。

5. 存在友商设备的情况下,与友商设备互联的我司交换机不保证100%能检测到环路。

6. 不支持环路检测的设备环路,环路检测将在支持环路检测的设备与其互联的端口检测到环路。

7. 未环路场景下,用户手动配置shutdown的端口,如果又手动在端口上配置loop-detect apply shutdown-port命令,环路检测定时恢复端口shutdown策略并检查环路,会将用户先前手动配置的shutdown命令恢复;如果没有手动在端口上配置loop-detect apply shutdown-port命令,则无影响。

8、需确保相关交换机型号和版本支持环路检测,否则配置环路检测时ONC上将提示如下

    列表.jpg