故障背景:
客户反馈,网络中电脑上网很慢,PC ping核心丢包严重;
1、确认具体故障现象及拓扑
(经验点:这点非常重要,否则将影响故障处理思路)
根据客户反馈的现象,我们要学会通过“提问+实际测试”等方式,梳理出具体的故障现象和拓扑:
1)确认具体的故障现象:
故障范围(了解故障范围和规律):有多少用户出现该问题,出现问题的用户是否都在同一个设备下;
丢包频率:ping多少个包丢一个包,是否规律性丢包;
故障规律:这个问题是一直都存在还是突然出现,丢包发生的时间点是否规律,若规律,记录大概的时间点;
网络是否变更:如果问题是突然出现的,确认问题出现前客户网络(拓扑、配置、上网流量等)是否发生过变更;
2)确认具体的网络拓扑:
网络拓扑,和客户了解的同时,通过show arp + show mac-address-table确认:
2.1)确认故障PC及网关的IP和MAC,如:
PC的IP为:10.10.10.1, MAC为:aaaa.aaaa.aaaa;
网关的IP为:10.10.10.254,MAC为:bbbb.bbbb.bbbb;
2.2)确认设备的具体型号及连接拓扑:
2.2.1)通过如下问题和客户确认设备的具体型号和拓扑:
核心是什么设备(具体的型号和版本)?
PC和核心是直连的吗,如果不是直连,PC和核心中间还连接了什么设备(具体的型号和版本)?
核心到PC之间的设备都是用什么口互联(trunk、access、no
switchport)?
PC的网关是核心吗,如果不是,pc的网关是哪台设备呢(具体的型号和版本)?
注:若客户无法回答如上问题,不用担心,可以通过 2.2.2)方式实测确认。
2.2.2)通过逐台交换机上使用如下命令进一步确认:
show version
show arp | in X.X.X.X (X.X.X.X为PC或网关设备的IP)
show mac-address-table | in xxxx.xxxx.xxxx(xxxx.xxxx.xxxx为PC或核心设备的MAC)
show run int gx/y
通过如上2种方法,明确客户环境拓扑后,将拓扑画出来。比如可以使用如下方式记录:
PC-----(access vlan10 g0/1)S5750-24GT/8SFP-E(g0/2
trunk)-----(trunk g1/1)8610(PC的网关)
注:
> 如果在show的过程中,发现设备学到的IP对应的ARP并非是PC或网关对应的ARP,则要注意网络中是否存在IP冲突或者arp欺骗的情况,需要根据客户环境进行进一步排查;
>如果再show 的过程中,发现某个MAC地址并非从正确的接口学到,则要注意网络中是否存在环路或者arp欺骗的情况,需要根据客户环境进行进一步排查;
该方法用案例形式描述,如下:
若客户只告知某交换机下的PC去ping核心都会丢包,用户网关是核心8610,网关IP为10.10.10.254的时候,要如何确认拓扑呢?
a、8610上查看具体的设备型号和版本:
Ruijie#show version
//确认设备的型号和版本
b、8610上查看PC对应的ARP地址:
Ruijie#show arp | in 10.10.10.1
Internet 10.10.10.1 0 aaaa.aaaa.aaaa arpa VLAN 1
//确认8610上学到PC的ARP是否正确,如果学到PC 10.10.10.1对应的ARP不是正确的aaaa.aaaa.aaaa,则要注意网络中是否存在IP冲突或者arp欺骗的情况,需要根据客户环境进一步排查;若正确,则继续如下排查;
c、8610上查看PC的MAC是从哪个接口学到的,并查看该接口配置(确认PC接在8610哪个接口下):
Ruijie#show mac-address-table | in
aaaa.aaaa.aaaa
1 aaaa.aaaa.aaaa DYNAMIC GigabitEthernet 1/1
//可以看到aaaa.aaaa.aaaa是从接口G1/1学到,若已经了解到PC实际应该从G1/2口学到,并非G1/1口,则要注意网络中是否存在IP冲突或者arp欺骗的情况,需要根据客户环境进一步排查;若正确,则继续如下排查;
Ruijie#show run int g1/1
interface GigabitEthernet
1/1
switchport mode trunk
//可以看到G1/1接口是trunk
d、8610上通过show
lldp neighbors interface gigabitEthernet 1/1 detail 查看G1/1接口对端连接的设备型号及IP;
Ruijie#show lldp neighbors interface
gigabitEthernet 1/1 detail
<...省略>
System description : Ruijie
High-density IPv6 100G Core Routing Switch(S5750-24GT/8SFP-E) By Ruijie
Networks
<...省略>
Management address :
10.10.10.3
//可以看到G0/1口对端连接的是S5750-24GT/8SFP-E设备,对应的IP为10.10.10.3
E、登录S5750-24GT/8SFP-E查看PC及8610的MAC是从哪个接口学习到及该接口的配置,从而确认PC及8610分别接到S5750-24GT/8SFP-E的哪个接口上;
show mac-address-table | in aaaa.aaaa.aaaa //可以看到aaaa.aaaa.aaaa是从接口G0/1学到;
show mac-address-table | in bbbb.bbbb.bbbb //可以看到bbbb.bbbb.bbbb是从接口G0/2学到;
show run int g0/1 //可以看到g0/1接口是trunk;
show run int g0/2
//可以看到g0/2接口是access;
.....同理,继续通过如上方式在逐台交换机上show,可以确认到拓扑如下:
PC-----(access vlan10 g0/1)S5750-24GT/8SFP-E(g0/2
trunk)-----(trunk g1/1)8610(PC的网关)