故障背景:

客户反馈,网络中电脑上网很慢,PC ping核心丢包严重;

1、确认具体故障现象及拓扑

(经验点:这点非常重要,否则将影响故障处理思路)

根据客户反馈的现象,我们要学会通过提问+实际测试等方式,梳理出具体的故障现象和拓扑:

1)确认具体的故障现象:

故障范围(了解故障范围和规律):有多少用户出现该问题,出现问题的用户是否都在同一个设备下;

丢包频率:ping多少个包丢一个包,是否规律性丢包;

故障规律:这个问题是一直都存在还是突然出现,丢包发生的时间点是否规律,若规律,记录大概的时间点;

网络是否变更:如果问题是突然出现的,确认问题出现前客户网络(拓扑、配置、上网流量等)是否发生过变更;

 

2)确认具体的网络拓扑:

网络拓扑,和客户了解的同时,通过show arp + show mac-address-table确认:

  2.1)确认故障PC及网关的IP和MAC,如:

PC的IP为:10.10.10.1,   MAC为:aaaa.aaaa.aaaa;

网关的IP为:10.10.10.254,MAC为:bbbb.bbbb.bbbb;

  2.2)确认设备的具体型号及连接拓扑:

    2.2.1)通过如下问题和客户确认设备的具体型号和拓扑:

 核心是什么设备(具体的型号和版本)?

 PC和核心是直连的吗,如果不是直连,PC和核心中间还连接了什么设备(具体的型号和版本)?

 核心到PC之间的设备都是用什么口互联(trunk、access、no switchport)?

 PC的网关是核心吗,如果不是,pc的网关是哪台设备呢(具体的型号和版本)?

注:若客户无法回答如上问题,不用担心,可以通过 2.2.2)方式实测确认。

    2.2.2)通过逐台交换机上使用如下命令进一步确认:

show version

show arp | in X.X.X.X (X.X.X.X为PC或网关设备的IP) 

show mac-address-table | in xxxx.xxxx.xxxx(xxxx.xxxx.xxxx为PC或核心设备的MAC)

show run int gx/y

通过如上2种方法,明确客户环境拓扑后,将拓扑画出来。比如可以使用如下方式记录:

PC-----(access  vlan10 g0/1)S5750-24GT/8SFP-E(g0/2 trunk)-----(trunk g1/1)8610(PC的网关)

注:

> 如果在show的过程中,发现设备学到的IP对应的ARP并非是PC或网关对应的ARP,则要注意网络中是否存在IP冲突或者arp欺骗的情况,需要根据客户环境进行进一步排查;

>如果再show 的过程中,发现某个MAC地址并非从正确的接口学到,则要注意网络中是否存在环路或者arp欺骗的情况,需要根据客户环境进行进一步排查;

 

该方法用案例形式描述,如下:

若客户只告知某交换机下的PC去ping核心都会丢包,用户网关是核心8610,网关IP为10.10.10.254的时候,要如何确认拓扑呢?

a、8610上查看具体的设备型号和版本:

Ruijie#show version  

//确认设备的型号和版本

 

b、8610上查看PC对应的ARP地址:

Ruijie#show arp | in 10.10.10.1

  Internet  10.10.10.1   0    aaaa.aaaa.aaaa  arpa   VLAN 1

//确认8610上学到PC的ARP是否正确,如果学到PC 10.10.10.1对应的ARP不是正确的aaaa.aaaa.aaaa,则要注意网络中是否存在IP冲突或者arp欺骗的情况,需要根据客户环境进一步排查;若正确,则继续如下排查;

 

c、8610上查看PC的MAC是从哪个接口学到的,并查看该接口配置(确认PC接在8610哪个接口下):

Ruijie#show mac-address-table | in aaaa.aaaa.aaaa

  1      aaaa.aaaa.aaaa      DYNAMIC  GigabitEthernet 1/1

//可以看到aaaa.aaaa.aaaa是从接口G1/1学到,若已经了解到PC实际应该从G1/2口学到,并非G1/1口,则要注意网络中是否存在IP冲突或者arp欺骗的情况,需要根据客户环境进一步排查;若正确,则继续如下排查;

 

Ruijie#show run int g1/1

 interface GigabitEthernet 1/1

 switchport mode trunk           

//可以看到G1/1接口是trunk

 

d、8610上通过show lldp neighbors interface gigabitEthernet 1/1 detail 查看G1/1接口对端连接的设备型号及IP;

Ruijie#show lldp neighbors interface gigabitEthernet 1/1 detail

                <...省略>

 System description : Ruijie High-density IPv6 100G Core Routing Switch(S5750-24GT/8SFP-E) By Ruijie Networks

                <...省略>

 Management address : 10.10.10.3

//可以看到G0/1口对端连接的是S5750-24GT/8SFP-E设备对应的IP为10.10.10.3

 

E、登录S5750-24GT/8SFP-E查看PC及8610的MAC是从哪个接口学习到及该接口的配置,从而确认PC及8610分别接到S5750-24GT/8SFP-E的哪个接口上;

show mac-address-table | in aaaa.aaaa.aaaa      //可以看到aaaa.aaaa.aaaa是从接口G0/1学到;

show mac-address-table | in bbbb.bbbb.bbbb   //可以看到bbbb.bbbb.bbbb是从接口G0/2学到;

show run int g0/1                                                  //可以看到g0/1接口是trunk;

show run int g0/2                                                  //可以看到g0/2接口是access;

 

.....同理,继续通过如上方式在逐台交换机上show,可以确认到拓扑如下:

PC-----(access  vlan10 g0/1)S5750-24GT/8SFP-E(g0/2 trunk)-----(trunk g1/1)8610(PC的网关)