快速收集排查方案
1、若是整机升级失败
1)核对版本发型说明,核对所升级版本是否支持当前设备;
2)确认设备是从什么版本升级到什么版本,是否版本跨度太大;
3)查看设备flash空间是否足够;
3.1)在特权模式下dir查看flash空间是否足够;
Ruijie#dir
3.2)若机框式设备有多张引擎,需要将console线分别接入每张引擎的console口,通过dir查看每张引擎的flash空间是否足够;
若是备引擎,需要输入@@@@C打开console输入开关,输入后会提示:CLI
Control switch: Off -> On,说明打开console口输入开关;若提示CLI Control switch: On ->
Off,则需再输入一次@@@@C,将console口开关打开。(注:@@@@C千万不能输错)
3)若系统运行模式无法升级成功,尝试在ctrl模式升级:
3.1)设备重启后按住ctrl c,进入ctrl模式;
3.2)将PC和引擎上的MGMT口互联;
Ctrl>tftp 192.168.1.3 192.168.1.2 rgos.bin
-file rgos.bin //其中192.168.1.3为引擎MGMT口IP,192.168.1.2为PC的IP;
3.3)通过dir确认版本大小无误,然后通过如下命令直接升级:
Ctrl>dir
Ctrl> upgrade -slot all -type main -force
4)若如上步骤都无法恢复,提供完整的升级操作log及如上步骤的排查log;
4)提供设备升级前的show version、show run等基本信息;
2、若是线卡升级失败
1)核对版本发型说明,核对所升级版本是否支持当前线卡;
2)若所升级版本支持当前线卡,则按“1.3 机框式交换机线卡无法启动”排查;
3、常见软件升级失败原因
常见故障一:S86升级中出现“!!!!!!!!!!!!!Tftp download failed”:
1)现象
在ctrl下用tftp下载文件的时候,出现:
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Tftp
download failed.
2)原因
主管理板空间不足。
3)解决方法
释放主管理板空间,在主管理板ctrl 命令行下,将管理板文件系统中不需要的.bin
文件删除,腾出足够的空间存放要下载的文件,删除后需要在Ctrl 命令行重新下载管理板和线卡和安装包文件。(如果是格式化管理板的文件系统,那么必须进行必要的备份,以免客户数据丢失。)
Ctrl>rm filename
释放空间后,重新执行tftp 命令下载。
常见故障二:升级中出现tftp 提示"The flash space was not
enough, checkand remove some useless files.Tftp download failed.":
1)现象:
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
% Tftp: the flash space is
not enough, or something with flash is wrong!!
% File transmission failure.
2)原因
主管理板空间不足。
3)解决方法
释放主管理板空间
在主管理板ctrl 命令行下,将管理板文件系统中不需要的.bin
文件删除,腾出足够的空间存放要下载的文件,删除后需要在Ctrl 命令行重新下载管理板和线卡和安装包文件。(如果是格式化管理板的文件系统,那么必须进行必要的备份,以免客户数据丢失。)
Ctrl>rm filename
释放空间后,重新执行tftp 命令下载。
常见故障三:升级中不停打印“send download request.”:
1)现象
send download request.
send download request.
send download request.
send download request.
send download request.
2)原因,有以下几种可能情况
a.没有打开TFTP软件
b.IP 地址错误
c.网线没有连好
3)解决方法
a、运行tftp软件,设置好路径及文件名;
b、在ctrl 命令行,检查源目ip地址是否设置错误,颠倒,PC上的ip是否填写错误,请多试几次tftp
命令,或者更换tftp软件;
c、检查PC与引擎的MGMT口是否连接好了;
d、关闭PC端的杀毒软件,防火墙等可能阻止tftp协议的程序。
常见故障四:升级中出现“ERROR: THE PROGRAM FILE CAN NOT BE USED IN ANY
CARD !!!”:
1)现象
tftp 以-main 的形式下载bin 文件时,出现以下情况:
ERROR:
THE PROGRAM FILE CAN NOT BE USED IN ANY CARD !!!
You can ignore this error,
but this maybe cause system crashed.
Choose No and stop
upgrading, if you do not know what to do next !!!
IGNORE IT ? Timeout in 28s
[N/y]
2)原因
传入的bin 文件不适用该型号的引擎或者线卡。
3)解决方法
阅读对应软件的发行说明,检查型号是否匹配,选择正常、匹配的文件重传
常见故障五:show
version查看不到线卡信息,状态是conflict:
1)现象
Ruijie#show
ver slot
Dev Slot Port Configured Module
Online Module
User Status Software Status
--- ---- ----
---------------------------- ---------------------------- ------------
---------------
1 1 24 M8600-24GT/12SFP
M8600-24GT/12SFP
installed
ok
1 2 2 M8600-FW
none
installed
none
1 3 0 none
none
none
none
1 4 24 M8600-24GT/12SFP
M8600-NMM
installed
conflict
1 M1 0 N/A
M8610-CM II
N/A
backup
1 M2 0 N/A
M8610-CM II
N/A
master
2)原因
Configured Module(CLI下配置安装的线卡类型)与Online
Module (槽位上实际插的线卡类型)不一致,导致冲突。多数发生在槽位上原来插过A的线卡,后面更换成线卡B,这很容易出现冲突
3)解决方法
Ruijie(config)#no install ?
<1-4> Slot number of a module
Ruijie(config)#no install
4
//将槽位上原来线卡卸载掉
Ruijie(config)#install 7
? //install输入?,根据提示安装正确的线卡类型
<...省略部分提示>
nmm
Module Type: M8600-NMM
Ruijie(config)#install 7
nmm
//安装新的正确的线卡类型
如果长时间无log打印,show ver slot线卡状态是none,resetting,cannot
startup等状态,可以尝试通过reset命令复位线卡:
Ruijie#reset module ?
<1-4> Slot number of a module
M1 Module in slot M1
M2 Module in slot M2
Ruijie#reset module 4
//重置线卡
Module 7 will reset!
Continue? [N/y]:Y
Ruijie#show
ver slo
Dev Slot Port Configured Module
Online Module
User Status Software Status
--- ---- ----
---------------------------- ---------------------------- ------------
---------------
1 1 24 M8600-24GT/12SFP
M8600-24GT/12SFP
installed ok
1 2 2 M8600-FW
none
installed none
1 3 0 none
none
none
none
1 4 0 M8600-NMM
M8600-NMM
installed
ok
1 M1 0 N/A
M8610-CM II
N/A
backup
1 M2 0 N/A
M8610-CM II
N/A
master
常见故障六:show
version查看不到线卡信息,状态是resetting的故障处理
1)现象
Ruijie#show
ver slo
Dev Slot Port Configured Module
Online Module
User Status Software Status
--- ---- ----
---------------------------- ---------------------------- ------------
---------------
1 1 24 M8600-24GT/12SFP
M8600-24GT/12SFP
installed
ok
1 2 0 M8600-NMM
none
installed resetting
1 3 0 none
none
none
none
1 4 0 none
none
none
none
1 M1 0 N/A
none
N/A
none
1 M2 0 N/A
M8606-CM II
N/A
master
2)原因
resetting的状态,主要是线卡自身的程序丢失,或者升级出现异常,或者是管理板上与线卡的程序存在不一致,导致管理板无法驱动线卡导致的。
3)解决方法
a.可以尝试 Ruijie#reset module
2
//重置该槽位的线卡,建议耐心等待几分钟
b.或者在debug support模式下强制同步程序到线卡,建议耐心等待几分钟
Ruijie#debug support
Ruijie(support)#upgrade
force slot 2
Card in slot 2 is invalid.
Ruijie(support)#
c.如果出现方法2中的提示Card in slot 2
is invalid.,那么可以尝试在ctrl层下强制同步线卡
Ctrl>help upgrade //查看upgrade命令的使用方法
Ctrl>upgrade -slot 2
-type boot -force //强制同步boot程序到线卡
Ctrl>upgrade -slot 2
-type ctrl -force
//强制同步ctrl程序到线卡
Ctrl>upgrade -slot 2
-type main -force
//强制同步main程序到线卡
Ctrl>version
//确认版本线卡识别成功,信息同步一致
Ctrl>reload
//整机重启
常见故障七:S86升级10.4(3)软件,提示File is Too Long! Failed 或者The
binary file crc was not correct
1)现象
a、8610,原来软件版本RGOS 10.4(2b3)
Release(102059),用S8600_V10.4(3)_R118208_CMII.bin升 级包,升级总是失败
b、主程序下通过copy tftp升级,提示File
is Too Long! Failed!
Ruijie#copy
tftp://192.168.1.110/rgos.bin flash:rgos.bin
Accessing
tftp://192.168.1.110/rgos.bin...
System is running
defragment,please waitting....
Press Ctrl+C to quit
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!File
is Too Long! Failed!
%
File transmission failure
c、CTRL层下升级,提示 The binary
file crc was not correct. Delete it...
Ctrl>tftp
192.168.1.1 192.168.1.110 rgos.bin -main
Now, begin download program
through Tftp...
Host IP[192.168.1.110] Target IP[192.168.1.1] File name[rgos.bin]
%Now Begin Download File rgos.bin From 192.168.1.110 to 192.168.1.1
send download request.
send download
request.!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
%Mission Completion. FILELEN = 33553920
Tftp download OK, 33553920
bytes received!
The binary file crc was not
correct. Delete it...
2)原因
a.RGOS 10.4(3)以前的软件版本,存在tftp协议无法传输超过32MByte大小的文件,所有无法传输
S8600_V10.4(3)_R118208_CMII.bin这个有近35MByte的文件;
b.S8600_V10.4(3)_R118208_CMII.bin升级包是适用于EC类线卡的,从提示的报错信息来看,应该是
软件版本错了,如果没有EC卡,应该升级S8600_V10.4(3)_R118208_NOEC_CMII.bin升级包
3)解决方案
86如果原来是非10.4(3)的版本,同时有EC线卡,那么升级的顺序应该先整机升级S8600_V10.4(3)
_R118208_NOEC_CMII.bin(该文件适用于打破tftp协议的32Mbyte限制),重启,成功后再升级适用 EC卡的S8600_V10.4(3)_R118208_CMII.bin。
常见故障八:高端交换机MGMT管理口无法与某些特殊MAC地址的PC在CTRL模式下通过TFTP升级
1)现象
我司高端交换机,带MGMT管理口,比如s76,s78,s86,需要在ctrl层下升级设备,同时没有可用的带电口的线卡,只能用MGMT口来通过TFTP协议传输升级包时,存在无法下载成功的故障。比如PC端MAC为F0-DE-F1-3A-FF-CD,ctrl层下通过MGMT口传输BIN文件时,一直停留在send
download request.状态。
2)问题影响
CTRL下使用MGMT口进行TFTP下载时,凡是TFTP服务器(PC端)MAC地址符合以下规则的都无法正常通信:
MAC第1字节为F0,同时,第2字节为00、09、0A,或者大于0x14
MAC第1字节为FE,同时,第2、4、5字节全部为00
3)解决方法
目前10.4(3)及以前的所有版本都存在该问题,无版本可用解决,计划各产品线在下一个正式版本上解决,目前可以采取以下方式规避
1)不要在ctrl层下通过mgmt口升级,可采用线卡的电口进行文件传输,或者可以在主程序下直接升级
2)可以修改PC端MAC地址为00开头的