环路故障专题案例

环路故障专题案例
环路故障专题案例

【交换机在江湖】环路故障专题(3)扁鹊问道下篇----临床案例

环路故障纷繁错杂,难寻其理。愿广为搜罗现网案例,合览汇编,以求至简至约,开卷了如指掌。

1.1.1 对接设备故障

1.1.1.1 其她厂商设备上出现华为MAC地址漂移故障案例

涉及产品与版本

S交换机V200R002及先前版本

组网情况

如图1-1所示,防火墙设备上连接了三台交换机。

图1-1其她厂商设备上出现华为MAC地址漂移问题案例组网图

现象描述

防火墙设备上能够瞧到00e0-fc09-bcf9 MAC地址得漂移,对防火墙得业务转发有

影响。

原因分析

华为自研交换机上只有NDP会用00e0-fc09-bcf9作为协议报文得源MAC,而N

DP就是默认使能得,所以在这个场景中会导致防火墙设备报漂移,进而影响防火墙得

转发;这个MAC地址发生漂移一般情况下对业务没有影响(如果设备上对MAC漂移配

置了动作则除外)。

NDP协议报文就是BPDU报文,而BPDU报文就是不应该学习MAC地址得,交换机

最新版本已经不会学习BPDU报文了,防火墙设备也不应该学习该MAC地址。

处理步骤

执行命令ndp disable,去使能交换机全局NDP功能.

总结与建议

无。

1.1.1.2 ATAE软件问题导致与交换机MSTP对接失败得故障案例

涉及产品与版本

S交换机所有产品与版本

组网情况

如图1-2所示,新接入得ATAE机框与Switch—1与Switch—2交换机组成口字型

环路。

图1-2A TAE软件问题导致与交换机MSTP对接失败得故障案例组网图

现象描述

在启用STP后发现环路无法正常收敛:Switch—1、A TAE-SW-8均为根桥,Switch

互连端口、ATAE互连端口可正常收敛,而Switch—1、Switch-2与连接得其她

ATAE机框STP无法正常收敛。

原因分析

Switch-1配置为根桥,设备得系统MAC为:4c1f—cc82—d659。新接入得ATAE机

框软件版本为V200R013SPC005,该版本存在一个软件问题:对于收到得根

桥MAC以59结尾得STP报文不能正常处理.

处理步骤

1.检查各端口得STP收敛情况,发现存在两个根桥

Switch-1手动配置为STP根桥,ATAE-SW—8也选择为根桥:

<ATAE—SW—8〉disply stpbrief

MSTID Port Role STP State Protection

0 GigabitEthernet0/7DESI FORWARDING BPDU

0GigabitEthernet0/15 DESI FORWARDING NONE//ATAE互0GigabitEthernet0/18 DESIFORWARDING NONE //连联?

接Switch-2

2.检查ATAE-SW-8 GigabitEthernet0/18端口得STP信息与收发报文情况

ATAE—SW—8上没有部署任何业务,GigabitEthernet0/18端口入方向组播

报文计数有增加,但display stp信息中端口接收得MSTP报文计数一直为0:

750broadcasts,

730

Input(total):818962packets,114519592 bytes?

24 multicasts?

----[Port18(GigabitEthernet0/18)][FORWARDING]—---

Port Protocol:enabled

Port Role :CISTDesignated Port ?Port Priority :128

Port Cost(Dot1T ):Config=auto / Active=10000 ?Desg、Bridge/P

ort:32768、80fb—06ad—6d07 /128、18

Port Edged :Config=disabled /Active=disabled ?Point—to—

point :Config=auto/ Active=true?Transit Limit :3 pack

ets/hello—time

Protection Type:None

Port Stp Mode:Stp

PortProtocolType :Config=auto/Active=legacy?PortTim

es:Hello 2s MaxAge20s FwDly 15s RemHop 20 ?BPDU Sen

t:82117

TCN:0,Config:3391, RST:0,MST:78726

BPDU Received:0?TCN: 0, Config: 0,RST:0,MST: 0

3.对ATAE-SW—8 GigabitEthernet0/18配置端口镜像,确认已经收到来自Switc

h-1得STP报文

经ATAE研发确认,出问题得ATAE交换板使用得就是V200R013SPC005版本,该

版本存在已知软件问题:收到根桥MAC以59结尾得STP报文不能正常处理。V200

R013SPC006及以上版本已经解决该问题.将根桥切换到Switch-2后,MSTP收敛正

常。

0?Copyright (c)2000-2008 HUAWEI TECH CO、,LTD、?uptime is 0 week,0

day,2 hours,38 minutes ?

OSTA 2、0 V200R013 CN21XCBA switch system?OSTA2、0 V200R013 CN21XCB

Aswitch version: V200R013SPC005

16384K bytes FlashMemory?Config Register128M bytes SDRAM ?

points to FLASH

?Hardware Version isVER、A

ReleaseLogic Version is 0x03?Back BoardHardware Versionis VE

R、A ?Back Board Logic Version is 0x02

BackBoard TypeisCN21XCRA

升级ATAE交换板软件版本到最新得V200R013SPC007。

总结与建议

多设备形态得对接问题尽量控制在网络部署阶段.

对于与其她设备对接得STP问题,首先排查配置就是否存在问题、报文收发就是否正

常。

1.1.1.3 S交换机与CX600路由器端口UP时间不一致导致RRPP临时环路故障案例

涉及产品与版本

S交换机所有产品与版本

组网情况

如图1-3所示,S5700设备上配置RRPP协议,S5700_1与S5700_2分别作为R

RPP domain 1与domain 2得主结点,其她中间S5700做为RRPP传输结点,

CX600路由器未配置RRPP协议,它们之间通过不同得VPLSVSI透传RRPP协议

报文与数据业务。

图1-3交换机与路由器端口UP时间不一致导致RRPP临时环路问题案例组网图

现象描述

当CX600_1得1号板故障重启后,发现CX600_1设备GE1/1/1端口比S5700_1得G

E0/0/1端口UP得时间滞后8s或者最长能达到1分钟,单板恢复后会形成几秒钟得临

时环路,可能导致业务异常。

原因分析

1.CX路由器单板复位重启后,不管两边端口协商模式就是强制或自协商,底层端口

物理层状态都会先UP。单板在配置恢复过程中,会检查配置恢复有没有结束,如果

没有结束得话,就不取物理状态向软件层报UP事件,路由端口UP时间滞后可达

到1分多钟。CX路由器端口比交换机端口UP时间有很明显得滞后。

2.由于交换机端口先UP,RRPP协议会在端口UP以后6s放开临时阻塞,而路由器还

没有向软件层报UP.等到路由器软件层上报UP时,有得数据VSI已经先透传数据

报文.路由器得RRPPVSI可能起来得比较晚,或者起来可能短时间内也不能正

常透传.由于CX单板起来比较繁忙,而RRPP协议透传VSI还没有通,这时候就会

形成临时环路,根据CX单板业务配置多少及其繁忙程度,可能有时临时环路会达到

10s左右.如果中间交换机受到严重冲击,环路恢复可能需要更长得时间。

处理步骤

CX路由器优化软件版本,加快UP事件得上报.

总结与建议

无.

1.1.2 设备硬件连接问题

1.1.

2.1 S9300 交换机单板松动导致RRPP未生效故障案例

涉及产品与版本

框式设备

组网情况

如图1—4所示,四台S9300组成RRPP环形组网。工程师反馈客户组成RRPP环网

后,主节点上得从端口没有被阻塞。

图1-4RRPP环形组网图

现象描述

一线工程师反馈客户组成RRPP环网后主节点上得从端口没有被阻塞。

原因分析

设备上主控板上HG口没有转发RRPP报文,原因为单板连接松动。

处理步骤

1.组成RRPP环网后主节点上得从端口未被阻塞,初步怀疑就是RRPP协议功能下

发存在问题。

2.执行命令display diagnostic-information,收集设备信息时,发现HG口未加

入相应得控制VLAN。推测可能就是当时通道不稳定丢包导致部分设置没有下发

成功。

3.对于通道不稳定得情况,进行单板插拔处理,发现问题不再发生,确认为单板连接问

题。

4.重新插拔后,报文正常转发,故障解除。

总结与建议

协议下发失败,流量不通等问题,可以从光纤、光模块故障、单板连接不稳定等方面来

进行排查验证,在环境允许得情况下可以进行光模块替换、单板重新插拔等硬件故障

处理方法.

1.1.

2.2 设备连线错误导致环路风暴得故障案例

涉及产品与版本

S交换机所有产品与版本

问题现象描述及组网

如图1-5所示,某运营商工程网络部署阶段,未合理规划,连线非常复杂,在连线过程中

误连接导致网络业务受影响。

图1-5连线错误导致协议环路失效风暴得故障案例

问题根因说明

现网中S交换机之间端口连接方式绝大多数使用Access类型,VLAN没有很好规

划与隔离,连线非常复杂,非常容易误操作连线,导致环路后冲击上层核心设备。问题判断方法

忽略判断方法,主要关注解决或规避方案。

解决方案

1.合理规划组网,VLAN合理划分,进行有效隔离,减少不必要得连线,增加风暴抑

制功能。

2.复杂组网要经过正规流程评审。

3.网络开局调试阶段,必须shutdown与现网所有连接端口.

4.恢复新建与现网网络连接端口时,至少观察20分钟瞧端口上就是否有异常得广播

或组播流量,发现异常要立即shutdown上行端口。

5.若交换机端口灯有高速频繁闪烁或常亮得现象,可能端口上有大量流量转发,检查

就是否有环路.

经验总结

无。

1.1.3 组网及配置变更

1.1.3.1 服务器组网不合理引发交换机MAC地址漂移导致业务中断故障案例

涉及产品与版本

S交换机所有产品与版本

组网情况

如图1—6所示,两台服务器得两块网卡捆绑在一起,按照负载分担方式进行报文转发。

两块网卡对外体现同一个IP、同一个MAC。

图1-6框式交换机MAC与ARP漂移导致业务中断问题案例组网图

现象描述

Switch上持续出现MAC漂移告警。Switch下挂服务器得ARP同时学习到交换机不

同端口上,造成外网用户访问服务器业务时断时续,业务闪断。

原因分析

1.两台Switch连接服务器得端口一直存在物理UP/DOWN得异常情况,并且服务

器得MAC地址一直存在漂移现象,此时两台Switch得互连端口以及下行连接服

务器得端口上都学习到服务器得MAC地址。

2.当用户通过Switch-1访问服务器时,Switch-1会根据MAC地址表项找寻出接

口,由于MAC漂移导致出接口有两个(下行连接服务器得接口GE4/0/9y以及交

换机互连端口Eth-Trunk1)。当流量选择通过交换机之前得互连端口往外转发时,

将被转发到Switch-2设备.由于Switch-2学习到服务器得MAC也在中间互

连端口,根据二层流量避免环路机制,此时会丢弃该报文,导致业务中断。

处理步骤

1.服务器采用负载分担捆绑,而对端就是两台交换机,组网不对称。建议将服务器运

行模式从负载分担修改为主备模式.同时也可以解决MAC漂移得问题。

2.如果有特殊需求必须使用负载分担方式以及跨设备组网,建议采用交换机集群,集群

上采用链路负载分担方式。

总结与建议

组网规划前需要考虑环路风险,并给出规避措施。

1.1.3.2 设备误接入网络触发根保护导致业务中断得故障案例

涉及产品与版本

S交换机所有产品与版本

组网情况

如图1—7所示,两台S系列交换机与ATAE交换板组成STP环。A TAE交换板得两

个slot可以瞧成两台交换机,内部通过GE0/15连接。Swtich—1配置为根桥,Swit

ch-2配置为副根桥,Switch-1与Switch-2之间创建Eth-Trunk0。正常时

阻塞口在ATAE-slot8 GE0/19端口。两台S交换机部署VRRP功能,并作为ATAE得

网关。

图1-7报文触发根保护导致业务中断得故障案例组网图

现象描述

网络故障时A TAE交换板经交换机得业务中断.现网将Swtich-1下电后暂时业务恢复. 原因分析

Switch—1连接Switch—2、ATAE交换板得端口均配置根保护,一台优先级更高得O

&M交换机错误连入该网络后,触发根保护生效,所有配置根保护得端口都被阻塞,业务中

断。

处理步骤

故障发生时,在两台交换机上查瞧VRRP状态,发现均为Master,推断VRRP心

跳报文转发出现问题。VRRP心跳报文正常就是通过两台交换机间得Eth-Trunk

转发.如果故障时Eth-Trunk协商失败、STP重新收敛,心跳报文应该可以通过ATAE

交换板进行转发。

将Switch-1重新上电,但不连接到网路中。检查Switch—1得配置文件,发现Swit

ch-1上所有UP端口都配置了STP根保护:stp root-protection.对于设置了根

保护得端口,一旦收到了优先级更高得STP报文,这些端口得状态将被设置为阻塞状

态,不再转发报文.由于Switch-1已经重启过,无法确认故障时就是否确实收到了更

高优先级得报文,只能根据A TAE交换板得STP历史计算信息进行分析。

从ATAE交换板上采集得STP历史计算信息发现,slot8上得端口GE0/19收到了来

自000f-e2f6—1d18设备且优先级为0得STP报文,并触发了STP重新计算:

GigabitEthernet0/19 Alte->Desi at 2011/10/29 04:38:06

{0、5489-98f5-26bf 18 4096、5489-98f5-834d 0 4096、5489-98f5-834d12

8、18}??GigabitEthernet0/17 Desi->Root at2011/10/29 04:38:06

{0、000f—e2f6—1d18 0 0、000f-e2f6-1d180 0、000f-e2f6-1d18128、16}?

GigabitEthernet0/15 Root->Desi at2011/10/2904:38:06

{0、 5489-98f5-26bf 20000 32768、0018-8200—5428 032768、0018—8200-542

8128、14}

STP协议根据桥ID即(桥优先级,系统MAC)进行根桥选择,当桥优先级相同时,系统

MAC小得设备桥ID更小,优先级更高。故障发生时,A TAEslot8收到了比原根

桥Swtich-1(0、000f-e2f6-26bf)优先级更高得STP报文(0、000f-e2f6-

1d18),导致Switch—1上配置STP根保护功能得端口被阻塞。两台交换机间得V

RRP心跳报文无法转发,出现VRRP双主、业务中断得现象。

经排查,000f-e2f6-1d18为GE0/17下挂网络得一台O&M交换机得系统MAC,

故障期间被错误连入网络中。

此时,需要将ATAE上不在STP环中得端口去使能STP。

总结与建议

在使用根保护固定根桥位置时,需要考虑到网络中如果确实出现高优先级报文抢占根

桥,在端口配置根保护时对业务转发得可能影响,提前避免这种场景出现.

1.1.3.3 网络改造引发环路导致业务闪断故障案例

涉及产品与版本

S9300V100R003C00SPC200

组网情况

如图1-8所示,在网络迁移改造后,将原网中得核心层设备部署为接入层设备AS,即从

三层变为二层.DS_01与DS_02部署VRRP功能。

图1-8环路引起得业务时通时不通问题组网图

现象描述

三层设备DS向二层设备AS得管理IP地址发起Ping测试,发现时通时不通,并且发

现DS上得VRRP主备状态在频繁得切换。

在DS_02上出现如下告警信息:

Sep172013 21:46:11+08:00 DS_02VRRP/3/VRRPMASTERDOWN:OID 1、3、6、1、

4、1、2011、

5、25、127、2、30、1 ThestateofVRRP changed frommaster to ot

herstate、(VrrpIfIndex=143,VrId=48, IfIndex=143,IPAddress=11、91、12

7、239,NodeName=DS_02, IfName=Vlanif948,CurrentState=2, ChangeReason

=priority calculation)

Sep 17 2013 21:46:11+08:00 DS_02%%01VRRP/4/STATEWARNINGMEV1R3(l):V

irtual Router stateBACKUP changed toMASTER,because ofprotocol timer e

xpired、(Interface=Vlanif948, VrId=48)、

Sep 17 201321:46:11+08:00 DS_02%%01VRRP/4/STATEWARNINGMEV1

R3(l):Virtual Router state MASTER changed toBACKUP,becauseof priority

calculation、 (Interface=Vlanif948,VrId=48)

VRRP状态在不停得切换,查瞧VRRP状态,都为Backup状态正常:

VirtualIP?——-—-—-—---—-----——-———----—-—-----—--——--——---—----——-—

3Backup Vlanif903 Normal10、93、4、30

5 Backup Vlanif599 Normal 11、91、127、94

24Backup 14Backup Vlanif914 Normal10、93、41、126?

Vlanif924Normal 10、93、32、126

25 BackupVlanif925Normal 10、93、32、254?…………

原因分析

网络中存在环路。

处理步骤

1.执行命令display cpu-defend vrrp statistics all,查瞧VRRP协议报文统计

信息,发现DS_02上有大量丢包。

[DS_02]display cpu-defend vrrpstatistics all

Statistics on mainboard:?-----——-—--——-——----—-———--—-———---—-—-----

--——--—-—————--—--—-—-------—-—----—?Packet Type Pass(Bytes)

Drop(Bytes) Pass(Packets)Drop(Packets)?—---------——-———-—---—

--—----—-———--------——-—--—---——--——--———-—---——-—-—-—-—- ?vrrp

0 0 00

—-—-———--—------—-—----—-----------—--——-——————--—-—————----———--——----

--—--—-- ?Statistics on slot 1:?—-—-—------—----——--——-----—----—---

——----———-----—---------—-—--—-——----——-—-—

Packet Type Pass(Bytes) Drop(Bytes) Pass(Packets)Drop

(Packets) ?-———-—--—-—---—------—---—---——————-—--------—--————-—-—--—--

-----——--——-—-——-—

vrrp 0 0 0 0

-——--—-------—-----—---——----——--—-—-----—————---——-———-——-—--——--—

--———-—----—

Statistics on slot4:?—-----—-—---------—------—-———-————-———---——

—----------—----—-—----—-----——----

Packet Type Pass(Bytes) Drop(Bytes) Pass(Packets) Dro

p(Packets)

-----————--—-——-—-——--——-—--—-------—-----——-————-——-—-—---—----———-——

--—------ ?vrrp 79880066214258161773611746447

77

----—--—--—--—--——-—-———-—--——-——-------—-------—---—-----—--—-———-

-———-—-—----

2.执行命令display interface brief,查瞧设备端口带宽利用率信息。

?Interface PHY P

…………

[DS_02]display interface brief?

rotocol InUti OutUtiinErrors outErrors

Eth-Trunk1 upup31% 31%0

0?GigabitEthernet4/0/22up up 0、72% 81% 0

0 ?GigabitEthernet4/0/23 up up 81%0、73% 2

0 ?Ethernet0/0/0 down down0% 0% 0

0?…………

GigabitEthernet4/0/0 up up 0%81% 0

GigabitEthernet4/0/1 up up 0%81% 0

0 ?GigabitEthernet4/0/2 up up 0% 81% 2

GigabitEthernet4/0/3up up 0%81%0

0?GigabitEthernet4/0/4 up up0% 81%0

GigabitEthernet4/0/5 up up 0%81%0

0 ?GigabitEthernet4/0/6 up up0%81%0

GigabitEthernet4/0/7 up up0% 81% 0

0?GigabitEthernet4/0/8 up up 0% 82%0

GigabitEthernet4/0/9 upup 0% 82%0

GigabitEthernet4/0/10 upup 0% 82% 0

GigabitEthernet4/0/11 downdown 0%0% 0

GigabitEthernet4/0/12 up up 0%82% 0

0 ?GigabitEthernet4/0/13up up 0% 82%

0 0?GigabitEthernet4/0/14 up up 0%82%

0 0

GigabitEthernet4/0/15 upup 0% 82% 0

0?GigabitEthernet4/0/16 upup 0% 82% 0

0?GigabitEthernet4/0/17up up0、01%82%

0 0

GigabitEthernet4/0/18 up up 82%0%0

0?GigabitEthernet4/0/19 up up 87%82%0

0?GigabitEthernet4/0/20downdown 0%0% 0

GigabitEthernet4/0/21 up up 0、01% 0、01%0

LoopBack500 up up(s)0% 0%0

NULL0 upup(s) 0%0%0

0 ?Vlanif599 up up -- -— 0

0 ?…………

从端口计数查瞧连接AS得端口出方向都达到了80%以上,应该存在环路,其中Gi

gabitEthernet4/0/18与GigabitEthernet4/0/19端口得入方向流量统计也

到达80%以上,初步判断就是这两个端口下挂得AS设备引起环路导致,手工sh

utdown这两个端口,再查瞧cpu-defend统计与Ping其她AS设备管理

地址,VRRP协议报文Drop统计数不再增加,其她AS设备管理地址可以Ping

通。

3.GigabitEthernet4/0/18与GigabitEthernet4/0/19两个端口分别连接

得就是AS_03与AS_05,这两台交换机都就是其她厂商设备,排查后发现,由

于这两台设备原本都就是三层设备,没有开启STP协议,部署成二层设备时,未

添加开启STP得命令,导致环路。

开启STP后,从DS上打开GigabitEthernet4/0/18与GigabitEthernet4/0/19

端口,查瞧STP状态与接口流量,业务恢复正常。

总结与建议

在网络流量不稳定时,可以通过接口流量状态查瞧就是否有环路,并根据收发状态猜测

环路得源头,尽快手工Shutdown关闭端口来临时解决问题,分析出根因后,再实施解

决方案。

1.1.3.4 删除故障端口得SEP配置导致设备脱管故障案例

涉及产品与版本

S交换机所有产品与版本

组网情况

如图1—9所示,SwitchA、SwitchB、SwitchC、SwitchG、SwitchF、Swit

chE构成Segment1,SwitchC、SwitchD与SwitchE构成Segment 2。

图1-9删除故障端口得SEP配置导致设备脱管组网图

现象描述

SwitchC与SwitchD之间链路发生故障,将SwitchD故障端口得SEP配置删除,

造成SwitchD脱管。

原因分析

SwitchC与SwitchD之间得链路发生故障后,SEPSegment2得之前得阻塞

口将放开,两个故障口为Discarding状态,当删除SwitchD故障端口得SEP配置

后,SEPSegment 2将在SwitchD与SwitchE得两个端口上选择一个新得阻塞

口,导致SwitchD得上下方向得链路都不通,设备脱管。

处理步骤

通过命令displayseptopology segment segment-id,查瞧当前得拓扑信息,确

认故障端口.

SEPdetects a segmentfailurethat may be caused byan inplete topol

ogy

--—--———----———-----———-———---—----—-—-———-——---—-----——--------- ?System

NamePort Name Port Role Port Status?-—--—----——---

--—--———---—-—----------—-—---——--———-—-------—-——-

SwitchE GE0/0/3 secondary forwarding?SwitchC

GE0/0/1 mon forwarding?SwitchD GE0/0/2

mon discarding

开放环场景下,在需要删除SEP配置并重新部署SEP时,建议从开放环得一端开始

删除配置,剩余最后一个SEP接口时,Shutdown该端口,再删除该端口得SEP配

置。

总结与建议

在删除SEP配置时,需要考虑SEP段上业务VLAN得部署情况,防止在操作得过程中,

产生多点阻塞造成设备脱管或业务不通。

1.1.4 配置错误

1.1.4.1 端口未退出VLAN1导致端口流量异常业务中断故障案例

涉及产品与版本

S交换机所有产品与版本

组网情况

如图1-10所示,Switch双上行接入路由器,下行接入接入层设备。

图1-10二层环路导致端口流量异常业务中断案例组网图

现象描述

Switch双上行业务全部中断,重启设备可以短暂恢复,但就是问题会再次出现。

原因分析

接入层网络环路,发生网络风暴,导致Switch上行端口带宽被充满,OSPF peer down.

Switch设备重启后网络风暴暂时破除,业务正常,再次风暴后故障重现.

处理步骤

1.查瞧日志文件,可以发现ospf peer down以及down得原因:对端设备没有及时收

到ospf hello报文.

NBR_CHG_DOWN(l): Neighbor event:neighbor state changed toDown、

(ProcessId=88, NeighborAddress=x、x、x、x,NeighborEvent=KillNbr,Neig

hborPreviousState=Loading,NeighborCurrentState=Down)??NBR_DOWN_R

EASON(l): Neighbor state leaves full or changed to Down、(ProcessId=88,

NeighborRouterId=x、x、x、x,,NeighborAreaId=0,NeighborInterface=V

lanif4,NeighborDownImmediate reason=Neighbor Down Due to Kill Neighbo

r, NeighborDownPrimeReason=PhysicalInterfaceState Change, Ne

ighborChangeTime=

2.查瞧诊断日志文件,发现端口流量异常得告警。分析发现,上行口GE1/0/0、G

E1/0/1出方向流量告警,同时发现GE1/0/3与GE1/0/4入方向流量告警。

InterfaceGigabitEthernet1/0/0’s flow is abnormal、 (Speed=1000Mbps,

CurrentInSpeed=0Mbps, CurrentOutSpeed=849Mbps, , Line=13072)

?InterfaceGigabitEthernet1/0/1's flowis abnormal、 (Speed=1000Mbps,

CurrentInSpeed=3Mbps, CurrentOutSpeed=850Mbps,,Line=13072)

Interface GigabitEthernet1/0/3’s flow isabnormal、(Speed=1000Mbps,

CurrentInSpeed=847Mbps,CurrentOutSpeed=846Mbps, , Line=13072)?Interf

ace GigabitEthernet1/0/4'sflow isabnormal、(Speed=1000Mbps,

CurrentInSpeed=849Mbps,CurrentOutSpeed=849Mbps, , Line=13072) ?Interf

ace GigabitEthernet1/0/6's flow is abnormal、(Speed=1000Mbps,

CurrentInSpeed=0Mbps, CurrentOutSpeed=849Mbps,,Line=13072)?Interf

ace GigabitEthernet1/0/10’s flow isabnormal、 (Speed=1000Mbps, Curr

entInSpeed=0Mbps,CurrentOutSpeed=849Mbps,, Line=13072)

InterfaceGigabitEthernet1/0/11's flowis abnormal、(Speed=1000M

bps, CurrentInSpeed=0Mbps, CurrentOutSpeed=849Mbps, , Line=13072)

3.分析这些流量异常告警得端口得配置,这些端口只有一个共同得VLAN1,由此可

以判断,GE1/0/3与GE1/0/4两个端口VLAN1内进来得流量同时广播到其她几

个端口,导致上行端口出方向流量异常,ospf hello报文被丢弃。由此可见,VLAN1

内环路,将GE1/0/3与GE1/0/4退出VLAN1,故障解除。

经验总结

VLAN1环路就是比较常见得环路之一,发现端口流量异常,需要对比分析流量异常得

端口得配置,就是否存在共同得VLAN1,就是否端口下广播报文计数较大.

1.1.4.2 交换机端口未配置bpdu enable导致业务中断得故障案例

涉及产品与版本

S2700&S3700&S5700 V100R005

组网情况

如图1-11所示,Switch使用V100R005C01SPC100版本,全局使能STP并下

挂多台Cisco交换机,组成多个STP环。

图1-11Switch端口未配置bpdu enable导致业务中断得故障案例组网图

现象描述

业务故障时,登陆Switch,发现端口下有大量广播报文,网络中出现环路。

问题根因说明

从配置分析,两台Switch全局均使能STP,但所有互连端口下均未配置bpdu enabl

e:

#

interface GigabitEthernet0/0/4

port link-type access

port default vlan10

loopback-detect enable ?undo ntdp enable?undo ndp enable ?#

对于两台Switch设备,使能STP、LACP等二层协议得端口,需要配置bpduenab

le才能将端口接收到得协议报文上送到CPU处理,否则协议报文在端口丢弃,无法

实现协议协商.

处理步骤

网络中出现环路,首先排查STP收敛就是否正常。当STP环中没有阻塞口时,可通过

displaystpinterface查瞧具体端口在生成树中得角色,确认端口收、发ST

P报文就是否正常。例如:

PortRole:Designated Port//端口角色

Port Priority :128//端口优先级?Port Cost(Dot1

T) :Config=auto /Active=20000 //端口路径开销

Designated Bridge/Port :4096、5489-98f5—a433 /128、34 //指定桥ID

BPDUSent :726 ?TCN:0,Config: 0, RST: 0,MST:726 ?BPDU R

eceived :0 ?TCN:0, Config: 0, RST:0,MST:0

如果使能STP得互连端口均为DesignatedPort角色,说明STP协商失败,检查

端口下就是否配置bpduenable.如果未配置,将需要参与STP计算得端口配置bpdu

enable。

经验总结

框式交换机X7系列参与STP计算得端口不需要配置bpdu enable(默认bpdu

disable/bpdubridge disable)。

盒式交换机V100R006版本之前,参与STP计算得端口需要配置bpdu enable,否则对

于收到得STP报文不处理(不会影响STP报文发送)。盒式交换机V100R006及之后

版本,端口默认bpdu enable。

框式交换机参与STP计算得端口不需要配置bpdu enable(默认bpdudisa

ble/bpdu bridgedisable)。

1.1.4.3 未配置STP边缘端口导致部分终端从网卡启动时获取不到IP地址故障案例

涉及产品与版本

S交换机所有产品与版本

组网情况

如图1-12所示,PC终端用户通过交换机Switch接入网络,并通过DHCP方式获取

IP地址。

图1-12PC终端从网卡启动时获取不到IP得故障案例

现象描述

某些类型得终端(如联想PC笔记本)设备启动后,无法从DHCP服务器侧获取IP地

址,导致PC用户上网失败.

相关主题
相关文档
最新文档