流氓ONU处理方法汇编

流氓ONU处理方法汇编
流氓ONU处理方法汇编

流氓ONU处理方法汇编

一、华为厂家:

故障现象:某局点报障OLT 0/5/6 pon口下绝大多数ONT无法上线,现场更换分光器后,ont正常上线一会儿,约10分钟时间后故障再次出现,之后PON 口下大量ONT全部处于离线状态。

处理过程:

1. 查看PON口下ont状态,绝多数光猫均处于离线状态,个别ont在线。

0/5/6 0 1047-80E3-0C58 active offline initial initial no

0/5/6 1 AC4E-91EC-3217 active offline initial initial no

0/5/6 2 AC4E-91EB-A553 active offline initial initial no

0/5/6 3 4CB1-6C9A-8D34 active online normal mismatch no

0/5/6 8 1047-80E1-646E active online normal mismatch no

0/5/6 16 FCC8-9714-52EE active offline initial initial no

0/5/6 17 344B-5080-BAF6 active offline initial initial no

0/5/6 18 AC4E-91E9-3D2D active offline initial initial no

0/5/6 24 04C1-B967-F0D8 active offline initial initial no

0/5/6 32 04C1-B967-A452 active offline initial initial no

0/5/6 40 04C1-B967-CB80 active offline initial initial no

0/5/6 41 AC9C-E4BD-46BD active offline initial initial no

0/5/6 42 04C1-B967-E052 active offline initial initial no

2. 根据客户反馈的故障现象,怀疑PON口下存在流氓ont。查看pon口状态,系统检测显示pon口下存在非法入侵的流氓ont,且查看到ont最后一次下线原因为LOSi。如下:

XJ-ALT--MA5680T-2(config-if-epon-0/5)#display port state 6

----------------------------------------------------------------------------

F/S/P 0/5/6

Optical Module status Online

Port state Online

xPON MAC chipset state Normal

Low time lapse -

Last down cause -

Last up time 2014-04-17 18:01:32+08:00

TX power(dBm) 4.81

Illegal rogue ONT Existent//显示存在流氓ont

Max rate(Kbps) 1300000

Max Distance(Km) 20

Wave length(nm) 1490

Fiber type Single Mode

Signal detect Normal

TX fault Normal

Identifier SFP

选取某个ONT,查看它最后一次离线原因为LOSi。

XJ-ALT-FY-ZXJ-MA5680T-2(config)# display ont info 0 5 6 8

-----------------------------------------------------------------------------

F/S/P : 0/5/6

ONT-ID : 8

Control flag : active

Run state : online

Config state : normal

Match state : mismatch

……

Last down cause : LOSi

Last up time : 2014-04-17 18:52:29+08:00

Last down time : 2014-04-17 18:51:31+08:00

Last dying gasp time : 2014-04-15 01:48:00+08:00

ONT online duration : 0 day(s), 0 hour(s), 2 minute(s), 38 second(s)

3. 进入单板模式,进入pon板,将该PON口0/5/6下所有ont全部deactivate,然后逐个逐个执行ont active操作,故障依旧,所有ont均无法激活。

4. 全局模式下执行命令anti-rogueont autodetect on 打开系统自动隔离检测到的流氓ONT功能开关。几分钟后,设备显示alarm相关告警信息如下:

ALARM 919736 故障告警警告 0x2e314022 硬件设备类 2014-04-17

18:42:47+08:00

告警名称:ONT是流氓ONT

业务影响:影响业务

参数信息:机框号: 0, 槽位号: 5, 端口号: 6, ONT ID: 3

告警描述:ONT光模块常发光,ONT是流氓ONT

告警原因:ONT光模块常发光

修复建议:(1)隔离ONT

(2)替换ONT

5. 派人前往现场手工清除更换该流氓ont后,PON口下其他ont均陆续正常上线,用户业务恢复正常。此时设备alarm告警如下:

ALARM 919766 恢复告警清除 0x2e324021 硬件设备类 2014-04-17

18:57:31+08:00

告警名称:端口下的非法入侵流氓ONT已经被清除

业务影响:不影响业务

参数信息:机框号: 0, 槽位号: 5, 端口号: 6

告警描述:端口下的非法入侵流氓ONT已经被清除

告警原因:端口下非法入侵的流氓ONT已被替换

修复建议:无需处理

6. 执行命令anti-rogueont autodetect off 关闭设备自动隔离检测到的ont 功能开关。问题解决。

对于流氓ONU的判定,还可以通过U2000网管进行判断

登录U2000网管客户端,进入设备面板查看PON口状态,可以看到PON下时候存在流氓ONU的显示:

解决方法:

现场手工清除更换掉该ont后,pon口所有ont全部正常上线,问题解决

总结和建议:

关于流氓ont问题,总结如下:

1.流氓ont定义:由于PON上行时分复用,每个ONT根据OLT分配的时间戳向上行方向发送数据包。当某个ONT在没有分配时间戳的时候发光的话,就会与其他

ONT的发光信号发生冲突。我们把这种不按照分配的时间戳向上发送光信号的ONT 叫流氓ONT。

2.流氓ONT主要分为以下两种:

1).长发光流氓ont:ont一直在发光(任何时刻都在发光)。

2).乱发光流氓ont:在非OLT分配的时间戳内发光,可能是提前发光,或者是延迟关断等。

3.流氓ONT常见故障现象:

1).如果该ONT已上线,会导致同一PON口下其他某个ONT或者所有ONT下线(离线)或者大部分ONT频繁上下线。

2).如果该ONT未配置,会导致OLT设备下其他未配置的ONT无法正常自动发现。

4. 流氓ont问题常见解决办法:

当怀疑PON口下存在流氓ont时,一般在PON口下将所有ont全部deactivat 然后逐个逐个active的方法往往并不能解决问题,现网常见的解决问题办法如下:

1)对于长发光流氓ont,处理起来比较简单,如上案例。一般采取在OLT设备上自动隔离检测流氓ont的方法。

命令为:anti-rogueont autodetect on (OLT配置该命令后,系统检测到流氓ONT时,上报告警信息并将该流氓ONT设置为隔离状态。处于隔离状态的流氓ONT 只能接收信息,不能发送数据。(命令使用限制条件:1、系统只能检测长发光的流氓ONT。

2)对应PON口下的ONT必须全部要支持华为扩展PLOAM消息(GPON);或扩展OAM消息(EPON))。

另外注意:

1. GPBC单板仅支持长发光流氓ONT检测,不支持排查和隔离。

2. EPBA单板不支持长发光ont检测。

2).对于乱发光流氓ont,需要通过现场手工逐个排查的方法来解决。

a. 现场在分光器处将分支光纤全部拔掉,然后一根光纤一根光纤的插。插入

第一根分支光纤,ont正常上线后,再插入第二根分支光纤。依次进行,当插入某根分支光纤后,PON口下其他ont出现离线故障,证明该分支光纤有问题或者下挂ont是流氓ont。

b. 现场在分光器侧使用光功率计来测量ont的发送光功率,以此来判断流氓ont 的存在。光功率计波长选择1310nm,逐个测量ont上行发送给OLT设备的光功率值。在1分钟之内观察光功率计读数情况变化。如果光功率计一直没有读数,说明不存在流氓ont;如果光功率计一直有读数,证明存在长发光的流氓ont;如果光功率计时而有读数,时而没有读数,则该测量处存在乱发光的流氓ONT。

二、中兴厂家:

流氓ONU定义:正常情况下ONU发光时隙是由OLT控制的,但是当ONU发光时隙不再受OLT控制并且其光模块处于长发光或乱发光状态。这样的ONU就叫流氓ONU。

2、在C300上打开流氓ONU检测开关

(config-pon)#rogue-onu-detect 5 enable locate enable auto-shutdown enable //此处的数字5代表槽位号,locate enable表示打开流氓ONU定位开关,auto-shutdown enable表示自动关闭流氓ONU

3、在C300上查看流氓ONU告警(由于C300对ONU的检测是采用逐个ONU顺序检查的方法,需要等一段时间后再查看告警)

ZXAN#show logging alarm | include Rogue

ONU

An alarm 35279 level 0 occurred at 18:47:49 08/10/2012 UTC sent by MCP GPON a

larm Rogue ONU detected: shelf 1 slot 5 olt 1 onu 1 level 0 on

当C300检查到该流氓ONU后,会自动关闭该ONU,长发光ONU被关闭之后,其他正常ONU会自动上线,后续需要将检测到的流氓ONU进行更换,排除隐患。

4、在OLT上启用检测流氓onu 的功能(该功能需要onu支持)

rogue-onu-detect 2 enable locate enable auto-shutdown disable

第一个参数2是槽位号,locate 是长发光onu位置使能,也就是长发光告警的位置(定位为哪个onu长发光),auto-shutdown是自动关闭长发光的onu,enable 是关闭,disable是不关闭。

三、贝尔厂家:

故障现象:

OLT下带的PON用户(对应OLT PON端口1/1/2/2,该PON带大约25个ONT用户)不定时出现闪断,故障表现为ONT用户不停上线下线,闪断频率时快时慢,没有规律,且误码率增长非常迅速,具体log信息如下:

15/02/09 01:29:11 major alarm occurred for ont 1/1/2/2/36 (service affecting) : ONT is inactive

15/02/09 01:29:11 major alarm occurred for ont 1/1/2/2/27 (service affecting) : ONT is inactive

15/02/09 01:29:14 major alarm occurred for ont 1/1/2/2/25 (service affecting) : ONT is inactive

15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/23 (service affecting) : ONT is inactive

15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/18 (service affecting) : ONT is inactive

15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/16 (service affecting) : ONT is inactive

15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/15 (service affecting) : ONT is inactive

15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/13 (service affecting) : ONT is inactive

15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/5 (service affecting) : ONT is inactive

15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/3 (service affecting) : ONT is inactive

15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/2 (service affecting) : ONT is inactive

15/02/09 01:29:16 major alarm cleared for ont 1/1/2/1/21 (service affecting) : 1490 Optical signal level too low

15/02/09 01:29:16 major alarm cleared for ont 1/1/2/2/25 (service affecting) : Signal Degraded from ONT

15/02/09 01:29:16 major alarm cleared for ont 1/1/2/2/18 (service affecting) : Signal Degraded from ONT

ZZLY-NKeSuo-7360-33.227>#show pon ber-stats 1/1/2/2

=======================================================================

ber-stats table

=======================================================================

pon-idx |ont-num|bit-err-down|bit-err-up|ranged-ind

---------+-------+------------+----------+----------------------------------------------------------------------------

1/1/2/2 1 204 2077 ranged

1/1/2/2 2 417 1552461 ranged

1/1/2/2 3 229 183526 ranged

1/1/2/2 4 212 8361 ranged

1/1/2/2 5 405 3645598 ranged

1/1/2/2 6 1099 18100 not-ranged

1/1/2/2 7 185 5089591 ranged

1/1/2/2 8 278 5352530 not-ranged

1/1/2/2 9 57 2787475 ranged

1/1/2/2 10 189 3068826 ranged

1/1/2/2 11 217 3962846 not-ranged

1/1/2/2 12 229 2728350 not-ranged

1/1/2/2 13 360 4562798 ranged

1/1/2/2 14 243 4956220 not-ranged

1/1/2/2 15 269 1176529 ranged

1/1/2/2 16 228 5148 not-ranged

1/1/2/2 17 262 5392128 ranged

1/1/2/2 18 41 5137896 ranged

1/1/2/2 19 238 2276648 not-ranged

1/1/2/2 20 259 5904572 not-ranged

1/1/2/2 21 210 5086538 ranged

1/1/2/2 22 243 4734875 not-ranged

1/1/2/2 23 182 3672936 ranged

故障分析

PON技术是一种点对多点的光纤传输和接入技术,下行OLT将全部信号广播出去,通过ODN分配到各ONU。每个ONU接受到所有信号,但只取出属于自己的信号。上行则采用TDMA的传输方式,每个ONU在各自预定的时隙内发送光信号。所有ONU的突发光信号通过ODN汇合后形成包括所有ONU信息的突发光信号。OLT 接收所有信号后再根据协议处理。

结合PON工作原理及本次故障现象,分析故障原因为:

1.所有故障只集中在1/1/2/2这一个PON口上,当ONT用户发生闪断时,OLT 对应的PON口1/1/2/2能看到大量的误码存在(其他PON均没有误码),且一直快速增长,累计可达几十万。而在正常情况下,该部分数值应该为0或偶尔增长最多累计到几十几百的数量级。因此可以确定是因为误码快速变化导致了整个PON口下的ONT集中发生闪断。

2.分析产生误码的原因:在PON 网络中,导致误码快速增长的可能原因有:流氓ONT(某台ONT长发光或乱发光),或中间光路问题,或PON口光模块问题。而故障发生后该PON 口的主干光路及分光器等均做过替换,因此光路应该没问题,但故障依旧反复,因此基本判断是流氓ONT导致了故障。

处理过程

流氓ONT处理过程相对较复杂,并且可能需要用户方面的配合,下面简述此故障的现场排查过程:

1.通过流氓ONT排查命令admin pon diagnostic 1/1/2/2 mode init-onofftest 诊断流氓ONT(中断命令为admin pon diagnostic 1/1/2/2 mode stop),但没能成功定位故障ONT。

2.长时间跟踪告警打印log,没能发现某台ONT导致其他ONT跟随中断和误码迅速增长的规律。

3.人工对整个故障PON口进行排查(PON 1/1/2/2光路情况为: PON出来经1:2分光器分两路到不同的主箱):

1)在主分光器位置,把其中一个主箱(假设A路)下的所有ONT光路拔掉,观察发现另外一主箱(假设B路)下部分ONT端口的误码仍然快速在增长;

2)恢复A路,拔掉B路,发现A路下面的用户误码没有增长,初步判断是B路引起;

3)对B路ONT用户分段排查后发现,ONT 1/1/2/2/16异常。隔离该ONT后1/1/2/2 PON误码不再增长;把1/1/2/2其他用户恢复后,观察误码没有再快速增长。而把ONT 1/1/2/2/16接上后误码又迅速增长。

4)在该用户家测量OLT发过来光功率大约在-20dbm,判断光路没有问题。更换该ONT后观察,该PON所带ONT均正常运行,没有再出现闪断。而该PON下误码迅速大量增长的情况也未再出现。

流氓ONT排查思路

针对现场流氓ONT的排查思路如下:

1.判断此类故障的主要手段是检查故障PON下的误码率是否快速大量的增长(几秒钟内成千成万数量级的增长)。

2.用命令admin pon diagnostic X/X/X/X mode init-onofftest诊断流氓ONT,但需要注意该命令有时诊断不出来流氓ONT,需要再人工排查。

3.跟踪网管或CLI告警信息,如果发现某ONT inactive或dying gsap后其他ONT紧随着都开始掉线,则可以判断此ONT为疑似流氓ONT(如下例中的1/1/1/3/48),可以尝试用命令configure equipment ont interface X/X/X/X/X ont-enable disable将此ONT配置断光,然后再观察PON口误码的变化情况。

15/04/10 09:18:59 major alarm occurred for ont 1/1/1/3/48 (service affecting) : ONT is inactive

15/04/10 09:19:01 major alarm occurred for ont 1/1/1/3/47 (service affecting) : ONT is inactive

15/04/10 09:19:08 major alarm occurred for ont 1/1/1/3/46 (service affecting) : ONT is inactive

15/04/10 09:19:16 major alarm occurred for ont 1/1/1/3/44 (service affecting) : ONT is inactive

15/04/10 09:19:19 major alarm occurred for ont 1/1/1/3/42 (service affecting) : ONT is inactive

4.用光功率计在主干分光器位置测量从ONT侧发过来的光,因为ONT侧发光应为OLT触发后才产生,因此如果能测量到发光,则判断存在长发光的流氓ONT。下一步可以通知局方通过逐段测量发光来找到长发光的ONT。

5.有时流氓ONT表现为乱发光,并且通过上述方法不能定位的,则要在分光器侧逐个对ONT断纤并同步在OLT侧做误码检查来进行排查,从而排查出流氓ONT。

流氓ONU处理步骤

1. 流氓ONU问题分析和处理 1.1 故障现象描述 故障现象为: 1、设备被判定为流氓ONU; 2、同一PON口下其他设备都在反复掉线,只有这一台设备一直正常注册; 3、设备下所有ONU都在反复上下线,上下线时间没有规律; 4、只有几台设备能正常注册(距离较近的几台),较远设备都不能正常注册。 流氓ONU原理:ONU根据OLT分配的时间戳向上行方向发送数据报文。在没有分配时间戳的情况下,某个ONU发光,就会与其它ONU的发光信号发生冲突,影响其它ONU的正常通讯。这种不按照分配的时间戳向上发送光信号的ONU即为流氓ONU。 1.2 可能原因分析 1.3 工程处理步骤 1.3.1 被误判定为流氓ONU l 首先确认是否是将软件版本由V800R307升级为V800R308时出现的问题: 如果是升级后出现的问题,解决方法为:将软件升级到V800R308C00SPC503及以上版本。如果是在应用过程中出现的问题,按照下面的步骤进行测试确认。 l 如果测量ONU设备的发送光功率值都小于-40dBm,且更换设备后故障现象仍然存在,那么可能是被误判为流氓ONU,或是光路问题。 确认局端OLT软件版本,如果为MA5600V800R006C02以下的版本,请先将版本升级到MA5600V800R006C02以上的版本,并打上SPH1016和SPH120补丁。 查询流氓ONU标志位,确认是否被判定为流氓ONU,如果是,首先确认是否为误判, 判定方式如下: a、首先将流氓ONU的标志位去掉,测试正常情况下的发光状态,如果为支持突发光的 光功率计,正常的测量值一直在变化。一般为不支持突发光的光功率计,正常的测量值 为L0,或是小于-40dBm。否则可以判定为流氓ONU,请直接更换设备给华为维修。 流氓ONU查询方式: 进入对应的PON扣板,查询流氓ONU状态,如果流氓ONT状态为“是”,则为流氓ONU,下面以MA5620为例(其他设备命令一样): Huawei(config)#interface eponnni 0/0/1 Huawei(config-if-eponnni-0/0/1)#display onu info ----------------------------------------------------------------- 光模块状态:自动 信号状态:离线 环回状态:没有环回

排除华为OLT PON口下的业务上行网速慢的故障案例

关键字: pon口下业务上行网速慢 摘要: 本案例对日常工作中常遇到的网络不稳定的故障采用排除法及告警分析法进行故障定位,对网络不稳定网速慢及PON口下存在非法入侵的发光设备这类故障的处理思路进行整理,对排障过程及方法进行了总结。 案例正文: 故障现象: 1,100M专线用户反映网络不稳定,下载文件正常但上行网速慢,发生故障时带附件的电子邮件无法正常发送,玩QQ及微信发送图片失败。 2,在用户现场通过第三方测速网站https://www.360docs.net/doc/6218171555.html,测速,显示下载可以达到83.07Mbps,而上行只有1.03Mbps甚至更低; 3,重启ONU终端后,ONU上线慢,且网速无改善; 4,更换ONU终端后,ONU设备MAC地址无法被自动发现,无法正常注册。 (一)上行网速慢故障处理思路: 1,排除用户局域网设备导致故障的可能; 2,检查用户线路的光衰耗值是否在正常范围内; 3,由于用户反映下行正常但上行业务异常,因此需检查该用户接入OLT设备的配置的线路模板中DBA参数是否适当; 4,检查OLT设备上联中继带宽及流量是否正常;

5,PON网络中的其他故障(含设备板卡及光模块及PON口下的长(乱)发光的异常入侵等因素) 6,根据上述检查情况,指导相关(线路维护)人员到现场协助排除故障。 根据上述思路采取的故障排除方法: 1,在ONU的以太口直接连接单台电脑测试,故障现象仍然存在。 2,在华为OLT设备上通过命令#display ont optical-info 7 1 查看该ONU的收发光均在正常工作范围内(ONU收OLT方向为-19.17dBm;ONU发光为2.05 dBm) 3,在OLT设备上通过命令#display dba-profile all检查该用户使用的线路模板中调用的DBA 14模板参数无误:上行保证带宽为102400kbps

流氓onu处理案例

流氓ONU处理案例 前期通过处理某社区ONU数据故障,发现为流氓ONU导致,流氓ONU表现为常发光,它会使与它在同一业务板同一端口下的ONU全部掉线。此类ONU设备进行升级后即可正常使用。现汇总为如下判别与处理过程: 1、如果发现某一端口下的ONU只有一个在线,其他全部掉线,则初步断定其为流氓ONU。 2、先检查PON口主光缆是否有问题,如果光路没有问题,登录设备进一步检查。 3、登录OLT,进入对应的GPON单板模式下,查找掉线ONU所在PON 口。 Display port 端口号,查找illegal rogue ont 如果这条命令后边的状态为Inexistent 这说明它不是流氓ONU,另行处理。如果状态为 Existent 则认定其为流氓ONU。 4、如果是在现场,也可以将PON下所有ONU都断开,依次接入,如果当接入某一个ONU时候,其他ONU突然集体掉线,则证明该ONU 是流氓ONU。 5、更换问题ONU,修改问题ONU参数设置,解决问题。 被置为流氓ONU后的恢复命令:display board 0 Interface gponnni 0/0/1 Display ONU info -------------------ROGUE STATE: YES 说明被置流氓ONU------------------- Quit Diagnose

Reset rogue-ont 0/0/1 恢复 diagnose Undo anti-rogueont isolate Config Interface gponnni 0/0/1 Display onu info ----------ROGUE STATE:NO说明流氓ONU标记为清除-------------

EPON 系统下ONU频繁掉线问题处理专题

EPON 系统下ONU频繁掉线 问题处理专题 华为技术有限公司 版权所有侵权必究 3/27/2013 华为机密,未经许可不得扩散第1页, 共4页

修订记录 3/27/2013 华为机密,未经许可不得扩散第2页, 共4页

ONU频繁掉线是指当ONU在OLT上成功完成注册后,一段时间内频繁的上下线,一般分为“PON端口下单个ONU频繁掉线”和“PON端口下所有ONU都频繁掉线”。 (1)PON端口下单个ONU频繁掉线 【定位思路】 该故障的可能原因如下: 1、ONU电源不稳定 2、光纤线路故障或连接不规范 3、光路衰减过大或过小 4、ONU故障 5、ONU的IP地址冲突 【定位步骤】 1、ONU电压不稳定 在OLT上使用display alarm history命令查看ONU是否上报了ONT掉电(dying gasp)告警。 (1)上报了告警,在现场使用万用表测量测试电压,确保供电稳定且正常。 (2)未上报告警,重启ONU。如果还是不能注册,可能有其他的原因。 备注: 华为的ONU设备有交流供电和直流供电两种供电方式,如果设备采用的是交流供电,在电压不稳定的时候会导致设备反复重启,如果电压不正常且不能保证正常电压,建议用户选择使用带直流模块的ONU设备。 2、光纤线路故障或连接不规范 (1)检查光纤线路,可以使用光时域反射仪(OTDR)测量线路状况,确认线路正常。 (2)检查分光器的连接是否正常,V800R105版本EPON最多支持1:32的分光比,即一个端口下最多可以接32个ONU 3、光路衰减过大或过小 2013-3-27 华为机密,未经许可不得扩散第3页, 共4页

流氓ONU故障项目解决方案

流氓ONI故障解决方案 一、范围 本文从流氓ONU'可题的背景分析出发,阐述了解决方案的驱动力、应用场景,提出了通讯关于流氓ONU问题的解决方案,供研发和市场人员参考。 二、术语、定义和缩略语 略。 三、背景 EPON/GPON都属于TDM PON又称功率分割型PON它们在物理拓朴上是一对多结构,逻辑上则为一对一结构。其下行数据传送为广播方法,所有光网络单元(ONU都能在其物 理PON口上接收到所有的下行数据帧,而上行则为时分多址(TDMA方式,每个ONU只在光 线路终端(OLT)为其分配的上行授权时隙内发送上行数据。 随着PON网络的规模性建设和应用,用户规模的逐渐增加,运营商关注的重点已逐步 从网络建设转向网络的运维和管理。怎样建好和用好PON网络将是运营商今后工作的重点。 而流氓ONU问题将是潜在的危害网络稳定运行的主要问题之一。C NU因某种原因不停地发送 上行光信号,或者偏离授权时隙发送上行光信号,会使其他ONI发送的正常数据在OLT处无 法被恢复出来,也就无法成功注册到OLT上,轻则影响个别ONU正常使用,重则导致PON 口下业务全部中断。从网络服务保障角度出发,必须有流氓ONU故障的解决方案。 流氓ONU故障定位难度较大,一般的方法是在现场将ONU依此关闭,根据业务的恢复情况,来判定哪个是流氓ONU但是这种方法可操作性不强,费时费力。从服务实时保障、故障及时处理、降低运营商OPEX角度出发,流氓ONC解决方案需实现流氓ONI故障预警、流氓ONC远程诊断、流氓ONC远程恢复等功能。

四、应用场景 4.1 故障原因 流氓ONU'可题的产生,有多种原因,包括: 1)长发光问题: 错误的将光电转换器接入分支光纤,光电转换器长发光。 ONI光模块关断信号异常,该关断时没关断,导致ONU长发光。 ONI软件死机,也会引起ONI常发光。 2)覆盖性干扰问题:个别ONU由于某种原因(如消光比不足),在非授权时隙内发光,影响其他ONU的正常业务。 3)重叠性干扰问题:不同的ONU光模块参数不一致造成上行光信号部分叠加,彼此影响业务。 4.2 故障结果 流氓ONU问题将造成以下后果: 1)PON口下所有ONU无法注册,如长发光问题;严重覆盖性干扰问题造成的结果。 FTTB应用场景下,故障现象表现为:PON口下MDU全部脱管,且没有Dying Gasp告 警及ODN故障告警。 FTTH应用场景下,故障现象表现为:PON口下ONU全部离线,且没有Dying Gasp 告警及ODN故障告警,同时有PON口下用户申告故障。 2)PON口下部分ONU无法注册或者业务频繁中断,如重叠性干扰问题、一般覆盖性干扰问题、消光比不足问题造成的结果。 FTTB应用场景下,故障现象表现为:PON 口下部分MDI脱管,且没有Dying Gasp告警 及设备故障告警。 FTTH应用场景下,故障现象表现为:PON口下部分ONU离线,且没有Dying Gasp 告警,同时有PON口下用户申告故障。 4.3 故障处理

流氓ONU处理方法汇编

流氓ONU处理方法汇编 一、华为厂家: 故障现象:某局点报障OLT 0/5/6 pon口下绝大多数ONT无法上线,现场更换分光器后,ont正常上线一会儿,约10分钟时间后故障再次出现,之后PON 口下大量ONT全部处于离线状态。 处理过程: 1. 查看PON口下ont状态,绝多数光猫均处于离线状态,个别ont在线。 0/5/6 0 1047-80E3-0C58 active offline initial initial no 0/5/6 1 AC4E-91EC-3217 active offline initial initial no 0/5/6 2 AC4E-91EB-A553 active offline initial initial no 0/5/6 3 4CB1-6C9A-8D34 active online normal mismatch no 0/5/6 8 1047-80E1-646E active online normal mismatch no 0/5/6 16 FCC8-9714-52EE active offline initial initial no 0/5/6 17 344B-5080-BAF6 active offline initial initial no 0/5/6 18 AC4E-91E9-3D2D active offline initial initial no 0/5/6 24 04C1-B967-F0D8 active offline initial initial no 0/5/6 32 04C1-B967-A452 active offline initial initial no 0/5/6 40 04C1-B967-CB80 active offline initial initial no 0/5/6 41 AC9C-E4BD-46BD active offline initial initial no 0/5/6 42 04C1-B967-E052 active offline initial initial no 2. 根据客户反馈的故障现象,怀疑PON口下存在流氓ont。查看pon口状态,系统检测显示pon口下存在非法入侵的流氓ont,且查看到ont最后一次下线原因为LOSi。如下: XJ-ALT--MA5680T-2(config-if-epon-0/5)#display port state 6

案例1:ONU无法上报

ONU无法上报 故障现象: 汕头移动金砂中路MA5680T,PON口0/1/3下有12台ONU无法正常上报。施工人员在10月23号安装完成,后台在OLT上能看到新发现的12台ONU。10月24号上午要调试的时候,没有发现未注册的ONU,无法调试。在该PON下有一台两周前开通的ONU(ONUID9);该ONU工作正常。 原因分析: 可能原因判断: 1、光路问题,到该小区的光路全部中断。 2、电源问题,该小区停电。 3、存在流氓ONU,ONU发光不正常影响其他ONU上报 4、PON口问题 解决措施: 1、施工人员去现场查看,ONU电源正常;ONU光路指示灯link灯长亮,即代表有收到光;AUTH灯快闪,即ONU在请求注册;RUN灯慢闪。可以看出设备正常运行。 2、怀疑光功率达到临界值,用光功率测光路,光功率都为-18到-19db之间,排除光路问题。 3、怀疑PON问题,但该PON口已经有一台ONU正常运行,故排除PON口问题。 4、怀疑存在流氓ONU。在OLT侧,拔出0/1/3 PON口的尾纤,波长调到1310nm,测从ONU端上来的光功率,没测到光。排除流氓ONU存在。 5、至此排查失去头绪,怀疑问题依然出在OLT上。在OLT上用相关命令查看 命令: STYD_JSZL_MA5680T(config)#interface gpon 0/1 STYD_JSZL_MA5680T(config-if-gpon-0/1)# display port

ont-register-info 3 30 display port ont-register-info 3 30 ---------------------------------------------------------------- SN 日期时间注册结果 ---------------------------------------------------------------- 4857544301599203 2010-10-25 16:50:52 失败 485754431A519503 2010-10-25 16:50:52 失败 4857544300E9AA03 2010-10-25 16:50:56 失败 4857544301599203 2010-10-25 16:50:56 失败 485754431A519503 2010-10-25 16:50:56 失败 4857544301091903 2010-10-25 16:51:06 失败 4857544301016403 2010-10-25 16:51:06 失败 4857544301017003 2010-10-25 16:51:12 失败 4857544300E8D903 2010-10-25 16:51:12 失败 4857544301017103 2010-10-25 16:51:12 失败 4857544301016403 2010-10-25 16:51:13 失败 4857544300E7B303 2010-10-25 16:51:13 失败 485754431A50D003 2010-10-25 16:51:13 失败 485754431AA61003 2010-10-25 16:51:13 失败 4857544301019E03 2010-10-25 16:51:13 失败 485754431A519503 2010-10-25 16:51:18 失败 485754431AA61003 2010-10-25 16:51:22 失败 48575443A917B542 2010-10-25 16:51:22 失败 4857544301599203 2010-10-25 16:51:27 失败 4857544301091903 2010-10-25 16:51:27 失败 4857544300E9AA03 2010-10-25 16:51:32 失败

流氓ONU故障解决方案

流氓ONU故障解决方案 一、范围 本文从流氓ONU问题的背景分析出发,阐述了解决方案的驱动力、应用场景,提出了通讯关于流氓ONU问题的解决方案,供研发和市场人员参考。 二、术语、定义和缩略语 略。 三、背景 EPON/GPON都属于TDM PON,又称功率分割型PON。它们在物理拓朴上是一对多结构,逻辑上则为一对一结构。其下行数据传送为广播方法,所有光网络单元(ONU)都能在其物理PON口上接收到所有的下行数据帧,而上行则为时分多址(TDMA)方式,每个ONU只在光线路终端(OLT)为其分配的上行授权时隙内发送上行数据。 随着PON网络的规模性建设和应用,用户规模的逐渐增加,运营商关注的重点已逐步从网络建设转向网络的运维和管理。怎样建好和用好PON网络将是运营商今后工作的重点。而流氓ONU问题将是潜在的危害网络稳定运行的主要问题之一。O NU因某种原因不停地发送上行光信号,或者偏离授权时隙发送上行光信号,会使其他ONU发送的正常数据在OLT 处无法被恢复出来,也就无法成功注册到OLT上,轻则影响个别ONU正常使用,重则导致PON口下业务全部中断。从网络服务保障角度出发,必须有流氓ONU故障的解决方案。 流氓ONU故障定位难度较大,一般的方法是在现场将ONU依此关闭,根据业务的恢复情况,来判定哪个是流氓ONU,但是这种方法可操作性不强,费时费力。从服务实时保障、故障及时处理、降低运营商OPEX角度出发,流氓ONU解决方案需实现流氓ONU故障预警、流氓ONU远程诊断、流氓ONU远程恢复等功能。

四、应用场景 4.1 故障原因 流氓ONU问题的产生,有多种原因,包括: 1)长发光问题: ?错误的将光电转换器接入分支光纤,光电转换器长发光。 ?ONU光模块关断信号异常,该关断时没关断,导致ONU长发光。 ?ONU软件死机,也会引起ONU常发光。 2)覆盖性干扰问题:个别ONU由于某种原因(如消光比不足), 在非授权时隙内发光,影响其他ONU的正常业务。 3)重叠性干扰问题:不同的ONU光模块参数不一致造成上行光信号部分叠加,彼此影响业务。 4.2 故障结果 流氓ONU问题将造成以下后果: 1)PON口下所有ONU无法注册,如长发光问题;严重覆盖性干扰问题造成的结果。 ?FTTB 应用场景下,故障现象表现为:PON口下MDU全部脱管,且没有Dying Gasp告 警及ODN故障告警。 ?FTTH应用场景下,故障现象表现为:PON口下ONU全部离线,且没有Dying Gasp 告警及ODN故障告警, 同时有PON口下用户申告故障。 2)PON口下部分ONU无法注册或者业务频繁中断,如重叠性干扰问题、一般覆盖性干扰 问题、消光比不足问题造成的结果。 ?FTTB 应用场景下,故障现象表现为:PON口下部分MDU脱管,且没有Dying Gasp告 警及设备故障告警。 ?FTTH应用场景下,故障现象表现为:PON口下部分ONU离线,且没有Dying Gasp 告警, 同时有PON口下用户申告故障。

流氓ONU检测报告

流氓ONU检测 一、测试方法 1)保证要测试的OLT下PON口有两台及以上的ONU在线; 2)将ONU设置为长发光模式(模拟流氓猫发光,由于是内部命令,需要在贝尔工程师指导下使用),具体命令如下: S304# S304# manufactory MANUFACTORY# laser on 3)此时该PON下的其他ONU设备自动下线; 二、中兴OLT下面的流氓ONU检测 1、EPON版本协商 中兴OLT下协商过程: 第一步:OLT发起注册过程,表明其支持2.1,a.a(未知版本),2.0,1.3 和0.1(对应抓包第2365个)。 第二步:ONU回复OLT,表明可以支持OLT的某些版本,并列举ONU支持0.1、1.3、 2.0、2.1 和 3.0 (对应抓包第2368个)。 第三步:OLT选定2.1 作为协商最终版本:(对应抓包第2373个)。 第四步:ONU确认最终协商版本为2.1:CTC OAM discovery 注册完成。(对应抓包第2374个) 2、中兴OLT下手动或者等待周期性检测 1).以下为中兴OLT发出的包,逐个隔离ONU,开关启光模块看是否影响其他ONU。”FF FF”为”Action”字段,表示“永久关闭Tx电源”,表示为关闭设备mac为4C:1F:CC:C1:72:B8的光模块。(对应抓包第55381个)

2). 直到找到贝尔“RG220O”设备。关闭设备mac为d0:0e:d9:ac:b8:5b的光模块。(对应抓包第55388个) 3).关闭所有ONU TX电源后,OLT会逐个打开确认那个ONU为“流氓ONU”。 直到找到贝尔“RG220O”设备并认定为流氓ONU,关闭设备mac为d0:0e:d9:ac:b8:5b的光模块(对应抓包第55534、55553) 3、中兴OLT遵循EPON 2.1协议标准,华勤设备匹配EPON2.1规范,在中兴OLT下面能正常检测到流氓ONU,并能正常配合中兴OLT下发的隔离、去隔离流氓ONU指令。 《中国电信EPON设备技术要求_V2.1修订2_200912》 主要参照规范中Variable Width取值,中兴OLTVariable Width取值为10

流氓ONU问题分析和处理

流氓ONU问题分析和处理 嘉兴分公司网络操作维护中心郭莉晶发表于2011-11-17 11:11:53 故障现象为:1、设备被判定为流氓ONU; 2、同一PON口下其他设备都在反复掉线,只有这一台设备一直正常注册; 3、设备下所有ONU都在反复上下线,上下线时间没有规律; 4、只有几台设备能正常注册(距离较近的几台),较远设备都不能正常注册。 流氓ONU原理:ONU根据OLT分配的时间戳向上行方向发送数据报文。在没有分配时间戳的情况下,某个ONU发光,就会与其它ONU 的发光信号发生冲突,影响其它ONU的正常通讯。这种不按 照分配的时间戳向上发送光信号的ONU即为流氓ONU。 ?首先确认是否是将软件版本由V800R307升级为V800R308时出现的问题(可以通 过查看log信息确认是否是升级以后出现的问题): A、如果是升级后出现的问题,解决方法为:将软件升级到V800R308C00SPC503 及以上版本。 B、如果是在应用过程中出现的问题,按照下面的步骤进行测试确认。 ?如果测量ONU设备的发送光功率值都小于-40dBm,且更换设备后故障现象仍然存 在,那么可能是被误判为流氓ONU,或是光路问题。 1)、确认局端OLT软件版本,如果为MA5600V800R006C02以下的版本,请先将版本升级到MA5600V800R006C02以上的版本,并打上SPH1016 和SPH120补丁。 2)、查询流氓ONU标志位,确认是否被判定为流氓ONU,如果是,首先确认是否为误判,判定方式如下: 首先将流氓ONU的标志位去掉,测试正常情况下的发光状态,如果为支持突发光

的光功率计,正常的测量值一直在变化。一般为不支持突发光的光功 率计,正常的测量值为L0,或是小于-40dBm。否则可以判定为流氓 ONU,请直接更换设备给华为维修。 a、流氓ONU查询方式:进入对应的PON扣板,查询流氓ONU状态, 如果流氓ONT状态为“是”,则为流氓ONU,下面以MA5620为例 (其他设备命令一样): Huawei(config)#interface eponnni 0/0/1 Huawei(config-if-eponnni-0/0/1)#display onu info ----------------------------------------------------------------- 光模块状态 :自动 信号状态 :离线 环回状态 :没有环回 加密状态 :不加密 加密类型 :三重搅动 流氓ONT状态 :是 ----------------------------------------------------------------- b、去掉流氓ONU标志位的方法: 1)EPON 流氓ONU清除办法: Huawei(config)#diagnose Huawei(diagnose)%% reset rogue-ont 0/0/1 Huawei(diagnose)%%config Huawei(config)#interface eponnni 0/0/1 Huawei(config-if-eponnni-0/0/1)#reset subboard Are you sure to reboot EPON subboard? (y/n)[n]:y 2)GPON流氓ONU清除办法: Huawei(config)#diagnose Huawei(diagnose)%%undo anti-rogueont isolate Huawei(diagnose)%%config Huawei(config)#interface gponnni 0/0/1 Huawei(config-if-gponnni-0/0/1)#reset subboard Are you sure to reboot GPON subboard? (y/n)[n]:y 1.3.2 设备进水故障 查看设备是否进水,如果有进水痕迹,请整改环境。 1.3.3 ONU设备故障 1.3.1.1 光模块坏:设备长发光/乱发光。 ?首先从外观查看设备是否进水,如果进水直接更换设备,且整改安装环境。 在确认设备未进水的情况下,请测量设备刚上电时的发送光功率,如果光功率大于-40dBm,则代表设备长发光或乱发光,请直接更换PON扣板 ?(MA561X、MA562X)或更换光模块(V800R308设备)。

安徽移动家庭宽带故障处理案例汇总

精心整理安徽移动家庭宽带故障处理 案例汇编 17、广电合作宽带用户拨号691的故障处理. 18、拨号错误678和691的故障处理.......................................错误!未指定书签。 第五节应用类故障............................................................................错误!未指定书签。 19、网页打不开和无法玩游戏的故障处理...............................错误!未指定书签。 20、频繁掉线和网速慢的故障处理...........................................错误!未指定书签。 21、网络游戏慢的故障处理 ......................................................错误!未指定书签。 第二章线路类故障....................................................................................错误!未指定书签。 第一节光缆类故障............................................................................错误!未指定书签。 22、线路光衰过大导致网速慢的故障处理...............................错误!未指定书签。 23、光衰过大导致用户拨号678 ...............................................错误!未指定书签。 24、光路误码率高导致用户频繁678故障...............................错误!未指定书签。

相关主题
相关文档
最新文档