3G基站信令链路中断故障解析

3G基站信令链路中断故障解析
3G基站信令链路中断故障解析

3G基站信令链路中断故障解析

文章来源:本站原创发布时间:2014-08-08 浏览次数:620

3G基站信令链路中断故障解析

季鑫

(中国联通大连市分公司网络优化中心 116011)

摘要: 3G基站Iub接口的信令链路是用户终端与RNC及核心网的信令交互通道,该链路发生故障将直接导致基站无法工作进而引发大量投诉。本文针对3G基站信令链路中断这一故障,通过结合测试人员反馈的故障现场状况及网管提出的指标与告警信息进行分析,得出信令链路中断的根本原因。通过对Iub接口链路PVC配置带宽的更改,消除了故障。故障的发生揭示了因基站配置的信令链路带宽过低而无法支持基站承载过多的高话务的问题。

关键字:拥塞,PVC带宽,告警

1故障定位

1.1故障的发现

随着联通3G业务的不断发展,越来越多的人们选择W网体验3G技术带来的流畅上网感觉。依据热点地区的基站话务不断升高这一现象采取了基站多载波扩容的措施,有效地增加了基站吸收话务的能力。但是个别基站却发生了在高话务冲击下用户无法使用该基站提供的W网语音和数据业务的现象。由于这些基站分布在人群密集的热点地区,导致了大量的用户投诉且极大地影响了W网的相关考核指标,笔者针对这一现象展开了调查研究。1.2故障的特征

跟踪故障发生的现场,在故障发生时采取前后台相结合的方式,前台的网优人员现场测试,后台的维护人员检查基站相关告警和无线指标。用户投诉在大连中山广场附近无法进行3G的语音和数据业务,测试人员到达现场进行测试发现手机有3G信号,但是显示无服务,无法使用3G业务。后台查看中山广场附近基站的告警后发现辽艺基站上报“SSCOP信令链路连接中断告警”和“宽带链路拥塞告警”,因此初步认定是由于辽艺基站的故障导致了3G业务的无法正常使用。

网优后台的数据分析人员反馈,在辽艺基站故障的开始(2013-7-11 12:00:00)到自动恢复正常状态(2013-7-11 15:00:00)的这3个小时的时间内,该基站所归属的RNC1业务RAB 建立成功率低差,PS域RAB建立失败次数增长为正常时段的12倍,CS域RAB指配建立失败次数增长为正常时段的5倍掉话严重,掉话增长300余次。参见图1

图1

1.3故障的分析

笔者与相关维护人员展开了讨论,认为该类型故障并不是由于基站的设备板件发生问题导致的。在基站故障期间反复刷新的是“SSCOP信令链路连接中断告警”和“宽带链路拥塞告警”这两条告警,参见图2,图3。显然弄清这两条告警的产生原因便能探明基站发生故障的原因,从而找出避免基站再次发生此类故障的方法。

图2

图3

1.4故障普遍性

网优侧的人员通过指标的分析比对,又陆续的发现了几个和辽艺基站状况相同的基站,它们分别是RNC1下的“电业局”,RNC8下的“翰林观海”“大黑警校”,RNC9下的“金石滩国

税局”,这几个基站发生障碍的时间各不相同,但参看指标后发现都是故障持续一段时间之后自动恢复正常。分析故障发生时间,可以确定这些基站都是在吸纳大量话务的情况下发生的故障,我们迫切需要查找故障原因以及掌握根除这一故障的有效手段。

2基站Iub口传输模式

2.1双栈保护

W网的基站绝大多数采取ATM+IP的传输模式并开启了双栈保护模式,所谓双栈保护即在基站的NODEB侧既安装E1线又安装网线,在默认方式下由E1线(ATM侧)负责承载基站的信令和语音业务,由网线(IP侧)承载基站的数据业务,两种线路互相保护,当其中的一方承载线路发成故障无法使用时,其上的业务会自动的转移到另一方承载线路上,保证这个基站仍能正常运行。

2.2 ATM侧传输的PVC链路配置情况

现网绝大多数基站配置2条E1线作为ATM传输的承载线路,在PVC分别配置3条AAL2和3条AAL5链路。AAL2链路用于传输用户数据,AAL5链路用于传输信令数据。AAL2链路和AAL5链路所占的总带宽为2条E1线提供的4M带宽。

3排障方案

3.1告警原因分析

分析“SSCOP信令链路连接中断告警”,可以确认是该基站NODEB侧到RNC侧的信令链路建立失败,导致了无线侧公共信道无法正常建立及手机无法正常注册和鉴权的现象。而“宽带链路拥塞告警”这条告警,是由于相应的信令链路配置不足或带宽过小所触发的。综合这两条告警的信息可以得出结论,故障基站的AAL5信令链路带宽配置不足导致了基站在高话务冲击下发生了信令链路中断造成基站不能正常工作。以此分析做为排障的措施依据。

3.2排障方案的提出

3.2.1方案1

利用基站的双栈保护模式,在确定ATM侧和IP侧的传输线路状态都正常的情况下,手动闭塞基站NODEB侧E1线路(ATM侧),迫使基站的所有信令链路承载在网线上(IP 侧),从而达到重新建立信令链路使基站恢复正常状态的目的。

3.2.2方案2

查看基站的PVC链路配置情况,根据实际情况来调整AAL5信令链路和AAL2用户数据链路所占的带宽比例,以此来提高AAL5信令链路所占的带宽,解决“宽带链路拥塞告警”所提示的问题,保证信令链路不会中断。

3.2.3方案3

与传输侧人员配合,对发生过故障的基站进行ATM侧E1的扩容,AAL2和AAL5链路的带宽会随着E1带宽的增加而成比例增加,进而保证基站信令链路的安全。

4排障方案的实施及效果确认

4.1方案1实施

在辽艺基站发生故障期间,查看后台NodeB端口状态,发现信令链路是承载在link1上(ATM侧)。后台对基站的2条E1线进行了闭塞操作,迫使信令链路承载在网线上(IP侧)。在等待了几分钟后,要求前台的测试人员再次进行测试,前台测试后反馈3G业务恢复正常。并持续的关注该基站的各项无线指标,发现指标正常。

4.2 方案1优缺点分析

4.2.1优点

操作简便快捷,经过实践,可以在很短时间内使基站恢复正常状态。

4.2.2缺点

只是暂时解决基站故障,解蔽E1线路后,当基站再次受到高话务的冲击时故障还会发生。

4.2.3总结

后台闭塞基站E1线路法用来应对突发性的基站故障是可行的,只要在有后台人员值守的情况下便能实现故障的排除,但却不能达到杜绝这类故障再次发生的目标。

4.3方案2实施

查看辽艺基站的PVC带宽配置情况,辽艺基站IUB口的PVC链路配置是3条走信令的AAL5链路和3条走用户数据的AAL2链路。3条AAL5的带宽都为64kbps,2条RTVBR AAL2的峰值信元率为3520、可持续信元率为1760,1条UBR AAL2的峰值信元率为3520。

辽艺基站配置了2条E1线路,PVC的总的链路带宽为4M,决定将3条AAL5的带宽从64kbps修改到128kbps,那么AAL2的总带宽要减少64*3=192kbps。则RTVBR、UBR 的AAL2的峰值信元率为3520kbps-192kbps=3328kbps。RTVBR可持续信元率=峰值信元率/RTVBR AAL2的个数=3328/2=1664kbps。

在后台3G网管里进入配置管理页面,在OMCR侧调出辽艺基站的PVC配置参数,在申请互斥权限后,可按计划好的调整数据进行修改,并在修改后进行增量同步,R侧的带宽就修改完毕了。 OMCB侧的配置数据无法直接在网管界面上进行修改,需要导出相关配置信息表,对表中数据做修改,再将新配置表导入网管中,增量同步后即修改完毕。

SaalUni”表,将64都修改为128,如图4。

图4

“AAl2”表,3520都修改为3328,1760修改为1664,如图5。

图5

再次参看OMCR与OMCB侧数据,确认PVC带宽修改成功。。

4.4方案2优缺点分析

4.4.1优点

适当提高故障基站的AAL5信令链路带宽,理论上可以杜绝基站此类故障再次发生的可能,在熟练掌握修改方法的情况下,能够在较短时间排除障碍。

4.4.2缺点

修改基站PVC链路带宽的操作比较复杂,对相应链路带宽所占的比例调整的幅度还需考量。

4.4.3总结

修改完数据后,后台监控人员对基站的各项无线指标以及告警信息做了持续1个月的跟踪监控,在这1个月的时间里基站没有再上报SSCOP信令链路连接中断告警”和“宽带链路拥塞告警”这两条告警,无线指标也非常理想,“RAB建立成功率”保持在良好水平。

从投诉处理人员那里询问是否还有该基站覆盖区域下的短时间内的大量集中投诉,反馈得到的结果是1个月内无投诉。

4.5方案3实施

在对辽艺基站进行PVC链路更改操作之后,取得了很好的效果,基站不再出现链路中断的故障。将辽艺基站的带宽恢复最初的设置,经与传输侧人员协调,对其进行了E1线路的扩容,将原来的2条E1线路扩至4条。对PVC链路带宽进行查询,发现AAL2和AAL5链路的带宽都随着E1带宽的增加而成比例增加,3条AAL5链路的带宽均自动由原来的64kbps增至128kbps。对辽艺基站进行了长时间持续的观察,再未发生信令链路中断的故障。

4.6方案3优缺点分析

4.6.1优点

AAL2和AAL5的带宽会随着E1带宽的增加而成比例增加,在足够带宽的支持下,基站不会在高话务的冲击下发生故障。

4.6.2缺点

需要设计院提供传输时隙,同时还需要传输侧维护人员配合基站侧进行E1的扩容,整个过程耗时较长。

4.6.3总结

扩容基站E1线路法可以从根本上解决此类基站故障,但无法在短时间内使基站恢复到正常工作状态,而且E1线路的扩容受到许多客观因素的限制,比如没有合适的传输时隙或找不到合适的E1跳线路径等等。

4.7排障方案的推广使用

RNC1下的“电业局”,RNC8下的“翰林观海”“大黑警校”,RNC9下的“金石滩国税局”这几个基站也曾出现过同样的故障,对这些基站分别使用了方案2和3,经过一段时间的观察同样没有基站再发生信令链路中断的故障。

5思考与总结

现网的3G基站可以通过扩容多载波的方式来增强吸收话务的能力,但却忽略了基站NODEB侧到RNC侧PVC链路信令带宽的扩容工作,致使基站在高话务冲击下出现了“瘫痪”的极端状态,这是值得我们维护部门高度重视的一个问题。我们需要仔细查找并记录下这些出现过故障的基站,及时的采取合适的方法解决故障,也希望能够推动相关部门配合,对出现过故障的基站进行PVC带宽或E1线路的扩容,彻底杜绝故障的再次发生。

参考文献

1姜波《WCDMA关键技术详解》人民邮电出版社 2008年5月第1版

2窦中兆雷湘《WCDMA系统原理与无线网络优化》清华大学出版社 2009年5月第1版3高鹏赵培等编著《3G技术问答》人民邮电出版社 2011年8月第2版

LTE基站告警处理指导手册-大唐

大唐LTE站点告警处理指导手册

1、小区退服 ?? ?告警解释:故障小区业务全阻,不能提供任何服务 可能原因: 1、射频单元不在位; 2、辅光口故障; 3、人为去激活小区; 4、GPS 故障; 5、传输故障; 6、基带板故障。 处理步骤: 1、查找故障站点; 2、查看承建故障小区的射频单元是否在位,物理设备-射频单元拓扑,如下图,一般 情况小区1~3分别建立在射频单元拓扑0~2上。

射频单元不在位告警处理方法: (1)远程确认现场供电是否正常; (2)近端更换光模块观察告警是否恢复; (3)近端更换光纤观察告警是否清除; (4)近端更换RRU观察告警是否清除。 请参考“射频单元不在位告警”处理方法 故障告警依然没有恢复,请联系大唐工程师。 如果射频单元存在,则转步骤3处理; 3、查看承载小区射频单元接入BBU 的光口信息,如下图,射频单元0 接入基站板卡 槽位号为4,射频单元光口1接入板卡光口号为0,射频单元光口2(辅光口)接入板卡光口号为1; 查看光模块光口信号,位置物理设备-机架-机框-板卡-光模块,如果对应光模块的光口信号丢失状态为丢信号,请参考“BBU Ir 光链路光信号丢失告警”处理方法; 如果没有丢信号,则转步骤4处理; 4、请查看操作记录,确认人为去激活小区原因;如果不是人为去激活,则转步骤5 处理; 5、查看基站GPS工作状态是否正常,位置物理设备-时钟信息-当前时钟,如果当前 时钟不是锁定状态,请参考“GPS 告警”处理方法,如果当前时钟是锁定状态,转步骤6处理;

6、查看传输链路信息是否正常,如果链路公共信息是故障,请参考“S1链路断开告 警”处理方法。 故障告警依然没有恢复,请联系大唐工程师。 2、基站退服 ?? ?告警解释:基站所有小区业务全阻,不能提供任何服务 可能原因: 1、传输故障 2、时钟故障 3、基带板卡退服 即所有小区退服后,上报基站退服告警。 处理方法: 1、查找故障站点; 2、查看基站传输链路是否故障如下图,传输管理-SCTP 链路,如果SCTP链路建立 状态不是与对端建立成功,运行状态为故障,请参考“S1链路断开告警”处理方法; 如果传输链路运行正常,转步骤3处理;

爱立信 WCDMA 基站常见告警处理方法

爱立信 WCDMA 基站常见告警处理方法 1. PDH Loss of Signal:PDH信令丢失告警 Maj PDH Loss of Sign loss_of_signal Subrack=1,Slot=1,PlugInUnit=1,Cbu=1,ExchangeTerminal=1,E1PhysPathTerm=pp4 告警原因:传输不通。 2. Plug-In Unit General Problem:配置错误告警 Maj Plug-In Unit General Problem replaceable_unit_problem Subrack=1,Slot=2,PlugInUnit=1 告警原因:对应槽位没有板子,或板子读取不到。 处理方法:拔插相应槽位的板子,如拔插无效,则需更换板子。 3. AuxPlugInUnit_PiuConnectionLost:辅助单元设备告警 Maj AuxPlugInUnit_PiuConnectionLost equipment_malfunction AuxPlugInUnit=1 告警原因:外部告警先没接。 影响:无 处理方法:由于现在外部告警线不需要接,可闭掉AuxPlugInUnit=1 这个MO,以消除告警。 4. AuxPlugInUnit_LossOfMains:RRU电源告警 Maj AuxPlugInUnit_LossOfMains commerical_power_failure SectorAntenna=1,AuxPlugInUnit=RRU-1 告警原因:RRU掉电 影响:该小区将退服。 处理方法:到现场检查RRU电源。 5. Carrier_RejectSignalFromHardware: Carrier_SignalNotReceivedWithinTime:载频告警 Maj Carrier_RejectSignalFromHardware message_not_expected Sector=1,Carrier=1 Maj Carrier_RejectSignalFromHardware message_not_expected Sector=2,Carrier=1 Maj Carrier_SignalNotReceivedWithinTime timeout_expired Sector=2,Carrier=1 告警原因:RU或RRU故障。 影响:该小区退服 处理方法:尝试对故障小区的RU进行重启,如无效,安排代维人员更换该小区RU或RRU.

诺西GSM基站常见告警及处理建议

诺西GSM常见告警处理建议 一、 UltraSite BTS常见告警 1、7600 BCF FAULTY 基站故障 (1) Crystal oscillator damage 晶体振荡器损坏 Oven oscillator is broken 晶体振荡器故障 处理建议:更换BOIA单元。 (2) Base station synchronous failure 基站同步失败 处理建议:①检查同步线及接头②检查传输设置的同步设置③更换BOIA单元并重启BCF。 (3) BIOA unit to the temperature too high BIOA 单元温度太高 处理建议:①确保周围环境温度在允许的范围内②检查机柜风扇单元③更换BOIA单元。 1、7601 BCF OPERATION DEGRADED 基站性能下降告警 (1)Power unit output voltage fault./Power unit input voltage fault./No connection to power unit电源单元输入或输出电压故障,或者无法连接到电源单元 处理建议:更换所有出故障的电源单元。 (2)Power unit temperature is dangerously high电源单元温度太高 处理建议:①确保周围环境温度在限定范围内②检查机柜风扇③更换电源单元 (3)Difference between PCM and base station frequency reference.PCM链路和基站的频率参考有差异 处理建议:①检查2M线和2M头子②调整基站主时钟,观察时钟是否稳定③更换BOIA。 (4) Flash operation failed in BOI or TRX BOI或者TRX闪存操作失败 处理建议:更换BOIA。 (5)POWER SUPPLY FAULT 电源模块故障

常见告警故障处理及分析

···常见告警故障处理及分析 MOTOROLA基站的告警按故障设备可分为三类:设备告警、内部告警、外部告警。 一、设备常见告警 设备告警是硬件告警最常见也是最重要的告警,告警设备一般为基站的主要器件,它的告警类型就是它的设备类型。 1. DRI 29:[Front End Processor Failure - Watchdog Timer Expired] 前端处理器故障 DRI硬件故障,出现此告警时DRI可能会反复自启,可能会退服,应先reset or ins DRI应进行INS或RESET处理,若告警未消失,更换TCU。 2. DRI 40-47 :[Channel Coder Timeslot 0(-7) Failure] 0-7时隙信道编码器失败。 M-CELL基站经常出现此类告警,应进行INS或RESET处理,不行再更换TCU900。此告警在GSR4时出现,升级到GSR5可能会消失。 3. DRI 51 :[Baseband Hopping TDM Link Error]基带跳频TDM链路错误。 此告警有几种可能性:TDM-Highway BUS或KSW可能有问题。 DRIM的FEP,CCDSP可能有问题。 此告警须在现场具体测试分析。测试后判定故障点。 此告警在GSR4时出现,升级到GSR5可能会消失 TDM——Time Division Multiplexing时分复用:该总线用于把来自BTS的呼叫与信令数据传送到MSC,反之亦然。可分为两个独立的部分:交换机公共通路&出局公共通路。 交换机公共通路:处理路由到交换机的数据,数据来自外部信源 (通过E1/T1接口)或由GPROC内部产生。 出局公共通路:这是一个被交换的数据,现在被路由出BSC/RXCDR (通过E1/T1接口)或通向内部GPROC。 4. DRI 81:[Transmitter Synthesizer Failure]收发单元故障 此告警为收发单元TCU故障,故障原因有可能为: -接收Calibration频点丢失 -信道盘的CEB故障 -射频电缆连接失败 处理方法:远程ins或reset TCU,告警消失并监测;若告警未消失,更换TCU 5. DRI 86 :[Transmitter Failure]输出功率失败,引起DRI退出服务。状态:

常见基站告警处理

目录 ULTRA 一、TRX级 7743,7745,7606 (1) 7606,7735,7725,7741, (2) 7744 (2) 二、BTS和BCF级 7738,7602,7601 (4) 7604,7616 (5) 7704,7705,7711,7712,7746 (6) 7767 (7) DE34 7530,7840,7900,7706 (8) 7838,7839,7949 (9) 传输 8020,8050,8099,8010,8011,8012 (10) 8112,8179 (11) 附表1:告警代码定位 (11) 附表2:基站告警代码 (11)

ULTRA TRX级: 7743告警: JANBSC22G BCF-0283 BTS-0583 QUAL 2009-04-01 12:14:59.87 ** ALARM TRX -004 JACXBAOYUYUA1E (30042) 7743 MEAN HOLDING TIME BELOW DEFINED THRESHOLD 01 00 00 00 01 01 01 00 04 02 8d 主要是由于GPRS告警引起,不会对掉话率有什么影响,可能会影响彩信、GPRS激活 成功率、GPRS掉话率等,处理方式同7745告警。 7745告警: JANBSC22G BCF-0174 BTS-0176 QUAL 2009-03-28 08:15:03.12 ** ALARM TRX -009 JACXZHENGBJ3 (27326) 7745 CHANNEL FAILURE RATE ABOVE DEFINED THRESHOLD 01 00 00 00 01 00 00 00 00 03 02 20d 01 00 00 00 01 00 00 00 00 03 02 20d 其中头位数表示:01表示TCH 02表示SDCCH 第二到第九位数表示一块载频8个时隙,00正常,01掉话 第十位指出掉话时隙 当02时,表示SDCCH掉话率高,查看SDCCH掉话原因,大部分可能为BSC数据错 或MSC数据定义有误造成。 当01时,表示TCH掉话率高,最后一位表示载频由于信道失败的掉话占整个载频掉话 总数的百分比,如该值超过30%,可考虑重启载频、扇区、BCF。如重启后仍然存在过多 的7745告警,并且小区总体掉话率依然偏高(无直放站情况下大于8%的掉话率)建议更 换载频版或BB2板,一般能解决。 7606告警: JANBSC22G BCF-0004 BTS-0305 EQUIPM 2009-03-24 02:13:42.62 ** ALARM TRX -007 JACXSHENGANCU2E (24260) 7606 TRX FAULTY The transmitter output power is too low. 05 02 07 98 00 00 7606一般为载频退服告警,有不同的告警提示,The transmitter output power is too low.载频输出电平过低,载频故障,一般更换载频即可,故障代码:05 02 07 98 00 00,第 四位98指出故障或故障相关板件,98一般为TSxx,96一般为BOI,97为BB2,9A为RTxx, 9B为DUxx,详见附表1,可根据告警提示信息和代码进行故障定位处理。

基站常见告警处理

基站常见告警处理 一、驻波比告警 1.检查各个接头是否有松动现象 2.检查馈线头是否进水 3.更换RRU 4.更换天线 二、E1/T1链路远端接收故障告警 1.到基站后给传输侧打环看是否有问题, 2.没问题的话让传输再给RNC侧打环,定位告警。 三、NodeB退服 1.首先检查基站是否掉电 2.检查传输是否正常 四、光/电口上行帧失锁 1.BS8800:检查RSU40是否下电,查看光模块2端是否插紧。 2.B8200+R8840:检查RR8840是否掉电,查看光纤是否插紧。 五、设备温度高告警 1.拔出BBU上面的防尘网,进行清理 2.检查风扇是否有故障 3.查看环境温度是否超过工作范围 六、SCTP偶联断告警 出现此类告警时,请注意检查是否伴有以太网电(光.信号丢失告警,如果有,则 1.检查设备的网线 2.检查与设备连接的光端机的网口 3.检查BBU网口是否接错位置;

如果没有这个告警,只是出现SCTP偶联断开告警,则 1.检查传输的FE数据没有做 2.检查传输的FE数据没有保存上,此时需要传输人员重新下载数据或重新激活相对应的以太网单板. 3.检查无线和传输侧配置数据是否一致; 4.检查SCTP端口配置是否错误 七、PM电源过压告警 1.检查站点提供的电源电压是否正常, 2.检查设备的PM板是否有告警;如有告警,联系中兴技术人员判断该单板是否损坏,是否需要更换. 八、以太网模式与对端不匹配告警 1.和传输人员核对以太网的传输模式,RNC侧的模式为auto(自适应.,请传输人员对其模式进行修改. 九、RRU RTWP 上报异常值 1.检查天馈、线缆是否连接好,更换损坏线缆,判断告警是否消失 2.复位RRU 3.更换RRU 十、BPC单板反复重起 1.处理高温告警,温度正常后看是否恢复 2.复位或拔插单板 3、更换单板 十一、中继电路异常 1.检查线路是否完好,若线路毁坏则更换2M线 2.通过环回判断故障位置逐步排除 十二、单板电源关断(LTE) 1.插拔单板; 2.检查是否存在风扇故障告警 3.检查外围环境温度 4.检查设备的进风口以及防尘网是否被堵

爱立信常见基站故障告警处理

基站常见故障处理 CF EC10(Main fail (External Power Source Fail)):外部电源故障 处理步骤: 1.检查出现故障小区的PSU是否工作正常:检查指示灯是否正常; 2.检查电源链路,包括电缆、熔丝空开等; 3.检查IDB中配置的电源系统是否和实际使用的电源系统一致; 4.检查交流电源是否连接正确; 5.更换PSU。 HW and IDB inconsistency(硬件和IDB数据不一致): 处理步骤: 1.检查硬件的频段、配置数量是否和IDB的配置数据相一致。 2.如发现数据不同,需要重新传建IDB或者在IDB中进行修改。 Climate sensor fault, System voltage sensor fault,A/D converter fault告警 处理步骤: 1.检查出现告警小区的PSU、ECU是否工作正常。 2.如PSU出现问题,则更换。(参照例三) 3.如ECU出现问题,则更换。 4.将出现告警的ECU电源关闭,更换ECU。 5.更换后,将其电源开启。 TRX 1A/13 (RF loop test fault): RF 环路测试故障 处理步骤:

1,检查TX电缆与TRU是否正确连接。 2,对TRU进行复位或者断电后重新加电,看是否能够恢复。 3,讲该载频进行退出/进入服务的操作,或者将该载频对应的TG退服后重新进入,看是否可以恢复。 4,若经过上述操作后,故障仍然存在,或者以后再次出现,建议更换该TRU。 TRX 1A/21 (Internal configuration failed): 内部配置失败 处理步骤: 1,检查CDU电源是否正常。 2,检查IDB中CDU配置是否正确。 3,检查TRU是否安装正确,与Y-link线连接是否正确。 4,检查IDB中TRU配置是否正确。 5,检查CDU-BUS线包括背板连线。 6,将CDU进行断电/加电操作。 7,重启DXU,CDU,TRU。 8,更换TRU。 9,更换CDU。 10,更换CDU-BUS线。 TRX 1A 11(DSP CPU Communication Fault):DSP CPU通信故障处理步骤为: 1,对该TRU进行复位; 2,若复位后无法消除该故障,或者复位后再次出现,更换该TRU。 TX 1B 4(TX Antenna VSWR Limits Exceeded):TX驻波比超限处理步骤如下: 1.在OMT检查IDB里面的VSWR Limits定义的值的大小:

室分基站常见告警处理方法、流程及技术联系人

2G 一)OML链路故障告警(E1TI故障告警):即断站 1 、与传输网管核对,光端机运行是否正常(即是否能监控到本基站光端机),如 果可以监控到,则说明是基站侧问题,需上站处理。如果不能,则可判定传输光缆中断或者传输设备断电,上站核实。(仅限于华为光端机) 2 、上站核查是否断电,掉电则上电即可,如果没断电则检查基站2M质量并环回。 设备对应的传输2M环回,与传输网管核实该端口状态,如果正常则再向BSC网管核实。 如果传输网管看到该端口正常而BSC网管看到不通,则需传输网管与BSC网管进行核实,并找机房相关人员处理。如果基站环回没问题,则可判定是基站侧问题。 3、检查设备2M头质量。(自环或者万用表测)GSM可以自环,观察LIU0-4指示灯, WCDMA早期部分基站也有此功能。 4、是否为设备单板故障。主控板GSM(GTMU),WCDMA(WMPT) 5、由于室分安装场景比较复杂,而且有的相当恶劣。检查是否有进水迹象或者高 温等。观察设备外观,及主控板RUN指示灯运行状态(绿色慢闪)。风扇(BBU的FAN 模块)运行状态。 6、室分传输比较多样。华为可由网管监控,但格林威尔传输及PDH等网管看不到, 需相应厂家配合。 二)CPRI链路异常告警、射频单元维护链路异常告警、光接口性能恶化、光模块收发异常告警。 此类告警通俗点说即:BBU与RRU之间通讯不正常。 1、首先核实设备全部上电。同时检查基站尾纤与光模块是否匹配(室分基站全部为 单模尾纤,对应单模光模块1.125G-1310nm-10KM)。 2、观察主控板及RRU的CPRI接口指示灯。正常为绿色。有时指示灯正常,但依然有 光接口性能恶化告警,说明光衰较大。这时需用光功率计测各个光路,光衰不能 大于-15db。 3、尾纤拔插,酒精清洗接头,更换法兰盘等。法兰盘对接要插入凹槽内松紧适度 4、正常状态下BBU及RRU的CPRI接口灯为绿色常亮。RUN慢闪,ACT常亮,具体 各指示灯含义见下表1,RRU指示灯见表2 注:2G一些设备在后台数据去激活状态下主控板GTMU的CPRI接口指示灯不会亮,需要后台把数据激活才能看到光口亮灯,但是未激活状态下BBU与RRU之间如果光路正常则RRU的CPRI指示灯可以看到绿色。不通则红色。 三)GSM小区退服告警。 产生此告警原因如下: 1.基站断站 2.载频板(RRU.RFU)故障 3.主控板故障 4.驻波 四)E1/T1类。 2M告警主要有E1/T1告警指示告警、E1/T1帧失步告警、E1/T1信号丢失告警、E1/T1

常见基站告警处理

常见基站告警处理 主要告警: 常见的最多的告警是CF 2A:57,为接收通路不平衡告警,而其中绝大多数为假告警,这样的假告警对基站业务实际上是没有影响的。对于真告警,一般都是伴随着CF 2A:8、CF 2A:33这样的告警出现,我们处理完CF 2A:8、CF 2A:33,CF 2A:57自然就跟着消除。对于如何分辨该告警的真假,我们一般采用测相关TRX的SSI值来区分,对于假告警,我们直接修改天线在OMT中的参数,便可以消除告警。 其次CF 2A:33也出现得较多,为分集接收告警,这样的告警比较影响通话质量。硬件故障可以引起这个告警,像2202 CDU D;2202的TRU;2206的CXU;2206的DTRU,;另外人为原因也可以造成该告警,如基站IDB数据配置错误(天线不共享却配置为共享);将两个小区的光纤接得交叉;辅柜掉电,造成与辅柜相连天线丢失一路RX信号等。 CF 2A:57告警处理 目前出现的这个告警大多为假告警 如果是真告警,也多是伴随着CF 2A:33、CF 2A:8、CF 2A:9之类的告警同时出现,一般处理完这些告警,CF 2A:57的告警就会随之消除 这里只说明如何处理假的CF 2A:57告警 一般情况下,假的CF 2A:57在用OMT读取告警时,只有这样一条告警,如图 为了确定为假告警,可对上图告警中的RX-2、RX-3对应的TRX2、TRX3进行SSI值的测试,如果SSI值都正常,则为假告警。 处理过程 打开OMT,选择Radio->在对应小区上点右键-> Define->Antenna Supervision,如图 选择Antenna Supervision后,出现下图

施工中基站天馈系统驻波比告警产生原因分析

[提要]:不论是对建设单位还是施工单位,驻波比告警是一个影响通信质量及考核的问题,作为施工单位在基站设备施工中却不可避免的会碰到驻波比告警等问题,如何避免此类问题的发生就是本文的目的所在。 [关键词]:驻波比告警 1、引言 作为施工单位在设备施工中不可避免的碰到如驻波比告警等基站告警,本文不牵涉因设备引起的驻波比告警,就由于天馈施工方面而产生的驻波比告警加以分析,并引以为戒,从根本上杜绝此类问题的产生。 2、正文 2.1、什么是驻波比 驻波比全称为电压驻波比,又名VSWR和SWR,为英文Voltage Standing Wave Ratio的简写。在无线电通信中,天线与馈线的阻抗不匹配或天线与发信机的阻抗不匹配,高频能量就会产生反射折回,并与前进的部分干扰汇合发生驻波,其相邻电压最大值和最小值之比就是电压驻波比。为了表征和测量天线系统中的驻波特性,也就是天线中正向波与反射波的情况,人们建立了“驻波比”这一概念: SWR=R/r=(1+K)/(1-K) 反射系数K=(R-r)/(R+r)

(K为负值时表明相位相反) 式中R和r分别是输出阻抗和输入阻抗。当两个阻抗数值一样时,即达到完全匹配,反射系数K等于0,驻波比为1。这是一种理想的状况,实际上总存在反射,所以驻波比总是大于1的。 2.2、为什么产生驻波比告警? 驻波比值反应了无线电波在空中损耗大小,同时也反应了无线电波被接收机所接收电波好坏程度。由于驻波比高会直接影响天线的有效发射功率,降低了覆盖区域,必然会降低了接通率,调话率,切换成功率,而且电压驻波比过大,将缩短通信距离,而且反射功率将返回发射机功放部分,容易烧坏功放管,影响通信系统正常工作。 为了保证设备及系统的正常运行和安全性,需要对驻波比设置一个允许范围,超过这个范围就产生驻波比告警。驻波比的国标是小于1.5,一般运营商要求都是1.4或1.3以下,设备厂家的要求基本都是1.4以下。驻波比告警是在BTS主设备里设置的,通过中心机房进行监控,如BTS中的一个小区你设置驻波比是1.3,该小区的TRx的驻波比超过1.3就会产生告警。 2.3、天馈系统组成部分 一个基站天馈系统主要包含天线、馈线(主要包括主馈线和跳线)、接头密封件、以及其它一些天馈配件,具体如下: 2.3.1、天线用于接收和发送基站信号,有三种最常见的单极化天线、双极化天线和全向天

常见爱立信基站告警处理方法

常见告警处理 A1类告警 CP FAUL T 一、告警产生原因: CP FAULT一般是位于CPS或MAU中的硬件故障。当系统发现一个永久性故障或三个相同类型的暂时性故障或暂时性故障出现频率太高时,MAS 的软件就会产生CP FAULT的告警。 二、告警处理流程: 具体告警处理和操作规程请参考B-MODULE ALEX相应的OPI。以下为主要操作步骤: 当CP FAULT告警出现时,首先察看CP的状态,若状态为

WCDMA基站日常告警处理

告警名称故障定位及常用处理方法AntennaBranch_AntennaSystemProblemInBranchA 驻波告警,天馈接口问题,需要检查接 口,把接口拧紧,也可能是天馈线弯曲 过度。 AuxPlugInUnit_LossOfMains 3小区的RRU掉了,一般情况下是由 于光口掉了,所以同时看有没有光口掉 了的告警,如果有,该故障就确定是光 口故障了,如果没有,就有可能是设备 RRU的故障,或者是OBIF板子故障AuxPlugInUnit_PiuConnectionLost 插入单元掉了,看后面明细位置,可以 知道是CBU上得TEST口,TEST口是 起局的时候用得,之后就没用了,所以 需要把这个口子闭了,不然就会出现告 警。Equipment=1,AuxPlugInUnit=1表 示TEST口 UpLinkBaseBandPool_ULHWLessThanULCapacity 下行链路带宽容量不够,这个告警需要 配合其他告警一起看,一般来说出现这 个告警就是硬件RAX掉了,或者RRU 光口掉了导致RRU掉了,随之就会带 有光口告警还有上行带宽容量不够的 告警;或者是RAX(或OBIF)板子故 障,随之就会带有板子故障的告警和上 行带宽容量不够的告警。 该站的这个告警是独立的,没有其他附 带的告警,所以说是LICENSE里的 licenseCapacityRbsChannelElementsDo wnlink值比该站得 availableRbsChannelElementsDownlink 值大,(命令lget . channel查看)这个 告警就出来了,解决方法是重新换 LICENSE或者加RAX板子增加容量。Ethernet Switch Port Fault 如果为Port3告警,需要联系传输和 RNC:确认传输端口已开,RNC侧确 无端口告警。如果出现Port2 告警,联 系RNC工程师解决。出现Port1,4,5,6,7 告警,可以将Port闭掉NodeBFunction_MbmsIubEfficiencyLicenseNotValid 该LICENSE不支持多媒体广播业务功

诺西GSM基站常见告警及处理建议

诺西G S M常见告警处理建议 一、 UltraSite BTS常见告警 1、7600 BCF FAULTY 基站故障 (1) Crystal oscillator damage 晶体振荡器损坏 Oven oscillator is broken 晶体振荡器故障 站的频率参考有差异 处理建议:①检查2M线和2M头子②调整基站主时钟,观察时钟是否稳定③更换BOIA。 (4) Flash operation failed in BOI or TRX BOI或者TRX闪存操作失败 处理建议:更换BOIA。 (5)POWER SUPPLY FAULT 电源模块故障

处理建议:电源模块(PSUX)没有输出电压,电源模块坏或没有输入电压,更换电源模块或提供电源给电源模块 3、7602 BCF NOTIFICATION 基站提示告警 (1) Temperature inside the TRX is high 载频高温告警 处理建议:①检查风扇单元告警是否处于激活状态②检查并确保没有异物堵塞③确保基站环境温度在允许范围内 (2) Temperature inside the TRX is low 载频低温告警 处理建议:①确保周围环境温度在规定的范围内②检查机柜风扇③更换合路器单元(TRGA)。 (2) Remote tune combiner temperature is low 远端调谐合路器温度太低 处理建议:①确保周围环境温度在规定的范围内②机柜内部安装有加热器,检查其工作是否正常③更换合路器单元(RTGA)。 (3) Rx levels is differ too much between main and diversity antennas主天线和分集天线的接收信号电平值差异过大

基站常见的十种告警

基站常见的十种告警(免费) 一、OML为E-U或D-U的问题 在BSC或RXCDR看到此现象时,还可能看到相关的一些告警,如OML 242号告警等 OML链路是OMCR到RXCDR或BSC的信令链路,可能引起此类告警的原因: ①相关的MMS口退出服务;②主用MSI板没有插;③数据库中关于OML链路的定义不对;④DTE地址定义不对;⑤路由器定义不对;⑥软件进程问题 二、GCLK无法锁相的问题 GCLK无法锁相时会产生GCLK Failed Phase Lock的提示,并可能伴随出现4、14、13号等告警。GLCK 的功能是使得系统与更准确的时钟同步,对于BSS来说,GCLK要与MSC的时钟同步。时钟同步的目的是在射频部分提供±0.05ppm(ppm为百万分之一。可能引起此类告警的原因: ①因传输问题引起MMS退服;②MSI板或MMS口硬件故障(包括T43、MSI、NIU、XCDR板);③数据库定义不合理;④GCLK 本身的问题,需要校正或更换 三、DRI 12号告警此告警表示信道编码失去TRAU帧同步。此告警一般与其它告警共同出现,会影响系统的服务(单通问题)。此告警表明CCDSP(TCU内信道编码数字处理单元)至少与RXCDR失步1秒。这是因为TDM链路错误使得帧失步。可能引起此类告警的原因: ①RXCDR可能出现问题。②在切换时BSC没有把原DRI的相应CCDSP置为空闲。 此告警可能伴随着以下两个告警: [9] MSI (XCDR): TRAU Frame Synchronization Loss. [11] DRI: Channel Coder TDM Link Error. 四、BSP 239号告警 此告警表示GPROC的安全检测进程检测到进程错误。可能引起此类告警的原因: ①GPROC、BSP、BTP板子损坏;②被检测的GPROC、BSP、BTP软件进程出现错误;③被检测的硬件出错④GPROC没插(但数据库中作了定义)⑤从TCU到BTP的HDLC链路可能出错⑥BTP的输入输出链路出错⑦TCU的运行软件出错 五、MTL告警 MTL最多的告警一般为0号告警,出现此告警时MTL为D-U。此告警表示MTL链路与MSC已经失去联系。此告警与BSS 0号告警的区别为:MTL 0号告警表示一条MTL退出服务,而一个BSS可能有多条MTL链路,BSS 0号告警表示此BSS系统的最后一条MTL链路也退出服务,此时BSS完全瘫痪了。可能引起此类告警的原因: 1)MSC传来的MTP第二层LSSU信息出现错误。2)MSC端拥塞超时3)在要求时间内系统对MSU响应fail次数超出门限,确认消息超时4)序列号出现错误5)SUERM的错误门限值超出6)收到不正常的FIB7)硬件方面:检查GPROC、及相关MSI板8)检查MTL相关database 六、IAS 1号告警 IAS 1号告警——内部告警系统Serial Bus Connection Failure,多出现在BSC 或RXCDR基站内。可能引起此类告警的原因:①告警板故障②告警线连接错误③数据库定义错误④告警线损坏⑤风扇告警 七、BSS 22号告警 此告警表示被BLOCK的CIC数目超过了紧急告警门限值。可能引起此类告警的原因: ①由于MSI板和MMS口的硬件问题导致可用的CIC数目减少②由于E1链路的问题,包括传输问题,导致CIC数目减少③由于RXCDR中GDP、XCDR板的DSP处理器出现问题使得CIC数目减少④MSI、XCDR、GDP板可能被人为lock了⑤database中关于此告警的门限值设置得太低 八、GPROC 245号告警 此告警表示一个GPROC或BTP退出服务。可能引起此类告警的原因:

相关文档
最新文档