三十二个网络故障案例汇编..

网络故障汇编

案例一:

最近调试ADSL网络,遇到一些问题,提供一些解决方案如下:

笔者所在地区为河南,ADSL采用河南通信公司统一的虚拟拨号软件,大致原理为DHCP加上Web认证,当输入帐户与密码,马上可以连接到internet,但是该拨号软件与许多杀毒软件、防火墙还有其它的一些程序兼容性不好,经常出现一些网络故障,造成拨号上网不成功。

ADSL局域网,工作站二十台,服务器采用Win98/Win2000 Server系统,代理软件分别采用sygate和操作系统自带的ICS连接共享,但是一旦服务器无法拨号,工作站就无法正常上网,严重影响公司的正常使用,而且sygate还有连接共享经常出现异常情况,其中包括服务器可以正常上网,而工作站却不能上网,工作站可以上网的时候,此时服务器却不能上网,为了整个网络的稳定性,决定不再单独设置服务器。

经过一段时间的使用,笔者发现,该虚拟拨号软件采用动态分配IP地址,其DHCP的租约期限一般情况下为一天,就是说,在一天之内再次拨号,通常还是保留上一次IP地址,该虚拟拨号软件要求计算机必须自动获取IP,根据这种情况,可以使用ipconfig /all来显示上一次拨号的IP地址,并将IP地址、子网掩码、网关、DNS指定在对应的网卡上。在每一台计算机上都可以通过拨号上网以后,记下IP地址,将其绑定在网卡上,当然,每台计算机的IP地址都各有不同。

例如:IP地址:218.29.228.41

子网掩码:255.255.255.0

网关: 218.29.228.254

DNS:202.102.224.68 202.102.227.68

需要注意一点,由于ADSL虚拟拨号获得的IP地址是可以被外界访问的IP 地址,所以通过这种方式可以强行绑定一个公网IP,使用起来肯定是比较方便的,可以不通过拨号直接上网,但是由于设备与技术方面的种种原因,用户使用固定的公网IP也是比较容易遭受攻击的,具体使用哪一种方式上网,当然要根据实际情况而定。

经过一段时间的使用,大家都感觉比较好用,至少原来的服务器不能上网的时候,不再影响其它的工作站,但是又发现了一个新的故障,就是无论怎么设置,整个局域网上网的时间最多不超过一个小时,观察ADSL信号以及局域网的传输信号一切正常。但是,将ADSL调制解调器的电源切断,然后再接通电源,等过一分钟以后,ADSL完成与局端的同步,整个局域网就又全部可以正常上网,但这却最多还是维持几十分钟。

根据笔者维护网络的经验,初步判断是数据包传输碰撞,造成的网络风暴,以至于电信局端传输过来的ADSL数字信号不能有效地到达工作站,ADSL现在的接入方式是插到hub上,其它计算机与其并联。由于hub不能有效地对数据进行交换,笔者建议购买交换机。

自从使用交换机以后,整体上网就非常稳定,不再出现掉线等其它现象,任何一台电脑可以不通过拨号开机直接连入Internet。

案例二:

[症状]某大型化工股份有限公司信息中心报告网络故障,新近进行网络的更新升级和扩容,由10M网全部提升为100M以太网,核心交换机为千兆以太网。完工后系统试机时发现,大部分的网络成员感觉速度慢,有时数据出错,但子网段内拷贝数据速度基本不受影响。Ping测试检查所有工作站和服务器均正常。遵照网络医院上周的建议他们对网络布线系统进行严格认证测试,布线施工质量优良,全部电缆光缆链路按超五类标准测试参数均合格,没有发现任何问题。由于信息中心除了电缆和光缆的认证测试仪外,没有其它测试维护工具,无法对网络进行评测。虽然仔细进行了网络系统及平台的重新安装,仍无济于事。由于总公司希望全面提高ERP系统的覆盖范围,新增的网络设备比较多,网上成员也增加了二倍多,工作站从原来的220台猛增至680台,办公区和生产区之间、生产区和生产区之间均用光缆和路由器连接起来,因此洪主任抱怨现在网络的管理成了问题,查找故障不象从前那样容易了,一来网络规模比以前大多了,故障数量和种类增多,二来网络结构变得比以前复杂多了,故障的定位分析和隔离变得比较困难。

该网络各子网段基本上采用核心交换机和工作组交换机作网络骨架,用桌面交换机和集线器混用的方式构成基层用户接入平台,核心交换机之间为千兆以太网连接,用户全部为100M到桌面。为了便于维护和管理,同时也从安全角度考虑,设计方案中将大多数数据服务器均安装在了网管中心。

[诊断过程]网络为新扩容的网络,从拓扑图上看不出网络结构设计有何不合理之处。由于在各子网段内拷贝数据时速度基本不受影响,所以分析数据多在跨网段时受阻。将网络测试仪接入办公区网络的网管中心,打开网段内的全部4个路由器的端口观察,网段间的流量为27%~42%之间,由于网络没有多媒体应用启用,因此如此高的流量记录是不正常的。我们需要观察这些流量的走向,于是在办公区将网络测试仪串入路由器与交换机之间(100M端口)监测,启动IP 矩阵监测和以太网MAC矩阵监测功能,观察数据流向。结果如下,大部分的数据流向均指向办公区的WINS服务器,而WINS响应流量极少。查看拓扑图,该WINS 服务器直接与一台工作组交换机相连,打开工作组交换机的端口记录检查,流量记录为13%,伴随少许碰撞指示记录。为了不影响用户的使用,下班后我们从测试仪所在端口向WINS服务器所在交换机端口P32的邻近端口P31发送高额流量,选值为90Mbps流量冲击,并在此邻近端口P31观察接收到的流量记录,记录显示为89.7Mbps,这说明端口P31的通道测试是合格的。然后对准WINS服务器所在端口P32发送90Mpbs的高额流量,观察P32端口流量冲击记录,结果显示为13.5%,并出现大量延迟帧,表明该端口通道测试不合格。将流量发送方向指向与该端口连接的上游端口P17,观察P17流量显示为90Mbps。问题很清楚,被丢弃和延迟的流量就在P32口。对WINS本身作WINS查询,10次测试响应只有2次,响应地址正确,响应率20%。重新测试WINS链路电缆,合格。测试WINS 服务器网卡,合格;测试交换机的端口P32,低效。在此临时将WINS服务器端口P32改接到端口P33,重新启动系统,5分钟后进行上述测试,全部合格。为了验证P32口低效,用网络测试仪接入该端口并向P17发送90M流量,收到流量为12%。由于这台工作组交换机为新品,尚在保用期之内,因此建议立即更换之。

[诊断评点]网络中的大多数数据服务器由于设置在办公区的网管中心,所以公司整个系统的工作依赖集中式系统中的这些专用数据服务器,链路连接和数

据交换时需要WINS服务器提供服务。与WINS服务器连接的链路中,交换机一侧的端口P32发射能力低效,使得发送的信号幅度不符合要求,由于链路长度不长,所以并不是对所有的数据包WINS服务器都无响应。有些数据被作为部分错误和碰撞数据由端口记录之,大部分从交换机各端口送往P32端口的的数据因链路接口问题被延迟和丢弃,造成记录数据中有用流量正常,而网络用户速度普遍偏慢的假象。交换机、网卡、集线器和路由器等网络设备的端口一般从工作2~3年开始出现低效现象,5年比例为3%~18%(这取决于不同的厂商产品质量,也取决于同一厂商的不同系列产品的产品质量)。由于系统中有大量的端口,所以在网络维护周期建议中要求每半年对端口性能进行定期测试。每一~二年对布线系统进行一次轮测,尤其对重要的网络设备如服务器、交换机、路由器等应该坚持定期测试,这样做对提高网络的可靠性有莫大的帮助。

[诊断建议]建议“病人”所有网络设备进行一次普查,将全部端口都进行备案测试,并列入定期维护的内容之一。

[后记]经处理被告之,上班后所有网络用户都惊喜地发现,网络速度比之以前有了惊人的表现,速度真正大幅提高,皆大欢喜。

案例三:【多协议使用,设置不良,服务器超流量工作】

[症状]今天的故事发生在某机电进出口公司来电告知他们的网络昨天刚刚进行了升级,从10M以太网桌面应用全部升级为100M以太网交换到桌面,结果出现局域网内网络访问速度反而比升级前慢的现象。有的访问很长时间没有结果,有的则出错。他手里有几款侦测网络流量的软件,启动运行后也没有发现任何问题。对服务器的Ping测试平均小于1ms,应该不会慢,但不知何故会如此表现。

[诊断过程]这个故障看起来比较简单,实际诊断却颇费周折。该网络由4个路由器经帧中继线路与国内总部和国际分部链接,占据4层楼面,由2台千兆核心交换机和二级5台工作组交换机(每层一台)以及20台桌面交换机(每层4台)组成,100M交换到桌面,结构比较典型。从故障现象看,网络联通性尚可,但速度受影响。一般来说,速度慢的原因有很多,比如网上设备速度跟不上要求,

网络设备出现阻塞或瓶颈效应,电缆光缆系统问题使得网络数据出错或产生高额碰撞,网络协议设置错误造成无效的重复访问,应用软件或协议设置错误访问受阻等等。由于刚更新了网络,原来的电缆系统又没有经过认证测试,根据以往的经验,电缆系统存在问题的可能性最大,所以我们决定先检查电缆系统。鉴于所有网络成员都有速度问题,我们先抽取部分电缆尤其是主要服务器的网络电缆进行现场认证测试。

系统电缆采用的是超五类线,用电缆认证测试仪测试20条电缆链路,结果出乎意料地全部合格!改用网络测试仪对抽测的电缆人工模拟发送流量,结果当发送至75%流量时,碰撞率仍不超过5%,表明网络布线系统虽然在工程完工后没有进行认证测试,但电缆品质和施工品质还是不错的,实属少见。转而进行网络健康指标评测,除了服务器流量严重超标以外,其它如错误、碰撞、广播等都合格。检测流量分布,基本上都集中在服务器链路上,平均流量达91%。令任意两台工作站之间进行拷贝文件操作,速度很快。说明问题很可能就出在服务器与工作站的协议流程障碍上。启动F683网络测试的ICMP Ping、Scan Host、ICMP Monitor等功能测试,检查其IP协议的工作质量,结果显示正常。这说明,网络连接通道性能是可以的,问题出在协议的5层以上。

启动网络测试仪的协议分布侦测功能Protocol Mix,结构发现其Apple Talk和BanyanVines协议流量分别为47%和39%,合计流量为86%。进一步显示运行该协议的是两台主服务器。

询问网络部主任网络设计运行的是什么协议,答曰全部是基于视窗环境的单一的IP协议。为何会出现Apple Talk和Banyan Vines?答曰根本未知。

由于这两种协议有没有参与该公司的业务流程尚且不明,故暂时不能贸然将其删除。必须尽快核实现在的业务软件是否依赖这两种协议。网络部主任告知他是一年前接手网络部主任一职的,对业务流程软件并不熟悉,但知道现在运行各软件的供应商。我们请他立即与该软件开发商联系,15分钟后对方发来传真明确说明该公司的软件只在Windows平台上运行,不支持Apple Talk和Banyan Vines等应用平台。为慎重起见,我们请各业务部门的代表集中辨认并统计现在

各自所用的操作平台和软件,结果都不包括Apple Talk和Banyan Vines。至此,我们决定对该协议平台进行卸载。一边操作一边请林先生查阅以前网络档案,结果发现了这两种平台的安装软盘和应用软件安装软盘。

完成协议清理作业后,重新启动网络,网络访问立即恢复正常。

[诊断评点]非工作协议是指在网规划和络设计中未被选用的协议和应用,但他们存在于各种网络平台之中。作为网络上的“游魂”之一,他们会耗用少量网络带宽。常用的被捆绑于视窗平台的协议如IPX、IP、NetBEUI基本上没有冲突。所以许多用户虽然没有同时使用这几种协议但也会时常同时捆绑这些协议。NetBIOS设置有多种平台协议的输入输出接口,有助于众多协议的交互工作和各种协议平台及其应用的并存。但从网络性能优化的角度看,各种协议平台和应用版本是由不同厂商开发的,兼容性始终是一个动态适应的过程。没有一种始终能紧密跟踪各种协议平台和应用协议变化、相容和协调的有效方法。从这个意义上讲,多协议工作的冲突是不可避免的。

翻阅六年前网络档案我们发现,该网络多年以前一直使用的是Apple Talk 和Banyan Vines平台协议,当时是请ALP国际公司提供的应用软件并负责安装工程。直到三年前才全部安装启用视窗平台和基于IP协议的新的应用软件,但APL公司的人员没有将老平台卸载,而是简单地停止启动运行。后继的网管人员在交接时因不熟悉这些协议及其用途,没有进行清理。最近的这次的网络升级工程安装调试时根据原先的网管记录和服务器平台的提示重新安装并启动运行了这些软件。询问负责软件安装的网管人员是否了解这些软件的用途,答曰因为在老平台的窗口中一直看见这些软件,其间也曾询问过一直任职的财务经理,证实有用,所以才重新安装之。实则该平台的设置与新的应用软件之间有严重冲突,并同时干扰现行应用软件的有效工作。两台服务器之间一直在互相询问并重新发送无法处理的无效数据包,除了干扰其它协议外,直接的结果就是占用大量的网络带宽,破坏数据的传输和处理,致使网络速度变慢并时常出错。

另外,网络部手里的诊断软件都是基于视窗环境的应用软件,无法观察其它应用的流量。

[诊断建议]协议的无缝互联和互操作是软件开发工程中的难点。实际的应用软件品质并不如开发商所标榜的那样乐观。为了使网络的工作效率达到最佳,网管人员需要经常监测网络协议数量及其工作状态。对于无用的协议要即时清理之。重要网络在协议监测对新出现的协议还要监测其操作过程,查找其来源。因为许多网络在遭到黑客攻击时常会伴随某些新协议的活动。

[后记]经过一周的观察,删除无用协议后网络一直工作正常。其网络部将其它一些无用协议进行了清理,现在的网络速度可以说是非常地“爽”。

案例四:【水晶头损坏引起大型网络故障】

[症状]某大公司规模发展很快,两周前对网络实施了一次比较大的扩容工程,新增加了200台工作站(为新员工配备),网络规模由2000个站点增加到2200个站点,全部在一个网段中。该公司采用100BaseT以太网结构,用两个路由器实现与生产基地和开发基地的连接(新换2个155ATM骨干),以前我曾建议他们将网段划分小一些,以便管理和隔离故障,但因网络未出现什么大的故障,加上公司网络管理员的丰富经验和自信以及维护经费未落实等原因,网络一直保持了这种大型网段的“危险结构”。这次扩容同时将两条广域网骨干链路升级到155ATM,但网段结构仍然未作根本调整,计划留待下期工程时再作打算。本周内网络已多次出现阻塞现象,每天至少两次,每次阻塞时间10~30分钟不等。逐个仔细检查了新安装的200台工作站,没有发现任何问题。由于故障不是持续存在,Boss催得又紧,故令公司网络管理员颇有些“精疲力尽”的感觉。

[诊断过程]上午10:00,打开路由器的MIB库,记录的参数基本正常,网络平均流量13%。其中有约1.5%左右的碰撞,表明网络结构的绝大部分构件是好的。给新增加的200台工作站Share一个软件,然后每40台一组同时下载并操作该软件,结果证明200台工作站工作基本正常。将F683网络测试仪接入网络,同时将F693网络流量分析仪也接入网络进行监测。下午14:21分,网络阻塞现象出现,持续时间15分钟,F693流量分析仪监测的流量正常,平均流量从9%上升到13%,一分钟后下降为8%,但F683网络测试仪的流量报告为84%左右,其中碰撞帧占82%~87%,少量FCS损坏帧(约2%~4%左右)。记录该时间前

后的Protocol Matrix协议对话图谱,发现在15分钟阻塞时间内共有137个工作站曾发送或接收过数据,其中4个工作站一直在持续收发数据,有一个工作站发送的数据包流量一直占其它工作站流量总和的15倍左右。幸好公司网络管理员以前对站点的Mac地址做过文档备案,依据仪器显示的Mac地址我们立即确定了这4个工作站的使用者(流量最大者是财务科陈小姐的地址)。随即询问他们最近有无更动过硬件和网线,有无增删或调整过软件,回答均是“没有”。询问陈小姐刚才在使用何种软件与生产基地的小张联络(Protocol Matrix协议矩阵指示为小张的工作

站)。回答是“机器一直就连在网上,但刚才没有使用计算机”。将网络测试仪连接到陈小姐的台式机网卡接口上,模拟发送流量,结果碰撞随流量的增加而大幅增加。测试该链路的网卡和网线,显示插头为3类插头,链路近端串扰超差比较多。重新更换5类插头后,网络恢复正常。

经过私下再三询问原因,陈小姐才道出了实情。

[诊断评点]本故障是由更换不适当的3类插头引起的。新员工小张是陈小姐的多年不见的同学,也是个网虫。此次与陈小姐在新公司相遇,自然倍感亲切。一周前小张在帮陈小姐安装新声卡时不慎将插头损坏,随意用一个3类插头更换之。临近新年,陈小姐在小张的指点下从网上陆续下载了不少大容量的贺年卡,均为动态电影格式,可以在网络上实时传送播放并加上双方对话,非常有趣。该站点平时使用的财务软件无论是传输速度和数据量都很小(3k左右),对整个网络系统影响不大。但在向小张放送解压后的动态电影贺年卡时数据流量约在3~4Mbps左右。由于网线问题,事后推算传输的数据帧约有13%是有效的,其余均被反射和串绕所破坏须重新发送,表现为网络上大量的碰撞帧和少量的FCS 帧。

[建议]大型网络不划分网段既不便于管理又很难隔离网络故障,此种结构是非常少见的,同时也是非常危险的。该公司网络大部分采用的是集线器,只有很少几台交换机,这对故障隔离也是不利的。另外,一定要对员工进行上机前教育,不能随意增删、更改软件和网络设置。所幸的是公司网络管理员本人经验非常丰富,平时已将文档备案工作做得很细致(国内多数网络在文档备案时不将网卡的Mac地址备案),否则是不可能在半小时内查出本故障,一般来讲,可能会耗费

1~3天左右的时间才行。

[后记]公司网络管理员经过此次“洗礼”,也悟出一点当好IT经理的绝招。至少他已不再认为仅凭经验就可以“打遍天下无敌手”。网络维护是一门艺术,更是一门科学或工程,没有适用的工具和科学的方法是达不到这最高的“艺术境界”的。至于陈小姐,我们还是愿意善意地再为她,也为小张保守一段时间的“秘密”。

案例五:【网线制作不标准,引起干扰,发生错误】

[症状]某证券公司求诊,要求查找错误源。近日股市火爆,新增不少用户,但一周内已经三次出现交易数据错误,数据恢复也进行了三次。虽然涉及的金额不大,与证券交易所的资料核对不上,昨晚对历史记录和当日交易记录进行了比较,发现在同一时刻往往有几个用户的交易数据出错。怀疑存在病毒或恶意用户捣乱的可能,用多套软件查杀病毒,并重新安装系统,恢复备份的数据。不料今日故障现象依旧出现。

[诊断过程]该网络99年2月进行了改扩建,全部采用NT平台。最近又新增家50个站点。根据一般经验,先对新增加的工作站极其联网系统的状况进行常规检查。由于现在已经休市,网上错误无法观察。用流量发生器模拟网上流量进行体能检查,结果如下:正常数据帧下限帧长64Byte各类型帧体能检查,网络致瘫流量为99%,上限帧长1518Byte的致瘫流量为99.5%,错误帧50Byte短帧致瘫流量为90%,错误帧4000Byte超长帧致瘫流量为97%,碰撞最高时为6.4%,略偏高。无新的错误类型出现。从交换机处测试只发现少数传输延迟数据包,以上数据说明,被检查的网络是一个“身体素质”相当好的证券网络。仔细研究发生错误的工作站,发现是在同一个新增用户的集线器组当中,该网段通过一交换机接口与服务器相连。除了对交易服务器和行情服务器分别进行体能检查外,对该网段内的工作站也进行体能检查,各站表现正常。各工作站模拟流量和交易也都正常。可以基本判定,该网络是一个承受能力很强的优秀网络。由此我们怀疑可能存在“恶意用户”(注:恶意用户是指在工作站上安装自备软硬件或将工作站网卡插头拔下并将自带笔记本电脑私自接入的用户,其目的叵测)。为了跟踪数据出错的情况,将F683网络测试仪接入该网段作长期监测。第二天故障现象没有出现。第三天下午开始后10分钟,即13:10分,网络测试仪监测到该网段

大量错误出现,其中FCS帧错误占15%,幻象干扰占85%,约持续了1分钟。FCS帧涉及本网段的3个用户。该证券系统装备有CCTV闭路视频监控系统,从长时录像机中可以发现故障对应时刻13:10有一个用户使用了手机,仔细辨别图像画面发现其使用的是对讲机。

无风不起浪,对讲机的功率比微蜂窝手机的功率要大得多,使用频率也更接近网络基带传输的频带,容易对网络造成近距离辐射干扰。但是,一个合格的、完整的UTP电缆系统在5米外还完全能抵抗不超过5W的辐射功率。从故障现象推断,本网络的电缆或接地系统可能有一些问题。随即决定查找本网段50个站点的布线系统(扩容时没有经过认证测试),用Fluke的DSP2000电缆测试仪进行测试,测试结果全部通过。只在中心集线器与交换机端口的插头发现接头线做得很差,外包皮与接头之间有15厘米的缺失,线缆散开排列,双绞关系被破坏。交换机的物理位置离用户仅隔一面玻璃幕墙,直线距离1.5米左右。可以基本断定,对讲机发出的较大功率的辐射信号就是由此处串入系统的。

重新按TIA568B标准的要求打线,连接好系统。

[诊断评点]出问题的网线接头是扩容施工时的最后一根遗漏的网线,为本部工作人员自己临时增补上的。他们不了解TIA568B所要求的打线标准,乃随意为之。系统中串入干扰的途径有多种,比如大动力线与网线并行距离太近或干脆就在同一个走线槽内;与某些辐射源(包括日光灯、电焊机、对讲机、移动电台等)距离太近;系统设备的接地回路不良等等。本案是由散列的网线接头引入近距离的辐射干扰造成。由于对讲机用户比较特殊,他们的干扰是短时的,查找时有时需要“守株待兔”。当然,如果网线全部经过严格的测试,应该不会出现本例故障。

[诊断建议]建议按标准化的布线环境来设计布线系统,更改系统结构后一定要测试电缆。合格的UTP电缆系统抵抗辐射干扰的能力是很强的,但要求电缆系统必须经过严格的测试(事实上多数布线系统只测试过物理连通性,未做严格认证测试,存在着大量的隐患)。大量的问题都出在不起眼的接头上。建议年检时将布线系统作为年检内容全部检查一遍(也可以以一年或两年为周期平时进行

轮测,测试标准可选用北美标准TIA568A/568B或ISO11801等)。营业室内最好禁止使用大功率对讲机,部分大功率模拟手机也要列入禁用清单。

故障检测中,应重点检查最近动过的或变更过的设备,此为经验之谈。不过,一个有趣的现象是,当你向某个事后证明他确实更改过设置的用户询问时,经常得到的答复却是:没有动过任何东西。

[后记]按约定时间接到了该证券公司的通报,系统已稳定地工作了两周,没有再出现同类问题。施放干扰的用户是一位具有合法使用对讲机权利的公务人员(在此不便披露具体细节),利用工作之便业余炒股,每天会到股市“例行巡查”一番,已接受劝告。

案例六:【插头故障】

[症状]某电信移动计费中心,用户反映,近三个月移动用户总数增加了近30%,但移动计费的营业收入却只增加了5%,怀疑计费系统是不是有问题。从计费服务器查看收费记录,没有发现什么问题。检查计费服务器软件,工作正常。从路由器另一侧的财务服务器检查,内部的财务服务器显示的计费数据与计费服务器的数据没有差错。查找电话局局端记录,发现记录次数超出移动计费的记录次数。最后作实地测试,用移动电话拨打50次,记录次数45次,记录时间与实际通话时间一致的次数为30次。历时一周,还不能确定故障位置。

[诊断过程]计费服务器连接到一台16端口交换机Bay28115的第一插槽5号端口。第6号端口下挂一个100Mbps的以太网,网管机HP Open View也设置在此。打开网管系统,准备观察5号端口的工作情况,这时才发现无法打开5

号端口的工作表数据记录。询问网络管理人员,告知3个月前因交换机故障自行更换过备用的Bay28115交换机,更换后系统工作很正常。查看维护工作记录登记和日志,没有任何关于Bay18115的维护说明,也没有关于网络工作参数的记录(记录上显示的还是系统开通时的原始数据)。询问网管人员为何不设置并打开交换机工作表的Mib。答曰网管系统是一年前安装的,平时只用来看看系统设备是否连接以及是否有报警信号,更多的功能也不会用。前任网络管理员已调任工作岗位,实际上现在已没有人会使用和设置网管系统。由于系统开通是有系统承

包商负责的,自行更换交换机后没有发现什么问题,也没再仔细检查。

用网络测试仪的协议对话分析功能从网管机所在网段观察计费服务器的工作情况,发现服务器对约有1/3的数据包没有回应。为了不影响系统工作,于凌晨3:00在移动用户使用率底的时候用F683网络测试仪模拟服务器测试5号端口,显示链路工作于10Mbps速率(原始记录显示此端口的速度应该是100Mbps)。由于交换机没有启动SNMP支持功能,故临时在5号端口安装了一只10Mbps的集线器与服务器连接,用网络测试仪从这个集线器的任意端口对计费服务器发送数据并观察服务器数据流工作情况。发现大量碰撞和错误的FCS帧,当流量为30%时,碰撞及错误流量占21%。用电缆测试仪检查服务器电缆,发现靠交换器一端的插头处近端串扰NEXT严重超差。重新更换插头并正确打线,碰撞率下降为0.5%,错误率为0%。去掉临时集线器,重新启动交换器的SNMP功能,从交换器某空闲端口向服务器发送流量,用网管系统观察5号计费服务器端口,当流量为40Mbps时,碰撞率、错误率、广播率等参数均表现优良。服务器自适应恢复为100Mbps链路速度。

重新进行两组各50次实际拨打测试,计费数据完全正确。可以基本肯定计费功能已全部恢复正常。

[诊断评点]本次故障的原因非常简单(一个插头问题),但表现出来的现象则稍微复杂一些。该服务器使用的是一个10/100Mbps的自适应以太网卡,设计链路速度为100Mbps。网管人员在更换交换器时曾不小心将插头拉坏,随即更换了接头,但确留下隐患,不过,维护人员并未及时发现速度方面异常。服务器链路此时的实际工作速度已经下降为10Mbps。新交换器没有启动SNMP支持功能,网管系统也就不能观察计费服务器的端口工作状态。在平时的维护工作中,该计费中心的维护人员基本上不用网管系统定期观测并记录网络的工作参数,当故障出现时就不能觉察到服务器工作速度的变化。有趣的是,如果电缆没有问题,即使将链路速度设置为10Mbps,计费服务器应该还是能正常工作的(计费信息的网络流量一般不高)。在本故障中,计费服务器繁忙时由于碰撞率和错误率太高,服务器无法处理一部分数据包,其中已经被“挂号”的部分数据包将被丢弃,造成计费数据不准确。

[诊断建议]布线系统平时要定期轮测(一至两年轮测意义遍)。更换链路元件后一定要对链路进行测试(尤其是100Mbps链路,必须用电缆测试仪测试)。网管系统要指定专人进行维护使用,一般来讲,网管系统可以覆盖约35%左右的网络故障,因此强烈建议重要的网络要安装支持SNMP或RMON协议(多数网络设备都支持SNMP协议,部分支持RMON),启动已有SNMP、RMON等功能的网络设备,否则网管系统将形同虚设。维护工作要求有及时完整的记录,这对提高处理故障的速度是非常必要的。

[后记]经过一个月的运行,收费系统“贡献”了35%的收入额,大喜。

[案例七]5类线Cat5勉强运行千兆以太网

[症状]某期货交易所,网络改造为千兆以太网后只有1个网段能正常工作,其它12个网段工作均不正常,数据时有出错,连接经常会莫名其妙地中断。每个网段用千兆以太网连接起来,下挂的网段均是100Mbps用户端口。起初怀疑是系统运行的平台或者软件有问题,经过多次重新安装和设置仍不能解决问题,而且同样的系统在其它地方的交易网络中应用是正常的。因而转向怀疑是否是布线系统的问题,比如电缆不合格或是有干扰信号串入以及接地系统等方面的问题。每个网段均利用升级前铺设的电缆系统连接起来,未作大的更改。由于计算机网络的布线系统采用的是标准的5类线方案,根据千兆网的设计标准,采用4对线全双工工作,5电平编码,占用的信号物理带宽正好是100MHz,故5类线应该是完全可以胜任的,况且一般情况下期货交易网络现有的流量水平远不能达到满载运行的程度,流量很低。重新用专业电缆测试仪作过严格的认证测试,显示参数合格并且不存在脉冲噪声干扰或接地方面的问题。

所谓能工作的那一个网段是因为行情和交易服务器都安装在该网段中,本网段内的工作站与服务器除了个别站点外都可以上网连接工作,进行行情浏览和交易割接。其它网段内的服务器对内连接时除了个别工作站外也基本正常,共同特点都是不能与行情服务器和交易服务器所在网段实现良好连接。系统升级时原布线电缆全部保留不动,经过测试也全部合格,不知原因何在?

[诊断过程]不能连接的因素很多,象网络硬件设备的功能设置问题、布线系统的问题、操作平台的安装设置问题、应用软件的安装设置和软件冲突方面的问题等等。从用户所反映的情况分析,各个网段内的站点基本上全部能工作,网段之间的连接比较困难,可以初步确定故障出现在网络设备设置和布线系统性能等方面的可能性大一些。

将网络测试仪F68X接入能连接服务器和交易服务器的网段(100Mbps),观察网络流量5分钟平均为12%,FCS帧校验错误帧约11%,碰撞率1.7%(正常范围)。显然FCS帧校验错误比例偏高,查看错误源,显示为其它网段站点产生FCS帧错误的比例占错误帧总量的97%。各网段的错误帧比例差别不大。由于有大量的FCS帧普遍存在,所以各网段内的各站点同时出问题的可能性很小,用

F683向各网段内的服务器或站点发送流量,FCS帧错误随流量增高而迅速增加,各站点或服务器反映基本一致。启动网络测试仪的ICMP Ping功能,统计对各网段内选定的站点和交换机、路由器等的测试结果,表现基本一致,即:ICMP Ping 断层约96%,ICMP Monitor显示目标不可达占91%。改在其它网段内作同样内容的测试,对行情服务器和交易服务器所在网段的路由器和交换机结果基本与前项测试相同。所不同的一点是,对其它网段内的交换机和路由器等网络设备的测试结果显示是正常的,数值为:ICMP Ping断层为0%,全部可以通达,ICMP Monitor目标不可达为0%。基本可以肯定,故障出在行情服务器网段与其它网段的连接链路上。用FLUKE公司的DSP-4000电缆认证测试仪选用TIA Cat5n Channel UTP100标准测试,显示长度为25米,链路测试不合格。其中,回波损耗RL和衰减串扰比ACR等参数超差。改用同样长度的一根超5类线Cat5e代用之,启动系统,除了各网段内个别站点外,整个网络恢复正常。监测高峰时的流量,服务器所在网段最高时平均流量为3%,可见故障时12%的流量主要都来自大量的重发帧流量。

[诊断评点]千兆以太网可以满足网络用户对大带宽应用的“贪婪”胃口,无疑是网络下一步的重点发展方向。千兆以太网的设计者在选用电缆类型时对5类线Cat5已经存在的应用规模考虑比较多,所以选择的物理带宽为100MHz。这样,原则上5类线是可以运行千兆以太网的。但实际的统计结果表明,仍有1%~5%的用户不能上网或连接出现断续和困难。也就是说,千兆以太网对5类线的

参数要求更严格一些。只要用户对5类线布线系统进行过严格的认证测试,可以保证绝大多数的站点是可以联网工作的。少数站点因为某些参数余量小可能有上网困难的现象。影响比较大的参数有综合近端串扰PS NEXT、综合远端串扰PS FEXT、等效远端串扰ELFEXT、综合等效远端串扰PS ELFEXT、回波损耗RL、衰减串扰比ACR等。此时需要对5类线进行Cat5n标准测试,该标准是专为用5

类线运行千兆以太网的用户准备的,如果依循该标准测试都合格,则可以放心地用5类线系统运行千兆以太网。新的Cat5n标准中,回波损耗对系统的影响比较大,并且,由于电缆匹配方面的阻抗不连续问题,越短的电缆链路反而越容易出问题。本例中,由于电缆长度为25米,虽然衰减串扰比ACR参数也不合格,但,回波损耗引起本故障的可能性要大些。

[诊断建议]对5类线的认证测试可以适当考虑选用Cat5n标准进行测试,这样可保运行千兆以太网网时不出问题。如果选用超5类线Cat5e进行布线,则一般不会有不能运行千兆以太网之虞。对用Cat5n标准诊断出来有问题的5类线链路,为了以最小的成本换来网络性能的提高,一个最简单的办法就是用超5

类线Cat5e代换参数不良的个别链路。注意,联结模块最好一并更换,以保证链路的安装质量。

[后记]遵循我们的建议,两周后该期货交易所将全部的安装链路用

DSP-4000电缆测试仪选用TIACat5n标准进行了测试,全部站点数为1300个,不合格链路21个。对不合格的链路改用超5类电缆后所有站点均工作正常,网络状态保持优良(该网络平均流量高峰时才3%)

[案例八]电缆超长,LAN可用,WAN不可用

[症状]今天的病人是某进出口公司,开通DDN专线后部分用户抱怨数据交换的速度变慢,且经常有联结中断的现象。网络支持人员虽经多方查找仍不得要领,故请求网络医院出诊援救。

该公司的网络结构原先是单纯的局域网,分布在三层楼面中,共有300个站点,每个楼层有100个左右的用户。配线间设在最上面一层的楼层中,用交换机将各

楼层共分成三个网段。以前员工均使用拨号上网方式实现与Internet的联结,自我感觉网络速度还比较快,工作一直很正常。新近增加了路由设备,并申请开通了DDN专线。每个楼层用集线器将用户联结起来,结果最低楼层的员工反映有时速度很慢,并常有莫名其妙的中断现象。由于该公司没有配备任何网络监测工具,且在局域网内传输数据不受影响,只在上Internet网时才有麻烦,故直到工程竣工两周后才向网络医院求援。

[诊断过程]该公司的网络为10Base-T局域网,此次只增加了DDN设备和路由器,其它配置基本不变。故将网络测试仪F68X从最低楼层的某个用户端接入网络进行观察,平均流量为1.2%,未发现异常。改用流量发送功能作流量逐级递增的体能测试,也未发现任何异常。表面上看,该网段似乎没有什么问题。为快速定位网络故障,将流量发送到其它网段,同时观察网络状况。随着发送流量的增加,1分钟后发现错误帧,帧类型为FCS错误帧,并指示FCS帧来自第二层的某个用户。显然,只据此现象就判断故障原因为该工作站的网卡损坏或网卡驱动程序错误,似乎显得“证据不足”,因为整个楼层的用户反映的故障现象是相同的。继续观察到5分钟,发现FCS错误帧数量增加为10个用户左右,由此可以断定不是某个工作站的问题。为此,令其它楼层多个用户与故障楼层用户交换数据(比如拷贝文件),结果发现多个FCS帧错误。打开交换机端口工作表观察,本楼层的记录中也显示FCS帧错误,而其它的交换机端口工作表中没有FCS错误记录(交换机为非切发型交换机),这说明是本网段内存在者线缆超长的链路。再试着向Internet某个已知用户发送流量,并且进行ICMP Ping测试,结果发现损失率为90%左右。由于刚才本网段内的体能测试未发现异常,所以只能是集线器与交换机联结的单条链路有问题。测试该电缆,长度指示为175米!超长。

[诊断评点]根据网络规范,以太网为碰撞侦听共享介质方式工作的。每个工作站到集线器的网线长度应不超过100米,方可保障无延迟碰撞(同轴电缆)或FCS帧错误。由于175米超常链路在集线器和交换机之间,所以本网段内的用户在交换数据时可以顺利进行。但与其它网段的用户交换数据时就可能处问题。但由于网络平均流量低,虽然在整个局域网内存在FCS帧错误影响,对低流量局域网内的数据交换而言,其对速度的影响甚微。当同时有多个用户通过DDN进行WAN数据交换时,FCS帧错误将导致64K的出口流量浪费加大。这是因为64K比

10Mbps的速度要低得多,流量中错误帧的比例较高,进入WAN链路时可能要经过多次重发才能实现远程数据交换,感觉网络速度明显变慢。且由于经常有FCS 错误帧,较容易引起WAN链路联结时因错误而中断,综合表现为故障楼层的所有用户都抱怨速度变慢且常中断。

[诊断建议]网络速度低时很多故障现象都将被掩盖起来。建议网络拥有者在新的网络工程结束时应该进行两项验收:网络布线系统现场认证测试和网络验收测试(最起码要作体能测试和加载条件下的逐个工作站的模拟上网测试)。

[后记]一周后该公司重新划分网段施工结束,用户来电报告一切正常。

[案例九]线缆连接错误,误用3类插头,致使网络升级到100BaseTX网络后无法上网

[症状]某船运公司,为满足日益增长的业务需求,三周前开始网络升级改造工程,按设计规划将10BaseT网络全部升级为100BaseTX以太网,电缆系统不作任何改动。昨天设备安装调试工程全部结束,今天凌晨开始网络割接作业。所有工作站更换100BaseTX以网太网卡,然后分批接入网络。此时工程人员发现一些奇怪现象,比如:有些工作站不能联入网络;有些工作站第一次可以联入网络,过一段时间再次连接则无法进入;有的工作站开始时能联入网络并且工作很正常,但过一段时间后则出现连接断续或数据出错的现象。集成商起先以为是网络平台安装不当,遂将系统平台重新清理并安装了一次,出问题的工作站系统软件和应用软件也进行了重新安装,结果毫无改善。“折腾”了将近一整天,也无法为用户提供服务,业务基本中断。

[诊断过程]接到报告后立即赶到“出事地点”,启动包括故障工作站在内的全部系统成员进入网络运行。用F683网络“万用表”对故障网络首先作常规健康测试,一分钟后测试结果如下:网络利用率1.3%(此时员工已经全部下班),碰撞率8%,错误率11%,广播9%。显然网络碰撞率和错误率比较高,打开错误诊断定位功能,显示FCS帧错误、本地碰撞、碎帧等错误计数。这说明网络可

能存在网卡工作失常、电缆系统故障、干扰或接地回路等方面的问题。查看具体的FCS错误帧测试结果,发现有许多工作站发出错误的FCS数据帧。一般来将,同时存在多个网卡失效的故障是不大可能的,此时的FCS帧错误多数由电缆问题尤其是有超长链路的电缆问题所引起而不是由网卡所引起。但为慎重起见,我们先随机抽查其中两张网卡进行测试,结果正常,再测试对应的集线器端口,其物理参数结果正常,工作协议匹配无异。由此则可以有把握地确定故障的原因是由电缆系统的问题引起的。

用户告知,本系统采用的是五类线,共有270台工作站,划分为6个网段,有一个专网路由器和一个公网路由器,升级前一直工作在10BaseT以太网状态,整个系统除了业务一部经常反映网络速度偏慢和偶尔的连接断续外,其它部门使用状况一直很正常(业务一部工作量最大)。今天开始升级工作后部分工作站出现上面提到的各种故障现象,涉及范围大约有近三分之一的工作站。询问用户以前是否对布线系统进行过测试,答曰:“只测试过通断,因为在10BaseT以太网一直能上网,所以布线系统应该不会有问题。”为快速定位故障,随机抽取了其中10条有问题的链路进行测试,结果为:一分二插座故障8个,3类线连接模块3个,综合近端串扰PS NEXT参数不合格4个。检测结论:该系统布线工程存在严重问题。

[诊断评点]网络布线工程的低劣质量一直是综合布线工程中的一个让人担心的严重问题。目前虽然有成熟的测试标准和方法,但多数用户并不知悉或不要求按标准进行现场认证测试。本系统的电缆故障存在多种原因,均是由于工程设计、施工和验收不规范造成。现分述如下:

a)一分二插座故障:系由接线错误所至。用户在设计时没有考虑到扩容的需要,所以在新增用户时采用了这种不规范的一分二插座,一个插座可以连接2个PC机。从原理上讲这种用法是基本上可行的,这种接法要求将1-2/3-6两线对联接一台PC机,而将4-5/7-8两线对联接到另一台PC机上。但实际的测试结果却发现线对接法是1-2/3-6和4-5/3-6,用户把3-6线对当成了直接的“共享媒体检测总线”!!在10BaseT网络中这种错误接法可以勉强工作。虽然这会造成全部网络流量中的数据帧会存在不少错误,但由于多数现存网络的利用率(流量)不高,用户是难于察觉布线中程中的此种异常情况的。100BaseTX网络对阻

抗不匹配和近端串扰比较敏感,升级后这种错误接法会导致上网困难;(注:同轴电缆可以用三通匹配连接器将工作站接入网络,此时阻抗仍保持连续,但双绞线不可以直接并联,否则阻抗异常。)

b)该系统在用户数增加,网线数量不敷使用时网管人员进行了自行扩容,不幸的是他们选用的是假冒的5类插头(实际上是3类插头)。在10BaseT网络3类插头不会影响网络正常运行,但升级后近端串扰NEXT等参数将严重影响工作站与网络连接并经常导致数据出错。不经测试,此3类插头将会长期潜伏而不被发现。

c)由于采用一分二插座,测试电缆的近端串扰指标时必须考虑其它线对的综合影响(非一分二接头的链路多数只使用两对线的网卡),因此,在数据流量大时,综合近端串扰PS NEXT等参数不合格的链路有可能出错或导致工作站连接困难。

[诊断建议]网络投入运行前,布线系统(电缆、光缆)要首先进行认证测试,用户可以选择的标准很多,目前多建议选用TSB-67或ISO11801等国际流行标准进行测试。只测试物理通断后就认为链路肯定可用,这一认识是非常片面的也是非常有害的。采用一分二插座的链路一定要测试综合近端串扰、综合远端串扰等高端参数,最好选择Cat5n标准进行认证测试。为此,我们建议船运公司将全部布线链路连夜进行测试和清理,并对清理后PS NEXT等高端参数仍不合格的链路进行最后标记,以便日后进行更换。

[后记]第二天清晨,测试工作全部结束,共发现连接错误的一分二插座88个(全部接错),误用3类插头54个。在纠正了所有插座故障和误用的3类线插头后,除了少数几条链路外,所有工作站均能投入正常运行。中午时分,中断了一天多的各项业务终于得以全面恢复。随后进行的网络性能评测也基本合格。对于个别高端参数不合格的链路,我们建议网管人员随后更换链路或先暂时取消一分二的连接方式,以保证数据传输的正确性。

[案例十]网线共用,升级100Mbps后干扰服务器

[症状]今天的“病人”是某移动电话公司计费中心。据该中心的网络主管人员介绍,为了缓解移动电话用户解交电话费难的问题,该中心三个月前投巨资对原计费中心的网络进行了调整和升级。与四家被委托代收手机费的银行之间的网络连接速度从标准的64Kbps速率DDN专线全部扩展为E1(2.048Mbps)速率,计费中心网络从10Mbps以太网全部升级为以交换机为主的100Mbps以太网。升级前各委托收费银行经常反映网络连接时常莫名其妙地中断,但一般能迅速恢复,业务妨碍不算大。升级后网络速度提高了很多,但其下辖的各营业网点(共计120个)在为手机用户办理交费收费手续时计算机屏幕上常会提示“网络远端故障,无法提供数据”或“数据传输不稳定,请检查网络”,此时营业网点的收费服务会暂停,用户意见很大。有时虽然还能提供服务,不过数据处理速度明显变慢,最差的时候处理一笔业务查询竟然需要反反覆覆操作5、6分钟(正常时一般在10秒钟以内)。比网络设备升级前反而要慢得多。此故障每星期都要出现1到2次,每次从1小时到2小时不等。由于一直没有查明升级前网络时常中断的真正故障原因,网络管理人员在做此次网络升级规划时曾心存侥幸地寄希望于通过设备升级来彻底排除这些遗留网络故障。遗憾的是,他们的运气实在太差,非但老问题没有解决,反而惹出了更大的新问题。遂向网络医院“挂号”求诊。

[诊断过程]由于银行网和电信计费网不在同一个地方,出了“网络医院”我们需要决定先去哪里?从上述的故障现象初步分析,银行络网和移动通信公司计费中心网络以及其连接的链路都有可能存在问题。计费中心的网络设备和路由设备大部分在此次升级时都更换过,升级后故障依旧存在且表现更严重,基本可以排除新入网设备存在严重问题的可能性。网络测试可以从银行网络和计费网络同时着手。途中从银行各营业厅网络使用者处了解到,手机收费出现“麻烦”时银行的其它业务流程均保持正常,并不受此影响(此时电信计费中心网络的用户也没有反映网络异常)。这说明银行网络存在问题的可能性要比计费网络及其连接链路存在问题的可能性低。而问题出现在手机计费网络和与银行网络的路由设备范围内的可能性比较大,故我们决定先前往设在移动通信公司机房的手机计费网络进行检查测试,首先检查计费网络及其连接链路。

第一次网络测试是在网络没有出现故障时进行的,结果显示各项测试指标都显示网络工作完全正常。将F683网络测试仪接入计费网络的交换路由器,监

服务器网络故障排除的实际案例与解决方案分享

服务器网络故障排除的实际案例与解决方案 分享 近年来,随着互联网的快速发展,服务器网络故障成为了许多企业 面临的一项紧迫问题。本文将分享一些实际案例,并提供一些解决方案,帮助您迅速排除服务器网络故障,确保业务的连续性和稳定性。 案例一:DDoS攻击造成的服务器宕机 在互联网环境中,DDoS攻击是一种常见的网络安全威胁。一家电 商公司就曾遭受了一次规模庞大的DDoS攻击,导致服务器宕机,所 有业务无法正常运行。为了排除故障,技术团队采取了以下措施: 1. 迅速检测攻击:通过实时监测网络流量,技术团队迅速发现了异 常流量的涌入,并确定这是一次DDoS攻击。 2. 提高带宽:为了抵御攻击,技术团队与网络服务提供商紧密合作,临时增加服务器的带宽,以缓解攻击带来的冲击。 3. 过滤恶意流量:技术团队配置了防火墙和入侵检测系统,对恶意 流量进行过滤,并将正常流量导向服务器,保证正常业务的运行。 经过上述措施,电商公司成功排除了服务器网络故障,业务迅速恢 复正常。 案例二:硬件故障导致的服务器宕机

服务器硬件故障也是一种常见的网络故障类型。一家在线游戏公司曾遇到了一次由于硬盘故障引起的服务器宕机。为了快速恢复业务,他们采取了以下解决方案: 1. 及时备份数据:游戏公司定期备份重要数据,确保在出现硬件故障时能够迅速恢复。 2. 更换故障硬件:技术团队迅速识别故障的硬盘,并将其更换为新的硬盘。在更换过程中,保证了其他硬件的正常运行,确保业务的连续性。 3. 数据恢复与测试:经过硬件更换后,技术团队进行了数据恢复和服务器测试,确保服务器能够正常运行,并验证数据的完整性。 通过以上措施,在线游戏公司成功恢复了服务器的运行状态,用户能够继续畅玩游戏。 总结与展望 服务器网络故障是现代企业所面临的一项严峻挑战,但通过科学的解决方案和快速的响应,这些问题是可以得到解决的。在处理服务器网络故障时,我们应该: 1. 实时监测与检测:建立强大的网络监测系统,能够及时发现并识别异常流量和故障。 2. 合作与沟通:与网络服务提供商建立良好的合作关系,共同应对网络故障的挑战。

移动通信维护故障案例集

移动通信维护故障案例集 移动通信维护故障案例集 1:引言 1.1 目的 本文档旨在整理和归纳移动通信维护过程中的各类故障案例, 并提供解决方案,以供维护人员参考和借鉴。 1.2 范围 本文档涵盖了移动通信维护中常见的各类故障案例,包括但不 限于网络问题、硬件故障、软件故障等。 2:案例集 2.1 网络问题 2.1.1 通信中断 案例描述:用户在通话过程中突然无法正常通信,话音中断。 解决方案:检查基站运行状态、网络连接情况,排查故障原因,并及时恢复通信。 2.1.2 数据传输异常

案例描述:用户在使用移动网络时,数据传输速度慢或无法连 接互联网。 解决方案:检查网络信号强度、服务器负载、网络设备是否正 常运行,并进行相应的维护和优化。 2.2 硬件故障 2.2.1 基站故障 案例描述:某个基站无法正常工作,导致通信中断或通信质量 下降。 解决方案:检查基站设备、天线连接、电源等硬件是否正常, 及时修复或更换故障设备。 2.2.2 方式硬件故障 案例描述:用户反映方式存在各类硬件问题,如屏幕黑屏、无 法充电等。 解决方案:为用户提供相应的维修服务,修复或更换故障部件。 2.3 软件故障 2.3.1 系统崩溃 案例描述:方式系统出现崩溃现象,无法正常开机或运行。

解决方案:对方式进行软件重置或系统升级,恢复系统正常运行。 2.3.2 应用程序故障 案例描述:用户反映某个应用程序无法正常使用或运行出错。 解决方案:检查应用程序是否更新至最新版本,清除缓存数据,或重新安装应用程序,解决故障。 3:附件 本文档附带故障案例实际发生时的相关数据、故障处理记录等。 4:法律名词及注释 4.1 法律名词解释 4.2 注释 本文档中使用的法律名词及其解释如下: - 移动通信:指通过无线电信号进行传输的移动方式、移动互 联网等通信方式。 - 维护:指对移动通信设备和网络进行检修、保养、故障处理 等活动。

宽带故障处理案例

宽带故障处理案例:无法上网的家庭用户 背景 某城市的一家宽带运营商,提供宽带服务给家庭用户。在该城市有大量用户使用该运营商的宽带服务。其中,有一个家庭用户报告无法上网的问题。该用户家庭共有4人,都需要使用互联网进行工作和学习。 过程 1.用户报障 –用户通过电话联系运营商的客服中心,向客服人员反映无法上网的问题。 –客服人员记录了用户的姓名、联系方式和住址,并为该用户开立了一份故障工单。 2.故障排查 –运营商将故障工单派发给网络维护团队,由他们负责故障排查。 –网络维护团队首先电话联系了用户,进一步了解情况,并约定了上门维修的时间。 –维修人员按照约定时间到达用户住址,并与用户进行面对面沟通。 –维修人员检查了用户家中的路由器、光猫等设备,并发现所有设备都正常工作。 3.线路检测 –维修人员怀疑是线路出现问题,需要进行线路检测。 –维修人员使用专业的测试仪器对用户家中的宽带线路进行了检测。 –检测结果显示,线路信号强度正常,不存在明显的故障。 4.交换设备 –维修人员决定将用户家中的光猫和路由器更换为新设备,以排除设备故障的可能性。 –新设备安装完成后,维修人员进行了相应的设置和测试。 5.故障解决 –经过更换设备后,用户仍然无法上网。 –维修人员决定联系运营商的网络运维中心,请他们进一步排查问题。 6.网络运维中心介入 –网络运维中心通过远程访问用户家中的网络设备,对其进行了排查和诊断。 –在诊断过程中,发现用户家中使用的路由器固件版本较旧,并且存在一个已知的软件漏洞可能导致无法上网。 7.路由器更新

–网络运维中心向用户提供了新版本的固件,并指导用户如何更新路由器固件。 –用户按照指导进行了固件更新,并重新启动了路由器。 8.故障修复 –经过固件更新和路由器重启后,用户成功连接到了互联网,问题得到了解决。 结果 通过以上的故障处理过程,用户的宽带故障问题最终得到了解决。运营商的客服中心、网络维护团队和网络运维中心共同协作,通过电话沟通、上门维修、线路检测和设备更换等方式,逐步排查并解决了问题。最后,在网络运维中心的指导下,用户成功更新了路由器固件,恢复了上网功能。 这个案例具有代表性和启发性。它展示了宽带故障处理的一般流程,并强调了团队合作和专业知识的重要性。在处理宽带故障时,需要全面考虑各种可能性,并采取适当的措施进行排查和修复。同时,及时与用户沟通并提供有效的解决方案也是非常关键的。

【干货】典型网络故障案例及处理思路

【干货】典型网络故障案例及处理思路 很多朋友经常提到网络故障,其中在交换机组网时常见的故障比较多。为了便于大家排除这些故障,在此介绍一些常见的典型故障案例及处理思路。 故障1:交换机刚加电时网络无法通信 故障现象 交换机刚刚开启的时候无法连接至其他网络,需要等待一段时间才可以。另外,需要使用一段时间之后,访问其他计算机的速度才快,如果有一段时间不使用网络,再访问的时候速度又会慢下来。 故障分析 由于这台交换机是一台可网管交换机,为了避免网络中存在拓扑环,从而导致网络瘫痪,可网管交换机在默认情况下都启用生成树协议。这样即使网络中存在环路,也会只保留一条路径,而自动切断其他链路。所以,当交换机在加电启动的时候,各端口需要依次进入监听、学习和转发状态,这个过程大约需要3~5分钟时间。

如果需要迅速启动交换机,可以在直接连接到计算机的端口上启动“PortFast”,使得该端口立即并且永久转换至转发状态,这样设备可以立即连接到网络,避免端口由监听和学习状态向转发状态过渡而必须的等待时间。 故障解决 如果需要在交换机加电之后迅速实现数据转发,可以禁用扩展树协议,或者将端口设置为PortFast模式。不过需要注意的是,这两种方法虽然省略了端口检测过程,但是一旦网络设备之间产生拓扑环,将导致网络通信瘫痪。 故障2:5口交换机只能使用4口 故障现象 办公室中有4台计算机,但是只有一个信息插座,于是配置了一台5口(其中一口为UpLink端口)交换机。原以为4台计算机刚好与4个接口连接,1个UpLink端口用于连接到局域网,但是接入到网络之后,与UpLink端口相邻的1号口无法正常使用。 故障分析 UpLink 端口不能被看作是一个单独的端口,这是因为它与相邻端口其实就是一个端口,只是适用的连接对象不同而已。借助UpLink端口,集线设备可以使

关于PON网络故障典型案例

关于PON网络故障典型案例 目录 1、华为PON网络典型故障案例 (2) 1.1、B类ONU上行VLAN透传问题 (2) 1.2、ONU参数设置问题 (5) 1.3、B类ONU更换PON口 (8) 2、阿尔卡特PON网络典型故障案例 (13) 2.1、OLT上联口故障 (13) 2.2、ONU端口异常 (20)

1、华为PON网络典型故障案例 1.1、B类ONU上行VLAN透传问题 故障描述:接到电话保障一个B类ONU无法上网,网管检查该ONU 状态正常,(该ONU有两个上联口,尾纤接1口时ONU无法登陆,接2口时ONU正常登陆)业务配置正常,ONU上能识别到网口下带电脑的MAC地址,但在OLT上查询不到该MAC地址。 故障诊断:定位及处理过程: 1、检查该B类ONU状态正常,无任何异常告警。 2、与现场核对CVLAN,SVLAN与网管上配置一致,检查OLT上service port、线路模板配置正常,检查ONU上service port,以太网端口设置均正常。 3、联系现场,把手提电脑接到对应的网口上,长PING网关。在网管上,进入ONU的命令行,观察该手提的MAC地址能透传上ONU。 4、进入OLT的命令行,查询不到该MAC地址。 5、双击ONU进入网元管理器,检查VLAN是从0/0/1口透传到OLT 的,而状态正常且在用的是0/0/2口,于是把0/0/2口增加到VLAN 的端口列表中。 6、进入OLT的命令行能够查询到该MAC地址,现场反馈业务正常。 分析情况: 1、display mac_address port 0/1/1 查看ONU能否获取手提上的

数据中心常见故障案例集

数据中心常见故障案例集 数据中心作为现代企业信息系统的重要基础设施,承载着海量的数据和关键业务运行,一旦发生故障将会给企业带来严重损失。本文将从网络故障、电力故障和硬件故障三个方面,为大家介绍几个数据中心常见的故障案例。 一、网络故障 1. 网络链路故障 某一天,某企业的数据中心突然无法正常访问互联网,经过排查发现是网络链路出现了故障。原来,由于网络供应商的设备故障导致传输链路中断,数据中心失去了与外部网络的连接。解决办法是及时与供应商联系并要求其尽快修复设备,同时在故障发生期间采取临时措施保障业务的正常运行。 2. DNS故障 DNS(域名系统)是数据中心中非常重要的组件之一,负责将域名转化为 IP 地址,使用户能够访问互联网。某企业的数据中心发生了DNS 故障,导致用户无法通过域名访问到企业的网站。故障的原因可以是 DNS 服务器的配置错误或者是 DNS 服务器被攻击。解决方法可以是检查 DNS 服务器的配置并进行修正,并采取一些安全措施保护DNS 服务器免受攻击。 二、电力故障

1. 电力供应中断 在数据中心中,电力是最基础的能源,一旦电力供应中断将会导致 整个数据中心的停机。某企业的数据中心曾经遭遇到过电力供应中断 的情况,由于电力供应商的设备故障,数据中心停止了运行。为了解 决这个问题,企业采取了多项措施,如与电力供应商签订备用电力供 应协议、购买UPS(不间断电源)设备等,以保障数据中心的稳定运行。 2. 电力过载 电力过载是指数据中心的用电负荷超过了电力供应的负荷承受能力。一旦发生电力过载,数据中心将出现电力供应不足、机房设备故障等 问题。某企业的数据中心发生了电力过载故障,导致机房中的部分设 备无法正常运行。为了解决这个问题,企业对机房的用电负荷进行了 评估并采取了相应的措施,如增加电源容量、优化机房设备布局等, 以确保数据中心的稳定运行。 三、硬件故障 1. 服务器故障 作为数据中心的核心设备,服务器的故障将直接影响到业务的正常 运行。某企业的数据中心曾经遇到过服务器故障的情况,导致部分业 务中断。为了解决这个问题,企业采取了一系列措施,如服务器备份 和冗余、定期维护和更新等,以降低服务器故障的风险。 2. 存储设备故障

网络故障诊断案例

网络故障诊断的原则 网络与路由器概述 网络诊断是一门综合性技术,涉及网络技术的各个面。为方便下面的讨论,首先简单回顾一下网络和路由器的基本概念。 计算机网络 是由计算机集合加通信设施组成的系统,即利用各种通信手段,把地理上分散的计算机连在一起,达到相互通信而且共享软件、硬件和数据等资源的系统。计算机网络按其计算机分布范围通常被分为局域网和广域网。局域网覆盖地理范围较小,一般在数米到数十公里之间。广域网覆盖地理范围较大,如校园、城市之间、乃至全球。计算机网络的发展,导致网络之间各种形式的连接。采用统一协议实现不同网络的互连,使互联网络很容易得到扩展。因特网就是用这种方式完成网络之间联结的网络。因特网采用TCP/IP协议作为通信协议,将世界范围内计算机网络连接在一起,成为当今世界最大的和最流行的国际性网络。为了完成计算机间的通信,把每部计算机互连的功能划分成定义明确的层次,规定了同层进程通信的协议及相邻层之间的接口和服务,将这些

层、同层进程通信的协议及相邻层之间的接口统称为网络体系结构。国际标准化组织(ISO)提出的开放系统互连参考模型(OSI)是当代计算机网络技术体系的核心。该模型将网络功能划分为7个层次:物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。 TCP/IP即传输控制协议和网间互联协议是一组网络协议。TCP/IP起源于美国ARP ANET网,发展至今已成为因特网使用的标准通信协议。使用TCP/IP能够使采用不同操作系统的计算机以有序的方式交换数据。路由器是一种网络设备,是用于网络连接、执行路由选择任务的专用计算机。路由器工作于网络层,对信包转发,并具有过滤功能。路由器能够将使用不同技术的两个网络互连起来,能够在多种类型的网络之间(局域网或广域网)建立网络连接。它将处在七层模型中的网络层的信息,根据最快、最直接的路由原理从一个网络的网络层传输到另一个网络的网络层,以达到最佳路由选择。同时在内部使用高档微处理器,用高速的内部总线连接适合各种网络协议的接口卡。并具有多种网管功能,能监视与路由器相连接的一些网络设备和它们的配置运行情况。

最全的网络故障案例分析及解决方案

第一部:网络经脉篇2 [故事之一]三类线仿冒5类线,加上网卡出错,升级后比升级前速度反而慢2 [故事之二]UPS电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错4 [故事之三]光纤链路造侵蚀损坏6 [故事之四]水晶头损坏引起大型网络故障7 [故事之五] 雏菊链效应引起得网络不能进行数据交换9 [故事之六]网线制作不标准,引起干扰,发生错误11 [故事之七]插头故障13 [故事之八]5类线Cat5勉强运行千兆以太网15 [故事之九]电缆超长,LAN可用,WAN不可用17 [故事之十]线缆连接错误,误用3类插头,致使网络升级到100BaseTX网络后无法上网18 [故事之十一]网线共用,升级100Mbps后干扰服务器21 [故事之十二]电梯动力线干扰,占用带宽,整个楼层速度降低24 [故事之十三]“水漫金山”,始发现用错光纤接头类型,网络不能联通27 [故事之十四]千兆网升级工程,主服务器不可用,自制跳线RL参数不合格29 [故事之十五]用错链路器件,超五类线系统工程验收,合格率仅76%32 [故事之十六]六类线作跳线,打线错误造成100M链路高额碰撞,速度缓慢,验收余量达不到合同规定的40%;34 [故事之十七]六类线工艺要求高,一次验收合格率仅80%36 第二部:网络脏腑篇39 [故事之一] 服务器网卡损坏引起广播风暴39 [故事之二]交换机软故障:电路板接触不良41 [故事之三]防火墙设置错误,合法用户进入受限44 [故事之四]路由器工作不稳定,自生垃圾太多,通道受阻47 [故事之五]PC机开关电源故障,导致网卡工作不正常,干扰系统运行49 [故事之六]私自运行Proxy发生冲突,服务器响应速度“变慢”,网虫太“勤快” 52 [故事之七]供电质量差,路由器工作不稳定,造成路由漂移和备份路由器拥塞54 [故事之八]中心DNS服务器主板“失常”,占用带宽资源并攻击其它子网的服务器57 [故事之九]网卡故障,用户变“狂人”,网络运行速度变慢60 [故事之十]PC机网卡故障,攻击服务器,速度下降62 [故事之十一]多协议使用,设置不良,服务器超流量工作65 [故事之十二]交换机设置不良,加之雏菊链效应和接头问题,100M升级失败67 [故事之十三]交换机端口低效,不能全部识别数据包,访问速度慢70 [故事之十四]服务器、交换机、工作站工作状态不匹配,访问速度慢72 第三部:网络免疫篇75 [故事之一]网络黑客程序激活,内部服务器攻击路由器,封闭网络75 [故事之二]局域网最常见十大错误及解决(转载)78 [故事之三] 浅谈局域网故障排除81 网络医院的故事 时间:2003/04/24 10:03am来源:sliuy0 整理人:蓝天(QQ:12015152) [引言]网络正以空前的速度走进我们每个人的生活。网络的规模越来越大,结构越来越复杂,新的设备越来越多。一个正常工作的网络给人们带来方便和快捷是不言而喻的,但一个带病

桌面运维典型案例

桌面运维典型案例 案例:网络故障的快速响应与解决 背景:ABC企业是一家大型科技公司,拥有上千台桌面设备,运行着多个关键业务系统。作为公司的运维工程师之一,张先生负责保障员工的办公环境,并确保系统的稳定 性。 问题描述:某天早上,ABC公司的办公室网络突然发生故障,许多员工无法正常连接 到内部系统和互联网。员工线上办公势必会受到严重影响,因此张先生迅速行动。 响应措施: 1. 确定问题范围:张先生首先向网络部门了解是否有网络异常的报告,是否存在计 划维护或硬件设备故障等。网络部门确认没有预计的维护工作,则故障来源可能是硬件故障。 2. 排查硬件故障:张先生立即前往机房检查核心网络设备。通过观察发现,核心交 换机的指示灯出现异常状态,确认其存在故障。他尝试重新启动交换机,但问题依然存在。考虑到时间紧迫,他决定启用备份设备进行快速替换。 3. 做好替换准备:张先生迅速查找备份设备,并配置好相关网络设置,确保能够在 最短时间内替换故障设备。 4. 紧急替换:张先生与网络部门合作,组织一个快速但受控的设备替换计划。他们 事先通知了员工可能会遇到短暂的网络中断,并鼓励他们备份重要工作和文件以防万一。 5. 故障排除与测试:完成设备替换后,张先生与网络团队一起验证新设备的配置和 网络连接是否正常。他们对各个部门的代表进行了测试,确保大多数员工能够正常运行。 6. 恢复工作:张先生向员工们反馈网络故障的原因和维修过程,并鼓励他们测试各 个系统和应用以确认一切正常。 结论: 张先生在该案例中展示了快速响应和决策的能力,通过合理的故障排查和备份设备的 替换,成功解决了网络故障,最大程度地减少了员工的工作中断时间。在这次事件中,他 展现了优秀的桌面运维技能,并与团队紧密协作以确保业务的持续正常运行。

常见网络故障实例及解决方案

常见网络故障实例及解决方案 网络故障是指在计算机网络中出现的各种异常情况,可能导致网络信 号中断、数据传输失败、网络速度缓慢等问题。以下是一些常见的网络故 障实例及其解决方案。 1.网络连接中断:当网络连接中断时,无法访问互联网或局域网。解 决此问题的方法包括: -检查网线是否插好,并确保网线没有被损坏。 -检查无线网络状况,确定无线网络是否工作正常。 -重启路由器和调制解调器,以恢复网络连接。 -确保路由器没有被过多连接设备拖慢速度。 -重启路由器,以清除缓存并恢复网络速度。 3.无法访问特定网站:当无法访问特定网站时,可能是因为网站服务 器故障或本地网络设置问题。解决此问题的方法包括: -检查其他设备是否可以正常访问该网站,如果可以,则可能是本地 设备的问题。 - 清除浏览器缓存和 cookie,尝试刷新网页或使用其他浏览器访问。 -检查网络代理设置,确保没有设置不当导致无法访问该网站。 4.IP地址冲突:当多个设备同时使用相同的IP地址时,会导致网络 故障。解决此问题的方法包括:

-检查设备是否设置为自动获取IP地址,避免手动设置相同的IP地址。 -重启路由器,以重新分配IP地址或释放占用的IP地址。 5.DNS解析失败:当无法解析域名时,无法访问互联网或特定网站。解决此问题的方法包括: -检查本地DNS设置,确保正确配置了DNS服务器。 - 使用公共 DNS 服务器,如 Google DNS 或 Cloudflare DNS,以避免 ISP 的 DNS 问题。 6.网络安全问题:网络故障也可能是由于网络安全问题引起的,如病毒、入侵等。解决此问题的方法包括: -安装杀毒软件和防火墙,保护计算机免受恶意软件和网络入侵。 -定期更新操作系统和软件,以修复已知的安全漏洞。

安徽移动家庭宽带故障处理案例汇总

精心整理安徽移动家庭宽带故障处理 案例汇编 17、广电合作宽带用户拨号691的故障处理. 18、拨号错误678和691的故障处理.......................................错误!未指定书签。 第五节应用类故障............................................................................错误!未指定书签。 19、网页打不开和无法玩游戏的故障处理...............................错误!未指定书签。 20、频繁掉线和网速慢的故障处理...........................................错误!未指定书签。 21、网络游戏慢的故障处理 ......................................................错误!未指定书签。 第二章线路类故障....................................................................................错误!未指定书签。 第一节光缆类故障............................................................................错误!未指定书签。 22、线路光衰过大导致网速慢的故障处理...............................错误!未指定书签。 23、光衰过大导致用户拨号678 ...............................................错误!未指定书签。 24、光路误码率高导致用户频繁678故障...............................错误!未指定书签。

路由器故障典型案例分析

路由器故障1:不堪重负,路由器外网口关闭 1、网络环境 某单位使用的是Cisco路由器,租用电信30MB做本地接入和l0MB教育网双线路上网,两年来网络运行稳定,路由器也没有发生故障。随着网络用户数量增加,原来电信30MB已不能满足需要,于是决定租用电信1OOMB来解决带宽问题。电信采用光纤接入到单位机房后,使用百兆光电转换器经转换后通过双绞线接到路由器外网口上面,该路由器使用是千兆电口作为外网口,由于光电转换器只有1O0MB,该端口连接后速度显示100MB。 2、外网端口流量为零 经过几天的运行,管理员发现每天当路由器外网口流量超过50Mbps/s后,该端口就会出现“Receive Errors” ,流量超大,错误信息很多。突然有一天,出现外网不能上了,Telnet到路由器上面,发现电信对应的外网口没有流量,显示状态为UP,路由器上其他端口工作正常。第一反映是电信的那边出现问题了,是电话通知电信那边查检一下,对方很快回应说没有什么问题,并询问是否光电转换器死机了。于是管理员将光电转换器重启后,故障依然。没有办法,只好将路由器重启一下,故障排除。谁知,过了不到一个小时,故障又重现。Telnet到路由器后将该外网口执行shutdown 和undo shutdown后,故障排除。谁知,将所有有关病毒的安全策略应用到该端口,将tcp mss修改为2048(厂商默认1460),故障依然出现。 3、故障分析 管理员发现在故障发生时,CPU显示23%,Memory为33%,不算太高,关键是其他接口都正常工作,看样子问题还是出现在这个端口上面。可这个端口已用了两年了,升级扩容以前没有出现端口不能正常通讯的情况,端口硬件应该是有什么问题。通过网管软件对端口关闭前的流量检测,发现该端口关闭前有很大的流量通过(超过80Mbps/s) ,显示端口的错误信息也比较多。通过分析得知应该是网络流量太大,利用率过高所致。流量超过80%后,造成端口不能正常。如果该端口能工作千兆模式下,100MB带宽仅利用该端口10%,这样端口可以轻松处理。 4、解决方案 在找到症结后,推荐的解决方案是购买千兆光电转换器代替原来的百兆设备,而且价格也比较便宜。但为了保证网络运行的稳定性,该单位决定直接购买一个千兆光口路由模块,直接利用光纤进行通讯,减少网络延时。电信则通过端口限速来控制保证提供百兆带宽。通过一段时间运行,发现该端口除了有少量错误信息外,再没有出现过端口无故关闭情况。 路由器故障2:路由器为何发包失败 在路由器的配置过程中,经常会碰到这样的问题:网络通信正常,路由器可以成功路由数据包到目标网络,但是从路由器发的数据包却传送失败,故障表现为路由器ping目标网络失败,下面就是一个典型的案例。 (1).现象描述 某单位的网络配置完成后,管理员在测试网络连通性时发现:从PC机(6.159.245.195) 向目标网络 (6.159.245.65/26)发送Ping时,路由器R1可以成功转发数据包,然而从R1向目标网络(6.159.245.65/26) 发送ping时,出现ping失败。 (2).排错过程

企业IT网络常见故障案例分析

企业IT网络常见故障案例分析 随着信息技术的不断发展,企业IT网络已经成为企业运营的重要基 础设施。然而,由于网络系统的复杂性和规模,网络故障仍然是企业IT 运维工作中常见的问题之一、本文将分析企业IT网络常见故障案例,并 探讨解决策略。 一、网络连接故障 网络连接故障是企业IT网络中最常见的问题之一、该问题通常由以 下原因引起:网络线路故障、设备故障、网络配置错误等。一旦发生连接 故障,企业内部的通信和对外部的连通性都会受到影响。 解决策略: 1.检查网络线路连接是否正常,确保连接丝插好且紧固。 2.检查设备是否正常工作,例如路由器、交换机、网卡等设备的指示 灯是否正常。 3.检查网络配置,如IP地址、子网掩码、网关等是否正确设置。 4. 使用网络故障诊断工具(例如ping命令)检测网络连接是否正常,并根据诊断结果进行相应的调整。 二、网络速度慢 解决策略: 1.分析网络流量,找出网络拥堵的瓶颈。可以使用网络监控工具来检 测哪些设备或应用程序占用了大量的带宽。

2.扩大带宽,以满足企业的网络需求。可以与网络服务提供商协商, 购买更高带宽的网络连接。 3.升级设备,如路由器、交换机等,以提供更高的性能。可以通过更 换设备或优化设备配置来提升网络速度。 4.对网络流量进行优化,如使用流量控制措施、调整网络访问策略等。 三、网络安全问题 随着网络攻击的增多,企业IT网络的安全问题变得越来越重要。网 络安全问题包括入侵、数据泄露、恶意软件等。一旦出现安全问题,企业 的商业机密和数据资产都会受到严重威胁。 解决策略: 1.设置防火墙和入侵检测系统,对网络入侵进行实时监控和防护。 2.加强对网络设备的管理和配置,及时修复设备的安全漏洞,并保持 设备软件的更新。 3.加强员工网络安全培训,增强员工的网络安全意识,防止社会工程 学攻击和网络钓鱼等形式的攻击。 4.定期备份企业数据,并设置访问控制和加密措施,确保数据的安全 存储和传输。 四、移动设备接入问题 随着移动设备的普及,员工使用移动设备接入企业网络的情况也越来 越多。然而,由于移动设备的多样性和复杂性,移动设备接入问题也成为 企业IT网络的一个重要难题。

安徽移动家庭宽带故障处理案例汇编

安徽移动家庭宽带故障处理案例汇编

目录 概述 (4) 第一章用户端类故障 (5) 第一节网卡类故障 (5) 1、网卡MAC地址问题导致拨号错误676 (5) 2、用户网卡驱动未安装导致拨号错误代码645 (6) 3、网卡禁用及网线故障的处理 (6) 4、用户网卡适配模式导致拨号不成功的故障处理 (7) 第二节软件类故障 (8) 5、客户端电脑软件安装问题导致网速慢 (8) 6、宽带拨号错误代码676的故障处理 (9) 7、电脑上观看网站视频时反复回退的故障处理 (10) 8、电脑配置低导致网速慢的故障处理 (10) 9、网页无法打开的故障处理 (11) 10、游戏无法登陆的故障处理 (11) 第三节外接设备类故障 (12) 11、用户使用路由器上网导致拨号错误678 (12) 第四节账号类故障 (13) 12、用户反映账号无法使用的故障处理 (13) 13、宽带上网“691”故障处理 (14) 14、拨号错误691的故障处理 (14) 15、客户忘记宽带密码的故障处理 (15) 16、用户欠费导致拨号错误691 (15) 17、广电合作宽带用户拨号691的故障处理 (16) 18、拨号错误678和691的故障处理 (16) 第五节应用类故障 (17) 19、网页打不开和无法玩游戏的故障处理 (17) 20、频繁掉线和网速慢的故障处理 (17) 21、网络游戏慢的故障处理 (18) 第二章线路类故障 (19) 第一节光缆类故障 (19) 22、线路光衰过大导致网速慢的故障处理 (19) 23、光衰过大导致用户拨号678 (20) 24、光路误码率高导致用户频繁678故障 (20) 25、冷接子污染导致拨号678的故障处理 (21) 26、分支光纤长度过大导致ONU无法注册的故障处理 (21) 27、冷接头损坏导致拨号不成功的故障处理 (22) 28、光信号过强导致拔号错误678的故障处理 (23) 29、光纤弯曲直径过小导致上网频繁掉线的故障处理 (24) 30、主干光纤中断导致拨号678错误 (25) 31、ONT光衰正常但在网管上无法注册的故障处理 (26) 32、皮线光缆损坏导致无法上网的故障处理 (26)

蚌埠分公司装维故障案例

蚌埠分公司装维故障案例 蚌埠分公司装维故障案例 一、案例背景 蚌埠分公司是一家大型通信公司的下属分公司,负责该地区的装维工作。近期,该分公司接到多起用户报修电话,投诉光纤宽带速度慢、网络不稳定等问题。为了解决这些问题,分公司决定对相关故障进行调查和排查。 二、故障调查与分析 1. 网络线路故障 在开始排查故障之前,分公司首先请专业人员对局部网络线路进行了检测。经过检验,发现在某一地区的网络线路存在问题,可能是导致用户网络不稳定的原因之一。 2. 光纤设备故障 除了网络线路问题外,分公司还怀疑光纤设备可能出现故障,从而导致用户上传下载速度慢。为了确认这一点,分公司找到了相关设备的供应商进行故障排查。 经过一番检查,供应商发现设备中的某一部分元件出现了故障,影响了设备的正常工作。供应商对故障元件进行更换后,设备恢复了正常。

3. 用户设备问题 除了线路和设备问题外,分公司还怀疑部分用户的设备可能存在问题,从而导致用户体验不佳。为了验证这一点,分公司对一些用户设备进行了检查。 结果发现,部分用户的设备存在过多的缓存文件,导致设备运行缓慢。分公司告知用户清理缓存文件的方法,并提供了相应的指导。 三、故障解决与改进 基于上述故障调查与分析的结果,蚌埠分公司采取了以下解决方案: 1. 网络线路故障的解决 分公司与运营商合作,对存在问题的网络线路进行了维修和调整。确保用户网络连接的稳定性。 2. 光纤设备故障的解决 供应商对故障设备进行了更换和维修,确保设备正常运行。 3. 用户设备问题的解决 分公司向用户提供了设备优化的建议,包括清理缓存、关闭无

用应用等。并提供了后续技术支持和指导。 四、效果评估与总结 经过以上解决方案的实施,蚌埠分公司收到的用户投诉明显减少,网络速度和稳定性得到了明显的提升。 此次故障排查过程中,蚌埠分公司对线路故障、光纤设备故障以及用户设备问题进行了全面的分析和解决。通过与供应商合作,并向用户提供技术支持和指导,最终解决了用户的问题。 总结起来,故障排查过程中的关键在于全面分析和解决问题的方法。只有通过深入的研究和全面的解决方案,才能真正解决用户的问题,提升用户体验。蚌埠分公司将继续以用户满意度为核心,不断改进和提升服务质量,为用户提供更稳定、更快速的网络服务。

网络故障案例手册

网络故障案例手册

目录 案例编号 .....................................................错误!未定义书签。 交换机硬件故障引起网络中断................................错误!未定义书签。 典型症状..................................................错误!未定义书签。 其它现象..................................................错误!未定义书签。 处置方法..................................................错误!未定义书签。 案例具体原因..............................................错误!未定义书签。 扩展......................................................错误!未定义书签。案例编号 .....................................................错误!未定义书签。 症状......................................................错误!未定义书签。 处置方法..................................................错误!未定义书签。 处置结果..................................................错误!未定义书签。 扩展......................................................错误!未定义书签。案例编号 .....................................................错误!未定义书签。 症状......................................................错误!未定义书签。 处置方法..................................................错误!未定义书签。 处置结果..................................................错误!未定义书签。 扩展......................................................错误!未定义书签。案例编号 .....................................................错误!未定义书签。 症状......................................................错误!未定义书签。 处置方法..................................................错误!未定义书签。

PING大包丢包网络故障分析案例解决方案

PING大包丢包网络故障分析案例解决方案网络故障是在使用网络过程中经常会出现的问题,其中大包丢包是一 种常见的网络故障。大包丢包指的是在网络传输过程中,发生了传输较大 包的数据丢失的情况。接下来我将进行一个关于大包丢包的网络故障分析 案例,并提供相应的解决方案。 案例分析: 公司A部门反馈在办公网络中使用视频会议时,经常出现画面卡顿和 断流的问题。在进行网络故障排查的过程中,发现了存在大包丢包的情况。问题分析: 大包丢包会导致网络传输不稳定,影响视频会议等带宽需求较高的应用。造成大包丢包的原因主要有以下几点: 1.网络拥塞:当网络带宽使用过高时,可能会造成网络拥塞,从而引 发大包丢包问题。 2.路由器配置错误:路由器可能会存在配置错误,导致无法正确转发 大包数据,从而引发大包丢包问题。 3.网络设备故障:路由器、交换机等网络设备可能存在故障,导致无 法有效处理网络数据,从而引发大包丢包问题。 解决方案: 针对以上问题,可以采取以下解决方案:

1.网络监控与优化:通过网络监控工具对网络流量进行实时监控,及 时发现网络拥塞问题。在网络拥塞时,可以考虑对网络带宽进行扩容,以 保证网络的稳定性。 2.检查路由器配置:对路由器进行检查,确保其配置正确。可以参考 厂商提供的配置文档,根据网络需求合理设置路由器参数。同时,也可以 考虑升级路由器固件,以确保设备的正常工作。 3.检查网络设备故障:定期对网络设备进行巡检,发现故障及时进行 修复或更换。例如,使用专业的网络测试工具对路由器、交换机等设备进 行故障检测,确保其正常运行。 4.优化网络拓扑:对网络拓扑结构进行优化,确保网络中的数据传输 路径短且流畅。通过优化网络拓扑,可以减少数据传输的时延,从而降低 大包丢包的发生概率。 5.加强网络安全:网络安全问题也可能导致大包丢包问题。加强网络 安全措施,防范网络攻击与入侵。例如,使用防火墙、入侵检测系统等安 全设备,对网络数据进行过滤和监测。 总结: 大包丢包是一种常见的网络故障,可能会对网络传输稳定性产生严重 影响。在面对大包丢包问题时,可以通过网络监控与优化、检查设备配置、修复设备故障、优化网络拓扑和加强网络安全等方法来进行解决。通过合 理的网络规划与优化,可以减少大包丢包的发生概率,提高网络传输质量。

传输网告警故障典型案例

本地传输网故障告警典型案例 光缆线路中断导致业务全阻 系统概述 某局本地传输网采用ZXSM-150/600/2500设备组网,整个网络由5端 ZXSM-150/600/2500网元组成,构成一个通道保护环带链的结构,环一上 的传输速率是2.5Gbit/s,F到C的链上的传输速率是622Mbit/s,B和D 的链上的传输速率是155Mbit/s。网络结构如图6-1所示。中心局设在E 网元,网管终端放在中心局。 图6-1 案例1网络结构图 链上光纤连接关系如下:F网元的27#OL4接A网元7#OL4,A网元的10#OL4接B网元7#OL4,B网元的10#OL4接C网元7#OL4,B网元的13#OL1接D网元7#OL1。 所有其他网元均只和E网元有业务配置,A到E的业务使用链上的1#AU,B到E的业务使用链上的2#AU,C到E的业务使用链上的3#AU,D到E的业务使用链上的4#AU。网元A 设置为内时钟,其余网元通过S1使用双向提取线路时钟。 故障现象描述 A,B,C,D到E的业务全部中断,通过网管采集告警发现,F网元的27#OL4上有“622M 接收信号丢失”,A网元的7#OL4上有“622M接收信号丢失”,7#和10#OL4上有1~4#AU 的“AU通道告警指示信号”、“不可用时间开始”等告警。B,C,D网元的光板上有相关AU的“AU通道告警指示信号”、“不可用时间开始”等告警。A网元和F网元间有B1/B2/B3 UAS性能指示。

故障分析 由于有再生段和复用段等高级别的告警和B1/B2性能,首先必须排除光路上的故障和外部光缆线路的因素。通过上面的告警指示可以知道,A和F都没有收到光信号。故障在A和F 之间,由于A和F光板同时产生故障的可能性比较小,因此外部光缆线路等因素导致上述故障的可能性比较大。 故障定位和排除步骤 采用光功率指标测试法:到网元F所在机房,用光功率计从27#光板输入口、ODF的收光法兰连接、ODF上光缆成端的法兰连接,逐级测量光接口的功率。光功率计上均为收无光率指示。测试27#光板的发口光功率,为-2.15dBm,由于F和A距离25km,采用L4.1的光板连接,测试值在发送指标范围内。然后联系网元A所在机房,使用光功率计做类似测试,收光测试结果相同,7#OL4发口光功率,为-1.85dBm。于是确认是外部光缆线路中断,通知局方处理。并配合局方调度中断的业务到其他设备和线路上。 进一步的工作:必须确认A网元7#OL4和F网元的27#OL4收口良好。采用尾纤自环的办法将光板的收口和发口自环,但必须保证光板收口接收从尾纤过来的光功率在指标范围内。此时如果该网元指示“622M接收信号丢失”告警消失,证明该光板收口良好。 通过局方检查确认光缆线路由于工程施工被挖断,熔接处理后光缆恢复正常。在网元A和F 测试收口光功率正常后,将光板上的尾纤接回,光路正常,告警消失。 注意:因为局方处理外部光缆线路故障要使用OTDR(光时域反射计),验证A和F光板收发接口良好后,必须将光板上的收发尾纤拔掉,避免OTDR发出的强光功率损伤光板上的光器件。 设备温度过高导致B2误码 系统概述 某局本地传输网采用ZXSM-150/600/2500系统组网,整个网络由2端 ZXSM-150/600/2500网元组成,传输速率是2.5Gbit/s。采用点对点无保护 链形组网,网络结构如图6-2所示。中心局设在B网元,网管终端放在 中心局。 图6-2 案例2网络结构图 光纤连接关系如下:A网元的5#OI16接B网元5#OI16。A网元和B网元的业务配置使用全部16个AU资源。网元B设置为外时钟,网元A提取线路时钟。

相关主题
相关文档
最新文档