网络可靠性优化

网络可靠性优化
网络可靠性优化

网络可靠性优化方法总结

概述:目前较流行的智能优化方法包括遗传算法以及群智能算法。这两种优化算法的共同特点就是模拟生物行为方式,进行全局随机搜索,在单目标或多目标问题中找到最优解。应用到网络中比如用于网络路由的自适应调整,解决QoS 组播路由问题,在费用最低情况下求解使整个网络可靠性最有拓扑等等

遗传算法(GA)

遗传算法 (GA)是一种借鉴生物界自然选择思想和遗传机制的全局随机搜索算法。它把问题的可能解组成种群,把每一个可能解看作种群的个体,运行时,算法在整个种群空间内随机搜索,按一定的评估策略对每一个体进行评价,不断使用选择、交叉、变异这3种遗传算子,使问题的解不断进化,直至产生最优解。

GA基本内容包括编码结构、种群初始化、选择操作、遗传操作(交叉和变异)、目标函数以及适应度函数设计、终止条件选择等。其中,选择、交叉和变异三种操作是遗传算法的核心,选择操作是根据父代中个体适应度函数值大小进行选择或淘汰,保证了算法的最优搜索方向;交叉操作是产生新个体的主要方法,它决定GA的全局搜索能力;变异操作是产生新个体的辅助方法,它决定GA的局部搜索能力。

GA控制参数主要包括:种群规模、交叉率、变异率以及其它一些GA参数(如最大迭代次数等)。GA参数的选择对于算法的最终优化效果至关重要,目前,多以大量试验测试的方法来确定这些参数。

(1) 编码。

?遗传算法不能直接处理解空间的数据,因此需要通过编码把问题的解表示成遗传空间里的染色体。

(2) 群体初始化。

?需要考虑两个问题:

?1、群体的规模

?2、群体个体产生方法:

? (a) 在遗传空间中直接产生,即在遗传空间中随机地产生染色体。

? (b)编码产生。

(3)适应度评估

?选择操作是以染色体的适应度为依据进行的,适应度通过适应度函数计算得到。染色体的适应度应该要能准确地描述染色体所对应的解的性能好坏:染色体的适应度越大,表明解的质量越高,该个体被选择成为父代进而产生后代的的概率越大。

?通常,在设计适应度函数时,要遵循以下原则:

?(1) 单值性。 (2) 非负性。 (3) 计算量小。

?适应度函数对遗传算法的影响主要体现在三个方面:

?(1) 适应度函数和选择算子共同决定了群体中各个染色体产生后代的概率。适应度越大的个体产生后代的概率越大。

?(2) 遗传算法的终止条件受到适应度函数的影响。

?(3) 问题的约束条件在适应度函数中考虑。

(4)选择算子

?从当前群体中挑选出优良的个体直接遗传到下一代或通过交叉操作产生新个体,从而将解的优良性状遗传给子代。越优良的个体,被选成父代进行遗传操作的机会越大。保证了方法的最有搜索方向。

?几种常见的选择算子:

?1、轮盘赌选择法

?2、锦标赛选择法

?3、排序选择法

?4、最佳个体保存法

(5)交叉算子

?交叉算子模拟自然界生物进化过程中的基因重组,把两个父个体的部分结构进行重组替换从而产生适应度更高的个体。交叉操作保证了算法的全局搜索能力。

?交叉操作一般需要以下两个步骤来完成:

?(1) 选择一对个体作为父个体。

?(2) 根据某个概率,即交叉概率,实施交叉操作,从而产生一个新个体。

?

(6)变异算子

?变异算子模拟自然界生物进化过程中的基因突变,变化个体中的某些结构从而引入初始群体中不包含的基因模式。

?变异算子的作用:

?1、变异算子使得遗传算法具有局部最优搜索能力。当遗传算法通过交叉算子接近问题解空间的最优领域时,变异算子可以加速遗传算法收敛于最优解。

?2、变异算子随机地引入初始群体中不含的个体模式,保持群体的多样性,防止遗传算法由于过早收敛从而陷入局部最优。

?变异算子的步骤一般是:

?(1) 选择变异个体。

?(2) 在变异个体中选择基因座(发生变异的位置)。

?(3) 按照变异概率对个体进行变异操作。

优点

?1)一般而言,遗传算法的操作对象是参数的编码,而非参数本身,从而避免了约束条件限制(如可导性、连续性、单峰性等),拓宽了算法的应用范围

?2)遗传算法的搜索方式是多点并行搜索,而非单点搜索。从而可以有效地

防止搜索过程收敛于局部最优。

?3)遗传算法的评估策略依赖于目标函数和适应度函数的值,而与辅助信息和辅助知识无关,从而减小了对问题的依赖程度。

?4)遗传算法的寻优规则是不确定性概率变迁规则,而非确定性规则,从而引导搜索向全局最优解方向前进

缺点

?1)遗传算法容易出现过早收敛现象。

?2)遗传算法的局部搜索能力较差,主要原因是遗传算法的交叉操作容易破坏当前模式,使得小范围的精确搜寻很困难。

?3)遗传算法在进化后期搜索效率较低,这使得最终搜索得到的结果往往不是全局最优解,而是局部最优解。

群智能算法(OPA):包括蚁群优化算法,粒子群算法,人工鱼群算法等。

蚁群算法(ACO)

蚁群优化算法(Ant colony optimization ACO)是一种随机搜索算法,它基于对自然界真实蚁群的集体觅食行为的研究,模拟真实的蚁群协作过程。算法由若干个蚂蚁共同构造解路径,通过在解路径上遗留并交换信息素提高解的质量,进而达到优化的目的。

AS 算法主要包括两个基本阶段:适应阶段和协作阶段.在适应阶段,各候选解根据积累的信息不断调整自身结构,路径上经过的蚂蚁越多,信息素数量越大,则该路径越容易被选择,时间越长,信息素数量越少;在协作阶段,候选解之间通过信息交流,以期望产生性能更好的解.

蚁群算法实现步骤

题(Traveling Salesman Problem,TSP)为例说明

在网络方面的主要应用

(1)网络路由问题:蚁群算法在动态组合优化问题研究中的应用主要集中在通讯

网络方面.随着Internet 上广泛的分布式多媒体应用对服务质量(Quality of Service,QoS)需求的增长,各种服务应用对网络所能提供的QoS 提出了不同的要求,而路由是实现QoS 的关键之一.将蚁群算法用于解决受限路由问题,目前可以解决包括带宽、延时、包丢失率和最小花费等约束条件在内的QoS 组播路由问题,比现有的链路状态路由算法具有明显的优越性,应用蚁群算法求解更复杂的QoS 问题还需要深入讨论.

(2)无线传感器网络路由协议问题:作为一种新的信息获取方式和处理模式,无

线传感器网络(Wireless sensor network,WSN)目前已经成为国内外备受关注的研究热点.WSN 是由众多具有通信和计算能力的传感器节点,以多跳通信、自组织方式形成的网络.节点传感器电池供电,电源能量、通信能力计算能力都是有限的.WSN 路由协议研究中的一个重要问题是路由的选择要结合节点的能量信息,使得节点的能量消耗能够均衡,延长网络生命周期.蚁群优化算法求解模式将问题求解的快速性、全局优化特征以及高度的自组织性等特点合理结合,与无线传感网低能耗、自组织的大规模网络路由快速建立要求极其相似,有助于建立面向数据为中心的路由协议.目前,已有许多学者研究蚁群优化算法在WSN 路由协议中的应用.

粒子群算法(PSO)

粒子群优化( Particle Swarm Optimization,PSO) 算法是另一种群智能算法。在粒子群算法中引用了鸟群的概念。PSO 也是一种基于群体的优化工具,同时也是一种基于迭代的优化工具。

PSO 算法原理

PSO 首先生成初始种群,即在可行解空间中随机初始化一群粒子,每个粒子都是优化问题的一个可行解,并根据目标函数构造一个适应度函数(fitness function)。以该适应度函数作为评价标准。每个粒子在解空间中运动,该粒子运动的速度由个体的飞行经验和群体的飞行经验进行动态的调整,并经逐代搜索最后得到最优解。在每一代中,粒子将跟踪两个极值,一个是粒子本身迄今找到的最优解,另一个是整个种群中迄今找到的最优解.

PSO 算法流程

PSO 的算法流程如下:

(1)初始化一群随机粒子,包括粒子的随机位置和速度;

(2)计算每个粒子的适应度值;

(3)对于每个粒子,将其适应度值与其经历过的最优位置Pbest进行比较,如较好,则将其作为当前的最优位置Pbest;

(4)对于每个粒子,将其适应度值与全局所经历过的最优位置gbest进行比较,如较好,则重新设置gbest的索引号;

(5)根据PSO 算法的两个计算公式变化粒子的速度和位置;

(6)如果得到的适应度值足够好或达到预设的最大迭代次数GAP,则返回第 2 步。

网络方面的主要应用:无线传感器网路,近年来,将群智能算法应用于无线传感器网络问题引起了众多研究者的关注.网络节点位置优化是无线传感网络研究的核心问题之一.由于无线传感网络中移动节点的位置优化可以抽象为以移动节点位置构成的非整数向量为输入参数,网络有效覆盖区域面积大小为优化目标的优化问题.对于此类问题,微粒群优化算法相比其它算法具有更高的收敛速度、更强的全局搜索能力此外,微粒群算法在无线传感器网络路由协议中的应用也表现出了良好的优化性能。

人工鱼群算法

人工鱼群算法是李小磊等在对动物群体智能行为研究的基础上提出的一种新型仿生优化算法。与传统人工智能系统的自上而下的设计思路相比,该算法采用了自下而上的设计方法。所以,首先应着重构造鱼群自治体的模型,具体模型描述如下:

(1) 觅食行为:平时我们会看到鱼在水中游来游去,这一般可视为一种随机移动。当鱼群发现食物时,会向着食物逐渐增多的方向快速游去。

(2) 聚群行为:鱼在游动过程中为了保证群体的生存和躲避危害而形成了一种生活习性——会自然地聚集成群。在这个群体中,每条鱼都需要遵循一些局部相互作用的规则:

①分隔规则:尽量避免与临近伙伴过于拥挤;

②内聚规则:尽量朝临近伙伴的中心移动;

③对准规则:尽量与临近伙伴的平均方向一致。

(3) 追尾行为:在鱼群的游动过程中,当其中一条或几条食物时,其临近的伙伴会尾随其后快速到达食物点。

(4) 约束行为:在寻优过程中,由于群聚行为、随机行为等操作的作用,容易使人工鱼的状态变得不可行,此时就需要加入相应的约束对其进行归整化,使它们由无效状态或不可行状态转变为可行的。

(5) 公告板:公告板用来记录最优人工鱼的状态。各人工鱼在寻优过程中,每次行动完毕就比较自身状态与公告板的状态,若自身状态优于公告板状态,就将公告板状态改写为自身状态,这样公告板记录下的就是历史最优状态。

(6) 移动策略:根据所要解决问题的性质,对人工鱼当前所处的环境进行评价,从而选择一种合适的行为策略。

综上所述,有了底层的人工鱼模型,算法的展开就在一群人工鱼的自主活动中开始了,每条人工鱼按照自己的规则游动,所求问题的满意解就显示在公告板上。

伪代码描述如下:

伪代码描述如下:

伪代码描述如下:

人工鱼群算法伪代码:

WIFI+Portal认证解决方案_高可靠性

宽带连接世界,信息改变未来 WIFI+Portal认证解决方案 2013年02月

目录 1 概述 (3) 2 安朗WIFI+Portal认证系统解决方案 (3) 2.1 系统拓扑 (4) 2.2 系统容量估算 (4) 2.3 防火墙 (5) 2.4 负载均衡 (5) 2.5 Portal系统 (5) 2.6 AAA系统 (5) 2.7 Oracle数据库 (6) 2.8 磁盘阵列 (6) 3 方案特点 (6) 4 典型案例 (6) 4.1 广州电信本地WIFI认证平台 (6) 4.2 广交会WiFi+Portal 认证平台 (8) 广州安朗通信科技有限公司 2 / 9

1概述 随着智能手机和手持终端的不断普及,使用者需要随时随地上网获取信息。为了给客户更好的服务,越来越多的商家开始提供免费或者收费的WIFI接入服务。在酒店、餐饮、汽车4S店等行业,都开始都提供WIFI服务。 目前随着WIFI的接入增加,对于WIFI的认证也逐渐开始收到了更多的关注。特别是对于WIFI的Portal认证方式收到了越来越多的应用。对于电信运营商这一类的WIFI接入提供商来说,Portal认证系统的稳定可靠是优先考虑的,这就需要提供一个具有高可靠性的Portal 认证系统。 2安朗WIFI+Portal认证系统解决方案 为了满足高可靠性的需要,安朗WIFI+ Portal系统解决方案中包括防火墙、负载均衡、Portal系统、AAA系统、Orcale数据库(负载均衡工作模式)、磁盘阵列等部分。 广州安朗通信科技有限公司 3 / 9

广州安朗通信科技有限公司 4 / 9 2.1 系统拓扑 2.2 系统容量估算 这里的系统容量主要是指各个系统需要采用的Portal 服务器和AAA 服务器的计算以及系统所需带宽估算,负载均衡设备和防火墙容量的估算请参考各个厂家的估算公式。 系统带宽=页面文件大小×并发用户数 页面的连接数×并发用户数=Portal 系统需要支持的连接数 并发用户数/超时时间5秒(认证超时)=AAA 系统每秒需要处理认证请求数 需要的Portal 硬件数量= Portal 需要支持的连接数/单台Portal 支持的连接数

最新硬件测试标准(最全可靠性测试)

1. 目的 此可靠性测试标准的目的是尽可能地挖掘设计,制造中的潜在性问题,在正式生产之前寻找改善方法并解决上述问题点,为正式生产的产品在质量上做必要的保证;并检测产品是否具备设计上的成熟性、使用上的可靠性.具体包括新产品的试验、物料的试验及例行抽检试验等等。 2. 围 此指引适用于所有诺亚信高科技集团生产的移动产品。 3. 定义 3.1 技术员:设定仪器,完成相关测试项目,并记录测试结果.解决检测过程中的问题;并向工程师反 馈检测方法的缺陷和不足。 3.2 工程师:判断测试结果是否可接受;跟进问题的解决情况;改善检测方法。 4. 抽样方案 4.1 以具体的实验项目要求为准。 5. 检验容 5.1 环境可靠性试验 5.1.1 高温运行试验 试验目的:验证手机在高温环境的适应性。 试验样品:2sets 试验容:55℃,手机配齐SIM卡/T卡,装电池开机,进行12小时测试,运行时间从到达 55℃温度始算起.试验后在箱检查,要求产品的功能、外观正常.受测前样机胶塞必须安装 归位.射频指标符合国家标准.对于翻/滑盖手机,1台开盖,1台合盖.(若屏/主板不同供 应商,则样机各选2pcs,共4pcs)。 判定标准: 1、壳体外观检查,缝隙,镜片以及使用背胶固定的装饰件等粘贴牢固度。 2、功能检查(注意屏的显示是否有黑影,坏点等异常)。 3、触摸屏划写,点压准确性(如有触摸不准偏位等现象,进行屏幕校准看是否 可恢复)。 4、MP3,FM,耳机,充电,滚轮…。 5、实网通话一次,看送话和受话是否正常。

5.1.2 低温运行试验 试验目的:验证手机在低温环境下的适应性。 试验样品: 2 sets 试验容: -20℃,手机配齐SIM卡/T卡,装电池开机并运行老化软件,进行12小时测试,运行时间从到达-20℃温度始算起.试验后在箱检查,要求产品的功能、外观正常.受测前样机胶塞必须安装归位.射频指标符合国家标准.对于翻/滑盖手机,2台开盖,1台合盖.(若屏/主板不同供应商,则样机各选2pcs,共4pcs)。 特别注意:俄罗斯项目需要测试低温下的充电功能(电池电压是否会升高)。 判定标准:1、壳体外观检查,缝隙,镜片以及使用背胶固定的装饰件等粘贴牢固度。 2、功能检查(注意屏的显示是否有黑影,坏点等异常)。 3、触摸屏划写,点压准确性(如有触摸不准偏位等现象,进行屏幕校准看是否 可恢复)。 4、MP3,FM,耳机,充电,滚轮…。 5、实网通话一次,看送话和受话是否正常。 5.1.3 高温贮存试验 试验目的: 应力释放和加速材料的老化。 试验样品:2 sets 试验容:80℃,手机配电池关机,存储时间24小时,贮存时间从温度到达80℃开始算起. 在进行存储到24小时后,直接进行外观检查.受测前样机胶塞必须安装归位.再进行2小时回温后,开机进行电性能检查.对于翻/滑盖手机,2台开盖,1台合盖.(若屏/主板不同供应商,则样机各选2pcs,共4pcs)。 判定标准:1、壳体外观检查,缝隙,LENS以及使用背胶固定的装饰件等粘贴牢固度。 2、功能检查(注意屏的显示是否有黑影,坏点等异常)。 3、触摸屏划写,点压准确性(如有触摸不准偏位等现象,进行屏幕校准看是否 可恢复)。 4、MP3,FM,耳机,充电,滚轮…。 5、实网通话一次,看送话和受话是否正常。 5.1.4 低温贮存试验 试验目的:加速材料的脆化。 试验样品:2 sets

网络可靠性设计

网络可靠性设计

目录 1.1 网络可靠性设计 (2) 1.1.1 网络解决方案可靠性的设计原则 (3) 1.1.2 网络可靠性的设计方法实例 (4) 1.1.3 网络可靠性设计总结 (9)

1.1网络可靠性设计 可靠性是指:设备在规定的条件下、在规定的时间内完成规定的功能的能力。对于网络系统的可靠性,除了耐久性外,还有容错性和可维护性方面的内容。 1)耐久性。是指设备运行的无故障性或寿命,专业名称叫MTBF(Mean Time Between Failure),即平均无故障时间,它是描述整个系统可靠性的重要指标。对于一个网络系统来说,MTBF是指整个网络的各组件(链路、节点)不间断无故障连续运行的平均时间。 2)容错性。专业名称叫MTTR(Mean Time to Repair),即系统平均恢复时间,是描述整个系统容错能力的指标。对于一个网络系统来说,MTTR是指当网络中的组件出现故障时,网络从故障状态恢复到正常状态所需的平均时间。 3)可维护性。在系统发生故障后,能够很快地定位问题并通过维护排除故障,这属于事后维护;根据系统告警提前发现问题(如CPU使用率过高,端口流量异常等),通过更换设备或调整网络结构来规避可能出现的故障,这属于预防维护。可维护性需要管理人员来实施,体现了管理的水平,也反映了系统可靠性的高低。

表示系统可靠性的公式为: MTBF / ( MTBF + MTTR ) * 100%。 从公式或以看出,提高MTBF或降低MTTR都可以提高网络可靠性。造成网络不可用的因素包括:设备软硬件故障、设备间链路故障、用户误操作、网络拥塞等。针对这些因素采取措施,使网络尽量不出故障,提高网络MTBF指标,从而提升整网的可靠性水平。 然而,网络中的故障总是不可避免的,所以设计和部署从故障中快速恢复的技术、缩小MTTR指标,同样是提升网络可靠性水平的手段。 在网络架构的设计中,充分保证整网运行的可靠性是基本原则之一。网络系统可靠性设计的核心思想则是,通过合理的组网结构设计和可靠性特性应用,保证网络系统具备有效备份、自动检测和快速恢复机制,同时关注不同类型网络的适应成本。 构建可靠的网络,需要从耐久性、容错性以及可维护性三个方面进行网络规划设计。而网络的规划设计是个系统工程,不同的设计方案的可靠性性效果不尽相同,这就需要以科学的方法进行设计,构建符合需要的可靠性网络。 1.1.1网络解决方案可靠性的设计原则 不同的网络,其可靠性的设计目标是不同的。网络解决方案的可靠性需要根据实际需求进行设计。高可靠性的网络不但涉及到网络架构、设备选型、协议选择、业务规划等技术层面的问题,还受用户现有网络状况、网络投资预算、用户管理水平等影响,因此在规划可靠性网络时需要因地制宜,综合考虑各方面的影响因素。

计算机网络可靠性优化技术研究

计算机网络可靠性优化技术研究 陈 聪 (广西梧州学院,广西梧州543000) 摘要:随着计算机网络用户不断增加,其可靠性问题对于计算机的用户信息至关重要。本文介绍了当前计算机网络的可 靠性概念与设计的原则,并在此基础上提出优化计算机网络可靠性的优化技术,提高了计算机用户的信息安全性。关键词:计算机网络;可靠性;优化技术;经济发展中图分类号:TP393.02文献标识码:A 文章编号:1673-1131(2013)01-0085-02 1计算机网络的可靠性概念 计算机的可靠性指的是网络在操作方式或者在负载条件、维修方式以及温度、辐射、湿度等条件下、并在一定时间内,其的网络仍然保持连通并且达到通信要求的一种能力。计算机网络可靠性是指计算机网络的拓扑结构、并且能够确保计算机的网络能够正常运行的能力,同时也是计算机网络的规划与设计以及运行的重要参数部分[1]。 2计算机网络可靠性设计的原则 进行计算机网络的优化设计与实践过程中,计算机研究人员积累了较多的设计原则与经验,并且对于提高计算机网络的可靠性问题具有较好的指导与规范作用。计算机网络的可靠性设计原则主要涉及以下几个方面内容。 2.1遵循国际的标准 计算机网络的可靠性优化设计应积极使用较为开放的网络体系,确保网络体系或者结构具有升级与扩展的能力。此外系统设计时,需确保其的实用性、先进性以及通用性结构等问题得到解决。 2.2互联能力强 计算机的可靠性设计对系统的互联能力提出较高要求,需要确保系统可支持不同的通信协议,保障网络的可靠性与安全性。同时还要求网络系统的服务器或者产品,具备较强 的容错与冗余能力,更好地满足使用者的需求,进而确保信息数据的安全与网络系统的良好运行。 2.3可管理性强 进行计算机的可靠性设计时,优先考虑技术与科技含量好的网络设备或者管理软件,确保提高网络设计的先进性;此外,对于计算机的网络链路介质而言,要求主干网需要具备充足的带宽,并且具备较高的性价比,有助于提高计算机网络的反应速度。 2.4合理配置资源 计算机可靠性优化设计应该确保网络投资的安全,并且能够充分、合理地对网络资源进行配置,做好网络布线、硬件设施以及操作系统的软件等方面的调配与配置工作。 3计算机网络的可靠性优化设计模型分析 3.1模型概率图 在计算机网络的可靠性优化设计当中,对于较多复杂的系统而言,可将其转化为计算机的网络模型进行分析,再将系统的网络模型转化成图,进而分析其的可靠性,有利于求解。例如,计算机的网络系统模型所使用的概率图,用G (V ,E )来表示,系统中的结点集合V 表示的是服务器、用户终端或者主机;而边集合E 是指计算机的网络链路。图还包含分析问题 2.7网站的运行与维护 课程网站设计制作完成后,就进入运行阶段。这个阶段一个必不可少的工作就是对网站进行必要的维护。网站维护服务基本内容如下: 监测网站的运行情况; 保证网站脚本程序正常运行; 监测并保证您的主机处于正常运行状态; 备份网站内容及数据; 监测域名的解析运行状况;提供网站内容的维护服务,包括:网页文字内容的更新、修改;网页图片内容的处理、更新;网站Flash 动画中文字内容的更新、修改;网页链接指向的更新、修改;网站其他内容的修改; 提供网站改进和完善的意见和建议,提升网站的运行效果;制作新的页面及模块,同时确保网站总体风格的完整和统一。 3结语 本文将软件工程思想引入到课程网站的开发设计过程中,较之传统的开发方法,整个系统结构化更强,逻辑性更加严密; 图文结合,形象、直观,可视化更强;同时还配有完整、规范的软件文档,便于系统的维护与更新。系统提供的个性化学习支持功能,可以大大提高学生的学习效率,真正实现个性化教育。本文论述的个性化网上教学系统设计与实现方法适用于绝大部分课程,并在《中国美术简史》、《网络实用软件》、《国家赔偿法》和《WTO 专题》等多门课程的网上教学系统开发过程中得到了应用,效果显著。参考文献:[1] 郑人杰,殷人昆,陶永雷.实用软件工程[M ].北京:清华大学 出版社,2008,4 [2]陈明.软件工程学教程[M ].科学出版社,2009,7 [3]前沿电脑图像工作室.巧学巧用DreamweaverMX/Fir-eworksMX/FlashMX 制作网页[M ].人民邮电出版社,2009,1 作者简介:刘德学(1965-),男,重庆涪陵人,硕士,副教授,研究 方向为计算机辅助教学。 2013年第1期(总第123期) 2013 (Sum.No123) 信息通信 INFORMATION &COMMUNICATIONS

网络可靠性实现

高可用性技术(故障检测技术)在路由网络中的应用 国网电科院信息通信技术服务中心蓝鹏 VER1.0 引言:为了保证网络的不间断运行,特别是核心出口网络的高可用性,通常在部署较大规模网络时,会采取链路级备份、设备级备份等方式。技术上通常使用多管理引擎备份、浮动静态路由、VRRP、HSRP等。虽然这些技术给网络带来了一些备份作用,但是对于实时性要求较高的网络还会存在一些问题,本文结合在H3C路由器上的配置实例说明一些故障检测技术与传统技术的结合(联动)从而实现更为智能的高可用性解决方案。 关键字:可靠性故障检测技术NQA BFD TRACK 路由协议网络收敛 (一)、可靠性概述 随着网络的快速普及和应用的日益深入,网络中断可能影响大量业务,因此,作为业务承载主体的基础网络,其可靠性日益成为倍受关注的焦点。在实际网络中,总避免不了各种非技术因素造成的网络故障和服务中断。因此,提高系统容错能力、提高故障恢复速度、降低故障对业务的影响,是提高系统可靠性的有效途径。 1.可靠性需求 可靠性需求根据其目标和实现方法的不同可分为三个级别,各级别的目标和实现方法如表 1 所示。 级别目标实现方法 1减少系统的软、硬件故障硬件:简化电路设计、提高生产工艺、进行可靠性试验 软件:软件可靠性设计、软件可靠性测试等 2即使发生故障,系统功能也不 设备和链路的冗余设计、部署倒换策略、提高倒换成功率受影响 3尽管发生故障导致功能受损, 提供故障检测、诊断、隔离和恢复技术 但系统能够快速恢复 表 1 在上述三个级别的可靠性需求中,第1级别需求的满足应在网络设备的设计和生产过程中予以考虑;第2级别需求的满足应在设计网络架构时予以考虑;第3级别需求则应在网络部署过程中,根据网络架构和业务特点采用相应的可靠性技术来予以满足。 2.可靠性度量 通常我们使用 MTBF ( Mean Time Between Failures ,平均故障间隔时间)和 MTTR ( Mean Timeto Repair ,平均修复时间)这两个技术指标来评价系统的可靠性。 (1).MTBF MTBF 是指一个系统无故障运行的平均时间,通常以小时为单位。 MTBF 越多,可靠性也就越高。 (2).MTTR MTTR 是指一个系统从故障发生到恢复所需的平均时间,广义的 MTTR 还涉及备件管理、客

网络性能和可靠性优化方案及对策

网络性能和可靠性优化设计方案 当前整个社会已进入全面信息化时代,人们对网络的依赖性已越来越强,几乎成为工作、商业和生活中不可缺少的必需工具,但随之伴随而来也产生一些不容忽视的问题,网络系统可靠性就是其中一个主要的问题,网络的快速应用,一旦网络中断必将影响大量业务,甚至可能造成极其重大的社会影响和极大经济损失,因此,作为业务承载主体的基础网络,其可靠性日益成为倍受关注的焦点。在实际网络中,总会避免不了出现网络故障和服务中断的情况,因此,提高系统容错能力、提高故障恢复速度、降低故障对业务的影响,是提高系统可靠性的有效途径。本文将主要研究网络可靠性影响因素及提升网络可靠性的方法,并对网络可靠性方案做出了归纳总结。 网络系统可靠性设计的核心思想则是,通过合理的组网结构设计和可靠性特性应用,保证网络系统具备有效备份、自动检测和快速恢复机制,同时关注不同类型网络的适应成本。为了保证网络的不间断运行,特别是核心出口网络的高可用性,通常在部署较大规模网络时,会采取链路级备份、设备级备份等方式。技术上通常使用多管理引擎备份、浮动静态路由、VRRP、HSRP、GLBP等。虽然这些技术给网络备份起到了一定的作用,但是对于实时性要求较高的网络还会存在一些问题,所以对网络系统进行科学优化设计是网络可靠运行的重要

基础。网络建设目标就是使网络系统能够满足用户应对网络各个方面的正常需求,以避免网络建成后可能出现的各种问题,网络的可靠性和冗余设计在网络建设中必须重点加以考虑。不同的网络,其可靠性的设计目标是不同的,网络解决方案的可靠性需要根据实际需求进行设计,高可靠性的网络不但涉及到网络架构、设备选型、协议选择、业务规划等技术层面的问题,还受用户现有网络状况、网络投资预算、用户管理水平等影响,因此在规划可靠性网络时需要因地制宜,综合考虑各方面的影响因素。 网络可靠性影响因素 网络可靠性是指设备在规定的条件(操作方式、维修方式、负载条件、温度、湿度、辐射等)下,在规定的时间(1000小时、一个季度等),网络保持连通和完成通信要求的能力。它反映了网络拓扑结构支持网络正常运行的能力,是计算机网络规划、设计与运行的重要参数之一。从现实层面讲,当前影响网络可靠性的外因素较多,且形式多样,容不确定性逐渐增加,诸如电子元件老化,传输介质及设备接口故障,软硬件配置因素失当、网络设计层次不恰当、用户非常规操作等等,这些因素的集聚均相应导致网络可靠性的下降。 网络设备及用户终端的影响。要保证网络可靠稳定运行,硬件设备的质量在其中起着很重要的作用,硬件的质量越好,网络运行的连续性和可靠性就会越高。尤其是网络核心和骨干层,其重要性不言而喻,

网络高可用性技术白皮书之一

网络高可用性技术白皮书(一) 杭州华三通信技术有限公司

目录 网络高可用性技术白皮书(一) (1) 1. 硬件冗余 (1) 1.1 主控冗余 (1) 1.2 单板热插拔 (2) 1.3 电源风扇冗余 (3) 2. 链路捆绑技术 (3) 3. 热补丁技术 (3) 4. IRF智能弹性架构 (4) 4.1 分布式设备管理 (5) 4.2 分布式路由 (7) 4.3 分布式链路聚合 (8)

网络高可用性技术白皮书 网络高可用性技术,基本都可以归入容错技术,即在网络出现故障(错误)时,确保网络能快速恢复。对目前常用的高可用性技术,可以作一个简单的归类: z单个设备上的硬件冗余,如双主控、单板热插拔、电源冗余、风扇冗余等; z链路捆绑,如以太网链路聚合、MP、MFR等; z环网技术,如RPR、RRPP; z STP、Smart Link、Flex Link等二层冗余技术; z冗余网关技术,如VRRP、HSRP、GLBP; z ECMP,浮动静态路由,动态路由快速收敛(如快速hello,iSPF); z不间断转发:NSF/SSO/GR; z MPLS 快速重路由; z快速故障检测技术,如BFD。 1. 硬件冗余 这里的硬件冗余指的是单台设备上的硬件冗余,一般有主控冗余、交换网冗余、单板热插拔和电源风扇冗余等,使用冗余部件可以在单个部件可靠性一定的情况下,提高整个设备的可用性。随着硬件技术的进步,目前很多设备交换网集成在主控板上,所以交换网冗余不单独介绍。 1.1主控冗余 在设备只有单主控的情况下,如果主控板故障,重起主控板需要加载映象文件、初始化配置、重新注册业务板,然后重建控制平面和转发平面表项,整个过程在5分钟左右,这个时间实在是太长了,特别对于网络中处于单点故障的节点来说更是如此,因为业务在这个过程中将完全中断。为了缩短这个时间,主控冗余应运而生。 主控冗余是指设备提供两块主控板,互为备份。因为主控冗余在控制和转发分离的架构下才能发挥最大的效用,这里先介绍一下控制和转发分离的概念。在控制和转发分离的架构中,控制平面负责各种协议,如路由协议(如RIP/OSPF/IS-IS/BGP)、标签分发协议(如LDP/RSVP-TE/BGP)等的处理,形成路由信息表(RIB)和标签信息表(LIB),从其中选择最优者,加上必要的二层信息,形成路由转发信息表(FIB)和标签转发信息表(LFIB),下发到转发平面,转发平面据此实现快速转发。控制平面的处理在主控板上进行,转发平面的处理既可以在主控板(集中式设备),也可以在业务板(分布式设备)。一旦实现了控制和转发分离,即使控制平面出现故障,转发平面的转发表项在短时间内可以认为仍然合理,继续转发数据而不会导致问题(如环路),当然,控制平面必须能快速恢复并重新和邻居建立协议会话,收敛后再对转发平面进行检查,对表项作必要更新,删除在新的会话环境下不再正确的转发表项。 在主控冗余的设备上,配备了两块主控板,一块实际起作用,称为Master,另一块备用,

可靠性评估

可靠性概念理解: 可靠性是部件、元件、产品、或系统的完整性的最佳数量的度量。可靠性是指部件、元件、产品或系统在规定的环境下、规定的时间内、规定条件下无故障的完成其规定功能的概率。从广义上讲,“可靠性”是指使用者对产品的满意程度或对企业的信赖程度。 可靠性的技术是建立在多门学科的基础上的,例如:概率论和数理统计,材料、结构物性学,故障物理,基础试验技术,环境技术等。 可靠性技术在生产过程可以分为:可靠性设计、可靠性试验、制造阶段可靠性、使用阶段可靠性、可靠性管理。我们做的可靠性评估应该就属于使用阶段的可靠性。 机床的可靠性评定总则在GB/T23567中有详细的介绍,对故障判定、抽样原则、试验方式、试验条件、试验方法、故障检测、数据的采集、可靠性的评定指标以及结果的判定都有规范的方法。对机床的可靠性评估时,可以在此基础上加上自己即时的方法,做出准确的评估和数据的收集。 可靠性研究的方法大致可以分为以下几种: 1)产品历史经验数据的积累; 2)通过失效分析(Failure Analyze)方法寻找产品失效的机理; 3)建立典型的失效模式; 4)通过可靠性环境和加速试验建立试验数据和真实寿命之间的对应关系;5)用可靠性环境和加速试验标准代替产品的寿命认证; 6)建立数学模型描述产品寿命的变化规律; 7)通过软件仿真在设计阶段预测产品的寿命; 大致可把可靠性评估分为三个阶段:准备阶段、前提工作、重点工作。 准备阶段:数据的采集(《数控机床可靠性试验数据抽样方法研究》北京科技大学张宏斌) 用于收集可靠性数据, 并对其量化的方法是概率数学和统计学。在可靠性工程中要涉及到不确定性问题。我们关心的是分布的极尾部状态和可能未必有的载荷和强度的组合, 在这种情形下, 经常难以对变异性进行量化, 而且数据很昂贵。因此, 把统计学理论应用于可靠性工程会更困难。当前,对于数控机床可靠性研究数据的收集方法却很少有人提及, 甚至可以说是一片空白。目前, 可靠性数据的收集基本上是以简单随机抽样为主, 甚至在某些情况下只采用了某一个厂家在某一个时间段内生产的机床进行统计分析。由此所引发的问题就是: 这样收集的数据不能够很好地反映数控机床可靠性的真实状况, 同时其精度也不能够令人满意。 由于现在数控机床生产厂家众多、生产量庞大、机床型号多以及成产的批次多,这样都对数据的收集带来了很大的困难。因此,在数据采样时: (1)必须采用合理的抽样方法来得到可靠性数据; (2)简单随机抽样是目前普遍应用的抽样方法,但是必须抽取较大的样本量才能够获得较高的精度和信度; 针对以上的特点有三种数据采集的方法可以选择:简单随机抽样、二阶抽样、分层抽样。 (1)简单随机抽样:从总体N个单元中,抽取n个单元,保证抽取每个单元或者几个单元组合的概率相等。

计算机网络可靠性优化设计方法

计算机网络可靠性优化设计方法 摘要:计算机网络使人们的生产生活方式发生了翻天覆地的变化,并进一步带 动了其他科学技术的进步与发展。长期以来,由于人们对计算机网络安全的不重视,致使计算机网络成为不法分子获得不当利益的工具,计算机网络安全形势变 得愈发严峻,人们的隐私甚至国家安全面临极大的威胁。为了营造绿色、安全的 计算机网络环境,就必须要提高计算机网络的可靠性,这对于推动我国现代化社 会的发展是具有重要意义的。 关键词:计算机网络;可靠性;优化设计 1计算机网络可靠性的含义 可靠性是计算机网络的一个基本要求,关系着计算机网络是否能够正常稳定 运行。在计算机网络领域中,影响可靠性的因素有三个,第一个是计算机的网络 环境,包括计算机硬件和环境背景,计算机网络的功能和作用只有借助特定的网 络环境才能够发挥出来。第二个是时间因素,计算机网络只有在一定的时间内完 成工作才有意义,尤其是在当前生活节奏不断加快的情况下,计算机网络只有在 短时间内尽可能快地完成工作,才能够提升人们生产生活的效率,体现出计算机 网络的价值。第三个是计算机网络能力,在满足网络环境和时间要求的基础上, 计算机网络只有具备完成业务的能力,能够发挥出切实有效的作用,才能确保其 可信程度。如果计算机网络的可靠性不足,那么不仅无法保证其能够在短时间内 完成工作,还可能会受到外网的攻击,严重的话还会危害使用者的经济利益。 2影响计算机网络可靠性的主要因素 2.1传输交互设备 网络数据交换设备在每个终端的链路中心称为数据传输和交换设备,数据传 输和交换设备在网络各部分的通信中起着重要作用。传输切换装置作为计算机网 络的主要方式,应当受到技术人员的高度重视,通常来讲这个装置是由两部分组 成的。分别是通信线路以及集线器技术人员,应当明确他们可能出现的种种问题,并且对其展开处理,只有这样才能促进计算机网络的正常运行,保证其在保障期 内有较高的可靠性。由于集线器具有连接终端设备节点的功能,集线器保证了整 个网络的稳定性,并且如果发生某些故障,整个网络就会瘫痪。技术人员应当加 大对计算机网络的关注并且保证其中的终端能够正常运行,也就是当有终端出现 异常情况时,那么要保证与他工作相联系的一些终端能够依法进行正常工作,所 以就是因为要保证终端能够正常工作。这在数据交换设备中是极其重要的一部分,是设备的核心,也是提高计算机网络可靠性的基础。 2.2计算机网络的拓扑结构 计算机的网络节点可以分为三类,一类是涵盖结点路由器、交换机和终端控 制器的转接结点;另一类是用户终端设备的访问节点;最后一类是指含有多个节 点的节点混合体。网络拓扑结构按照复杂程度和可靠性大小排列可以分为星型拓扑、总线型拓扑、环型拓扑、树型拓扑和混合型拓扑五种结构。这里需要注意, 星状拓扑的中心汇聚点非常关键,如果出现故障,那么整个计算机网络就无法正 常工作,但一般计算机网络往往由多种拓扑组得成混合型拓扑,并不会因为中心 汇聚点出现故障而整体瘫痪。 2.3使用人的素质 人是计算机网络所服务的对象,主要是为了满足人类发展而服务的,人类如 果对计算机网络使用的方法得当,而且个人信息保密意识强,也能给计算机增加

基于复杂网络的城市轨道交通网络可靠性研究

do:i 10.3969/.j issn .1672-6073.2010.02.004 都市快轨交通#第23卷第2期2010年4 月 快轨论坛 基于复杂网络的城市轨道 交通网络可靠性研究 陈菁菁 (上海申通轨道交通研究咨询有限公司 上海 201103) 摘 要 通常的可靠性理论难以有效分析城市轨道交通网络的可靠性。鉴于复杂网络理论对大量现实网络实证研究的有效性,以及城市轨道交通网络作为现实世界网络的典型实例与其他网络具有相似性,应将城市轨道交通网络相关问题的研究归为复杂网络的研究范畴。引入复杂网络的可靠性测度指标,从网络的适应性、稳定性和有效性三方面来构建城市轨道交通网络可靠性的衡量指标,将原先基于设施设备的可靠性研究拓展至基于交通系统管理者和使用者的全局性研究。 关键词 城市轨道交通网络 复杂网络 可靠性测度中图分类号 F51213 文献标志码 A 文章编号 1672-6073(2010)02-0018-04 城市轨道交通网络是由大量相互作用的单元构成的复杂系统,在一定的规则下产生有组织的行为,呈现动态的变化和演化过程,并且具有与外界相互作用的开放性。城市轨道交通网络表现出既有不确定性,又有一定的内部自组织原则的特性,不能简单地将城市轨道交通网络的问题归为随机网络或规则网络的问题来研究。 1 城市轨道交通网络可靠性分析的难度 1.1 大系统与小样本 城市交通网络系统是一个错综复杂的大系统。概率论是可靠性最主要的理论基础,其中的大数定律决定了在可靠性试验或数据分析时,必须有足够的样本量。对于城市轨道交通系统而言,网络可靠性的研究还刚刚 收稿日期:2009-10-10 修回日期:2009-11-20 作者简介:陈菁菁,女,博士,工程师,主要研究城市轨道交通运营安 全与可靠性,c j j yh @ya hoo.c https://www.360docs.net/doc/dc10625079.html, 基金项目:国家自然科学基金(50478105) 起步,研究的基础很薄弱,特别是在我国的各个城市, 轨道交通仍然处于集中建设时期,具有一定规模的网络还未形成,实际的样本数据匮乏,样本数据少的问题极为突出。因此,如何在小样本条件下确定系统的可靠性参数是一个迫切需要解决的问题。 1.2 模糊性 由于可靠性数据较少,特别是在方案论证和系统设计的早期阶段,由于分析和评定的失效数据样本小,基于大样本数据的概率模型和统计方法难以适用。目前,往往采用专家经验等定性信息的形式来描述系统的可靠性,如/该城市轨道交通网络的可靠度不太高0等,这种描述本身就存在模糊性,难以用基于概率论的可靠性分析与评定方法来处理。 常规的可靠性理论是建立在二态假设和概率假设基础上的。二态假设是指系统只有两种极端状态,完全正常或完全失效。概率假设则要求满足事件明确加以定义、大量样本存在、样本具有概率重复性、不受人为因素影响4个条件。 城市轨道交通网络作为一个系统运行,其工作状态就存在模糊性,很难满足二态假设,难以用基于概率论的可靠性分析与评定方法来处理。某些系统工作状态的正常或不正常,在外延上难以定义明确的界限,具有模糊的概念,如网络中的部分线路已失效,但整个网络并不完全失效,系统可以降级运行等,用二值逻辑和统计方法难以处理,二态假设无法精确描述,具有模糊性。 1.3 建模困难 可靠性评估的数学模型应该正确地反映系统中各个部分之间的内在联系,准确描述系统的实际运行情况。在系统的复杂性与精确性描述之间,由于城市轨道交通网络是由许多分系统、线路、车站、设施设备组

可靠性指标

第五章 指标的统计与分析 可靠性主要指标依据《供电系统用户供电可靠性评价规程》选择了经常用于分析的六个关键指标分类,包括供电可靠率、用户平均停电时间、用户平均停电次数、平均停电用户数、停电持续时间。要掌握这些指标的定义和计算。 第一节 可靠性主要指标 1、用户平均停电时间 供电用户在统计期间内的平均停电小时数,是反映供电系统对用户停电时间的长短指标,记为AIHC-1, h /∑?=每次停电每次停电持续时间用户数用户平均停电时间(户) 总用户数 若不计外部影响时,则记为AIHC-2, 若不计系统电源不足限电时,则记作AIHC-3。 结合用户平均停电时间示意图讲解 2、供电可靠率 供电可靠率指在统计期间内,对用户有效供电时间总小时数与统计期间小时数的比值,是反映的供电系统对用户供电的可靠度的指标,记作RS 1, 1100%??=-? ??? 用户平均停电时间供电可靠率统计期间时间 若不计外部影响时,则记作RS 2; 若不计系统电源不足限电时,则记作RS 3。 结合可靠率指标计算中各类时间关系示意图讲解 3、用户平均停电次数

供电用户在统计期间内的平均停电次数,是反映供电系统对用户停电频率的指标, /∑=(每次停电用户数)用户平均停电次数(次户)总用户数 4、平均停电用户数 在统计期间内,平均每次停电的用户数,是反映平均停电范围大小的指标,其公式如下 /∑=(每次停电用户数)平均停电用户数(户次)停电次数 5、预安排停电平均持续时间 在统计期间内,预安排停电的每次平均停电小时数。本指标统计的是统计期间内平均每次预安排工作的持续停电时间,主要反映了总体预安排工作的合理性, h /∑=(预安排停电时间)预安排停电平均持续时间(次)预安排停电次数 6、故障停电平均持续时间 在统计期间内,故障停电的每次平均停电小时数。本指标统计的是统计期间内平均每次故障停电的持续停电时间,主要反映了平均每次对故障停电恢复能力的水平, h /∑=(故障停电时间)故障停电平均持续时间(次)故障停电次数

物流网络可靠性及优化设计

物流网络可靠性及复杂性物流网络可靠性研究是一个相对较新的物流研究方向,很多国内外学者在相关文献中提到了这个研究方向的重要性,但几乎还没有系统研究的文献面世。但是,在可靠性基础理论,以及其他一些与可靠性有关的应用领域和研究方向上已经取得了许多研究成果,这为本文的研究开拓了思路并提供了相关理论支持。 1.可靠性的含义 所谓可靠性,是指产品在规定的条件下,在规定的时间内,能够完成规定功能的能力。可靠性有很多数量指标,如寿命、失效率、可靠度等。其中常用的特征是可靠度,可靠度是指产品在规定的条件和规定的时间内,完成规定功的概率。 2.网络可靠性的含义 网络可靠性的研究始于对通信网络的分析,而后,逐渐渗透到电力系统、计算机网络系统和工程系统等各个领域。网络可靠性的分析方法最初只限于两终端问题,随着大型复杂网络系统的发展,使其分析变得更为一般化,同时出现不少新的算法以及新的理论方法。 国内外许多文献对网络可靠性作了定义,虽然有所差别,但最终可认为网络可靠性是指网络系统在实际规定的连续运行过程中,充分完成所规定的正常功能的能力闭。在此,“完成所规定的正常功能的能力或概率”是网络可靠性的测度,它既包含了网络的生存能力和有效性,也反映了网络对用户需求的适应能力;既研究网络正常运行情况下的可靠性,也研究异常情况下的可靠性,是对整个网络运行过程的综合测度。这一定义包括了可靠性研究对象、规定条件、规定时间、规定

功能和概率等五项要素。 3.网络可靠性测度 目前国内外研究是将网络抽象为一个由节点和连接组成的传送各种信息(业务流)的流图进行分析,网络可靠性的测度归纳起来主要有3种:网络的抗毁性、网络的生存性和网络的有效性。 (1)网络的抗毁性(Invulllerability)是网络在人为破坏下的可靠性,是从图论中提出来的,从网络连通性的角度描述了拓扑结构对网络可靠性的影响。一般通过粘聚度和连通度的确定测度表示。近年来多用于军事通信网的研究和部分公用网。 ⑵网络的生存性(survivability)是在随机性破坏下的可靠性,反映了随机性破坏和网络拓扑结构对网络可靠性的影响,是由概率论和图论得出的。其连通性(即网络端到端的连通概率)作为生存性的测度。近来,在自愈网中研究网络的生存性较多。 ⑶网络的有效性(渐ail曲i一ity)又称完成性(pe而rmability),是一种基于业务性能的可靠性测度。它反映了网络在部件失效的情况下,满足业务性能要求的程度。国内外对其测度指标研究较多。随着科学技术的进步,网络可靠性分析在提高网络可靠性与生存性,网络的优化设计中具有重要意义。而网络可靠性理论在社会经济系统、管理领域应用的建模与方法、算法设计等方面还有许多研究工作要做。 4.网络可靠性计算基础 网络可靠性理论涉及到计算,估计和最大化网络在面对随机失效时连接仍然存在的概率。失效或许是由于中断、阻塞或涌堵引起的。对于失效后连接的测量有各种各样的方法,比如节点可靠性(两个节点可

高可靠性网络解决方案

2. 高可靠性网络解决方案 根据《中国证券经营机构营业部信息系统技术管理规范(试行)》第三章“硬件设施”中第四节“局域网络”的规定:网络结构应合理可靠、网络设备应兼具技术先进性和产品成熟性以及网络设备应用冗余备份的要求。我们凭借多年在证券网络系统集成方面丰富的工作经验,结合网卡容错技术(Adapter Fault Tolerance,AFT)、交换机扩展堆叠技术(Scalable Stacking Technolgy,SST)和IEEE链路冗余技术(Spanning-Tree Protocol,802.1D);使用100M服务器网卡、100M交换机、10M交换机和10M工作站网卡设计并实施了一种高可靠性网络方案。它实现了在服务器网卡端(100M NIC)和主干交换机(100M Switch)上能够自动容错的功能。 国内证券营业部当前流行的网络结构是服务器采用100M交换结构,直接连接到100M交换机上;工作站采用10M交换结构,直接连接到10M交换机连接构成100M网络主干(见图1)。 原有网络主要存在以下几种结构上的隐患: ①如果某服务器网卡崩溃,将引起此服务器与网络的数据传输中断。 ②如果100M交换机崩溃,将引起整个网络数据传输中断。 原有解决方案: ①在服务器上安装双网卡,如果主网卡崩溃,由人工装载备份网卡驱动。 ②另配备一台100M交换机,如果主交换机崩溃,由人工替换。 但它们都需要暂时中断网络运行,并且人工干预。为了解决以上问题。我设计了以下不间断自动解决方案: ①在每台服务器上安装两块100M服务器网卡,并将它们配置成容错状态。 ②配备两台主干交换机(100M交换机),分别连接每台服务器上的一块服务器网卡。同 时每台100M交换机都安装堆叠模块(Stack Module),两台交换机上的堆叠模块相 互连接起来,建立一条1GB链路。 ③根据工作站数量配备多台支干交换机(10M交换机),每台交换机都具有两个100M 端口。两个100M端口分别连接两台100M交换机,建立两条100M主干链路,配合 两台100M交换机间的堆叠链路,将其中一条建成冗余主干链路。

天然气管网系统可靠性评价指标研究

天然气管网系统可靠性评价指标研究 发表时间:2019-09-22T01:20:04.140Z 来源:《基层建设》2019年第19期作者:刘亮[导读] 摘要:科技的进步,促进人们对能源需求的增多。贵州乌江新能源开发有限责任公司贵州省贵阳市 550002摘要:科技的进步,促进人们对能源需求的增多。天然气作为清洁的化石能源已经广泛应用于现代化建设当中,其需求量迅猛增长。天然气管网作为连接上游气源和下游市场的生命线,在国民经济和能源安全领域具有重要作用和意义。因此,确保供气管网系统安全可靠至关重要。本文就天然气管网系统可靠性评价指标展开探讨。 关键词:天然气管网系统;可靠性指标;供气可靠性 1可靠性指标天然气管网系统可靠性指标是开展天然气管网系统可靠性评价的前提,也是后期实行可靠性管理的基础。可靠性指标体系的应用对象分为系统和单元两方面,其中系统包括管网、管道、站场3个层级,单元则包括管段、压缩机组、阀门、工艺管道、储气库、LNG接收站、资源及市场等各级系统的主要组成要素。结合天然气管道生产实际,管网系统的可靠性指标应至少包含以下3类:狭义的可靠性类,反映系统在规定条件下和规定时间内完成规定功能的能力;健壮性类,反映系统抗干扰能力;维修性类,反映系统发生故障后通过修复,从而恢复正常工作能力。可靠性指标体系的不同应用对象由于各自不同特点,可能适用上述3类指标中的2种或3种,如管网系统只涉及可靠性及健壮性两类指标,管道、站场系统以及一般设备单元泽可适用全部类别指标。(图1) 图1 天然气管网系统可靠性指标分类示意图对每个对象的广义各类可靠性指标而言,考虑到其多项指标间的逻辑计算关系及管理的需要,需将每类指标划分为基本指标、中间指标、综合指标3个层次(图2)。其中,基本指标为可在现场直接测量或能够利用基本参数简单计算而获得的指标;中间指标是能够反映对象某项特定性能,并能利用若干基本指标计算而获得的指标;综合指标则是狭义的可靠性类/维修性类/健壮性类的综合性能指标。一般而言,基本指标和中间指标数量不限,而综合指标数量较少,一般为1。此外,根据天然气管道管理需要,某些对象还可设置附属指标,其虽然不参与基本指标、中间指标及综合指标的计算,但可以从不同角度反映对象可靠性(狭义)、维修性及健壮性方面的能力,属于常用管理指标。在确立天然气管网系统可靠性具体指标时,要遵循以下3个原则:①能够准确反映出对象的性能,指标具体含义精准、无异议;②尽量不使用需要现场打分或专家咨询等主观手段获取分值的指标;③确保指标计算所需基础数据能够通过统计或现场检测的方法获取,否则该指标不能有效使用。 图2 天然气管网系统可靠性(广义)指标分层示意图 2管网系统水力可靠性评价指标天然气管网水力可靠性是指系统在规定时间和条件下,完成规定的供气任务的能力,用于对系统的供气能力进行评价。采用输出可用度AT、载流可用度Ao以及时刻t水平c的可用度Ac(t)等指标对油气生产运输系统的水力可靠性进行评价。 3供气可靠度供气可靠度指管网系统在规定条件和时间内,完成规定供气任务的概率。系统平均供气不足时间SAIDI指在给定时间和规定条件下,管网系统因各类原因导致的不能满足供气任务的时间均值。系统平均供气不足频率SAIFI指在给定时间和规定条件下,管网系统因各类原因造成下游用户缺气的平均次数。具体表达式为: 4天然气管道行业的可靠性评价方法天然气管道的可靠性是指在规定时间内,系统按照规定运行条件完成规定输送任务的能力。考虑到天然气管道的任务输量及最大承压等因素,相对原油管道,天然气管道系统的冗余度较小,且用户需求多样,管道的局部失效就可能引发大面积连锁事故的发生。限于此,天然气管道系统对管体结构安全性和供气保障能力都有较高的要求。中国工程院院士黄维和率先提出了天然气管道系统可靠性的概念,并对系统可靠性的评价方法和管理框架进行了初步设计。对于单条天然气管道系统的可靠性分析,重点在于管体结构可靠,在统计学方法的基础上明确各管道之间的逻辑关系,为天然气管网系统的可靠性分析奠定基础。而对于天然气管网系统的可靠性管理,需综合系统工程理论和现代物流理论的研究方法,统筹规划各子系统的可靠性历史结果,运用统计和概率的方法反映管网系统的可靠程度。天然气管道系统可靠的基本要求为保障运行安全,因而对于可靠性的研究也应以满足需求侧的供应要求作为评价标准,在保障管体结构安全的前提下实现自身功能。目前,可将天然气管道可靠性评价方法分为结构可靠性和供气可靠性两类,以实现“全方位、全生命周期”的科学管理,保障管道系统安全高效地运行。结语

如何提高企业网络安全可靠性

如何提高企业网络安全可靠性 LINUX服务器为妥 若有人问你,在中小企业的网络规划中,必须遵守的几个原则是什么?那么,可靠性,必定名列其中,而且是名列前茅的。可见,可靠性在中小企业网络建设中的重要性。但是,俗话说,站着说话不怕腰疼,要提高中小企业网络的可靠性不是嘴巴说说就可以完成的,是需要网络管理员拿出全部智慧来设计中小企业的网络应用才可以达到这个目标。 笔者虽然在中小企业网络管理设计中,对于可靠性有比较深刻的认识。但是,自认为还没有掌握到全部内容。下面,笔者就自己的在这方面的一些经验拿出来供大家参考。 一、服务器还是采用LINUX的好 随着信息化技术的普及,服务器在企业中的应用越来越广泛。如企业若采用ERP系统,则需要有ERP系统服务器;采用文件服务器的话,也需要有专门的服务器来支持这个网络应用。现在网络管理员面临着一个问题,就是该采用什么样的服务器操作系统?现在用的最多的是微软的服务器版本的操作系统与LINUX的开源的免费的服务器操作系统。 那我们该怎么选择呢?我个人倾向与LINUX的服务器操作系统,我现在在企业中部署的两个服务器,也都是采用这个免费的开源的操作系统。我为什么选择这个免费的操作系统呢,主要有以下原因。 一是我们都知道,微软的操作系统补丁太多,时不时的需要给操作系统打补丁。从这里也可以看出,微软的操作系统稳定性不容乐观。而这正式企业网络应用可靠性的最大杀手。 二是微软也不知道得罪了谁,跟其相关的网络应用成为了众多黑客等攻击的对象,什么病毒、木马都在其周围打转。而且攻击的不仅仅是其操作系统本身,还有其上面的相关应用。如SQL SERVER数据库系统、Exchange邮件服务器等等,都是其攻击的对象。相对而言,LINUX因为是开源的,而且其有很多技术专家在为其服务,所以,其仇家就没有这么多。针对LINUX服务器系统的攻击,跟微软的操作系统比起来,可以说是九牛一毛。 虽然LINUX在操作性上,没有微软操作系统那么简便,而且,也不是所有的网络应用都支持这个开源的操作系统。但是,企业网络可靠性的考虑,我还是会好不犹豫的选择LINUX的服务器操作系统。其在稳定性方便,要远远的超过微软的服务器操作系统。而且,还可以省去不断打补丁的烦恼;同时,还可以省一大笔软件的授权费用。这一举多得的事情,我们怎么能够放过呢? 服务器的可靠性,是整个企业网络应用可靠性的基础,我们在网络规划的时候,要引起充分的重视。 采用新技术要慎重 二、避免采用最新的技术 新的技术,对于企业来说,可能意味着高性能,但是,同时也意味着不稳定,是可靠性的又一个隐形杀手。在这方面,我的师傅给我讲过一个非常深刻的例子。 那时,我师傅是一个技术迷,是技术的崇拜者。是幸运也是不幸的是,那时候他在一家国有企业负责网络管理。我们知道,那时候的国有企业可是铁饭碗,而且,网络信息化那时候还是一个新名词。在网络信息化这一方面,国有企业是乐意投资的,因为这是一块活招牌,而且,国家在这方面也有资助。所以,我师傅在资金方面是不用愁的,这使得我师傅有足够的金钱去追从新技术。其实,这也怪不得我师傅,也是当时企业管理层的需要。 那时候,无线局域网刚出现,我师傅应企业管理层的需要,就迫不及待的花费巨资,对企业的网络进行大范围的改造。要知道,那时候无线网络设备刚出来的时候,不但价格昂贵,而且,其技术还不是很完善,存在很多问题,让我师傅吃足了苦头。

相关文档
最新文档