云平台服务器存储应急预案

云平台服务器存储应急预案
云平台服务器存储应急预案

云平台服务器存储

应急预案

目录

1 目的 (3)

2 适用范围 (3)

3 规范内容 (3)

3.1 故障分类 (3)

3.2 应急准备 (3)

3.3 具体措施 (4)

4 故障处理规范 (4)

4.1 机房停电 (4)

4.2 主机故障 (4)

4.3 存储系统故障 (5)

4.4 云平台软件系统故障 (5)

4.5 云平台管理服务器故障预防 (5)

4.6 云平台日常告警故障排除 (6)

5 硬件故障预防与排除 (6)

5.1 故障预防 (6)

5.2 故障排除 (6)

5.3 故障处理 (7)

1目的

为提高云平台服务器、存储故障处理能力,形成科学、有效、反应迅速的日常管理流程和应急处理机制,确保平台的安全和稳定运行,最大限度地减小故障对生产的影响,降低业务中断风险,特制定本规范。

2适用范围

本规范适用于提供云计算虚拟化平台服务的服务器、存储管理,应对发生和可能发生的故障。

3规范内容

服务器运维和应急处理应包括风险评估,检测体系和应急处理三个环节,合理有效的执行控制将防止故障影响扩大。

3.1故障分类

平台故障包括服务器硬件和存储系统故障;自然灾害(水、火、电等)造成的物理破坏;人为误操作造成的损害等。

3.2应急准备

部门责任人员明确职责和管理范围,根据实际情况,安排应急值班,确保到岗到人,联络畅通,处理及时准确。

3.3具体措施

(1)建立安全、可靠、稳定运行的机房环境,防火、防雷电、防水、防静电、防尘;建立备份电源系统。

(2)虚拟化平台服务器应采用可靠、稳定、兼容性硬件,落实责任管理机制,遵守安全操作规范;对虚拟机和管理服务器进行定时备份;采用有效的虚拟化监控工具,及时发现问题和日报告。

4故障处理规范

4.1机房停电

接到停电通知后,相关人员应及时部署应对具体措施,启动备用电源,保证服务器正常运行。

4.2主机故障

(1)平台服务器出现硬件告警需要停机维护,服务器责任人应立即通知相关人员,将业务虚机迁移到集群中其他服务器主机上,再将故障服务器切换至维护模式并从HA集群中移除,负责陪同硬件厂家现场更换至成功恢复。

(2)若服务器硬件24小时内无法恢复,服务器责任人需书面报告原因并立即通知业务管理人员进行数据应急备份,防止灾难扩大。

(3)若虚拟化存储硬件出现告警,第一目击人应立即通知存储管理员,并上报主管领导,存储管理员应在报告1小时内联系厂家到场处理,处理完成后因报告原因,找到解决方法;并立即对数据做完整性检查,消除重复发生隐患。

4.3存储系统故障

(1)做好存储系统的定时备份,一旦出现数据损坏、丢失,能够及时恢复系统。

(2)发生存储系统故障后,相关人员应检查出现故障的原因并尽快排除。

(3)如遇系统崩溃,数据丢失,应启用备份文件进行数据恢复。

4.4云平台软件系统故障

(1)日常做好虚拟机的定时备份和快照,系统崩溃后,能够及时恢复虚拟机。

(2)发生虚拟机系统故障后,相关人员应及时通知业务人员检查出现故障的原因并尽快排除。

(3)如遇虚拟机系统需要启用备份系统进行恢复时,应在恢复后和业务管理员仔细检查业务是否恢复并做好恢复记录。

4.5云平台管理服务器故障预防

虚拟化服务器采用群集配置。配套管理软件对虚拟数据中心管理单元进行集中管理,系统平台常年24小时运行,每天将产生大量的任务日志和记录信息。同时管

理服务器担任了整个平台主机管理和集中配置的角色,使用率极高。为了安全,应定期备份配置数据库,定期检查告警日志。

4.6云平台日常告警故障排除

当虚拟化平台出现告警信息,通过以下步骤排除:

1.确定故障原因。查看已触发的警报内容,确定故障前操作是否是引发该故障

的原因,对合规操作引起的告警,进行消除。

2.对提示硬件产生的告警,应查看硬件状态信息,对确认是硬件的问题按硬件

维护预案处理。

3.对提示因资源不足或性能引发的告警,因查看近期性能图表,找出原因,消

除故障提示。

4.对于无法判断的故障,可导出系统日志发给厂家分析处理。

5硬件故障预防与排除

5.1故障预防

保持双机运行状态正常,单机出现故障后,及时对故障单机进行修复。

5.2故障排除

当服务器出现硬件故障,通过以下步骤排除:

(1)确定故障原因。依次查看电源、硬盘、内存、主板、处理器等,如条

件许可,可使用替换法检测各硬件。

(2)恢复固件缺省配置。比如去除第三方厂商备件和非标配备件。

5.3故障处理

(1)硬盘故障处理:当硬盘出现黄灯提示预警时,应先查看硬盘数据是否丢失,如数据存在应先做好数据备份,将此服务器各应用迅速转移,然后排查报警具体原因,如由于错误操作或硬盘连接不好引起的报警,可尝试重启服务器,重新插拔硬盘等操作即可解决问题。如硬盘损坏,应及时将备用硬盘替换下故障硬盘,使服务器恢复正常工作。排查过程中,如不能正确判断问题原因,不能随便操作,可向售后服务咨询处理。

(2)内存故障:由于我们的服务器有多组内存,单条内存故障时,会对服务器性能稍有影响,当不会影响整体使用,所以如发现内存条损坏时,安排时间将损坏的内存条替换掉即可。

(3)RAID卡故障:服务器的RAID卡出现故障时,系统会无法识别出硬盘,服务器不能正常使用,所以应第一时间启动备用服务器。将故障服务器移出生产网络后更换RAID卡,RAID卡通过硬盘重新读取RAID配置信息后即可恢复使用。

(4)电源故障:现阶段我们的服务器都是双电,如果单路电源故障不影响运行,如果长期单路停电运行需准备备用电源。

(5)CPU故障:我们的服务器多为8路CPU,所以在CPU故障时同内存一样,只会对服务器性能有所影响,不会影响整体使用,所以及时安排时间将有问题的CPU 换掉即可。

(6)网卡故障:启用本机备用网卡,顶替故障网卡。

服务器应急预案

服务器应用系统应急预案 1. 服务器应用系统出现故障 (1)当服务器应用系统出现故障,系统管理员应当立即初步确定故障的严重程度,估计出现故障的应用系统故障排除需要的时间,并根据应用系统需要保障的无故障运行时间,采取不同的应用系统恢复策略。 (2)如果应用系统不能停机,立即启用热备份系统进行工作。如果业务系统不能停机,而故障又可以在10分钟之内排除,那么系统管理员立即排除故障,恢复系统正常运行。业务系统可以停机而故障又可以在2小时内排除,应该断开服务器的网络连接,处理服务器故障,尽快排除故障,恢复系统运行。应用系统可以停机但故障排除不能在2小时之内完成,而业务系统有冷备份系统,应该断开服务器的网络连接,通知系统管理员启动冷备份系统,完成业务系统的安装、设置,并进行数据的恢复,保证系统正常运行。业务系统可以停机,而又没有冷备份的业务系统,那么系统管理员备份现有系统的数据和程序,如果不能进行备份系统的数据和程序,系统管理员在确定了业务系统有之前备份的情况下,重新修复或安装操作系统,并重新安装或修复业务系统并恢复最新备份的数据。如果备份丢失或不存在,系统管理员应该报告分管经理,并求助技术支持商,完成对硬盘数据的恢复。 (3)系统管理员在业务系统出现故障时,应该及时查找本地的数据备份,本地的数据备份损坏或丢失,应该立即从异地数据备份复制业务系统的数据备份到本地。 (4) 系统管理员应在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败,立即联系相关厂商和技术支持,请求援助,分析故障原因,若经设备厂商或技术支持认定是硬件损坏,那么需要请求厂商更具维修协议,进行保修或维修。在服务器硬件正常的情

阿里云弹性计算服务ECS技术白皮书改

弹性计算服务 (ECS)-技术白皮书 目录 文档图索引 (3) 文档表索引 (4) 1.云服务器概述 (4) 2.产品功能与特点 (4) 2.1.产品价值 (4) 2.2.系统架构 (4) 2.2.1.虚拟化平台与分布式存储 (5) 2.2.2.控制系统 (5) 2.2.3.运维及监控系统 (6) 2.3.云服务器 (6) 2.4.磁盘快照 (7) 2.5.自定义镜像 (7) 3.产品特点介绍 (8) 3.1.灵活方便 (8)

3.1.1.数据安全可靠 (9) 3.1.2.网络安全可靠 (10) 3.1.3.高效的运维与客服 (10) 4.价值分析 (10) 5.使用案例 (12) 5.1.平台概念解析及原理介绍 (12) 5.1.1.镜像与云服务器实例 (12) 5.1.2.Region (13) 5.1.3.存储系统 (13) 5.2.网络与安全组 (13) 5.3.实施 (15) 5.3.1.镜像使用 (15) 5.3.2.创建并使用云服务器创建并使用云服务器并使用 (16) 5.3.3.使用安全组完成解决方案使用安全组完成解决方案 (17) 5.3.4.使用磁盘快照 (17) 5.3.5.调用API实例 (17) 6.附录 (18)

6.1.云服务器规格说明 (18) 6.2.云服务器使用说明 (19) 6.3.云服务器安全防护 (19) 文档图索引 图 1 系统架构 (4) 图 2 虚拟化平台与分布式存储 (5) 图 3 云服务器 (6) 图 4 磁盘快照 (7) 图 5 自定义镜像 (8) 图 6用户业务 (8) 图 7产品特点介绍 (8) 图 8网络安全设置 (10) 图 9防ARP/IP欺骗 (14) 图 10 流量清洗 (15) 图 11 自定义镜像 (16) 图 12 安全组实施方案 (17) 图 13 磁盘快照 (17)

服务器配置方案v1.1

服务器配置方案

目录 服务器配置方案 (1) 第一章引言 (3) 1.1.编写目的 (3) 1.2.项目背景 (3) 第二章系统网络拓扑结构 (4) 第三章硬件需求 (6) 第四章软件需求 (7) 第五章网络需求 (8) 第六章云环境租用说明 (8)

第一章引言 1.1.编写目的 该文档针对工程造价类项目管理信息系统(以下简称项目管理系统)的实际情况,提出其服务器配置方案。方案的制定本着满足用户实际需要并降低资金投入的原则,需要满足从硬件、网络、软件、安全等方面进行阐述,提供主推方案和备选方案,以便用户根据自身特点进行决策。 1.2.现状和目标 工程造价类项目管理信息系统建设的主要目的是:建立对造价项目的全生命周期管理,包括从项目的启发到项目的后评估,对项目的各里程碑阶段提供信息化支撑手段;统一管理造价项目的各类信息,做到安全存储、有效统计、有效分析;实现造价项目相关流程的信息化,提高流程的流转效率,降低因纸质流程所带来的效率低下和非增值工作的浪费。因此系统的运行需要满足以下目标: 用户在内外网均可访问:公司的员工可以在公司局域网和Internet上均能够访问使用系统; 高可用性:当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会迅速的自动启动并运行(一般为2分钟左右),从而保证整 个系统的正常运行。 扩展性:整个网络以及硬件环境须具有可扩展性,满足公司用户能正常流畅的实用系统。比如存储能能扩展满足日益增长公司业务需求等。 项目管理系统适用于以项目管理为主线贯穿销售、人资、客服等环节业务的管理。用户范围包括造价项目相关的所有人员,目前公司员工240多人,预计在2015年员工总人数达到300人以上,因此系统实用规模预计支持在线用户200人,并发用户50人。 公司目前硬件环境如下:

阿里云主机Linux服务器配置步骤详解

阿里云主机Linux服务器配置步骤详解 编辑:restart 来源:转载 下面我们一起来看看关于阿里云主机Linux服务器配置步骤详解,如果你正在使用阿里云主机我们可进入参考一下配置步骤哦,有兴趣的同学可进入参考。 一提到云主机,大家肯定熟知国内最知名品牌——阿里云了,后来居上的它受到不少的站长所追捧,它的稳定与服务让它的性价比直线上升,现在阿里云的最低端配置云主机年费只需要550元了,在同类产品中可谓最有性价了。如果想做个小站,又想速度上去,阿里云也是一个不错的选择。用过阿里云的站长都知道,阿里云主机是需要自己动手配置的,一些站长就有夸大其词说“没有一定的技术,最好不要用阿里云”。其实,配置阿里云主机也不是很难,只要按照本文的方法一步一步去做就可以了。 第一步:远程连接阿里云主机。 下载xshell和xftp 并安装。这2个软件可以到网站下载。xshell 是一个强大的安全终端模拟软件,它支持SSH1, SSH2, 以及Microsoft Windows 平台的TELNET 协议,可以方便地远程登录阿里云主机。Xftp 是一个基于MS windows 平台的功能强大的S 文件传输软件,可以通过它来上传文件到主机。 这2个软件的安装这里就不说了。下面来看看怎么使用这两个软件。 一、打开xshell

二、设置云服务器登录信息,点击认证(新版本可能是“用户身份验证”)。填写阿里云主机用户名和密码。 三、设置服务器帐号密码。再点击“连接”,填写在“主机”处填写你购买的阿里云主机的IP地址。

四、设置字符集编码。点击”终端“,然后在“编码”选项选择“ UTF-8″。然后按确定保存配置。接着就开始连接主机了。 五、连接后的阿里云主机的庐山正面目。

服务器应急预案

服务器应急预案

服务器应用系统应急预案 1. 服务器应用系统出现故障 (1)当服务器应用系统出现故障,系统管理员应当立即初步确定故障的严重程度,估计出现故障的应用系统故障排除需要的时间,并根据应用系统需要保障的无故障运行时间,采取不同的应用系统恢复策略。 (2)如果应用系统不能停机,立即启用热备份系统进行工作。如果业务系统不能停机,而故障又能够在10分钟之内排除,那么系统管理员立即排除故障,恢复系统正常运行。业务系统能够停机而故障又能够在2小时内排除,应该断开服务器的网络连接,处理服务器故障,尽快排除故障,恢复系统运行。应用系统能够停机但故障排除不能在2小时之内完成,而业务系统有冷备份系统,应该断开服务器的网络连接,通知系统管理员启动冷备份系统,完成业务系统的安装、设置,并进行数据的恢复,保证系统正常运行。业务系统能够停机,而又没有冷备份的业务系统,那么系统管理员备份现有系统的数据和程序,如果不能进行备份系统的数据和程序,系统管理员在确定了业务系统有之前备份的情况下,重新修复或安装操作系统,并重新安装或修复业务系统并恢复最新备份的数据。如果备份丢失或不存在,系统管理员应该报告分管经理,并求助技术支持商,完成对硬盘数据的恢复。 (3)系统管理员在业务系统出现故障时,应该及时查找本地的数据备份,本地的数据备份损坏或丢失,应该立即从异地数据备份复

制业务系统的数据备份到本地。 (4) 系统管理员应在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败,立即联系相关厂商和技术支持,请求援助,分析故障原因,若经设备厂商或技术支持认定是硬件损坏,那么需要请求厂商更具维修协议,进行保修或维修。在服务器硬件正常的情况下,尽快做好系统软件的恢复或重新安装,之后再进行业务系统的恢复或重新安装,再进行业务系统的数据恢复,业务系统完全恢复正常运行后,重新启用恢复的业务系统服务器,再将备用系统停掉。 (5)应急预案技术措施,如果出现网络病毒,黑客攻击等,系统管理员采用瑞星杀毒软件或卡巴斯基杀毒软件和360木马查杀工具等,对整个计算机进行杀毒。对不能确定是否为病毒的文件。如果出现不良信息,系统管理员程要设法找到不良信息的文件或不良信息存在数据库中的位置,对非法信息,进行手工删除,或编程删除,若不能清除,采用程序和数据备份进行恢复。 2、软件系统故障应急预案 (1)发生服务器软件系统故障后,系统管理员应立即对服务器进行查看,分析故障原因,采取并及时报告分管经理;同时安排将故障服务器脱离网络,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据,按照系统恢复应急预案进行。 (2)处理结束后, 系统管理员应将事发经过、处理结果等在

(完整版)阵列服务器配置要求

阵列服务器配置要求一、一台磁盘阵列,配置如下: 平均传输率(MB/s) 200 高速缓存512MB 平均无故障时间(MTBF)500000小时以上操作系统支持Windows /2000/2003 外接主机通道2 X 1Gb iSCSI RAID支持0,1,3,5,10 单机磁盘数量(个) 14 内置硬盘接口Ultra 3 SCSI,SATA 其他规格认证CE,FCC 电源及功率AC 220V 双冗余,热交换电源 冗余风扇 扩展磁盘柜 相关配件及其他附件 容量8T 二、一套虚拟主机软件,配置如下: ◇WEB服务软件:IIS、Apache ◇FTP上传软件:Serv-U、pureFTP ◇邮局服务软件:IMAIL、WEBMAIL ◇数据库软件:MSSQL、MySQL

◇DNS服务软件:Win自带的DNS服务、MyDNS、本公司的WinMyDNS ◇支持脚本:asp,https://www.360docs.net/doc/5a15344011.html,,php,cgi,jsp等所有可在iis或apache下运行的脚本 ◇虚拟主机在线开通、删除、修改、升级 ◇MSSQL数据库在线开通、删除、修改、升级 ◇MySQL数据库在线开通、删除、修改、升级 ◇支持四家邮局在线开通、删除、修改、升级 ◇独立虚拟主机控制面板,支持域名绑定、设置默认首页、修改FTP密码、WEB上传、修改MSSQL密码、修改MySQL密码、自定义404等错误页面、脚本错误信息设置、修改邮局密码、Web 日志下载、ASP脚本加密、文件解压缩 ◇独立的主控端WEB服务器集中管理平台 ◇支持服务器集中监控 ◇所有服务器IIS及FTP保中自动备份及恢复 ◇所有服务器的IIS、FTP、MSSQL、MySQL、DNS、NT帐户、NT文件夹集中WEB管理功能 单位:南京师范大学教务处 联系人:鄢放83598787

云服务器与服务器托管的区别

云服务器和自建服务器的区别 .云服务器云服务器是一种类似VPS服务器的虚拟化技术, VPS是采用虚拟软件,VZ或VM 在一台服务器上虚拟出多个类似独立服务器的部分,每个部分都可以做单独的操作系统,管理方法同服务器一样。 而云服务器是在一组集群服务器上虚拟出多个类似独立服务器的部分,集群中每个服务器上都有云服务器的一个镜像,从而大大提高了虚拟服务器的安全稳定性,除非所有的集群内服务器全部出现问题,云服务器才会无法访问。 云主机服务是云计算服务的重要组成部分,是面向各类互联网用户提供综合业务能力的服务平台。平台整合了传统意义上的互联网应用三大核心要素:计算、存储、网络,面向用户提供公用化的互联网基础设施服务。 云主机服务包括两个核心产品:面向中小企业用户与高端个人用户的云服务器租用服务;面向大中型互联网用户的弹性计算平台服务。 云主机可以有效的解决传统物理租机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。在实际应用中的云主机具有三个方面的弹性能力: 1.主机服务配置与业务规模可根据用户的需要进行配置,并可灵活的进行调整; 2.用户申请的主机服务可以实现快速供应和部署,实现了集群内弹性可伸缩; 3.计费方式灵活,用户无需支付押金,且有多种支付方式供用户选择。 云主机平台的每个集群节点被部署在互联网的某个骨干机房,可独立提供计算、存储、在线备份、托管、带宽等互联网基础设施服务。集群节点由以下硬件构成: 管理服务器:采取双机热备的方式,对整个节点的所有计算服务器、共享存储、网络进行管理,同时对外提供管理整个节点的API。管理服务器上提供: 管理服务(管理节点的计算服务器,对外提供管理接口)、DHCP 服务(为计算服务器的网络启动分配管理网段的IP)、tftp 服务(为计算服务器的网络启动提供远程启动映象下载)、nbd 服务(为计算服务器提供网络块设备服务)。管理服务器上还会运行一个数据采集程序,他定时将各种性能数据采集下来并发送到中央的数据采集服务器上存储服务器群:存储服务器可以是ISCSI 或内置存储容量比较大的x86 服务器,通过CloudexFS 集群文件系统组成一个统一的存储池,为节点内的虚拟机提供逻辑磁盘存储、非结构数据存储以及整合备份服务。 计算服务器群:计算服务器是高配置的DELL 服务器,计算服务器无需安装操作系统,但必须具备网络引导功能,其上运行一个linux 微内核、Xen 软件、一个与管理服务器进行通讯的Agent 交换机:按不同功能和节点性能要求配备多个三层交换机,分别负责管理网段、公网交换网段、内部交换网段、存储网段等。 .自建服务器自建机房是根据特定需求量身定制的专属产品,选择自建机房是因为它能够更精准的满足金融行业对于安全性、私密性的需求,很大程度上降低了因在公共机房所出现服务器被攻击,数据被窃取的隐患。同时,由于数据中心由金融企业自行运营,所以在沟通环节和应对突发问题的速度上是有先天优势的。另外,自建机房也避免了因第三方过失或因数据中心内其他服务器中出现问题而引起全面封网等问题。 相比优势而言,自建机房对于金融行业也有一些明显的弊端。首先,金融企业自建数据中心其实是一次费用庞大的购买行为:粗略计算,企业建造一座1000平方米且各方面设备齐

云平台服务器存储应急预案

云平台服务器存储 应急预案 目录 1目的 (2) 2适用范围 (2) 3规范内容 (2) 3.1故障分类 (2) 3.2应急准备 (2) 3.3具体措施 (2) 4故障处理规范 (3) 4.1机房停电 (3) 4.2主机故障 (3) 4.3存储系统故障 (3) 4.4云平台软件系统故障 (3) 4.5云平台管理服务器故障预防 (4) 4.6云平台日常告警故障排除 (4) 5硬件故障预防与排除 (4) 5.1故障预防 (4) 5.2故障排除 (4) 5.3故障处理 (5)

1 目的 为提高云平台服务器、存储故障处理能力,形成科学、有效、反应迅速的日常管理流程和应急处理机制,确保平台的安全和稳定运行,最大限度地减小故障对生产的影响,降低业务中断风险,特制定本规范。 2 适用范围 本规范适用于提供云计算虚拟化平台服务的服务器、存储管理,应对发生和可能发生的故障。 3 规范内容 服务器运维和应急处理应包括风险评估,检测体系和应急处理三个环节,合理有效的执行控制将防止故障影响扩大。 3.1 故障分类 平台故障包括服务器硬件和存储系统故障;自然灾害(水、火、电等)造成的物理破坏;人为误操作造成的损害等。 3.2 应急准备 部门责任人员明确职责和管理范围,根据实际情况,安排应急值班,确保到岗到人,联络畅通,处理及时准确。 3.3 具体措施 (1)建立安全、可靠、稳定运行的机房环境,防火、防雷电、防水、防静电、防尘;建立备份电源系统。 (2)虚拟化平台服务器应采用可靠、稳定、兼容性硬件,落实责任管理机制,遵守安全操作规范;对虚拟机和管理服务器进行定时备份;采用有效的虚拟化监控工具,及时发现问题和日报告。

服务器部署方案

FMScms网站包含2个部分,即为客户端和服务端。 客户端:网站前台+网站后台 服务端:FMS直播软件和组件 FMS主播系统工作图解 FMS主播系统服务器架构以及硬件级宽带需求说明 FMS服务器安排需要两部分,WEB服务器以及FMS直播服务器,即为开始所说的用程序的2部分。 WEB服务器的作用是用来安装承载用户访问的客户端(网站或者移动端前台) FMS直播服务器的作用是用来接收处理并发布直播视频流 一般来说,WEB服务器的要求不高,普通的服务器或者云主机就可以满足需求,FMS服务器相对来说带宽要求较高,硬件要求:市面上配置不错的独立服务器即可满足,当然还是推荐SSD固态硬盘。 服务架构图

服务器架构方案一: FMS直播中可以通过调整视频直播品质来调整带宽占用大小(视频品质数值范围1-100,数值越小品质越差) 1、通常一个在线观众要流畅清晰的观看标清视频需要大概30k~40k的带宽流量。 2、带宽的换算方法是128k的流量需要1M的网络带宽。 3、服务器所要负载的带宽是按可承载的最高并发流量计算出来的。并发流量是指同时访问资源的流量值, 如果是利用FMS技术,要想满足并发流量的需求就需要将流量累加。如100人同时访问视频资源则可计算出:100人 * 30k = 3000k 3000k ÷ 128k/M = 23.4M(约20M带宽) 如果网站的视频观众最高并发量时达到100人,就需要至少20M的带宽; 如果网站的视频观众最高并发量时达到1000人,就需要至少200M的带宽; 如果网站的视频观众最高并发量时达到5000人,就需要至少1000M的带宽; 推荐服务器: 服务器的配置重点在于带宽,根据市场了解G端口<1000M带宽>的服务器 推荐硬件配置 固态硬盘,大内存即可,CPU占用率相对较低,目前没有一定数量的真实用户,暂时不能测试出对服务器硬 件的消耗值,不过16G内存的服务器承载5000人同时观看直播。 服务器架构方案二:

阿里云服务器配置 SVN 服务器与生产站点同步

阿里云服务器配置SVN 服务器与生产站点同步 来源:本站转载作者:佚名时间:2014-03-08 TAG:我要投稿 作为linux的门外汉,一直觊觎svn的方便性,在有台aliyun的情况下,一起来搞搞。 1.环境 阿里云centos5.5 2.安装svn yum -y install subversion 3.配置 建立版本库目录 mkdir /alidata/www/svndata svnserve -d -r /alidata/www/svndata 4.建立版本库 创建一个新的Subversion项目 svnadmin create /alidata/www/svndata/myproject 配置允许用户rsync访问 cd /alidata/www/svndata/myproject/conf vi svnserve.conf anon-access=none

auth-access=write password-db=passwd 注:修改的文件前面不能有空格,否则启动svn server出错 vi passwd [users] #<用户1> = <密码1> #<用户2> = <密码2> myname=myaname 5.客户端连接 svn co svn://ip/alidata/www/svndata/myproject 用户名密码:myname 6.实现SVN与WEB同步,可以CO一个出来,也可以直接配在仓库中 1)设置WEB服务器根目录为/alidata/www/webroot 2)checkout一份SVN svn co svn://localhost/alidata/www/svndata/myproject /alidata/www/webroot 修改权限为WEB用户 chown -R www:www /alidata/www/webroot/myproject 3)建立同步脚本 cd /alidata/www/svndata/oplinux/hooks/ cp post-commit.tmpl post-commit 编辑post-commit,在文件最后添加以下内容 export LANG=en_US.UTF-8 SVN=/usr/bin/svn

服务器部署方案

服务器部署方案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

FMScms网站包含2个部分,即为客户端和服务端。 客户端:网站前台+网站后台 服务端:FMS直播软件和组件 FMS主播系统工作图解 FMS主播系统服务器架构以及硬件级宽带需求说明 FMS服务器安排需要两部分,WEB服务器以及FMS直播服务器,即为开始所说的用程序的2部分。 WEB服务器的作用是用来安装承载用户访问的客户端(网站或者移动端前台) FMS直播服务器的作用是用来接收处理并发布直播视频流 一般来说,WEB服务器的要求不高,普通的服务器或者云主机就可以满足需求,FMS服务器相对来说带宽要求较高,硬件要求:市面上配置不错的独立服务器即可满足,当然还是推荐SSD固态硬盘。 服务架构图 服务器架构方案一: FMS直播中可以通过调整视频直播品质来调整带宽占用大小(视频品质数值范围1-100,数值越小品质越差) 1、通常一个在线观众要流畅清晰的观看标清视频需要大概30k~40k的带宽流量。 2、带宽的换算方法是128k的流量需要1M的网络带宽。 3、服务器所要负载的带宽是按可承载的最高并发流量计算出来的。并发流量是指同时访问资源的流量值,如果是利用FMS技术,要想满足并发流量的需求就需要将流量累加。如100人同时访问视频资源则可计算出: 100人 * 30k = 3000k 3000k ÷ 128k/M = (约20M带宽)

如果网站的视频观众最高并发量时达到100人,就需要至少20M的带宽; 如果网站的视频观众最高并发量时达到1000人,就需要至少200M的带宽; 如果网站的视频观众最高并发量时达到5000人,就需要至少1000M的带宽; 推荐服务器: 服务器的配置重点在于带宽,根据市场了解G端口<1000M带宽>的服务器 推荐硬件配置 固态硬盘,大内存即可,CPU占用率相对较低,目前没有一定数量的真实用户,暂时不能测试出对服务器硬件的消耗值,不过16G内存的服务器承载5000人同时观看直播。 服务器架构方案二: 采用CDN加速,分发流媒体。这种方式目前也是需要FMS服务器,未来一段时间我们会用另外的方法代替,不过这种方式对服务器的硬件以及带宽的需求就大大减小了。 1.web服务器,当然也可以安装FMS 2.流媒体服务器,这里的流媒体服务器FMS只用来承载聊天、礼物赠送等数据 3.接入CDN,我们目前支持RTMP协议的流媒体加速方式,即将推出的版本的FMSCMS会 添加HTTP协议的流媒体,更适合主流加速方式。 方案二的优点 1.服务器硬件以及带宽要求降低太多,节省服务器成本 2.在线观看直播人数可以无限拓宽,不需要担心服务器占用达到峰值的危险 3.网络环境得到优化,直播效果更加理想

超详细的小微企业云计算服务器配置搭建方案

超详细的小微企业云计算服务器配置搭建方案 对于个人或刚成立的小微企业来说,搭建一个云计算平台是一件不太容易实现的事情,小微企业云计算服务器该怎么配置搭建?给大家推荐一下这篇文章,希望能够给予一些启发与参考。 需求分析 满足60 个以内的终端用户(使用场合为办公、教学、多媒体阅览、门柜业务、家庭等),允许适度的不可用,要求满足若干个员工(如财务人员、老板)的高安全性。我们设计了单机和双机两种方案,大家可以根据自己的实际情况选择。 单机方案结构简单、成本低,建设和运维容易,适合对可用性要求不高的场合,如教学、家庭、小公司办公等;而双机能确保很高的可用性,但是架构稍微复杂,成本增加倒是不多。 系统设计 采用Windows 的远程桌面服务,每个用户只能看到自己主目录中的资料。对于要求数据高度安全性的用户,给其分配虚拟机或者容器,以达到完全与他人隔离的目的。 1、单机方案 为了确保数据的安全性,我们在物理上采用了四级存储子系统(见图1)。

图1 单机方案 首先用一块120GB 的固态盘安装操作系统、应用程序和静态的配置文件,投入运行后开启写保护,这样能最大限度地保护系统,病毒、断电、误删文件等都不会破坏系统,从而确保机器总能正常运行。 其次采用两块250GB 的固态盘做成RAID1(通过硬阵列卡或者软阵列来 设置),有效存储容量是250GB,然后再与2TB 的机械硬盘做成存储池。这个存储池用于存放虚拟内存页文件和用户经常使用的文档资料,同时C:盘上的目录C:\Users、C:\Temp 符号链接到这里。这个存储池拥有2250GB 的容量,接近SSD 的性能。 Windows Server 2012 R2 的存储池管理和ZFS文件系统都能优化SSD 和HDD 的混搭环境,使得经常使用的文件存放在SSD 中,很少访问的文件存放在HDD 中,这些都是自动完成的,无须用户手工干预。 按60 个用户计算,每个用户可分配近40GB 的硬盘空间,这对于日常办公产生的资料来说足够使用。由于允许过度分配,所以每个用户几乎可以得到80GB 的空间。对用户启用磁盘配额限制。 最后使用一台NAS 存储设备,容量为4TB 以上,用于离线备份,也可以考虑做同步备份。安排一个后台备份任务,设定每30 分钟增量备份一次。 采用两块千兆网卡,捆绑在一起,这样正常时两块网卡平摊网络流量,即使一块网卡损坏,也不会中断用户会话。 配置32GB 的内存,至少一块4 核的CPU。本方案也支持少量的虚拟机桌面(4 台以内),每台虚拟机要分配1.5GB 内存。 对于资金预算稍微宽松的公司来说,可以考虑增加一块2TB 的机械硬盘,两块做成镜像,以增加存储容错能力;相反,预算紧张的企业可以考虑只买一块250GB 的固态盘,及时做好数据备份,以增加数据的安全性。 2、双机方案 与单机方案一样,双机方案仍然采用四级存储子系统(见图2),只不过采用一块250GB 的固态盘,再与机械硬盘做成混搭存储池,然后两台计算机的硬盘互为镜像,做成文件系统级同步。存储空间划分为三个分区,分别命名如下。 1)配置盘D 存放虚拟内存页文件,临时目录C:\Temp 符号链接到这里,要经常修改又不用同步到其他计算机的文件;存储虚拟机配置文件和虚拟机硬盘文件。

系统应急预案

系统应急预案2015年7月

系统名称 涉及部门财务部 人员名称人员所在单位人员联系方式涉 及 人 员 及 联 系 方 式 及 职 责 预案事件描述: 调整失败,可能涉及如下情况: 1)系统崩溃:系统出现重大故障是指所有的客户端程序都不能正常连接到服务器,任何合法的 系统用户都无法正确登录系统,甚至于系统完全崩溃; 2)数据丢失:系统数据丢失状态,如数据库服务出现故障,用户数据丢失,公司现有技术手段 无法恢复; 3)服务停顿:系统服务停顿状态,如系统由于不明原因导致大规模用户无法使用,服务停顿。 4)接口无法正常调用:系统无法正常调用财务管控接口(财务管控接口、ERP RFC接口、ESB)。预案处理要求 1)系统崩溃:停止系统后台服务,防止不知情用户继续投递数据。抓取并保存系统出错信息及 日志文件,简单判断异常部位,通知相关人员到岗,保留现场,分析查找原因。 2)数据丢失:停止服务和后台数据库服务,将剩余用户数据进行备份,抓取并保存系统出错信 息及日志文件,通知相关人员到岗,保留现场,分析查找原因。 3)服务停顿:联系网络管理人员、通知相关人员到岗,从网络和系统两个方面分析查找服务停 顿原因。 4)接口无法正常调用:联系相关接口服务提供方,确认服务是否正常。 注:对故障进行快速处理及归档,争取每次故障修复时间控制在两小时以内。 演练要求 1. 对在线系统不造成影响 2. 在主要系统管理员人员变更和服务器、操作系统、主页发布软件发生变更时要进行演练。 3. 演练前应填写工作单,并对系统做全备份。 4. 演练结束形成演练总结报告。 预案流程说明 一、事件报警与确认:系统人员在对系统进行调整的过程中发现公司系统运行中的异常及其它故障。由运维人员首先确认系统是否发生重大故障,及时通知相应管控经理及信通公司相应负责人,启用预案。 二、系统发生重大故障时,保护故障现场:必须及时采取以下措施,通知系统运维人员及时到场 1.保证服务器不再有任何人进行任何操作

阿里云云服务器Windows 2008中的FTP配置图文教程

阿里云云服务器Windows 2008中的FTP配置图文教程 这篇文章主要介绍了阿里云云服务器Windows 2008中的FTP配置图文教程,本文包含创建FTP账号、添加FTP站 点、绑定和SSL设置等内容,需要的朋友可以参考下 云服务器默认使用Windws 2008 IIS 中自带的FTP服务器。 1、添加FTP帐号 A. 选择“服务管理器”->“配置”->“本地用户和组”->“用户”;在空白处右键选择“新用户”; B. 输入用户名,全名和描述可以不填写;输入两遍密码;可以设置“用户不能修改密码”和“密码永不过期”;选择“创建”; 2、打开Internet 服务(IIS)管理器 启动左下角任务栏中的“服务器管理器”,选择“角色”->”Web服务器IIS”->”Internet 服务(IIS)管理器”来打开IIS管理界面; 3、启动添加FTP站点向导 选择左侧连接中的“网站”,点击右侧操作窗口中的“添加FTP站点”;

4、启动“添加FTP站点”向导 输入FTP站点名称和FTP指向的路径;选择“下一步”; 5、绑定和SSL设置 选择你希望开放的IP地址(默认选择全部未分配,即所以IP都开放)和端口(默认选择21);SSL请根据您的具体情况选择,如无需使用SSL,请选择“无”;选择“下一步”;

6、身份验证和授权信息 身份验证请选择“基本”,不建议开启“匿名”;授权中允许访问的用户可以指定具体范围,如果FTP用户不需要很多的话,建议选择“指定用户”,权限选择“读取”和“写入”;选择“完成”。 7、测试FTP连接 您可以在“我的电脑”地址栏中输入ftp://IP来连接FTP服务器,根据提示输入账户密码。 如果您开启了windows默认的防火墙,默认是外网连接不了ftp的,需要设置防火墙策略,允许在windows防火墙的例外里面添加“C:\windows\system32\svchost.exe”程序,才能从外网成功访问ftp 步骤如下: 8)打开windows防火墙,选择允许程序或功能通过windows防火墙

XX平台服务器配置与运行规范v1.0

XXX服务器运营配置与规范 作 业 指 导 书 拟制部门:运维部 编制人:陈永科

1、目的 为规范XXX服务器运营管理、配置、安全及稳定使用,指导系统管理人员正确维护使用系统、系统故障时能迅速解决问题、在新安装实例中作为参考,特建立本运营配置规范,以确保公司系统的可靠运营。 2、适用范围 适用于XXXIDC机房所有linux操作系统服务器。 3、职责 运维部负责人:负责对Linux系统的配置管理规范的实施控制和监督检查,定时更新本规范。 运维部运维工程师:需要严格遵循本规范的操作标准对所有linux主机进行系统配置维护和管理。 4、系统版本 针对XXX使用的Linux操作系统Centos6.3版本以及相应的更新版本。 5、系统账号管理 5.1针对操作系统管理员账号密码等策略 5.1.1 口令要求:口令最短8位,最少包含字母、数字、特殊字符,测试服务器也不能使用简单密码 5.1.2 登陆次数限制:登陆失败尝试5次锁定该账户60分钟,管理员至少每季度更改一次密码,发现有异常要及时更改密码 /etc/pam.d/system-auth系统认证配置文件,添加下面一行: "auth required pam_tally2.so onerr=fail deny=5 unlock_time=60" /etc/login.defs修改密码全局更新密码策略 "PASS_MAX_DAYS=9999"改为"PASS_MAX_DAYS=90",每季度须更改一次密码。

"/etc/shadow"修改所有用户的密码策略 修改对应用用户以"::"分段的第五列,将"99999"改为"90" 5.2 用户密码检查与管理 每星期对关键管理员用户进行检查,检查结果登记得服务器巡检 文件配置:/etc/passwd系统用户文件 /etc/group系统用户组文件 /etc/shadow系统用户密码文件 用命令"cat /etc/passwd"查看系统用户文件是否正常 6 各系统应用运行环境管理 6.1 远程访问管理 所有设备/服务器必须使用ssh v2.0进行登陆管理,禁止使用telnet进行管理,关闭telnet服务,每个管理员必须使用自己的用户名登陆系统。 SSH配置文件:/etc/ssh/sshd_config service sshd start|stop|restart|status ssh服务的启动、停止、重启、运行状态修改SSH默认端口 修改"#Port 22"将22改为22022端口 将SSH密码尝试次数限制为5次 修改"#MaxAuthTries 6",改为5 将允许root登陆改为禁止ROOT登陆 6.2 防火墙iptables配置 防火墙应根据业务系统开放需要的应用端口,默认禁止所有流量进入 防火墙配置文件/etc/sysconfig/iptables 命令:"iptables -p INPUT DROP" 默认禁止所有流量进入 iptables -D INPUT -p tcp --dport 端口号-j -ACCEPT"允许TCP端口号进入 chkconfig iptables on 系统启动时加载防火墙 service iptables save 保存防火墙配置

云平台服务器存储应急预案

云平台服务器存储 应急预案

目录 1目的 (3) 2适用范围 (3) 3规范内容 (3) 3.1故障分类 (3) 3.2应急准备 (3) 3.3具体措施 (3) 4故障处理规范 (4) 4.1机房停电 (4) 4.2主机故障 (4) 4.3存储系统故障 (4) 4.4云平台软件系统故障 (4) 4.5云平台管理服务器故障预防 (5) 4.6云平台日常告警故障排除 (5) 5硬件故障预防与排除 (5) 5.1故障预防 (5) 5.2故障排除 (5) 5.3故障处理 (6)

1 目的 为提高云平台服务器、存储故障处理能力,形成科学、有效、反应迅速的日常管理流程和应急处理机制,确保平台的安全和稳定运行,最大限度地减小故障对生产的影响,降低业务中断风险,特制定本规范。 2 适用范围 本规范适用于提供云计算虚拟化平台服务的服务器、存储管理,应对发生和可能发生的故障。 3 规范内容 服务器运维和应急处理应包括风险评估,检测体系和应急处理三个环节,合理有效的执行控制将防止故障影响扩大。 3.1 故障分类 平台故障包括服务器硬件和存储系统故障;自然灾害(水、火、电等)造成的物理破坏;人为误操作造成的损害等。 3.2 应急准备 部门责任人员明确职责和管理范围,根据实际情况,安排应急值班,确保到岗到人,联络畅通,处理及时准确。 3.3 具体措施 (1)建立安全、可靠、稳定运行的机房环境,防火、防雷电、防水、防静电、防尘;建立备份电源系统。 (2)虚拟化平台服务器应采用可靠、稳定、兼容性硬件,落实责任管理机制,遵守安全操作规范;对虚拟机和管理服务器进行定时备份;采用有效的虚拟化监控工具,及时发现问题和日报告。

阿里云云主机搭建网站攻略

阿里云云主机搭建网站攻略 前言:虽然我也不知道前言有什么用,但是还是跟随潮流写了。我也不知道这应不应该叫攻略,因为我自己也是一个新手,只是想写些自己用了云主机的一些经验和心得。作为一个萌新其实也很慌的好吗!虽然不知道有几个人会看,其实网上也有很多关于云主机如何搭建的,我会写还是要感谢同样在玩云主机的三位朋友!作为一个新人第一次写这么正经的文章有点小小的羞耻,不知道会写多少,坚持多久,只是想试试,能够坚持多久!这篇攻略主要针对阿里云出售的云主机,windows的系统和Linux系统大致一样。 1.阿里云云主机 1.1用途 云主机大多用于搭建一些小型网站,由于操作简单,价格比云服务器要便宜,是新手的话推荐这个 1.2购买 如果是新手的话我推荐阿里云中售价分别为6元/每年和9.9元每年的共享虚拟主机惠普版(如果有朋友找不到的话,我附上一个链接: https://https://www.360docs.net/doc/5a15344011.html,/hosting/free?spm=5176.8060947.858673.gongxiangpuhu i.794a029dqn9MbW) (ps:别说我打广告啊!我虽然也挺想收广告费的,但是人家也看不上我啊)。

如果打开链接或者自己搜索成功的话应该是这样的页面,以上三个选哪个都不影响,具体作用等着我下次有生之年系列再说。操作系统方面小白建议选windows 系统,windows系统支持https://www.360docs.net/doc/5a15344011.html,平台,如果是php开发就选Liunx系统。点击立即购买之后之后付款按钮之类的自己去找找吧,应该在很显眼的位置,毕竟是消费嘛。 显示购买成功之后就看下一步吧! 1.3怎么找到云主机的操作平台 确定买好了云主机,现在可以看下云主机是怎么操作的了,看网页的右上角有个这样的导航栏 点击控制台,以后在阿里云买的其他东西也可以在控制台看。 点击控制台之后在左上角应该可以看到这样一个侧边栏,点击有三根横线的按钮之后,应该看见这样一个面板 接下来选择域名与网站,因为买的是云主机,与网站相关,这个应该很好理解。在域名与网站中选中云虚拟主机,显示正确的话应该是如下页面

服务器配置方案

服务器配置方案 本文转自:傲龙网络 在日常工作中,经常给客户进行硬件配置建议,发现很多客户基本的信息化基础的知识都不是太懂,比如服务器配置数选择和用户数关系等等。甚至很多IT专业人士,比如erp,crm顾问都不是很清楚。当然也有可能这些顾问只专注于他自己工作的那一块,认为这些是售前干的事情,不需要了解太多。在我看来我觉得多了解一些,碰到不懂的客户也可以给人家说个所以然出来,至少也没有什么坏处嘛。下面这篇文章也是平常的工作总结,贴出来给大家分享一下,也许还用的着。 第一章服务器选择 1.1 服务器选择和用户数关系

说明: 首选原则:在初期给客户提供硬件配置参考时,在线用户数建议

按注册用户数(或工作站数量)的50%计算。 备用原则:根据企业的行业特点、用户使用频度、应用特点、硬件投入等综合因素考虑,在线用户数比例可以适当下调,由售前/销售人员在对客户的具体情况进行了解后做出适当的建议。 服务器推荐选择品牌:IBM、DELL(戴尔)、HP(惠普)、Sun 、Lenovo (联想)、浪潮、曙光等品牌机型。 CPU:如果因为选择不同品牌服务器或双核处理器导致CPU型号/主频变动,只要求达到同级别或该级别以上处理能力。 硬盘:对于硬盘方面,推荐选择SCSI硬盘,并做RAID5;对于小企业可以如果由于采购成本的考虑也可采用SATA。对于2000注册用户数以上企业,强烈推荐采用磁盘阵列。 硬盘容量=每用户分配容量×注册用户数+操作系统容量+部分冗余 1.2 常见机型参考报价

由于IBM服务器在几个品牌的PC服务器系列中价格较高,如果报价是供客户做预算用,则可将该报价直接发给客户供参考,减少商务询价的工作量。 硬件配置和相关型号可上网查询: IBM服务器 HP服务器 DELL服务器 SUN服务器 Lenovo(联想) 1.3 服务器选择和用户数关系在线计算 在IBM网站上有提供IBM Systems Workload Estimator工具可用于

云服务器介绍

云服务器介绍 引言:云服务器是最近才发展起来的技术,相信很多站长或是技术人员不是很了解。本文从云服务器的概念背景到应用,详细阐述了云服务器带来的技术革新和优势。 通过这篇文章,您能收获到: 1.知道什么是云服务器? 2.云服务器的原理。 3.云服务器的特征。 4.云服务器与VPS 的区别。 云服务器是一种类似VPS服务器的虚拟化技术,VPS是采用虚拟软件,VZ或VM 在一台服务器上虚拟出多个类似独立服务器的部分,每个部分都可以做单独的操作系统,管理方法同服务器一样。 而云服务器是在一组集群服务器上虚拟出多个类似独立服务器的部分,集群中每个服务器上都有云服务器的一个镜像,从而大大提高了虚拟服务器的安全稳定性,除非所有的集群内服务器全部出现问题,云服务器才会无法访问。 云服务器是,是一种基于WEB服务,提供可调整云主机配置的弹性云技术,整合了计算、存储与网络资源的Iaas服务,具备按需使用和按需即时付费能力的云主机 云主机服务是云计算服务的重要组成部分,是面向各类互联网用户提供综合业务能力的服务平台。平台整合了传统意义上的互联网应用三大核心要素:计算、存储、网络,面向用户提供公用化的互联网基础设施服务。 云主机服务包括两个核心产品:面向中小企业用户与高端个人用户的云服务器租用服务;面向大中型互联网用户的弹性计算平台服务。 云主机可以有效的解决传统物理租机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。在实际应用中的云主机具有三个方面的弹性能力: 1.主机服务配置与业务规模可根据用户的需要进行配置,并可灵活的进行调整; 2.用户申请的主机服务可以实现快速供应和部署,实现了集群内弹性可伸缩; 云主机平台的每个集群节点被部署在互联网的某个骨干机房,可独立提供计算、存储、在线备份、托管、带宽等互联网基础设施服务。集群节点由以下硬件构成:

机房服务器管理应急预案

机房服务器管理应急预案 目录 一. 故障处理流程 (2) 二. 应急预案方案 (4) 三. 预防保障措施 (8) 四. 应急资源配备 (8) 五. 厂家联系人 (8)

一.故障处理流程 (一)系统故障通报与应急恢复 1.当值班人员发现系统故障时,应立即采取应急措施设法恢复故障,并在故障 解决后以邮件方式通知技术中心领导。当故障处理需要技术部门协作时,由值班人员及时通知开发人员。不明确具体协作人员时,可直接联系技术开发部经理。 2.如果故障30分钟内无法解决,值班人员应以手机方式通知公司主要领导,并 通知系统维护人员与相关开发人员到场,一并协调尽快解决问题。 3.故障恢复后30分钟内,由值班人员发出《故障信息单》。通知单内容包括故 障信息、故障恢复信息。(恢复故障指:故障现象得到缓解,系统得到正常运行,但不代表引起故障的原因已明确定位,并彻底解决系统故障隐患。故障恢复后要求进行故障分析与故障纠正预防、彻底解决或减少故障重复发生次数。) 4.系统管理人员在收到《故障信息单》后,及时将故障情况添加到“故障案例” 中,以备日后学习总结。 (二)故障分析、纠正、预防 1.故障恢复后,不代表故障已彻底解决,不会再发生。值班人员、系统管理人 员及相关开发人员,需要对故障产生的原因进行定位,分析,制定彻底纠正、预防故障的解决方案。 2.在故障恢复后的3个工作日内,由系统管理人员负责编写《系统故障分析报 告》。《系统故障分析报告》内容要求含盖故障发生的时间、地点、项目名称、故障描述、处理全过程、影响面大小、故障级别、故障审核等各方面信息,编写人员必须认真填写,以确保数据的准确性和完整性。若在技术上有疑问,可向技术处理协作人员咨询。 3.《系统故障分析报告》要求在故障恢复后的3个工作日内完成,再发给技术 中心各领导知晓,并由专门人员将故障及处理过程录入知识库,以便于共享工作经验,提高故障处理能力与效率。 4.故障若无法制定或实施纠正预防措施,技术部门应做详细的原因说明,同时

相关文档
最新文档