网络设备巡检服务工作要求规范

网络设备巡检服务工作要求规范
网络设备巡检服务工作要求规范

XX信息中心

网络设备巡检服务工作规范

(H3C设备网络)

V1.0

信息中心

目录

1概述 (5)

2巡检工作流程 (5)

2.1巡检前期准备 (6)

2.2数据采集阶段 (7)

2.3数据分析和报告生成阶段 (7)

2.4汇报和满意度调查阶段 (7)

3网络巡检数据采集方法 (7)

3.1手工数据采集方法 (8)

3.2网络管理平台数据收集方法 (8)

3.3巡检工具数据采集方法 (8)

4网络巡检服务基准数据库的建立 (8)

5网络巡检工作内容 (9)

5.1巡检工作的主要内容 (9)

5.2网络巡检工作技术涵盖 (10)

6网络系统巡检基本判断标准 (10)

7设备相关信息收集 (12)

7.1软件版本及硬件信息分析 (12)

7.1.1当前设备硬件信息 (13)

7.1.2当前设备运行软件信息 (14)

7.2设备板卡硬件配置信息分析 (14)

7.3设备运行状况检查 (15)

7.3.1设备CPU工作状态检查 (16)

7.3.2设备CPU利用率分析 (16)

7.3.3设备MEMORY使用状态检查 (17)

7.3.4设备MEMORY利用率分析表 (18)

7.4设备运行状态检查 (18)

7.4.1电源的工作状态 (18)

7.4.2风扇的工作状态 (19)

7.4.3设备工作温度 (19)

8端口的可用性、准确性检查 (19)

8.1端口状态检查 (19)

8.1.1基本网络接口状态分析 (22)

8.1.2接口半/全双工模式和链路类型 (23)

8.1.3接口稳定性统计信息 (23)

8.2端口状态检查表 (23)

9设备端口负载及流量检查 (24)

9.1设备缓存信息检查 (24)

10 网络架构、配置信息分析 (24)

10.1网络结构检查 (24)

10.1.1检查内容 (24)

10.1.2检查方式 (24)

10.2网络配置信息检查 (27)

10.2.1检查内容 (27)

10.2.2检查方式 (27)

11LOG信息检查 (30)

11.1标准的LOG格式 (30)

11.2LOG日志等级 (30)

11.3日志信息分析表........................ 错误!未定义书签。

关于文档

为保障XX信息中心网络的平稳运行,将在每月进行网络巡检,并根据巡检结果给出相应的网络系统改进和优化建议。

本文档面向XX的技术人员和外部支持公司网络工程师,通过参考本文档,共同完成对XX信息中心网络运行状况的检查与分析。

通过本文档使XX技术人员和外部支持公司网络工程师充公了解XX信息中心对网络巡检的基本要求,以该规范为参考,使得网络系统巡检工作更加标准化、规范化。

由于网络技术的不断发展和设备的更新换代,本规范需要逐步地更新、完善,增加网络设备硬件、软件、固件的新版本和新硬件的内容。

同时,随着网络健康服务的不断深入,对网络系统检查的深度和范围也将发生变化,本规范也会逐步地完善。

文档适用对象

本文档仅适用参与XX网络项目相关技术人员和外部支持公司的网络工程师。

1 概述

为确保XX信息中心网络安全生产,提升网络服务质量,确保设备的正常运行,将每月对XX信息中心网络设备进行巡检,巡检范围根据巡检工作需要而确定,通过对网络设备的数据采集和分析,能够对XX信息中心网络设备的状态具有更加深入地了解。

网络巡检是指通过标准的方法和流程定期地对客户一定范围内的网络进行网元级的系统检查,内容包括现场数据采集、分析、客户报告生成等。通过对关键网元设备的关键检查点参数进行数据采集、并将采集到的数据与有关标准进行比较,从而确定关键网元设备所处的运行状态。通过定期网络巡检,可以及时发现网络中可能存在的隐患,并消灭在萌芽状态。

2 巡检工作流程

网络巡检工作分为前期准备、现场数据采集、数据分析、报告生成和汇报、满意度调查和问题整改追踪等五个阶段。

服务流程如下:

2.1巡检前期准备

在网络巡检的前期准备阶段,工程师需要在与客户进行充分沟通的情况下,确定要巡检的设备范围及巡检重点,形成《网络巡检方案书》。

网络巡检书至少包括:

●巡检设备范围和巡检工作重点

●巡检各个工作环节的方式

●数据采集的命令集

●协商具体的巡检时间安排

●巡检报告输出样表和图形

在得到客户认可的情况下,进入下一阶段的工作。

2.2数据采集阶段

在网络巡检的数据采集阶段,对于网络数据采集的手段和工具需要得到用户的授权,遵守用户运行管理的相关规定,在指定时间和网络设备范围内进行数据采集工作。

在用户的协助下收集相关网元的技术数据,并记录输出结果。

2.3数据分析和报告生成阶段

巡检工程师对现场采集到的数据进行分析,形成《XX信息中心XX中心网络巡检报告》。

经过南天公司的网络专家审核通过后,由工程师负责以纸质文档或电子文档的方式提交给客户。

2.4汇报和满意度调查阶段

通过定期交流的方式,讨论巡检工作中发现的问题及隐患,给出网络运行状况的检查、评估及建议,并进行问题跟踪。

同时进行客户满意度调查,以便发现和纠正工作中的问题,改进网络系统巡检工作。

3 网络巡检数据采集方法

网络巡检服务的数据采集方法有两种,一是手工命令采集,并配合网管平台进行辅助性数据采集的方法;一是巡检工具数据采集的方法。

3.1手工数据采集方法

手工采集就是登录到网络设备上,通过手工输入命令并记录输出结果的方式进行数据采集。

为加强手工数据采集的准确性和合理性,需要对数据进行多次,重复性数据收集。如考量CPU的利用率和MEM的利用率等信息,可以采用日起、日中、日结等三个阶段,分时段收集并进行汇总比。

对于网络设备运行状态、数据流量等信息的趋势性数据采集需要结合一定时间段数据的采集工作,需要利用网络管理系统进行相关数据的采集工作。

3.2网络管理平台数据收集方法

通过网络管理系统收集相关的数据,可以进行一个阶段的趋势分析,以便更加准确地了解网络系统的整体运行情况,并可以与手工数据采集的结果进行对比,确保数据采集和分析的合理性和可靠性。

3.3巡检工具数据采集方法

通过H3C提供的专用巡检工具进行数据采集。该工具集合了常用的设备状态检查的命令,可以自动化收集输出结果,并在后期导出巡检报告。但是需要H3C 提供软件及其授权。在没巡检工具软件的情况下,可以由第一巡检方法来替代。

4网络巡检服务基准数据库的建立

由于网络系统的巡检服务是一个长期的、持续性的工作,首先需要对网络系统具有一定的了解,建立一个基本信息库。主要包括:

设备清单:设备名称、IP地址、位置、功用、序列号等

设备模块硬件配置:模块种类、型号等

设备软件版本

设备使用、维修记录

设备性能基准,包括CPU、Memory利用率、设备端口流量的初始数据等

设备端口信息:相关计数器初始状态

通过第一次巡检完成基本信息库的建立,作为以后巡检工作的数据对比性分析的基础和依据,并保持数据更新,动态调整基本信息库的参考点。

5网络巡检工作内容

5.1巡检工作的主要内容

本项目中,网络巡检工作中涉及的相关内容如下:

1)设备基本信息收集

采集设备的基本信息,包括用户定义的设备名称、设备序列号、设备型

号、运行的软件版本、内存大小、CF卡的大小等

2)设备运行状态检查

主要采集和分析网络设备的CPU、Memory利用率,并在可能是的情况下,

观察其变化趋势。

3)设备管理运行环境检查

主要通过设备的相关命令收集网络设备的运行环境,主要包括机框内部

各个检测点的温度及其变化,电源工作状态和工作输出电压等相关信息。

4)场地环境检查

检查设备的运行环境,如机房温度、湿度、设备供电、网络线缆走线等

5)网络设备硬件检查

检查设备状态、设备连线状态等

6)网络设备日志检查

使用display命令,收集设备运行日志,并做分析

7)核心设备的端口可用性、准确性检查

使用display命令查看设备各端口的工作情况,包括端口的输出、输入

错误丢包信息等,buffer占用情况和缓冲器溢出现象等

8)核心设备端口负载及流量检查

通过网管及其他手段,对设备端口的带宽占用、负载和流量进行统计分

析,便于掌握网络设备及其连接线路的情况。

9)网络系统总体性能评估

针对巡检的内容及分析结果,对网络运行的整体情况做评估。

5.2网络巡检工作技术涵盖

网络系统巡检工作主要涵盖以下技术内容:

6网络系统巡检基本判断标准

我们将依照依据华三公司的技术指标和业界遵循的阈值、惯例和相关技术标准,将采集的数据结果与其对照分析,以判断当前网络运转情况是否良好,根据具体发现的问题提出合理改进意见。

1)设备运行记录

2)设备报警温度

3)电源风扇状态

4)CPU内存状态

5)接口丢包错包率(增量)

6)接口负载率

7)防火墙状态

7设备相关信息收集

7.1软件版本及硬件信息分析

使用命令display version,查看路由器信息,在巡检过程中用此命令收集来的数据主要作用是:

查看当前设备型号,及当前启动软件版本

查看当前设备已运行时间

查看当前设备引擎内存大小

查看当前设备Flash大小

具体关注方法如下:

7.1.1 当前设备硬件信息

设备硬件信息主要包括如下参数:

H3C S7500 with 1 MPC8245 Processor

256M bytes SDRAM

32768K bytes Flash Memory

512K bytes NVRAM Memory(如图第7-10行)当前设备引擎号、内在与Flash大小

H3C S7500 LPU with 1 MPC8241 Processor

128M bytes SDRAM

0K bytes Flash Memory

0K bytes NVRAM Memory(如图第18-21行)

如果设备有冗余引擎,此处显示

7.1.2 当前设备运行软件信息

设备软件信息主要包括如下参数:

BootROM Version(如图第23行)

自启动文件的版本,可用于路由器启动前配置,修改超级管理密码。中低端设备亦称之为Bootstrap。

Comware software Version (如图第3行)

系统文件的版本,不同的版本支持的功能不尽相同。一般情况下向下兼容。前期设备称之为VRP software

Uptime(如图第6行)

Uptime列出了该设备已运转的时间,这些信息可以帮助客户判断机器是否发生过意外的重启等

7.2设备板卡硬件配置信息分析

设备板卡硬件数据采集分析的主要任务是通过检查网络设备的板卡和模块配置,对网络设备的负载、容量和扩展能力进行分析。

查看基本信息检查的命令主要有:display device display diagnostic等命令

设备硬件统计信息主要包括以下参数:

Slot

所在位置的槽号

Status

显示板卡状态

SftVer

显示板卡上软件的版本

设备硬件分析的参考标准

Status:

当设备启动正常后,所有板卡状态就为Normal,如果有双引擎进行冗余状态配置时状态为一个Master,另一个是Normal。当板卡有故障时此板卡状态有可能显示FAULT 或显示不出装载的板卡。

7.3设备运行状况检查

运行状况检查包括:

●CPU的工作状态

●内存的工作状态

●Buffer的情况

7.3.1设备CPU工作状态检查

使用命令display cpu可以检查cpu的利用率,可以得到5秒、1分钟和5分钟的统计结果。

处理器利用率分析的参考建议:

这个数值在80%-90%之间时需要引起注意,大于90%时则影响网络稳定性和设备的正常处理。此数值可通过命令行窗口或网管软件采集连续值得出。当CPU 使用率偏高时排查各个进程CPU使用情况。

7.3.2设备CPU利用率分析

通过display cpu命令采集相关设备一天当中三次数据,并对数据进行整理分析得到:

【注】:日起数据为08:30-09:00的5分钟CPU的平均利用率

日起数据为11:00-12:00的5分钟CPU的平均利用率

日起数据为16:30-17:30的5分钟CPU的平均利用率

7.3.3设备MEMORY使用状态检查

在任意视图下使用display memory或display memory-usage命令可采集相关设备MEM利用率的数据。

display memory slot 0

System Total Memory(bytes): 197932416

Total Used Memory(bytes): 65234704

Used Rate: 32%

[H3C]display memory-usage

Memory utilization statistics at 2011-08-12 15:52:09 200 ms

System Total Memory Is: 171774608 bytes

Total Memory Used Is: 128234928 bytes

Memory Using Percentage Is: 74%

另外,可以用display memory limit显示内存配置消息

display memory limit

Current memory limit configuration information:

system memory safety: 40 (MBytes)

system memory limit: 30 (MBytes)

auto-establish enabled

Free Memory: 108120672 (Bytes)

The state information about connection:

The times of disconnect: 0

The times of reconnect: 0

The current state: Normal

7.3.4设备MEMORY利用率分析表

使用display memory 命令采集相关设备一天三次MEM利用率的数据,并进行数据比较,从表中看到内存占用是否稳定,并关注其变化范围。

7.4设备运行状态检查

7.4.1电源的工作状态

使用display power 命令查看电源状态是否正常,电源是否冗余。

display power

Power 1 State: Absent

Power 2 State: Normal

Power 3 State: Absent

7.4.2风扇的工作状态

使用display fan命令查看风扇状态是否正常。

display fan

Fan 1 State: Normal

7.4.3设备工作温度

使用display environment命令,查看设备内部板卡、机框的工作温度是否正常。

display environment

System temperature information (degree centigrade):

----------------------------------------------------

Board Temperature Lower limit Upper limit

1 30 10 70

3 43 10 80

5 33 10 70

8端口的可用性、准确性检查

8.1端口状态检查

使用display interface 查看设备端口运行状况。在巡检过程中用此命令收集来的数据的主要作用是:

display interface Ethernet2/0/1

Ethernet2/0/1 current state : DOWN

IP Sending Frames' Format is PKTFMT_ETHNT_2,

Hardware address is 000f-e20f-3f11

The Maximum Transmit Unit is 1500

Media type is twisted pair, loopback not set

Port hardware type is 100_BASE_TX

Unknown-speed mode, unknown-duplex mode

Link speed type is autonegotiation,

link duplex type is autonegotiation

Flow-control is not enabled

The Maximum Frame Length is 1536

Broadcast-suppression ratio: 20%

Allow jumbo frame to pass

PVID: 1

Mdi type: auto

Port link-type: access

Tagged VLAN ID : none

Untagged VLAN ID : 1

Last 300 seconds input: 0 packets/sec 0 bytes/sec

Last 300 seconds output: 0 packets/sec 0 bytes/sec

Input(total): 0 packets, 0 bytes

- broadcasts, - multicasts

Input(normal): 0 packets, 0 bytes

0 broadcasts, 0 multicasts

Input: 0 input errors, 0 runts, 0 giants, 0 throttles, 0 CRC 0 frame, - overruns, - aborts, - ignored, - parity errors Output(total): 0 packets, 0 bytes

- broadcasts, - multicasts, - pauses

Output(normal): 0 packets, 0 bytes

0 broadcasts, 0 multicasts, 0 pauses

Output: 0 output errors, - underruns, - buffer failures

- aborts, 0 deferred, 0 collisions, 0 late collisions

- lost carrier, - no carrier

参数指标如下:

H3C交换机巡检命令

1H3C交换机巡检命令 1.1查看CPU使用率 display cpu-usage Slot 1 CPU usage: 6% in last 5 seconds 5% in last 1 minute 5% in last 5 minutes #最后5分钟的平均使用率为5%# Slot 1 CPU 1 CPU usage: 0% in last 5 seconds 0% in last 1 minute 0% in last 5 minutes 1.2查看内存使用率 display memory Used Rate: 13% #内存使用率为13%# 1.3查看设备温度信息 display environment Slot 1 System temperature information (degree centigrade): ------------------------------------------------------------------------------- Sensor Temperature LowerLimit WarningLimit AlarmLimit ShutdownLimit Inflow 1 32 0 67 72 NA hotspot 1 38 0 77 82 NA

#hotspot:表示热点温度传感器 inflow:表示入风口温度传感器 目前slot1入风口入设备温度为32度,热点温度为38度,设备温度一般指热点温度# 1.4查看设备汇总信息 display device verbose Slot 1 SubSNo PortNum PCBVer FPGA Ver CPLDVer BootRomVer AddrLM Type State 0 30 REV.B NULL 003 210 IVL MAIN Normal slot 1 info: Up Time : 10 weeks, 0 days, 6 hours, 26 minutes Brd Type : H3C S5500-34C-HI-D Brd Status : Master Sft Ver : 5.20 Release 5203P03 Patch Ver : None PCB Ver : REV.B BootRom Ver : 210 CPLD Ver : 003 #可查看到设备的运行时间,设备型号# 1.5查看风扇信息 display fan Slot 1 FAN 1 State : Normal #查看风扇的状态,Normal为正常,Abnormal为异常#

H3C网络设备巡检服务工作规范

XX信息中心 网络设备巡检服务工作规范 (H3C设备网络) V1.0 信息中心 2011年8月 目录 1概述 (5)

2巡检工作流程 (5) 2.1巡检前期准备 (6) 2.2数据采集阶段 (7) 2.3数据分析和报告生成阶段 (7) 2.4汇报和满意度调查阶段 (7) 3网络巡检数据采集方法 (7) 3.1手工数据采集方法 (8) 3.2网络管理平台数据收集方法 (8) 3.3巡检工具数据采集方法 (8) 4网络巡检服务基准数据库的建立 (8) 5网络巡检工作内容 (9) 5.1巡检工作的主要内容 (9) 5.2网络巡检工作技术涵盖 (10) 6网络系统巡检基本判断标准 (10) 7设备相关信息收集 (12) 7.1软件版本及硬件信息分析 (12) 7.1.1当前设备硬件信息 (13) 7.1.2当前设备运行软件信息 (14) 7.2设备板卡硬件配置信息分析 (14) 7.3设备运行状况检查 (15) 7.3.1设备CPU工作状态检查 (16) 7.3.2设备CPU利用率分析 (16) 7.3.3设备MEMORY使用状态检查 (17) 7.3.4设备MEMORY利用率分析表 (18) 7.4设备运行状态检查 (18) 7.4.1电源的工作状态 (18) 7.4.2风扇的工作状态 (19) 7.4.3设备工作温度 (19) 8 端口的可用性、准确性检查 (19)

8.1端口状态检查 (19) 8.1.1基本网络接口状态分析 (22) 8.1.2接口半/全双工模式和链路类型 (23) 8.1.3接口稳定性统计信息 (23) 8.2端口状态检查表 (23) 9 设备端口负载及流量检查 (24) 9.1设备缓存信息检查 (24) 10 网络架构、配置信息分析 (24) 10.1网络结构检查 (24) 10.1.1检查内容 (24) 10.1.2检查方式 (24) 10.2网络配置信息检查 (27) 10.2.1检查内容 (27) 10.2.2检查方式 (27) 11 LOG信息检查 (30) 11.1标准的LOG格式 (30) 11.2LOG日志等级 (30) 11.3日志信息分析表 (30)

Juniper_华为_H3C设备维护常用命令

Juniper_华为_H3C设备维护常用命令1、[Router&Swithc]华为/H3C设备常规巡检命令 #系统时间 display clock #系统以及各单板软件版本 display version #设备温度 display environment #日志信息 display logbuffer #单板运行状态 display device #电源状态 display device #风扇状态 display device #CPU占用状态 display cpu-usage #存占用率 display memory limit #接口流量 display interface #接口、链路状态 display interface #地址分配 display current-configuration interface# #路由扩散 display current-configuration | include ospf #OSPF(Open Shortest Path First)配置 display router id #路由信息 display ip routing-table #端口统计数据 display ip interface #当前配置文件 display current-configuration #保存配置文件 display saved-configuration 端口使用状态 display interface GigabitEthernet/Ten-GigabitEthernet brief VLAN使用状态 display ip interface brief 2、脚本—华为

服务器维护规范2016

服务器维护规范 1、预防性维护服务 定期预防性维护也就是日常的一般性维护,是一种基于预防性维护的主动服务。定期对系统进行预防性维护,是确保系统正常健康运行的重要预防措施。通过该服务及时检查、发现故障隐患,更换与排除故障部件,调整系统参数,尽量减少系统故障及宕机时间,保持业务持续性运行。 1.1 预防性维护服务周期 每三个月预防性维护服务一次,对系统软硬件进行预防性检查维护,尽量将隐患消除在萌芽之中。 1.2 预防性维护服务内容 *系统运行环境检查,包括机房温度、湿度和零地电压、零火电压等 *系统硬件运行情况检查 *系统错误日志分析 *超级用户邮件分析,清理过期邮件 *对磁带机、光驱和软驱做读写测试和必需的清洗 *文件系统空间使用情况检查 *系统运行状态、性能检查和优化,包括CPU、内存和交换区使用情况,硬盘和网络的IO 情况检查 *记录系统存储空间的逻辑结构 *双机系统软件配置检查及有效性测试 *操作系统版本及微码检查 *设备除尘处理。 *检查如发现有隐患的部件将及时更换 1.3 预防性维护服务维护的方法 *主机和磁盘阵列的物理状态检查,具体包括电源、风扇状态、LED状态灯检查等。 主要部件的状态检查,具体操作如下: *适配卡状态(包括SCSI卡、网卡等):检查是否处于Available状态。 *内存状态:检查是否处于Available状态以及内存容量是否与机器原始配置相同。 * CPU状态:检查是否处于Available状态 *硬盘状态:检查是否处于Available状态 *网络通讯状态统计:检查其中Ierr和Oerr基本为0 *磁盘空间使用情况检查,要求已经使用空间在80%以下,并且至少有12MB以上的剩余空间。 软驱、光盘驱动器、磁带机的可用性检查,具体操作如下: *光盘驱动器:装入一张光盘,检查光盘的内容是否正确。 *磁带机:把一个文本文件写入空白磁带再读回,检查与原始文件是否一致。 *检查系统错误日志,主要检查其中是否存在永久性不可恢复的硬件错误;读取root邮件等,检查是否有需要处理的部件故障。 系统性能情况检查,具体操作如下: *检查系统内存使用和cpu使用的性能情况。 *检查磁盘I/O的性能情况。 *检查系统交换空间的使用情况。

服务器定期巡检制度

服务器定期巡检制度 为了保证省内各网点服务器正常、有序、安全运转,提升工作效率,保障客户能够更好的应用汇信科技产品及相关服务,特制定本制度,对服务器巡检加以规范。 服务器由专人负责统一管理和日常维护,其他员工未经允许,不得擅自动用。如必须在服务器控制台上进行操作,须经管理人员同意,并对所进行的所有操作进行登记(《服务器使用登记表》)。 一文件管理 每天对修改的文件进行备份,系统文件的正常拷贝。 每周对文件系统进行修复性检查。 每月对整个系统进行备份。 根据备份,恢复被不当修改的文件系统。 二服务器资源管理 检查服务器资源使用情况,处理由于服务器有限资源的使用而遇到的问题。 排除由于连接问题而造成的网络阻塞。 失控进程检查。 磁盘空间使用情况检查:查找无主注册区,删除临时文件和由于不当关机或其他原因而生成的大型文件。 服务器工作效率检查,按需重新调整系统、分配资源。 三日志管理: 对服务器上所起服务的各项日志进行整理、清理,对反映出的问题向相应人员进行反馈。对系统的修改和重大事件进行纪录。 四安全管理: 实时关注系统安全问题,包括病毒防范、外来攻击。 安装病毒防火墙,并保证实时更新;每周对服务器进行一次整体病毒扫描。 管理员制定服务器超级用户口令,并需保密,不得外泄。口令须6位以上,由字符、数字、符号组合而成,且每季更换。 按需制定员工的服务器使用权限,分配口令。员工只能在被允许的工作目录里进行操作,禁止试图进行权限外操作。 对软件使用权限进行审定。 寻找权限失控的文件,并检查文件所有者和大小。 寻找无主文件。 五员工使用管理: 员工需对自己的服务器登陆口令保密,严禁随意传播。 员工只能在分配到的工作目录里进行操作,严禁进行可能对服务器产生伤害的操作。 在未经允许的情况下,禁止在服务器控制台上进行操作,需向管理人员提交操作要求,由管理人员进行处理,若却有必要由本人进行操作,须经管理人员同意,并填写《操作日志》。

(h3c华为)网络设备巡检报告模板

(h3c华为)网络设备巡检报告模板

(h3c华为)网络设备巡检报告模板 篇一:网络设备巡检表 网络安全设备巡检报告 客户名称:湖北省疾控中心 巡检时间: 巡检工程师: 时间: 客户代表:时间: 篇二:网络设备巡检报告 运城市烟草公司 网络巡检报告 巡检人员: 巡检日期: 山西宇轩伟业科技贸易有限公司 网络巡检项目 一、网络拓扑、拓扑分析、拓扑建议二、网络带宽、链路类型、链路信息 三、网络设备信息、设备品牌、设备型号、设备放置、设备性能参 数、设备内存大小、设备槽位、设备序列号、设备购买年限、设备保修状态、设备备件状况、设备标签完善程度

四、网络设备软件版本信息、当前IOS版本信息、最新IOS版本信 息、设备持续运行时间、设备IOS备份情况、设备CPU 利用率、设备内存利用率、设备模块运行状态、设备风扇及电源状况、设备端口数量、设备端口类型、设备运行机箱温度 五、设备连通性、冗余协议运行状态、VLAN信息、以太网通道信息、 路由协议、邻居关系、交换协议、生成树STP协议、NAT 连接数状态、FLASH信息、设备配置信息分析、多余配置信息分析、配置精简建议、IOS安全建议、防火墙信息、防火墙策略、防火墙DMZ区检查、防火墙Xlate状态、应用业务、IP地址使用状况 六、配置LOG服务器查看LOG日志七、简单机房环境检查 网络拓扑巡检报告单 网络链路状况巡检单 网络设备巡检单 篇三:华为_H3C设备常规巡检命令 华为_H3C设备常规巡检命令 1、[Router&Swithc]华为/H3C设备常规巡检命令 #系统时间

display clock #系统以及各单板软件版本display version #设备温度 display environment #日志信息 display logbuffer #单板运行状态 display device #电源状态 display device #风扇状态 display device #CPU占用状态 display cpu-usage #内存占用率 display memory limit #接口流量 display interface #接口、链路状态 display interface #地址分配

机房巡检

机房巡检 一、对服务器巡检 1、检查机房环境是否(温度、湿度、电压)正常; 2、检查服务器硬件运行情况: 服务器硬盘指示灯、设备故障工作指示灯、网络工作指示灯有无异常; 3、检查服务器是否有异常声音报警信号; 4、检查系统软硬件运行日志、安全日志是否存在异常; 5、检查系统防毒软件是否升级到最新版本; 6、检查系统补丁是否升级到最新版本; 7、检查系统防病毒软件日志是否存在异常; 8、检查硬盘RAID运行情况是否正常; 9、检查系统备份软件运行是否正常,同时检查备份设备(存储、磁带机等)运行是否正常; 10、检查备份设备是否根据定制的备份策略存在备份文件; 11、根据服务器应用部署情况检查服务器CPU、内存使用情况是否正常; 12、检查服务器硬盘剩余空间是否正常; 13、检查服务器部署的各应用运行是否正常; 14、检查服务器部署的各应用日志是否正常; 15、检查服务器间网络通信是否正常; 16、检查服务器外部存储设备(光驱、软驱)是否运行正常; 17、检查服务器所在机柜排风设备是否正常;

18、检查冗余热备份设备工作是否正常; 19、对冗余冷备份设备加电,检查其工作是否正常; 20、对服务器进行清洁处理。 二、对网络设备巡检 1、检查机房环境是否(温度、湿度、电压)正常; 2、检查网络出口设备(光纤收发器、协议转换器)设备工作指示灯有无异常、是否有异常声音报警信号; 3、检查防火墙、网络出口路由器运行情况: 设备指示灯有无异常、是否有异常报警信号; 4、对于网络安全设备,如防火墙、IPS等检查其日志是否记录正常,日志内容是否正常; 5、检查各设备制冷结构(除设备有特殊制冷结构外,一般指设备风扇,设备所在容器的制冷机构等)是否正常; 6、检查热备份冗余设备工作是否正常; 7、对冷备份冗余设备定期加电并检测其工作状态是否正常; 8、对于存在多条冗余线路接入检查各线路通信是否正常; 9、对于具有特殊高级功能的网络通信设备(如具有安全认证功能的核心交换机)根据其功能检查其功能及运行日志是否正常; 10、对设备进行清洁处理。 三、其他设备巡检 1、机房制冷设备是否工作正常; 2、机房防雷设备是否工作正常;

H3C设备常规巡检命令

H3C设备常规巡检命令 一.巡检基础命令: #系统时间 display clock #系统以及各单板软件版本 display version #设备温度 display environment #日志信息 display logbuffer #单板运行状态 display device #电源状态 display device #风扇状态 display device #CPU占用状态 display cpu-usage #内存占用率 display memory limit #接口流量 display interface #接口、链路状态 display interface #地址分配 display current-configuration interface# #路由扩散 display current-configuration | include ospf #OSPF(Open Shortest Path First)配置 display router id #路由信息 display ip routing-table #端口统计数据 display ip interface #当前配置文件 display current-configuration #保存配置文件 display saved-configuration 2、脚本—华为

display version dis patch-information display clock dis dustproof dis frame-type dis health display cpu-usage display memory display memory limit display device display device manuinfo display power display fan display voltage dir cfcard2:/ dir cfcard: display device pic-status dis switchover state display environment display interface display logbuffer dis alarm dis bootrom ethernet display current-configuration display current-configuration interface# display router id display ip routing-table display ip interface display ip interface brief display current-configuration display saved-configuration display diagnostic-information 3、华为NE40e display version 查看VRP版本等信息 dis patch-information 查看版本补丁 display clock查看时钟 dis dustproof防尘网信息 Dis frame-type显示NE40E机框类型 dis health显示系统资源的使用情况display cpu-usage 查看1分钟CPU利用率display memory查看内存使用情况

机房日常巡检制度及操作规范初稿

各机房日常巡检制度及操作规范 为规范客户驻地各机房日常巡检工作,统一工作要求及执行标准,特制定此制度及规范。 日常巡检制度 1,运维服务工程师必须按日常工作安排及巡检要求,按时进行日常巡检工作。2,未经运维负责人员授权,运维服务工程师不得擅自调整巡检频度及巡检时间点,如遇特殊情况无法按时进行巡检工作时,应及时向运维负责人汇报。3,经安排的巡检测工作,运维服务工程师将对其执行的巡检过程及巡检结果承担相应责任,不得推卸、推脱相应责任。 4,巡检工程师在巡检过程中发现相关故障及问题,应及时如实进行记录,针对非单点性故障应及时向运维负责人汇报,由运维负责人进行下一步处理。5,巡检结束后,运维工程师应及时、全面、如实填写巡检结果记录文件,并签字确认巡检结果。巡检记录文件不得由非巡检人进行填写或代填。 6,针对巡检工作出现不适合现场实际工作等情况,运维服务工程师可向运维负责人提出问题和个人建议。 7,运维负责人须定期对巡检记录及巡检过程视频进行检查,检查频度不低于一周一次,且对检查结果进行记录和汇总。 8,针对相关超出制度约束范围情况,由运维负责人负责进行解释。 日常巡检规范 巡检规范根据各机房的具体情况及以前故障情况,针对性编制,视各个机房不同情况进行逐一说明。每个机房机房规范包括如下内容:巡检工作安排,巡检时间点,巡检线路,巡检关键点进行说明。

一,总局六楼机房巡检操作规范: 1)巡检工作安排: 本机房日间工作时段(8:00-17:00)内巡检工作按日常工作情况由值班人员和白班人员共同执行;夜间工作时段(17:00-次日8:00)内巡检工作由值班人员独立执行。间隔两小时巡检一次。 每日8:00点由白班人员检查,并将结果同前日晚班人员巡检结果进行核对。每日16:00点由晚班人员检查,并将结果同当日白班人员巡检结果进行核对。 2)巡检时间点: 日间巡检时间点为:8:00,10:00,12:00,14:00,16:00,其中8点巡检由当日白班人员执行,共5次,其中16点巡检由晚班人员执行。 夜间巡检时间点为:18:00,20:00,22:00,24:00,次日2:00,次日4:00,次日6:00,共7次。 巡检时间点尽可能按上述时间点要求执行,一般巡检实际发生时间和规范要求时间偏差不超过30分钟。 3)巡检路线说明: 建议巡检次序为,先基础环境巡检,再分区巡检(从A区到B区C区D区E 区G区)。 建议巡检步行路线从平台门到各台空调,再由A区通道到B区通道C区D区E 区G区等,最后检查门口粘灰板情况。 4)巡检关键点说明: 基础环境部分: 机房各门的开启情况;空调运行情况;玻璃地板下情况;上水加热器情况

巡检常用命令

IBM AIX 小型机巡检常用命令及流程 第一:首先是机房温度以及湿度的检查,当然这些一般情况都没问题。 参考值:温度(摄氏℃)10 ℃-40℃ 湿度8% -80% 第二:就是关于电源的检测,这个只要不是新装机,一般没问题。 参考值:零-地电压小于1V 火-地电压200-240V (补充:当然59系列的机器相间380V,相地240V)第三:关于报错。主要查看硬件的永久性报错#errpt -dH | pg 软件的永久性报错#errpt -dS | pg 还有系统又没又报警灯 第三:机器的序列号:#uname -Mu 第四:操作系统版本:#oslevel -r 注:有时候不能使用是因为系统版本低的原因 第五:其他检测 执行sysdumpdev –l (检查dump是否设置为always allow sysdump) 执行sysdumpdev –e (检查当前dump大小应该为主dump设备的大小的80%以下) 执行lsvg -l rootvg (检查有否"stale"状态的逻辑卷) 执行lsps -s (检查内存交换区占用情况) 执行df –k (检查文件系统的分配状况,一般不要超过80%) 执行lsdev –Cc disk (检查硬盘状态为available) 执行lsdev –Cc adapter (检查PCI卡状态为available) 执行lsdev –Cc tape (检查磁带机状态为available) 执行lsdev – Cc processor (检查CPU状态为available) 执行lsattr –El sys0|grep autorestart (检查系统crash后是否自动重新启动) 执行lsattr –El sys0|grep cpuguard (检查CPU GUARD是否开启) 执行lsattr –El mem0 (检查内存状态正常size=goodsize) 执行vmstat 2 iostat,topas观察us,sy,pi,po,(内存占用率,硬盘读写速度等检查是否有性能瓶颈) 执行netstat –in和netstat –rn (观察网络状态) 执行entstat –d enX (检测网卡运行速率与交换机速率是否匹配)(网卡速率由10M 半工改为自适应时,缺省网关会丢失。更改网卡速率后需要在系统中执行smitty route 操作重新激活缺省路由。如果进行网卡速率的调整,请务必小心。) 执行ping命令(检查网络连接状况) 执行lsdev –C|grep aio (检查异步IO是否可用) 执行lssrc –g cluster (查看是否有三个进程均为active状态)(这个主要看起了几个HA的进程了,有的时候是一个或两个) 执行/usr/sbin/cluster/clstat –a (查看cluster状态是否正常) 检查/etc/hosts, 确保双机配置中IP别名不会存在包含关系(share_ip1包含了share_ip)执行#more /usr/es/adm/cluster.log #more /usr/es/sbin/cluster/history/* #cat /tmp/hacmp.out (检查这三个日志中是否有error或者fail.) 检查7133面板上的指示灯,如果黄灯亮则需要诊断问题 HOTspare 磁盘检测 1、检查是否有raid保护# smitty ssaraid--->List All Defined SSA RAID Arrays 2、检查是否有Hot Spare # smitty ssaraid--->List Components in a Hot Spare Pool 对于7133,执行Smitty ssaraid? List All Defined SSA RAID Arrays查看7133 raid状态,正常应该为good状态。 对于7133,执行Smitty ssaraid?Change/Show Use of an SSA Physical Disk查看7133硬盘状态,正常应该为member或者spare状态 对于FastT,分别登录上两个controller (登陆方法后面详细讲解),查看是否有错误日志。

IT设备巡检服务

1.1 设备巡检服务 为了确保广州市工商局存储设备长期、稳定的工作,最大限度和降低系统的运行故障及延长系统设备的使用寿命,为项目组管理人员提供辅助决策的有效数据,维护项目组的服务工程师对广州市工商局存储设备提供定期的巡查及保养服务。 项目IT设备维护工程师在日常工作中,除了处理日常维护工作以外,由被动服务变主动服务,主动到进行日常巡检巡查服务,通过日常巡检巡查服务排除故障隐患,降低故障率。并通过以往广州市工商局维护数据分析,详细总结广州市工商局存储设备的具体故障情况,并及时对故障多发和高发设备进行预防性巡查。 每月的日常巡查主要包括以下内容: ?系统运行环境检查、机房温度,系统组件运行情况检查。 ?系统错误日志分析、文件系统空间使用情况检查。 ?应用系统的优化、数据的整理、常见故障的排除。 ?检查系统软件补丁情况。 ?系统软件补丁升级,数据备份与恢复。 ?服务器、存储设备的除尘处理。 设备清洁保养:通过清洁保养服务,最大限度降低设备的故障率,延长设备的使用寿命,同时为广州市工商局数据中心的工作人员提供一个整洁、干净的工作环境。 硬件设备运行情况巡检:了解和记录广州市工商局存储设备的最新使用情况(包括新增设备情况、已有设备的维修情况、耗材的使用情况、关键设备的运行情况等),检测设备的运行情况,排除故障发生隐患,最大限度的降低存储设备硬件的故障发生率,对一些经常出现故障的设备和关键设备要进行重点的检查。同时对一些已老化或需淘汰的设备进行记录并向项目组进行反映、提出备机建议。 系统及软件运行情况巡查:系统的优化、数据的整理、常见故障的排除;服务器病毒的查、杀、防毒软件的定期升级;提供系统软件的升级。系统数据的备份与恢复。 时间是每季度一次,范围是服务器和存储设备等此次合同中涉及到的所有的硬件、系统和应用软件,工作内容是进行所有设备和软件的健康检查,目的是详细的查看与解决其存在的故障隐患。首先由我公司的项目经理填写《巡检申请表》向广州市工商局提出巡检申请,在批准后1到2天内,开始巡检,在巡检过程中,按照巡检报告中涉及的项目进行详细的检

网络设备巡检手册

华东政法大学网络设备巡检测试方案 华东政法大学分2个校区,分别为松江校区和长宁校区。根据要求,运维人员每个月都必须对所负责的校区网络设备进行巡检。本方案是为了针对每个月巡检的设备,巡检指标明细化。巡检的内容分网络链路巡检以及网络设备硬件巡检。网络链路巡检: 主要检查出口链路流量包括核心交换机出口流量,电信主线路、备份线路、教科网出口的流量。 硬件设备巡检包括: CPU利用率 Memory利用率 系统模块 系统电源 串联口状态 风扇 记录结果并截图 网络链路巡检方法 电信主线路、备份线路、教科网出口的流量检测方法: 利用阿姆瑞特防火墙FineTune管理工具里的“实时监控”来检测端口Bps 流量。如图所示

以上信息检测完毕后,统计结果输入到“松江巡检汇总日志”或者“长宁巡检汇总日志”的“网络链路监控统计表”。 硬件设备巡检方法 检查设备CPU利用率 命令: [H3C]#display cpu 使用discpu命令检查设备短时间内(60秒)的CPU利用率。该命令将以百分比的形式给出路由器CPU的利用率,同时显示路由器中不同进程的CPU占用率。

记录结果:5秒,1分钟,5分钟的CPU利用率。并截图存档 设备Memory利用率 命令: [H3C]# display memory dis memory显示了存储器的一般信息,它表明系统可用的内存和使用内存,注意使用的百分比数。 记录结果:已使用内存、系统总内存、剩余内存。并截图存档 检查设备系统模块运行情况检查 命令: [H3C] display device 检查H3C设备模块运行状况检查。

记录结果:有无异常状态设备,并截图存档 检查设备系统电源及风扇检查 命令: [H3C] display power 命令: [H3C] display fan 记录结果:电源有无异常状态,并截图存档 检查设备系统运行温度检查 命令: [H3C] display enviorment 检查设备H3C设备运行环境,内部各部件运行温度是否正常。 记录结果:记录温度状况,并截图存档

服务器巡检规范

服务器巡检规范 一)收集服务器(应用、数据库)软硬件信息部分 此部分工作基本为一次性工作,收集完毕后整理成文档保存以备查。 1.收集主机名: hostname 2.收集cpu数量和信息: grep "model name" /proc/cpuinfo 3.收集内存信息: free 4.收集磁盘信息: fdisk –l 5.收集磁盘使用情况: df –m 6.收集系统信息: getconf LONG_BIT lsb_release –a cat /etc/issue cat /proc/version 7.收集应用安装路径 jdk安装路径 tomcat 安装路径及startup.sh参数 trans 安装路径及startup.sh参数 8.收集数据库信息 cat /home/oracle/.bash_profile (数据库安装参数) 以下使用PL/SQL DEVELOPER工具查看 select * from v$version; (数据库版本) select name,value from v$parameter where name in ('db_name','service_names','instance_name','processes','sga_max_size','db_cache_size','larg e_pool_size','shared_pool_size','java_pool_size','log_buffer','log_archive_dest','undo_mana gement','undo_tablespace','undo_retention','db_recovery_file_dest_size','db_recovery_file_

H3C常用巡检命令

H3C交换机常用巡检命令硬件状态、IOS版本信息检查: display clock 系统时间 display version 查看版本信息,最近一次重新启动的时间display enviroment 设备温度 display device 单板运行状态 display power 查看电源状况 display fan 查看风扇状况 display cpu-usage 查看cpu最近5S、1m、5m占用率display cpu history 查看cpu使用记录 display memory 查看内存大小和占用率 系统运行配置状态检查: display interface 接口流量、链路状态 dis current-configuration inter 地址分配 dis current-configuration |include ospf 路由扩散display ip routing-table 路由信息 display ip interface 显示vlan端口统计数据 display saved-configuration 保存配置文件 display logbuffer 日志信息 display port trunk 查看参与trunk的端口 STP信息检查: display stp root 查看stp根情况 display stp brief 查看stp简单信息 display stp abnormal 查看是否有非正常端口 vrrp和端口聚合检查 display vrrp statistics 查看主备用状态 display link-aggregation summary 查看链路聚合组的情况

网络设备巡检命令

----------------------------------------------值得拥有文档值得下载----------------------------精品wor 路由器巡检命令 terminal len 0 禁用当前会话终端的分页输出功能 显示当前时钟show clock 显示系统日志状态及本地缓存中的日志信息show logging 显示当前运行的软件信息及相关硬件设备信息show version 显示当前内存统计信息show memory statistics 显示内存利用率历史统计表show memory statistics history 显示当前所有进程的内存使用情况show processes memory 显示当前所有进程的CPUshow processes cpu 使用情况 显示CPUshow processes cpu history 利用率历史统计表 显示接口IP地址及状态简表show ip interface brief 显示接口统计信息汇总表show interfaces summary 显示接口状态及统计信息show interface 显示IP协议统计信息show ip traffic 显示IP路由协议进程参数和相关统计信息show ip protocols 显示活动网络路由协议show protocols 显示当前路由表信息show ip route 显示Flash空间及文件信息dir 列出NVRAMdir nvram: 文件信息 显示文件系统信息show file systems 显示引导及相关环境变量信息show bootvar 显示模块show diag /端口适配器诊断信息 ----------------------------精品word文档值得下载值得拥有---------------------------------------------- ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------值得拥有值得下载文档----------------------------精品wor show inventory 显示硬件资产信息,包含槽位、型号和序列号等信息 显示电源、风扇、温度等物理运行环境信息show environment 显示电源、风扇、温度等物理运行环境信息show env all 显示硬件平台信息show platform 显示当前运行的配置信息show running-config 显示ARP表信息show arp 显示用于技术支持的所有系统信息show tech-support 交换机巡检命令 terminal len 0 禁用当前会话终端的分页输出功能 显示当前时钟show clock 显示系统日志状态及本地缓存中的日志信息show logging 显示当前运行的软件信息及相关硬件设备信息show version

常用网络设备巡检命令参考

网络设备安全巡检命令参考 为了提高安全巡检工作效率,快速完成对网络设备交换机、路由器和防火墙的例行巡检,建议利用SecureCRT终端登录管理工具及拷贝粘贴批处理命令脚本快速完成网络设备巡检数据采集工作。 客户设备本地或远程登录统一采用SecureCRT工具,对所有巡检客户网络设备预先编辑好登录脚本,方便后期巡检和维护快速登录客户设备。 对要巡检的客户采用以下批处理执行命令快速完成数据采集任务。在执行以下批处理命令前先使用SecureCRT软件设置log session 到一个新建txt文件,然后选取全部以下命令拷贝粘贴到设备特权模式"#"下,以下命令所显示的信息会自动发送到新建的txt文件里。

目录 1CISCO网络设备例行巡检数据采集任务 (3) 1.1 CISCO交换机 (3) 1.2 CISCO 路由器 (4) 1.3 CISCO 防火墙 (4) 1.4 CISCO网络设备巡检命令解释 (5) 2华为网络设备例行巡检数据采集任务 (8) 2.1 华为交换机 (8) 2.2 华为路由器 (8) 2.3 华为网络设备巡检命令解释 (10) 3H3C网络设备例行巡检数据采集任务 (12) 3.4 H3C交换机 (12) 3.5 H3C 路由器 (12) 3.6 H3C网络设备巡检命令解释 (13) 4港湾网络设备例行巡检数据采集任务 (14) 4.7 港湾交换机 (14) 4.8 港湾路由器 (14) 4.9 港湾网络设备巡检命令解释 (14) 5HP网络设备例行巡检数据采集任务 (14) 5.10 HP交换机 (14) 5.11 HP 路由器 (15) 5.12 HP网络设备巡检命令解释 (15)

服务器设备日常巡检指导书

服务器设备日常巡检指导书

目录 1、声明 (3) 2、巡检工具清单 (3) 3、机房环境及线缆布局巡检项目 (3) 3.1、巡检注意事项 (3) 3.2、服务器所在机房环境巡检 (4) 3.3、服务器相关的线缆布局情况巡检 (4) 4、Tecal 服务器巡检 (5) 4.1、服务器指示灯巡检 (5) 4.2、服务器iMana健康信息巡检 (5) 4.3、MM管理模块健康信息巡检 (6) 附录:服务器巡检清单 (6)

1、声明 本指导书用于华为Tecal服务器设备的日常维护巡检,操作前应征得客户同意。巡检的操作应仅仅针对服务器外观以及系统的管理单元,如服务器的iMana单元或者MM 管理模块等,不应对业务面有任何操作,以免意外中断客户重要业务。 现场工程师在操作前应仔细阅读相关服务器设备的用户指南(用户指南可在配套光盘中获取到,或者通过登录https://www.360docs.net/doc/c912432116.html,/enterprise进行下载),有任何不清楚的地方务必确认清楚,整个操作过程请做好静电防护和机器保护工作。 2、巡检工具清单 3、机房环境及线缆布局巡检项目 3.1、巡检注意事项 在巡检之前,为了避免潜在的危险,请先熟悉下表中所列的安全信息符号,下列符号可能放置在服务器的一些部件上面。

3.2、服务器所在机房环境巡检 检查机房环境主要包括机房内部的空调、供电设备和策略等。 3.3、服务器相关的线缆布局情况巡检 对线缆的巡检,建议肉眼查看即可,即使需要重新拔插,也得征得客户的同意。日常操作线缆时,为防止损坏,需注意以下事项: ●检查电源线。 –确保三线制电源接地线的接头表面良好。 –确保电源线的类型正确。 –确保电源线表面绝缘部分没有任何破损。 ●保证线缆远离热源;线缆避免紧绷,保持松弛。 ●插拔线缆时,不要用力过大。

日常巡查管理制度

日常巡查管理制度 为了加强设备的管理和维护,及时的了解和控制故障,使基地网络能够正常高效运行,特制定本制度。 1.1机房设备的维护 1.1.1维护基本条件 经常检查常用工具,配置常用的维修工具及检修仪器,如各种钳子、螺丝刀、测电笔、巡线仪、胶布等等,需要时还应随时添置。 1.1.2巡查地点 一楼机房,二楼机房,五楼机房,各教室多媒体设备 1.1.3中心机房工作流程: 1、利用PING命令测试到服务器、各交换机、路由器、VPN网关以及外部 网络的连通性。 2、查看所有网络设备的端口以及状态灯的工作状态(包括一楼、二楼和五 楼的机房),保证检查的设备工作正常。 3、检查网络线缆及连接状态,确保网络线缆完好无损。 4、将所有的检查结果记录备案,对安全隐患提前预防 1.1.4机房监控设备的维护 1、每季度一次设备的除尘、清理,打扫监控设备显露的尘土,对摄像机、 防护罩、门禁、监控采集模块等部件要卸下彻底吹风除尘,之后用无水酒精棉将各个擦干净,调整摄像头清晰度,确保机器正常运行。

2、对容易老化的监控设备部件每月一次进行全面检查,一旦发现老化现象 应及时更换、维修,如视频头、采集模块等。 1.1.5空调控制系统的维护 1、从空调系统的显示屏上检查空调系统的各项功能及参数是否正常; 2、如有报警的情况要检查报警记录,并分析报警原因; 3、检查温度、湿度传感器的工作状态是否正常; 4、检查空调外机及保温管是否漏水 1.1.6机房基础设备维护 1、吊顶表面清洁;板材松动、翘起修复,变形、损坏更换;龙骨调平等 2、墙面污迹清理,裂缝修补 4、静电地板清洗清洁,地面除尘;缝隙调整;平整度调整;损坏更换 5、接地电阻测试;主接地点除锈、接头紧固;防雷器检测;接地线触点 防氧化加固。 6、线路测试;模块、光纤配线检查;标签检查;整理凌乱线缆;对所发 生的故障及时排除; 7、机柜除尘、清洁;机柜及网络设备整理,包括交换机、配线架和网线 的重新整理、排序,并重新标上统一的编号 1.2机房服务器的维护 1.2.1服务器维护流程

数据中心巡检规范-记录表格

巡检项目 服务器、网络、监控设备: 检查设备指示灯状态有无异常 检查设备有无传出异常报警声 检查设备有无散发出烧糊(焦)的气味 设备周围有无出现静电火花 设备有无冒出烟雾 设备物理外观是否完好 设备现场是否(位置)就位 是否有风从设备吹处 环境温度、物理安全隐患、水火灾及鼠害隐患方面: 开机状态: 夏季23±2℃;冬季22±2℃ 机房室内温度是否正常 停机状态:5℃-35℃ 开机状态:45%~65% 机房室内湿度是否正常 停机状态:40%~70% 检查设备面板显示信息有无异常 机房室内有无水患 机房室内地面风口是否有风吹出

机房室内是有鼠害隐患 机房室内建筑吊顶是否有安全隐患 机房建筑墙体、玻璃、隔断等有无安全隐患各类设备无错误代码信息,(对各类设备 显示异常信息记录) 机房建筑地面、墙体、顶墙均无水浸蚀。 有风吹出 机房室内无老鼠等小动物进出痕迹(鼠尿、 粪便等) 无即将掉落的石膏板、天花板等物 建筑墙体、地面、玻璃、隔断等无裂缝、 断裂的等痕迹。 无可燃、易燃易爆及与机房无关物品;xx 度在正常范围;硬件巡检正常 目前是检查内门锁好。(xx检查门禁期 间推、拉均不能打开室内门,拟建设中)观察观察感应观察观察——每天每天每周观察——观察每天各类设备指示灯显示正常,参考各类设备 指示灯状态图示。 各类设备无报警蜂鸣声 无烧糊(焦)的气味 设备周围无静电火花出现

设备无烟雾冒出 未受物理碰撞,无撞击痕迹。 设备无移动痕迹,保持原地位置 有风从设备吹出观察听闻观察观察感应每天每天每天每周每天正常状态判断内容巡检方式巡检频率机房有无火灾隐患观察每天机房室内门锁安全是否有效 UPS控制台 UPS显示屏幕是否能正常显示 UPS是否处于正常工作状态 UPS是否有报警声 UPS运行环境温度是否正常 强电控制设备运行显示是否正常 UPS在发电机供电状况下电池充电显示状态 巡检项目 ◆电池有无漏液现象 ◆电池有无烧糊、烧焦痕迹触摸感应每周输出电压显示220±2 V 两台UPS同时显示有负载显示 无报警蜂鸣声 符合机房室内正常温度范围 空开、仪表显示在正常状态,详见强电控 制设备显示图示。

相关文档
最新文档