IBMP750小型机日常维护手册簿

IBMP750小型机日常维护手册簿
IBMP750小型机日常维护手册簿

IBM P750小型机

日常维护手册

一、服务器硬件运行状态检查

1.当服务器处于启动和正常工作状态时,其前面板上的状态灯(与电源灯并排)和各硬盘的状态灯(一排

小灯,与各硬盘位置一一对应)应显示为绿色。

2.当服务器的状态灯出现橙黄色时,说明有硬件告警,此时要检查服务器的电源、接线、硬盘等。如果有

硬件故障则需要立即进行更换和更正,如果查不出具体问题,则需要联系相关专家进一步诊断。

3.当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,如该硬盘有读写操作,

则绿灯会不规则闪烁,当硬盘损坏时,则硬盘状态灯将熄灭,或者呈闪烁状态:以1~3秒的频率有规律地、不停地闪烁。

如果发现有服务器硬件状态灯不正常的情况,请及时联系我公司工程师,以便及时进行诊断并解决故障。

二、HMC(硬件管理平台)管理与操作

HMC的两种访问途径:

1、在机房直接通过显示器和键盘进行管理维护等相关操作

2、通过web远程访问,登录HMC web管理界面,访问地址为:https://

1、登录HMC

1.1 浏览器访问连接HMC后,首页界面如下图所示。

1.2 点击下图所示链接,进入HMC验证登录界面。

用户名:hscroot

口令:

1.4 成功登录到HMC管理界面如下图所示。

在HMC console右上角有(hscroot | help | log off)链接,单击log off,会出现如下图所示注销界面:

选择Log off,系统返回到HMC初始登录界面状态。

3、重启HMC

左边导航栏中选择→ HMC Management → shut down or Restart,如下图所示,对HMC进行正常重

启及关机操作。

请谨慎对HMC进行关机和重启操作!

4、状态栏功能

状态栏位于HMC左下角位置,如下图所示,负责监控并反映管理系统资源状态和HMC状态。

单击每个图标状态可以列出详细状态,你可以查到更详细的帮助信息:

:非法操作,如果任何被管理的主机执行了非法操作,这个图标将会变亮。

:黄灯警告, 如果任何被管理的主机有错误并有黄灯被点亮,这个图标也将会变亮

:报错日志:日志中有报错信息,这个图标将会变亮,此项与

:摘要,摘要中会将有用信息做统计并显示在工作栏中。

5、Service Management

导航栏中Service Management强大的管理功能给用户日常维护提供了更简单直观的界面,如下图所示,

但日平时最常用的子项是Manage Serviceable Events,如下图步骤可以对HMC所管理的设备进行日常错误及时直观的观察,以确保IBM小型机能正常工作,下图就是基本的操作方法图示:

Service Management Manage Serviceable Events

6、Service Plans-分区管理与操作

6.1 如何查看小型机资源配置:

如上图红色标注所示,选中所需查看主机(备注:请不要同时选中多台主机及多个分区),在下拉菜单中选中“Properties”,打开参数窗口,通过“Properties”可以查看主机运行状态,CPU,内存,I/0等重要硬件系统参数,如下图所示。

同理,在分区区域中先中每分区后的Properties选项,便可以直观方便的掌握分区状态和资源配置信息。

6.2 如何开关机及激活分区:

关机。

开机。

Operation项中主要包含小型机及分区开关机,及消除报警灯这两项功能,如虽要对小型机下电操作,请先将图15中的分区Deactivate(建议:最好在操作系统中按照正常流程将操作系统shutdown),最后再将主机power off。

注意:非特殊情况,无专业人员指导,严禁进行开关机操作!

6.3 手动消除黄灯警告

如下两图所示, Operations中LED status,及Deactivate Attention LED两项中所指,针对不同分区或主机所报出的警告黄灯,进行特定的消除黄灯操作。

6.4 如何打开控制终端(Terminal Window)

在HMC上对分区操作系统进行操作,可以通过分区下拉菜单Console Window- Open Terminal Window对选中分区进行操作,如图所示,操作界面如同telnet界面。

在HMC中同一分区只允许打开一个Terminal Window,如试图打开第二个窗口,系统提示如图17所示界面。

三、AIX系统日常维护

1、查看系统的错误记录

很重要,应该定期查看,如发现有硬件(H)类型的报错,应该及时关注。

在系统运行时,一些系统错误会记录在errlog 中,其中有些错误还会在终端上显示。

检查错误日志可用以下命令:

#errpt | more 查看系统所有的记录

IDENTIFIER TIMESTAM P T C RESOURCE_NAME DESCRIPTION

E85C5C4C 0426104399 P S CFGLFT SOFTWARE PROGRAM ERROR

2BFA76F6 0426104099 T S SYSPROC SYSTEM SHUTDOWN BY USER

9D4CF6E7 0426104399 T O errdemon ERROR LOGGING TURNED ON

1E2AC07E 0426103999 T O errdemon ERROR LOGGING TURNED OFF

1E5EER4T 0423132999 T O clstrmgr OPERATOR NOTIFICATION

其中

IDENTIFIER 为错误编号,当需要检查详细信息时常会用到。

TIME STAMP 为时间标签,它记录的是出错时间,其格式:月月日日时时分分年年

T 为Type , 它记录的是错误类型

P :为永久错误,需引起注意

T :为临时错误。

C 为Class, 它记录的是错误种类,如

H : Hardware

S : Software

O : Errloger command messages

U : undetermined

RESOURCE_NAME 为错误来源

DESCRIPTION 为错误描述

#errpt -aj 查看系统详细记录内容

其中IDENTIFIER为错误编号,如 #errpt -aj 0426104399

#errpt -dH 查看系统所有的硬件出错记录

2、日常检查服务器状态的项目及其相关命令

2.1 运行lsdev 命令配以各种参数,所列各种设备状态都应为Available。

#lsdev –C –H –S a 列出系统中可用设备。

#lsdev –Cc processor 列出系统中的所有CPU。

#lsdev –Cc memory 列出系统中的所有内存。

#lsdev –Cc disk 列出系统中的所有硬盘。

#lsdev -Cc adapter | grep ent 列出系统中的所有网卡

#lsdev -Cc adapter | grep scsi 列出系统中的所有SCSI卡。

#lsdev -Cc adapter | grep ssa 列出系统中的所有SSA卡。

2.2 lspv命令

#lspv 显示系统中可用的PV。

#lspv hdiskn 显示hdiskn的具体信息。

#lsdev –Cc pdisk 显示磁盘阵列的硬盘的具体信息。

2.3 lsattr命令

# lsattr –E –l mem0 列出系统中内存mem0的大小,本项目中内存有4GB。

2.4 lsvg命令

#lsvg 列出系统中所有的vg。

#lsvg rootvg 列出rootvg的详细信息。

#lsvg –o 列出激活的vg

2.5 oslevel命令

#oslevel 显示操作系统版本信息。

2.6 netstat命令

#netstat –in 显示系统中各网卡的配置。可查看网卡的IP配置好了没有。

2.7 diag命令

通过运行# diag 命令运行硬件诊断程序检测主机内所有硬件,检测结果为“No trouble found ”显示各部分工作正常。

2.8 lsps查看页面空间

lsps –a 查看PAGING SPACE的使用情况,如果使用率超过70%,就需要采取措施。

2.9 查看LV(卷)状态

lsvg –o | lsvg –il | grep –i stale查看有无stale的lv,如果输入该命令之后有输出结果,就需要采取措施

2.10 查看mail

# mail,查看有否发给root用户的错误报告(mail)。

3、检查文件系统

查看有没有“满”的文件系统。文件系统满可导致系统不能正常工作,尤其是AIX的基本文件系统。

如/ (根文件系统)满则会导致用户不能登录。

# df -k (查看AIX的基本文件系统)

Filesystem 1024-blocks Free %Used Iused %Iused Mounted on

/dev/hd4 24576 1452 95% 2599 22% /

/dev/hd2 614400 28068 96% 22967 15% /usr

/dev/hd9var 8192 4540 45% 649 32% /var

/dev/hd3 167936 157968 6% 89 1% /tmp

/dev/hd1 16384 5332 68% 1402 35% /home

除/usr文件系统,其他文件系统都不应太满,一般不超过80%。

4、性能监控与调优

4.1 通过topas来观察

topas能够将系统的全局信息,包括CPU、内存、磁盘、网络、文件系统、事件队列、文件等信息,排列在一个统一的界面上进行展示。

bash-4.3# topas

Topas Monitor for host:localhost EVENTS/QUEUES FILE/TTY

Wed Feb 22 10:42:00 2017 Interval:2 Cswitch Readch

Syscall Writech

CPU User% Kern% Wait% Idle% Reads Rawin

Writes Ttyout

Forks Igets

Network BPS I-Pkts O-Pkts B-In B-Out Execs Namei

Runqueue Dirblk

Waitqueue

Disk Busy% BPS TPS B-Read B-Writ MEMORY

PAGING Real,MB

Faults % Comp

FileSystem BPS TPS B-Read B-Writ Steals % Noncomp

PgspIn % Client

PgspOut

Name PID CPU% PgSp Owner PageIn PAGING SPACE

PageOut Size,MB

Sios % Used

% Free

NFS (calls/sec)

SerV2 WPAR Activ

CliV2 WPAR Total

SerV3 Press: "h"-help

CliV3 "q"-quit

SerV4

4.2 通过命令vmstat 1 来观察.

kthr memory page faults cpu

----- ----------- ------------------------ ------------ -----------

r b avm fre re pi po fr sr cy in sy cs us sy id wa

命令解析:vmstat 命令的输出可以反映系统整体运行状况,包括cpu、内存、虚拟页面、系统进程和系统调用情况。

检查CPU是否为瓶颈,分别检查CPU的四项数值和kthr的两项数值.

检查MEM是否为瓶颈,分别检查Memory的两项数值和Page 的六项数值.

4.3 通过命令 sar –mu –P ALL 来观察。

命令解析: sar可以用来收集反映系统运行状况,在这里主要是查看CPU的运行状况,CPU是否负载均衡,是否存在分配不均的情况。

4.4 通过命令ps gv | more来观察。

PID TTY STAT TIME PGIN SIZE RSS LIM TSIZ TRS %CPU %MEM COMMAND

0 - A 4:20 7 12 14516 xx 0 14504 0.0 5.0 swapper

1 - A 1:33 103 7895

2 79044 32768 25 36 0.0 29.0 /etc/init

命令解析:ps可以用来查看进程的当前状态。在这里通过参数的配搭,可以观察目前正在运行的进程所耗的时间,CPU和memory 量.其中,%CPU表示进程所占用的CPU资源情况,%MEM表示进程所占用的内存情况。主要检查是否有标示为的僵尸进程耗用系统资源,以及informix 数据库的oninit进程的系统消耗情况。

4.5 通过命令iostat 1 –d hdiskX观察磁盘

在机器上用dd命令进行磁盘阵列的写操作校验,与此同时用iostat 1 –d hdiskX观察磁盘。

Disks: % tm_act Kbps tps Kb_read Kb_wrtn

命令解析: iostat可以用来查看系统的 I/O的输入输出情况,在这里主要查看阵列上的硬盘的每秒读写量,同时估算磁盘阵列读写速度。

4.6 通过命令netstat –a 进行查看。

Active Internet connections (including servers)

Proto Recv-Q Send-Q Local Address Foreign Address (state)

命令解析: netstat可以用来查看系统的网络情况,在这里主要是查看网络客户端连接的情况和开销,检查参数为state,如有死连接,state状态为fin_wait, 这样耗用系统网络资源,从而导致网络性能下降构成瓶颈。

以上所有命令及参数的相关含义和详细信息,请参考AIX命令大全。

sap日常维护管理手册

SAP系统日常管理 1 系统监视 1.1 进程监视 §SM66/SM50 进程查看 管理员需全天监看系统的进程。长时间运行的后台工作,有缺陷的报表程序,若不进行控制都将消耗掉大量的系统资源。管理员用这个事务码检查他们的环境。当然,在杀掉这些进程前,需要与最终用户协商。 1.2 服务器监视 §SM51 R/3服务器的列表可用SM51显示,管理员用它来监视不同服务器之间的工作进程。想要显示某一服务器的进程,鼠标指针点中服务器的名称,然后选Processes。 §RZ20 CCMS监控 双击要查看的菜单项,检查系统收集的监控信息,遇到报警和错误信息要查清原因,找出解决办法。 1.3 用户监视 §SM04 用户监视 管理员应该考虑全天监视用户仅他们的活动。是否有非法用户?是否有用户试图或正在用他们不该用的事务码,等等。 1.4 性能监视 §ST03 工作量分析 世上没有经验的替代品。当需要调R/3系统的性能的时候是很痛苦的事情。管理员应该保留尽可能多的工作量分析数据,特别是系统没用性能问题时候的数据。拥有一副系统工作正常时的清晰的系统图,将使你具有对你的系统的不可估量的感觉,这种感觉将使你能预见到将要发生的问题,并且很多时候可以避免问题的发生。 §ST02 缓存分析 R/3的缓存存储经常用到的数据,以使本地应用服务器的实例能取得这些数据。这样就可以减少数据库的访问,数据库的负载,网络的流量,从而提高系统的性能。数据缓存中包括了ABAP/4程序,屏幕,ABAP/4字典数据和公司的数据,这些数据在系统操作过程中是不会改变的。我们应该经常的监视缓存、点击率、剩余空间、交换区。此进程可以帮助管理员作性能调整。 §SP12 TemSe管理 管理员要检查文件系统和数据库空间的增长,尤其是批量打印大量数据时。TemSe的一致性检查(RSPO0043)需要计划每天在打印池重新整理(RSPO0041)之前执行。 1.5 更新记录 §SM13更新记录 此事务码显示失败的更新动作。失败的更新动作在生产系统中是决不允许发生的,一旦发生,开发人员应马上修改。 1.6 锁定对象 §SM12 锁定对象 用户总是会时不时的因为某种原因(如断线,程序出错等等)而锁定一个对象。所有被锁定的老的对象均要被分析,更正。 1.7 出错分析 §ST22出错分析

Oracle数据库日常维护指导手册

NGN ORACLE数据库日常维护指导手册 UTS.610G14.A0 编者杨健易滨肖利光审稿吕学勇 日期2004年4月22日UT斯达康通讯有限公司 项目与技术支持部

UT斯达康公司以"客户成功,我们成功"的价值观衡量、规范员工的行为,致力于服务创新和服务承诺的兑现,力求为用户提供超越客户期望的服务。 UT斯达康公司拥有完善的服务体系,技术服务中心拥有一批优秀的专业技术人员,并在全国设有服务分支机构,提供24小时技术服务。本着用户至上,信守承诺的原则,UT斯达康公司承诺:在24小时之内对用户的问题给予答复。为客户提供优质、高效、专业的服务是UT斯达康的追求。 UT斯达康通讯有限公司项目与技术支持部 联系地址:浙江省杭州市教工路1号12号楼 邮政编码:310012 电话号码:(0571)88916789 传真:(0571)88916789 800免费电话:8008571466 邮件地址:utsupport@https://www.360docs.net/doc/ec3810728.html, 客户支持网站:https://www.360docs.net/doc/ec3810728.html,

版权声明 本文档属UT斯达康通讯有限公司版权所有,侵权必究。 本文档专供用户、本公司职员以及经本公司许可的人员使用。未经公司书面同意,任何单位或个人不得以任何方式复制、翻印、改编、摘编、转载、翻译、注释、整理、出版或传播手册的全部或部分内容。 UTStarcom,PAS,WACOS, iAN, AIRSTAR, WLL, ISP, WICOPS, NGDLC, Intranode, Internode, Xtr-m-IP, UNITECH,iPATH, !-Volution, mSwitch, 小灵通, 为UT斯达康公司或其子公司、关联公司的注册商标,受商标法保护, 任何个人或团体非法使用以上商标,UT斯达康公司有权追究其法律责任。

IBMPower740小型机+11G数据库维护教程

露露Power740小型机+11G数据库维护教程 硬件环境: 1、Power740小型机+AIX6.1操作系统 2、数据库版本:oracle 11.2.0.4 3、数据库安装模式:Oracle11R2+ASM+RAC(集群负载) 一、开机步骤 1、打开Power740小型机1和2开关机开关 两台服务器都要开机,在确定小型机电源处于关闭情况下开机,如果小型机处于开机状态跳过此步骤。 2、开启集群和数据库 小机开机后集群和数据库自动启动,一般不需要手工启动。 Ping 192.168.0.31\32\33\34\35 -t ping通后查询数据库状态。 通过实际IP登录小机1 登录方式1:windows开始菜单-运行 telnet 192.168.0.31 登录方式2:远程连接小机工具 登录方式3:直接在小机操作 用户名:root 密码:root #su – grid 切换到grid网格用户 $crs_stat –t 查询集群状态

ORACLE正常工作状态:3个gsd进程是OFFLINE 其他进程都是ONLINE。 此时完成开机和数据库启动操作,应用程序可以正常使用。 如果等待30分钟还没有正常启动,启动出现异常,可执行以下操作: #su – grid $srvctl start nodeapps -n dbserver1 $srvctl start nodeapps -n dbserver2 $srvctl start asm -n dbserver2 $srvctl start asm -n dbserver1 $srvctl start database -d lolo 单独启动监听 srvctl start listener -n dbserver1 srvctl start listener -n dbserver2 3、启动客户管理系统接口 远程桌面192.168.1.24->露露运营绩效管理系统->业务查询->WEB定时任务->【启动任务】4、启动EM 说明:EM为ORACLE数据库WEB管理,可以不启动,不启动不影响应用程序使用。 1)通过服务IP登录小机1 登录方式1:windows开始菜单-运行 telnet 192.168.0.33 登录方式2:远程连接小机工具 登录方式3:直接在小机操作 以下以登录方式1说明。 用户名:root 密码:root

数据库日常维护工作

数据库日常维护工作是系统管理员的重要职责。其内容主要包括以下几个部分: 一、备份系统数据 SYBASE 系统的备份与恢复机制保证了在系统失败时重新获取数据的可能性。SQL Server 提供了两种不同类型的恢复机制:一类是系统自动完成的恢复,这种措施在每次系统启动时都自动进行,保证了在系统瘫痪前完成的事务都写到数据库设备上,而未完成的事务都被回退;另一类是人工完成的恢复,这是通过 DUMP 和 LOAD 命令来执行人工备份和恢复工作。因此定期备份事务日志和数据库是一项十分重要的日常维护工作。 1、备份数据库 每一个数据库都应在创建之后卸出,从而提供一个装入基点。在此之后按排定的时间周期表卸出。比如每周五卸出数据库。对一般数据库系统卸出数据库周期建议为每周一次。 除了按计划周期卸出数据库之外,还需在每次运行没有日志的操作后卸出数据库。例如:·每次强制地运行了 DUMP TRAN WITH NO_LOG (因为数据库的磁盘空溢出); ·每次用 sp_dboption 允许 select into/bulkcopy 做快速拷贝,或用 SELECT INTO 命令创建一个永久性的表,或使用了 WRITETEXT 命令。 卸出数据库的命令为: DUMP DATABASE database_name TO dump_device database_name 是要卸出的数据库名称,dump_device 是卸出设备的名称。用系统过程 sp_helpdevice 可以获得设备的信息。 下面一条命令用来卸出数据库 my_db : DUMP DATABASE my_db TO db_bk_dev 2、备份事务日志 如果事务日志与数据库放在同一个设备上,则事务日志不应与数据库分开备份。master 数据库和小于 4M 的用户数据库就是这种情况。一般数据库系统的数据库和日志分别放在不同的设备上,因此,可以用 DUMP TRAN 命令单独备份日志。 备份事务日志的周期直接影响数据的恢复程度,因此建议每天备份。 备份事务日志的命令格式为: DUMP TRANsaction database_name [TO dump_device] [WITH TRUNCATE_ONL Y|WITH NO_LOG|WITH NO_TRUNCA TE] 其中 database_name 是要备份事务的数据库名称,dump_device 是备份设备名称,仅当包含了 WITH TRUNCA TE_ONL Y 或 WITH NO_LOG 子句时,才可以备份到设备。 注意:如果总是用 DUMP DA TEBASE (备份数据库及其日志),而不用 DUMP TRAN ,事务日志将不会刷新,而变得非常庞大。

ORACLE数据库日常维护与管理手册

全球眼?(MEGAEYES)网络图像管理系统2.0 ORACLE日常维护与管理手册 北京互信互通信息技术有限公司 2004-08-08

目录 全球眼?(MEGAEYES)网络图像管理系统2.0 (1) 1引言 (3) 1.1 目的 (3) 1.2 范围 (3) 1.3 参考资料 (3) 2日常维护与管理说明 (3) 2.1 运行环境 (3) 2.1.1硬件环境 (3) 2.1.2软件环境 (3) 2.2 数据库日常维护 (4) 2.2.1数据库初始设置 (4) 2.2.2每日工作内容 (5) 2.2.3每周工作内容 (6) 2.2.4每月工作内容 (7)

1引言 1.1目的 对于重要的商业系统来说,数据库系统的正常运行是保证商业应用平稳运行的关键。但是数据库在运行过程中可能会因为种种原因发生问题。这时,数据库的管理与日常维护工作将变得尤为重要。 为了指导数据库管理员做好日常维护工作,保证数据库系统的正常运行,特制定本文档。当然,数据库的日常维护是复杂和繁琐的,本文仅涉及一些常见的数据库日常维护的内容,在实际工作中,数据库管理员还需要做更多的工作。 1.2范围 本文档使用的人员:数据库维护管理人员和相关人员。 本文档涉及内容:oracle数据库的日常维护与管理解决方案。 1.3参考资料 中国电信网络视频监控技术(暂行)规范 2日常维护与管理说明 2.1运行环境 程序的运行环境包括硬件运行环境和软件运行环境。 2.1.1硬件环境 ◆CPU类型:Intel及其兼容系列CPU ◆内存容量:剩余内存要达2G以上 ◆硬盘容量:剩余硬盘容量要达1G以上 ◆网卡类型:100M网卡 2.1.2软件环境 ◆操作系统:RedHat Linux AS 3.0 ◆数据库:Oracle9i Database Release 2 (9.2.0.4.0) for Linux x86

软件系统运维手册(完整资料).doc

【最新整理,下载后即可编辑】 系统运维手册 1、目的 (3) 2、适用范围 (3) 3、服务器及数据库概述 (3) 3.1 服务器概述 (3) 3.2 数据库概述 (3) 4、系统服务程序的详细说明 (4) 4.1系统服务程序的构成 (4)

4.2 系统服务程序的启动、关闭及维护管理 (4) 4.2.1 dhcp主服务 (4) 4.2.2 dhcp从服务 (5) 4.2.3 web管理模块 (5) 5、服务器硬件维护(略) (6) 6、windows 2003系统的日常维护 (6) 6.1 定期检查磁盘空间 (6) 6.2 维护系统注册表 (7) 6.3 定期备份系统注册表 ..................................................................... 7 6.4清理system路径下的无用的dll文件 (7) 7、备份策略 (8) 7.1 备份方式 (8) 7.2 备份计划 (8) 7.3 常见故障恢复 (8) 9、数据库的日常维护 (11) 9.1 检查数据库的基本状况 (11) 9.2 检查数据库日志文件 (11) 9.4监控数据库表空间的使用情况(字典管理表空间) (11) 9.4.1 判断是否需要碎片整理 (11) 10、命令解释 (12) 1、目的 楚天行消费卡管理系统运营支撑系统使用的服务器中,服

务器均采用windows xp操作系统,数据库版本为:sql server 2000,随着业务的开展,sql server 数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。 本手册详细描述了程序模块,windows xp操作系统,负载平衡及sql server 数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。 2、适用范围 使用者为网e通宽带网络运营支撑系统维护工程师 3、服务器及数据库概述 3.1 服务器概述 服务器数量:4台,基本信息如下: 3.2 数据库概述 数据库软件分别安装在主服务器上。 4、系统服务程序的详细说明 4.1系统服务程序的构成 DHCP主程序:

IBM P750小型机日常维护手册

IBM P750小型机 日常维护手册 一、服务器硬件运行状态检查 1.当服务器处于启动和正常工作状态时,其前面板上的状态灯(与电源灯并排)和各硬盘的状态灯(一排 小灯,与各硬盘位置一一对应)应显示为绿色。 2.当服务器的状态灯出现橙黄色时,说明有硬件告警,此时要检查服务器的电源、接线、硬盘等。如果有 硬件故障则需要立即进行更换和更正,如果查不出具体问题,则需要联系相关专家进一步诊断。 3.当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,如该硬盘有读写操作, 则绿灯会不规则闪烁,当硬盘损坏时,则硬盘状态灯将熄灭,或者呈闪烁状态:以1~3秒的频率有规律地、不停地闪烁。 如果发现有服务器硬件状态灯不正常的情况,请及时联系我公司工程师,以便及时进行诊断并解决故障。 二、HMC(硬件管理平台)管理与操作 HMC的两种访问途径: 1、在机房直接通过显示器和键盘进行管理维护等相关操作 2、通过web远程访问,登录HMCweb管理界面,访问地址为:https://

1、登录HMC 1.1 浏览器访问连接HMC后,首页界面如下图所示。 1.2 点击下图所示链接,进入HMC验证登录界面。 1.3 输入用户名与口令,登录HMC。 用户名:hscroot 口令:

1.4 成功登录到HMC管理界面如下图所示。 2、注销HMC 在HMC console右上角有(hscroot|help|log off)链接,单击log off,会出现如下图所示注销界面:

选择Log off,系统返回到HMC初始登录界面状态。 3、重启HMC 左边导航栏中选择→HMC Management→shut down or Restart,如下图所示,对HMC进行正常重启及关机操作。 请谨慎对HMC进行关机和重启操作!

Oracle数据库日常维护手册

Oracle数据库日常维护手册 在Oracle数据库运行期间,DBA应该对数据库的运行日志及表空间的使用情况进行监控,及早发现数据库中存在的问题。 一、Oracle警告日志文件监控 Oracle在运行过程中,会在警告日志文件(alert_SID.log)中记录数据库的一些运行情况: ●数据库的启动、关闭,启动时的非缺省参数; ●数据库的重做日志切换情况,记录每次切换的时间,及如果因为检查点(checkpoint)操作没有执行完成造成不能切换,会记录不能切换的原因; ●对数据库进行的某些操作,如创建或删除表空间、增加数据文件; ●数据库发生的错误,如表空间不够、出现坏块、数据库内部错误(ORA-600) DBA应该定期检查日志文件,根据日志中发现的问题及时进行处理 问题处理 启动参数不对检查初始化参数文件 因为检查点操作或归档操作没有完成造成重做日志不能切换如果经常发生这样的情况,可以考虑增加重做日志文件组;想办法提高检查点或归档操作的效率; 有人未经授权删除了表空间检查数据库的安全问题,是否密码太简单;如有必要,撤消某些用户的系统权限 出现坏块检查是否是硬件问题(如磁盘本生有坏块),如果不是,检查是那个数据库对象出现了坏块,对这个对象进行重建 表空间不够增加数据文件到相应的表空间 出现ORA-600根据日志文件的内容查看相应的TRC文件,如果是Oracle的bug,要及时打上相应的补丁 二、数据库表空间使用情况监控(字典管理表空间)

数据库运行了一段时间后,由于不断的在表空间上创建和删除对象,会在表空间上产生大量的碎片,DBA应该及时了解表空间的碎片和可用空间情况,以决定是否要对碎片进行整理或为表空间增加数据文件。 select tablespace_name, count(*) chunks , max(bytes/1024/1024) max_chunk from dba_free_space group by tablespace_name; 个人收集整理 上面的SQL列出了数据库中每个表空间的空闲块情况,如下所示: TABLESPACE_NAME CHUNKS MAX_CHUNK -------------------- ---------- ---------- INDX 1 57.9921875 RBS 3 490.992188 RMAN_TS 1 16.515625 SYSTEM 1 207.296875 TEMP 20 70.8046875 TOOLS 1 11.8359375 USERS 67 71.3671875个人收集整理 其中,CHUNKS列表示表空间中有多少可用的空闲块(每个空闲块是由一些连续的Oracle 数据块组成),如果这样的空闲块过多,比如平均到每个数据文件上超过了100个,那么该表空间的碎片状况就比较严重了,可以尝试用以下的SQL命令进行表空间相邻碎片的接合: alter tablespace 表空间名 coalesce; 然后再执行查看表空间碎片的SQL语句,看表空间的碎片有没有减少。如果没有效果,并且表空间的碎片已经严重影响到了数据库的运行,则考虑对该表空间进行重建。 MAX_CHUNK列的结果是表空间上最大的可用块大小,如果该表空间上的对象所需分配的空间(NEXT值)大于可用块的大小的话,就会提示ORA-1652、ORA-1653、ORA-1654的错误信息,DBA应该及时对表空间的空间进行扩充,以避免这些错误发生。 对表空间的扩充对表空间的数据文件大小进行扩展,或向表空间增加数据文件,具体操作见“存储管理”部份。 三、查看数据库的连接情况

数据库日常维护

数据库日常维护(参考) 数据库日常维护工作是系统管理员的重要职责。其内容主要包括以下几个部分: 一、备份系统数据 SYBASE 系统的备份与恢复机制保证了在系统失败时重新获取数据的可能性。SQL Server 提供了两种不同类型的恢复机制:一类是系统自动完成的恢复,这种措施在每次系统启动时都自动进行,保证了在系统瘫痪前完成的事务都写到数据库设备上,而未完成的事务都被回退;另一类是人工完成的恢复,这是通过DUMP 和LOAD 命令来执行人工备份和恢复工作。因此定期备份事务日志和数据库是一项十分重要的日常维护工作。 1、备份数据库 每一个数据库都应在创建之后卸出,从而提供一个装入基点。在此之后按排定的时间周期表卸出。比如每周五卸出数据库。对一般数据库系统卸出数据库周期建议为每周一次。 除了按计划周期卸出数据库之外,还需在每次运行没有日志的操作后卸出数据库。例如: ·每次强制地运行了DUMP TRAN WITH NO_LOG (因为数据库的磁盘空溢出); ·每次用sp_dboption 允许select into/bulkcopy 做快速拷贝,或用SELECT INTO 命令创建一个永久性的表,或使用了WRITETEXT 命令。 卸出数据库的命令为: DUMP DATABASE database_name TO dump_device database_name 是要卸出的数据库名称,dump_device 是卸出设备的名称。用系统过程sp_helpdevice 可以获得设备的信息。 下面一条命令用来卸出数据库my_db : DUMP DATABASE my_db TO db_bk_dev 2、备份事务日志

(完整版)小型机及存储维保服务方案

XXXX小型机和存储维保服务 技 术 方 案 XXXX 2015年5月15日

目录 一、专业化第三方服务的需求 _________________________________________________ 2 二、技术服务方案 __________________________________________________________ 4 1.服务对象和目标____________________________________________________________ 4 2.服务内容要点 _____________________________________________________________ 6 3.服务内容要点说明__________________________________________________________ 7 3.1保修期内服务范围_______________________________________________________ 7 3.2服务响应_______________________________________________________________ 8 3.3维护间隔与维护情况汇报_________________________________________________ 8 3.4定期巡检与预防性维护___________________________________________________ 8 3.5免费备件保证___________________________________________________________ 9 3.6免费技术服务___________________________________________________________ 9 3.7免费远程诊断___________________________________________________________10 3.8技术人员保障___________________________________________________________10 3.9保修期终止_____________________________________________________________11 4.服务质量保证______________________________________________________________11 4.1技术服务流程___________________________________________________________11 4.2服务的监督_____________________________________________________________13 4.3紧急事件升级机制_______________________________________________________14 4.4客户满意度调查_________________________________________________________15 4.5备件管理监督___________________________________________________________15 4.6项目组织监督___________________________________________________________15 4.7服务文档管理___________________________________________________________15 4.8服务质量评估___________________________________________________________15 4.9违约赔偿_______________________________________________________________15 4.10保修终止______________________________________________________________16 5.技术服务组织方案___________________________________________________________16 6.备件管理___________________________________________________________________16 6.1备件渠道_______________________________________________________________16 6.2备件管理流程___________________________________________________________16 6.3本项目的备件准备_______________________________________________________17 7.技术培训方案 _____________________________________________________________17 7.1专业培训内容___________________________________________________________17 8.免费的技术增值服务________________________________________________________17 8.1提供系统及应用整合方案_________________________________________________18 8.2出保期后技术支持服务___________________________________________________18

系统管理员日常维护操作手册

系统管理员日常维护操作手册一、日常维护

一、服务器日常开关机器规定 (一)、开机步骤 1、开启服务器电源,系统将自动启动server2008操作系统,注意操作系统 启动过程中的系统提示信息,如果有异常的提示必须作好数据库操作启动的日志记录,并联系硬件维护人员。 2、待服务器操作系统正常启动后,使用administrator身份登陆到服务器, 启动自动过费程序。 3、服务器的任何异常提示,请及时联系硬件公司检查,个人及其他非专业人 员勿进行操作,以免造成数据丢失; 4、一般服务器至少20天左右要进行一次系统的关机动作。对于专用服务器 则不需要进行此操作。 (二)、系统运行过程中的数据库维护操作 5、每天必须做好数据库的日常备份工作,同时必须进行数据库至少存放在服 务器的2个地方,或者备份到U盘或其他电脑上,同时保存好备份数据。 6、拷贝数据库备份文件的U盘或其他存储工具,必须先在其他电脑杀毒后,在 到服务器使用,禁止其他未杀毒U盘在服务器使用,避免服务器中毒! (三)、服务器的关机操作步骤

7、点击开始菜单中关机按钮,进行正常关机,关机前先关闭应用程序,禁止 强制关机! 二、数据库备份原则说明 1、以上操作的意义为: 每天在服务器上执行数据备份以保证数据的安全性。防止硬件故障等突发原因引起的系统崩溃。 系统安全稳定性依赖于规范的操作。非正常操作(如:未正常关机,直接关电。强制关机)都会给系统带来损害。 2、建议备份方案: 每月盘点后:数据库备份并且将备份保存一年。 3、注意事项: 在使用过程中如果发生断电或硬件故障等意外情况而造成前后台死机,应先尝试开启服务器,如服务器不能开机,需及时联系硬件公司与蓝崎公司售后人员,大面积的死机可能由服务器故障引起,也可能由于网络(网线、HUB)等故障引起,出现问题时要注意区分,以便迅速有效的解决问题。

ORACLE数据库日常维护与管理手册

全球眼(MEGAEYES网络图像管理系统2.0 ORACLE S常维护与管理手册 北京互信互通信息技术有限公司 2004-08-08 目录

1 引言 1.1 目的 对于重要的商业系统来说, 数据库系统的正常运行是保证商业应用平稳运行 的关键。但是 数据库在运行过程中可能会因为种种原因发生问题。 这时,数据库 的管理与日常维护工作将变得尤为重要。 为了指导数据库管理员做好日常维护工作, 保证数据库系统的正常运行, 特 制定本文档。 当然, 数据库的日常维护是复杂和繁琐的, 本文仅涉及一些常见的 数据库日常维护的内容,在实际工作中,数据库管理员还需要做更多的工作。 1.2 范围 本文档使用的人员:数据库维护管理人员和相关人员。 本文档涉及内容: oracle 数据库的 日常维护与管理解决方案。 1.3 参考资料 中国电信网络视频监控技术(暂行)规范 2 日常维护与管理说明 2.1 运行环境 程序的运行环境包括硬件运行环境和软件运行环境。 2.1.1 硬件环境 Intel 及其兼容系列 CPU 剩余内存要达2G 以上 剩余硬盘容量要达 1G 以上 100 M 网卡 2.1.2 软件环境 CPU 类型: 内存容量: 硬盘容量: 网卡类型:

: RedHatLinuxAS3.0 Oracle9iDatabaseRelease2forLinuxx86 2.2数据库日常维护 数据库的日常维护工作主要包括管理员每日的工作内容, 每周的工作内容以 及每月的工作内容。 2.2.1数据库初始设置 基于数据安全性的考虑,需要对数据库进行如下的初始设置。 1数据库设为归档模式 1) 以管理员身份连接数据库 SQL>>connectsys/sys@数据库例程 SIDassysdba 2) 察看数据库是否处于存档模式 SQL>>archiveloglist 说明:该命令会提示以下信息,注意灰色部分显示的状态。 DatabaselogmodeNoArchiveMode AutomaticarchivalDisabled Archivedest in ati on Oldest on li nelogseque nce31 Curren tlogseque nce33 3) 如果处于非归档模式则设为归档模式 SQL>>shutdow nimmediate; SQL>>start upmount; SQL>>alterdatabaseachivelog; 4) 如果处于非自动归档状态则设为自动归档 SQL>>altersystemsetlog_archive_start=TRUESC OP E=s pfile; 5重新启动数据库 SQL>>shutdow nimmediate; SQL>>startu p; 2控制文件设置 每一个数据库都必须有一个控制档。它是一个小型二进制档案,用来描述 Oracle9i 实体结构。主要是储存数据库名称,数据库建立时间,资料文件名称 与所在位置,重置日志文件名称与所在位置,目前的日志序列码 (logsequeneenumber ),检查点信息。因此开启Oracle9i 数据库时一定要读取控 制文件才能取得所有数据库实体档案相关信息。 一旦控制文件不幸毁损,数据库 便无法顺利开启。也因为如此,控制档的管理与维护工作显得格外重要。 通常的设置建议为:每个数据库最好拥有两个以上控制档,并各自存放在不 同磁盘上。系统默认有三个控制文件 controlOl.ctI , control02.ctl , con trol03.ctl 。 如果需要增加更多的控制文件,最简单的方式就是先将既有控制文件复制到 目的位置,然后将控制文件名称加入起始参数档的 CONTROLFILE 之中()。同 理,如果想更改控制档名称,也可以先将控制文件复制到目的位置后予以更名, 再更新操作系统: 数据库:

Oracle数据库日常维护手册

密级:保密编号: Oracle10g数据库 维护手册

日期: 编写: 核对: 更新: 目录1............................... 检查数据库基本状况9

1.1. ........................... 检查O RACLE实例状态 9 1.2. ........................... 检查O RACLE服务进程 11 1.3. ........................... 检查O RACLE监听状态 14 2........................ 检查系统和ORACLE日志文件16 2.1. ........................ 检查操作系统日志文件 16 2.2. ........................... 检查ORACLE日志文件 16 2.3. ....................... 检查O RACLE核心转储目录 18 2.4. .............. 检查R OOT用户和O RACLE用户的EMAIL 18 3.............................. 检查ORACLE对象状态18 3.1. ....................... 检查O RACLE控制文件状态

19 3.2. ....................... 检查O RACLE在线日志状态 19 3.3. ....................... 检查O RACLE表空间的状态 20 3.4. ................... 检查O RACLE所有数据文件状态 22 3.5. ................................ 检查无效对象 26 3.6. .......................... 检查所有回滚段状态 26 4.................... 检查ORACLE相关资源的使用情况27 4.1. ............. 检查O RACLE初始化文件中相关参数值 28 4.2. .......................... 检查数据库连接情况 31 4.3. ............................ 检查系统磁盘空间 34

IBM小型机维护指导书

江西建行IBM小型机日常维护第一篇:日常维护部分 第二篇:故障处理部分 第三篇:安图特公司技术支持电话

第一篇日常维护部分 目录 第1章AIX系统管理日常工作(检查篇) (1) 1.1 常用的命令 (1) 1.2 语法介绍 (1) 1.2.1 vmstat:检查内存、CPU、进程状态 (1) 1.2.2 .................................... sar:检查CPU、IO 3 1.2.3 PS:检查进程状态命令 (3) 1.2.4 .............................. s vmon:显示进程占用内存 4 1.2.5 .................................. iostat:显示磁盘IO 4 1.2.6 ....................... n etstat, entstat:显示网卡信息 5 1.2.7 ............................... n o:显示tcpip参数设置 6 1.2.8 其它命令 (6) 第2章AIX系统管理日常工作(LV篇) (7) 2.1 IBM AIX系统管理的日常工作 (7) 2.1.1 开关机步骤 (7) 2.1.2 用户组及用户管理 (7) 2.1.3 文件系统维护 (7) 2.1.4 系统日常管理 (8) 2.1.5 系统备份 (8)

2.1.6 定时清洗磁带机 (8) 2.1.7 定时检查设备指示灯状态 (9) 2.1.8 简单故障的判断 (9) 2.1.9 熟悉ibm aix操作系统 (9) 2.2 关于IBM AIX的逻辑卷管理 (9) 2.3 LVM命令 (10) 第3章AIX系统管理日常工作(关键参数检查篇) (13) 3.1 AIO参数检查 (13) 3.2 磁盘阵列QUEUE_DEPTH参数检查 (14) 3.3 用户参数检查 (14) 3.4 激活SSA F AST-W RITE C ACHE (15) 3.5 IO参数设置 (15) 3.6 SYNCD DAEMON的数据刷新频率 (15) 3.7 检查系统硬盘的镜像 (15) 第4章AIX系统管理日常工作(性能分析篇) (17) 4.1 性能瓶颈定义 (17) 4.2 性能范围 (17) 第5章AIX系统管理日常工作(SHUTDOWN篇) (18) 5.1 概念 (18) 5.2 关机命令 (18) 第6章AIX系统管理日常工作(备份与恢复篇) (18) 6.1 用SMIT备份 (18) 6.2 手工备份 (18) 6.3 恢复系统 (19) 第7章HACMP的双机系统的管理和维护 (19) 7.1 HACMP双机系统的启动 (19) 7.2 HACMP双机系统的关闭 (20)

Oracle数据库维护手册

Oracle 数据库定期维护手册 定期备份任务计划执行检查 打开附件(系统工具(任务计划 查看状态,如果状态是未能启动,则打开菜单高级(查看日志,看未能执行任务计划的原因,并处理,处理完成后,右击任务计划运行。 使用DBA 图形工具(8.1.7 DBA Studio,9i Oracle Enterprise manager Console,10G 网页的EM )检查数据库状态 主要检查空间使用情况,重点对超过80%已使用的表空间进行检查,必要时增加数据文件或将相应的数据文件设为自动扩展,注意单个数据文件大小不要超过3.9G Oracle警告日志文件监控 Oracle在运行过程中,会在警告日志文件(alert.log或alert_SID.log)中记录数据库的一些运行情况: ●数据库的启动、关闭,启动时的非缺省参数; ●数据库的重做日志切换情况,记录每次切换的时间,及如果因为检查点(checkpoint)操作没有执行完成造成不能切换,会记录不能切换的原因; ●对数据库进行的某些操作,如创建或删除表空间、增加数据文件; ●数据库发生的错误,如表空间不够、出现坏块、数据库内部错误(ORA-600) DBA应该定期检查日志文件,根据日志中发现的问题及时进行处理 问题处理 如提示启动参数不对,则检查初始化参数文件 因为检查点操作或归档操作没有完成造成重做日志不能切换如果经常发生这样的情况,可以考虑增加重做日志文件组;想办法提高检查点或归档操作的效率; 有人未经授权删除了表空间则检查数据库的安全问题,是否密码太简单;如有必要,撤消某些用户的系统权限 出现坏块检查是否是硬件问题(如磁盘本生有坏块),如果不是,检查是那个数据库对象出现了坏块,对这个对象进行重建 表空间不够增加数据文件到相应的表空间 出现ORA-600根据日志文件的内容查看相应的TRC文件,如果是Oracle的bug,要及时打上相应的补丁 数据库表空间使用情况检查 数据库运行了一段时间后,由于不断的在表空间上创建和删除对象,会在表空间上产生大量的碎片,DBA应该及时了解表空间的碎片和可用空间情况,以决定是否要对碎片进行整理或为表空间增加数据文件。 select tablespace_name, count(*) chunks , max(bytes/1024/1024) max_chunk from dba_free_space group by tablespace_name; 其中,CHUNKS列表示表空间中有多少可用的空闲块(每个空闲块是由一些连续的Oracle 数据块组成),如果这样的空闲块过多,比如平均到每个数据文件上超过了100个,那么该

计算机服务公司工作手册范本

Guangzhou Institute of Technology 工程技术职业学院 信息系计算机服务公司 工 作 手 册 发行时间:2010年3月

目录 目录 (2) 第一章前言 (4) 第二章组织机构图 (5) 第三章质量目标 (6) 第四章岗位标准 (7) 4.1计算机服务公司经理岗位标准 (7) 4.1.1计算机服务公司副经理岗位标准 (8) 4.2计算机服务公司综合调度部经理岗位标准 (9) 4.2.1计算机服务公司综合调度部对外联系主管岗位标准………………………………………… 10 4.2.2计算机服务公司综合调度部数据综合主管岗位标准………………………………………… 11 4.2.3计算机服务公司对外联系岗位干事工作标准………………………………………………… 12 4.2.4计算机服务公司数据综合岗位干事工作标准………………………………………………… 13 4.3计算机服务公司安全服务部经理岗位标准 (14) 4.3.1计算机服务公司安全服务部办公软件维护及安装主管岗位标准…………………………… 15 4.3.2计算机服务公司办公软件维护及安装岗位干事工作标准…………………………………… 16 4.3.3计算机服务公司办公软件维护及安装岗位服务人员工作标准……………………………… 17 4.3.4计算机服务公司安全服务部办公软件安全检测主管岗位标准……………………………… 18 4.3.5计算机服务公司安全服务部办公软件安全检测岗位干事工作标准………………………… 19 4.3.6计算机服务公司安全服务部办公软件安全检测岗位服务人员工作标准…………………… 20 4.4计算机服务公司计算机维护服务部经理岗位标准……………………………………………… 21 4.4.1计算机服务公司维护服务部计算机硬件日常维护岗位主管岗位标准……………………… 22 4.4.2计算机服务公司维护服务部计算机硬件日常维护岗位干事工作标准……………………… 23 4.4.3计算机服务公司维护服务部计算机硬件日常维护岗位服务人员工作标准………………… 24 4.4.4计算机服务公司维护服务部计算机组装检测主管岗位标准………………………………… 25 4.4.5计算机服务公司维护服务部计算机组装检测干事工作标准………………………………… 26 4.4.6计算机服务公司维护服务部计算机组装检测岗位服务人员工作标准……………………… 27 4.5计算机服务公司网络技术服务部经理岗位标准…………………………………………………

相关文档
最新文档