《系统运维操作手册.doc》由会员分享,可在线阅读,更多相关《系统运维操作手册.doc(29页珍藏版)》请在三一办公上搜索。
1、精选优质文档-倾情为你奉上xxxx系统运维操作手册Xxxx单位二XXX年XX月专心-专注-专业版本控制版本号日期参与人员更新说明1.02011-06-06创建分发控制编号读者文档权限与文档的主要关系1创建、修改、读取负责编制、修改、审核2批准负责本文档的批准程序3标准化审核作为本项目的标准化负责人,负责对本文档进行标准化审核4读取5读取 1 概述本手册给出了湖南省移动公司的报账平台系统及报账平台外围系统的运维操作细则。手册从主机系统、应用系统以及数据库系统三个方面对任务项进行组织,对应章节包括第Error! Reference source not found.章报账平台主机系统,第Error
2、! Reference source not found.章报账平台应用软件系统以及第Error! Reference source not found.章报账平台数据库系统。每个任务项中可能涉及的表格将在第章表单模板中统一给出。2 主机系统2.1 检查文件系统利用率编 号名 称检查文件系统利用率描 述此任务检查文件系统利用率不低于85%或有大于0.5G以上的空闲空间操作角色主机系统管理员所属管控类别巡检执行频度每日操作说明1. 系统的正常运行应保证有足够的磁盘空间,文件系统被写满会导致系统服务的中断,可以使用df k进行检查是否有文件系统利用率高于85%并且可用空间小于500M,对于保存数据
3、库数据文件所在的磁盘空间和保存归档日志的应有更高的空闲空间。2. 但也不可以盲目的扩展文件系统,因为目前31省所使用的文件系统均不可以缩小,如果要回收空间只能删除重建表单填写参见表单模板中的巡检单表格2.2 查看系统硬件软件告警日志编 号名 称查看系统硬件软件告警日志描 述此任务查看系统硬件软件告警日志操作角色主机系统管理员所属管控类别巡检执行频度每日操作说明以root运行tail /var/adm/messages查看,如果系统写满了一个message文件会自动备份为message.0, message.1等。表单填写参见表单模板中的巡检单表格2.3 检查僵死或运行时间过长的进程编 号名 称
4、检查僵死或运行时间过长的进程描 述此任务查看检查僵死或运行时间过长的进程操作角色主机系统管理员所属管控类别巡检执行频度每日操作说明1. 使用ps ef|grep applprd和ps ef |grep oraprd进行检查(运行时间超过12小时的绝大部分是需要注意的进程)。2. 而程序名为defunct的均为孤儿或僵死进程。3. 由于,夜晚为非工作时间,因此运行超过12个小时的应用服务例如,form服务的客户端进程(AIX平台为f60runm,SUN平台为f60webmx),很可能是运行出错的进程,应可以kill掉,对于数据库进程一般不采用在UNIX命令中kill的方法而是登陆到数据库使用al
5、ter system kill session ,的方法中止该数据库进程。表单填写参见表单模板中的巡检单表格2.4 检查系统CPU利用率编 号名 称检查系统CPU利用率描 述此任务检查系统CPU利用率操作角色主机系统管理员所属管控类别巡检执行频度每日操作说明1.prstat a solaris 2. psrinfo -v (CPU状态)表单填写参见表单模板中的巡检单表格2.5 检查系统内存利用率编 号名 称检查系统内存利用率描 述此任务检查内存利用率操作角色主机系统管理员所属管控类别巡检执行频度每日操作说明1. solaris vmstat 查看free 值2. prtdiag -v表单填写参
6、见表单模板中的巡检单表格2.6 检查系统IO利用率编 号名 称检查系统IO利用率描 述此任务检查IO利用率操作角色主机系统管理员所属管控类别巡检执行频度每日操作说明1. solaris iostat表单填写参见表单模板中的巡检单表格2.7 检查系统交换量编 号名 称检查系统交换量描 述此任务检查系统交换量操作角色主机系统管理员所属管控类别巡检执行频度每日操作说明1. 手动运行的方法如下:topas2. swap l & swap s solaris 表单填写参见表单模板中的巡检单表格2.8 检查系统高可用性(HA)的使用状态编 号名 称检查系统高可用性(HA)的使用状态描 述此任务检查系统高可
7、用性(HA)的使用状态操作角色主机系统管理员所属管控类别巡检执行频度每日操作说明1.webview状态# /etc/opt/FJSVwvbs/etc/bin/wvstat2.CF和心跳状态# cftool - 和 cftool -r3.SF状态# sdtool -s4.CIP状态# ciptool -a 和 # ciptool -n5.CRM状态# /etc/opt/FJSVcluster/bin/clgettree 6.RMS状态# hvdisp -a1.表单填写参见表单模板中的巡检单表格2.9 清理过时的系统临时文件编 号名 称清理过时的系统临时文件描 述此任务清理过时的系统临时文件操作角
8、色主机系统管理员所属管控类别巡检执行频度每周操作说明1. f60*dump*。2. $ORACLE_HOME/reports60/server/cache/*(最好关闭服务清理)。3. $APPLTMP/*(只有关闭服务后可以进行)。表单填写参见表单模板中的巡检单表格2.10 检查磁带库和磁带使用情况编 号名 称检查磁带库和磁带使用情况描 述此任务检查磁带库和磁带使用情况操作角色主机系统管理员所属管控类别巡检执行频度每周操作说明1. 检查是否有足够的空间保存备份。2. 磁带库运行中是否有错误出现。表单填写参见表单模板中的巡检单表格2.11 修改用户口令编 号名 称修改UNIX用户口令描 述此项
9、目修改用户口令操作角色主机系统管理员所属管控类别用户帐号及密码管理执行频度每月操作说明1. 修改UNIX密码步骤如下:letterboxusername1: passwdEnter login password: 您的旧密码New password: 您的新密码Re-enter new password: 您的新密码passwd (SYSTEM): passwd successfully changed for usernameletterboxusername2:2.密码修改之后,必须及时通知系统管理员。修改过UNIX口令之后,需要通知需要知道口令的人员。表单填写参见表单模板中的用户帐号管理
10、情况登记表2.12 清洗磁带机编 号名 称清洗磁带机描 述此任务将清洗磁带机清洗干净操作角色主机系统管理员所属管控类别备份管理执行频度每月操作说明用清洗带清洗磁带机。表单填写参见表单模板中的巡检单表格2.13 检索操作系统日志编 号名 称检索AIX 操作系统日志描 述此任务检索操作系统日志操作角色主机系统管理员所属管控类别日志管理执行频度每周操作说明1 查看用户登陆日志:在命令行输入命令:last2 查看用户失败登陆日志: 在命令行输入命令,进入日志所在目录:cd /etc/security 查看日志内容: vi failedlogin3 查看su命令执行日志内容:在命令行输入命令,进入日志所
11、在目录:cd /var/adm查看日志内容:vi sulog4 查看Auditor文件操作日志首先需要在系统中开启audit功能,会在系统中自动生成/etc/security/audit/bin*文件。此处的bin*指所有以bin开头的文件进入日志所在目录:cd /etc/security/audit/查看日志: vi bin*表单填写参见表单模板中日志检索申请表及日志检索记录表根据情况可能需要备份介质访问登记表3 系统启动与关闭3.1 系统的运行架构3.2 系统的启动编 号名 称检查系统启动描 述此任务查看系统登录以了解应用系统此时此刻的运行状况操作角色应用系统管理员所属管控类别巡检执行频度
12、系统更改操作说明第一步: 第二步:挂接NFS:第三步:启动其他软件,表单填写参见表单模板中的巡检单表格输入用户名root和root的密码,点击OK。选择Global Cluster Service;选择Cluster Admin,选择其中的任意一个节点,如dbsvr;选择rms标签页,在Tools菜单中选择启动;启动后的状态如下图所示:3.3 系统的关闭编 号名 称系统关闭描 述此任务查看系统关闭操作角色应用系统管理员所属管控类别巡检执行频度系统更改操作说明第一步: 第二步:关闭其他软件这样,应用就关闭完成了。表单填写参见表单模板中的巡检单表格输入用户名root和root的密码,点击OK。选择
13、Global Cluster Service;选择Cluster Admin,选择其中的任意一个节点,如dbsvr;选择rms标签页,在Tools菜单中选择关闭;根据需要,选择stop all Apps。关闭完成后,如下图所示:4 系统部署4.1 生成部署包首先,需要更新SVN上的版本,在版本管理机器F:ProductSpecialSrc1128src下,选定下面的文件,按右键,选择update:F:ProductSpecialSrc1128WebRoot下,选定下面的文件,按右键,选择update:进入Eclipse:查看项目属性,确实为F:ProductSpecialSrc1128 的项目
14、:在项目上按右键,选择 Refresh。在Project菜单,选择Clean:待Clean完成后,在File 菜单选择Export,选择 War file:导出到一个文件夹:这样,部署包就生成了。4.2 程序部署登录到:http:/10.154.140.115:9060/ibm/console/输入用户名,可输入root:选择应用程序企业应用程序,选定eFinance.war,点击停止:待停止完成后,选择eFinance.war,点击删除:点击确定:点击保存:点击安装:点击浏览,选定部署包:输入上下文根: eFinance ,点击下一步:点击下一步:选定所有集群和服务器,选定ent_bpms,
15、点击应用;选定ent_bpms,点击下一步:点击完成:点击保存:部署包已经部署完成,如下图所示:下一步的任务是启动应用程序。点击集群:选择Cluster,点击停止:待选择Cluster,点击启动:启动完成后,如下图所示:启动完成后,进行验证:http:/10.154.140.116/eFinance5 重要的系统参数配置6 日志查看6.1 WAS日志编 号名 称检查WAS日志描 述此任务查看WAS日志状况操作角色应用系统管理员所属管控类别巡检执行频度每日操作说明1Wassvr日志存放于:/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/wa
16、ssvr2dbsvr日志存放于/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/dbsvr表单填写参见表单模板中的巡检单表格6.2 DB2日志编 号名 称检查DB2日志描 述此任务查看DB2日志状况操作角色应用系统管理员所属管控类别巡检执行频度每日操作说明1Db2日志存放与dbsvr服务器的:/ef/appinst/sqllib/db2dump表单填写参见表单模板中的巡检单表格7 查系统是否正确运行编 号名 称检查系统登录描 述此任务查看系统登录以了解应用系统此时此刻的运行状况操作角色应用系统管理员所属管控类别巡检执行频度每日操作说明1.
17、如果页面能正常显示,说明115服务器或117服务器运行正常 如图所示:检查登录页面公司参照列表是否能正常显示所有公司2. 检查是否能正常登陆表单填写参见表单模板中的巡检单表格115服务器运行页面:117服务器运行页面:8 系统管理员维护人员信息日志当管理员登录后可以看到如下图所示的页面: 您可以先点击 :系统管理员专区(用红色的框标出)进入相应的页面后,可以看到一个 日志管理(用红色的框标出) 的菜单,点击日志管理就可以查询相应的历史人员维护信息。9 查看表空间及附件硬盘的使用情况9.1 Db2表空间查看编 号名 称检查DB2表空间情况描 述此任务查看DB2表空间情况操作角色应用系统管理员所属管控类别巡检执行频度每日操作说明1.登录117dbserver,进入到db2cmd命令格式下,链接到数据库下使用list tablespase show detail命令查看数据表使用情况,空间是否快满。表单填写参见表单模板中的巡检单表格9.2 115服务器附件文件占用情况编 号名 称检查115服务器附件文件占用情况描 述此任务查看115服务器附件文件占用情况操作角色应用系统管理员所属管控类别巡检执行频度每日操作说明1Telnet到115服务器,使用df h命令查看attachment文件目录的占用情况,以便及时扩容快满的硬盘表单填写参见表单模板中的巡检单表格10 服务停启顺序