oracle 数据库巡检.doc

上传人:文库蛋蛋多 文档编号:2394927 上传时间:2023-02-17 格式:DOC 页数:75 大小:1.05MB
返回 下载 相关 举报
oracle 数据库巡检.doc_第1页
第1页 / 共75页
oracle 数据库巡检.doc_第2页
第2页 / 共75页
oracle 数据库巡检.doc_第3页
第3页 / 共75页
oracle 数据库巡检.doc_第4页
第4页 / 共75页
oracle 数据库巡检.doc_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《oracle 数据库巡检.doc》由会员分享,可在线阅读,更多相关《oracle 数据库巡检.doc(75页珍藏版)》请在三一办公上搜索。

1、Oracle巡检(V 0.1.0)2011年10月修改记录日期作者版本修改记录分发记录拷贝No.姓名单位123参考文档No.文档名称作者123目录1巡检概述- 5 -1.1巡检方法- 5 -1.2巡检范围- 5 -2巡检总结- 8 -2.1巡检评价- 8 -2.2巡检建议- 9 -3系统描述- 10 -3.1硬件配置- 10 -3.2操作系统数据库相关要求补丁- 11 -3.2.1共享内存参数- 11 -3.2.2信号量- 11 -3.3数据库配置- 12 -3.4基于Oracle 数据库的应用- 14 -4数据库主机性能- 15 -4.1磁盘空间利用率- 15 -4.2CPU利用率- 16

2、-4.3内存利用率- 17 -4.4网络性能- 18 -5数据库配置- 19 -5.1数据库版本和单独补丁- 19 -5.2数据库产品信息- 19 -5.3数据库参数- 23 -5.4数据库运行日志和跟踪文件- 23 -5.5控制文件- 25 -5.6Redo log文件- 25 -5.7归档Redo log文件- 27 -5.8数据文件- 27 -5.9表空间- 28 -5.9.1表空间使用率- 28 -5.9.2表空间存储参数- 29 -5.9.3段扩展- 30 -5.9.4系统表空间- 31 -5.9.5临时表空间- 32 -5.10回滚段管理- 33 -5.11数据库对象- 33 -5

3、.11.1数据库中的失效对象- 33 -5.11.2用户表和索引使用同一表空间- 35 -5.12总结及建议- 36 -6CLUSTERWARE配置- 37 -6.1CRS版本和单独补丁- 37 -6.2Clusterware配置- 37 -6.3CRS日志文件- 39 -6.4检查OCR FILE及Voting Disk- 39 -6.5总结及建议- 40 -7数据库安全- 41 -7.1DBA用户- 41 -7.2SYSDBA用户- 41 -8SQLNET 概况- 42 -8.1监听器Listener- 42 -8.2SQL*Net- 42 -8.3TNSNAMES- 42 -9数据库性能

4、- 43 -9.1数据库各项基于时间模型的统计信息- 43 -9.2数据库负荷压力分析- 46 -9.3各项命中率- 47 -9.4内存信息统计- 49 -9.5等待事件- 50 -9.6统计信息分析- 52 -9.6.1关于CPU数据库使用情况- 52 -9.6.2关于DBWR写脏数据- 52 -9.6.3关于长短表扫描统计信息- 53 -9.6.4关于数据库事务提交/回滚性能指标- 53 -9.6.5回滚段统计- 53 -9.7数据库I/O性能- 54 -9.8索引/行迁移/行链- 55 -9.8.1索引- 55 -9.8.2行链- 55 -9.8.3行迁移- 56 -9.9Enqueue

5、等待分析- 57 -9.10Latch分析- 59 -9.11Resource Limit分析- 59 -9.12Top SQL语句- 60 -9.13Cluster Interconnection 性能- 61 -10数据库备份策略(待补充)- 64 -10.1备份- 64 -10.2恢复- 64 -附录:初始化参数文件- 65 -1 巡检概述1.1 巡检方法数据库性能检查的工具是:l ORACLE 工具RDA( REMOTE DIAGNOSTIC AGENT) 进行系统信息收集。l dba_snapshot_database_10g.sql。l OSW(OS Watcher),操作系统工具

6、和命令检查操作系统。l SQL命令检查数据库配置,SQL命令在ORACLE 工具SQL*PLUS中运行。l ORACLE 工具AWR 进行数据库性能资料的收集。l ORACLE工具EM进行数据库运行情况的监控及分析。l 操作系统及数据库后台日志分析。上述输出结果为建议提供依据。工具使用说明:文档主要参考oracle官方文档以及metalink文档,因此部分连接访问时,需要有oracle官方网站帐号或metalink帐号。1. RDARDA是Remote Diagnostic Agent 的简称,是Oracle用来收集、分析数据库的工具,运行该工具不会改变系统的任何参数,RDA收集的相关数据非常

7、全面,可以简化我们日常监控、分析数据库的工作,Oracle Support也建议我们在反馈相关问题时,提供RDA收集的数据, 这样可以为快速解决问题提供一个有力的保证。RDA支持主流操作平台,如Linux、Windows、AIX、HP-UX、Solaris等。通过RDA工具,可以收集包括Oracle RDBMS Server,Oracle RAC Cluster,Oracle WebLogic,Oracle Tuxedo在内的软件的信息和日志,以前操作系统相关的版本,补丁,内核参数等信息。使用方法:解压RDA工具: tar -xvf rda.tar初始化RADA工具:/rda.sh -S收集数

8、据:./rda.sh日志信息:./output/RDA.$machine_name.zip.阅读方式:RDA_start.htm详细说明参见:Remote Diagnostic Agent (RDA) 4 - Getting Started ID 314422.12. dba_snapshot_database_10g.sql该脚本用来收集数据库详细信息,包括数据库、实例信息,存储信息,性能信息,对象信息等多方面内容,执行脚本需要有访问动态性能试图的权限,建议有SYSDBA权限的用户执行。使用方法:SQL conn sys/oracle as sysdbaConnected.SQL dba_s

9、napshot_database_10g.sql文件生成在 sqlplus 执行目录下格式为&FileName._&dbname_&spool_time.html。详细脚本参见:dba_snapshot_database_10g.sql3. OSWOSW是Oracle提供的一个用于操作系统监控的工具包。支持主流操作平台,如Linux、AIX、HP-UX、Solaris等。通过ps、top、mpstat、iostat、netstat、vmstat等系统命令,对系统CPU使用率,内存使用率,磁盘IO,网络流量等信息进行收集,形成报告。使用方法:解压OSW工具:tar -xvf osw.tar运行O

10、SW工具:./startOSW.sh 30 240日志信息:收集的日志信息位于OSW根目录的archive/目录下。在安装有Java并支持X-Win的环境下,可以通过OSWg.jar工具,生成统计图表。java -jar OSWg.jar -i $OSW_HOME/archive详细说明参见:OS Watcher Users Guide.htmlOS Watcher Graph (OSWg) User Guide ID 461053.14. AWRAWR是Automatic Workload Repository(自动工作负载信息库)的简称,是oracle 10g下提供的一种性能收集和分析工具

11、,它能提供一个时间段内整个系统资源使用情况的报告,通过这个报告,我们就可以了解一个系统的整个运行情况。使用方法:SQL awrrpt.sql选择报表类型:HTML选择快照日志的天数:1选择快照开始、结束ID:22051、22052生成日志 文件:awrrpt_1_22047_22048.html详细说明参见:Overview of the Automatic Workload RepositoryHow to read an AWR report. ID 1359094.15. OEMOracle Enterprise Manager是一个基于 Java 的框架系统,该系统集成了多个组件,为用

12、户提供了一个功能强大的图形用户界面。Oracle Enterprise Manager 将中心Console、多个代理、公共服务以及工具结为一体,提供一个集成的综合性系统管理平台,管理 Oracle 数据库环境。使用 Oracle Enterprise Manager Console,可以执行以下任务:管理、诊断和调整多个远程系统。 在多个节点上,按不同的时间间隔调度作业。 监视整个网络范围内的服务和事件。 管理管理员,实现 Oracle Enterprise Manager 管理员间的信息共享。 将远程系统分组组织,便于管理和监视。 管理 Oracle Parallel Server。 从任

13、何一个授权位置上通过 Management Server 管理您的数据库网络。 管理集成使用的 Oracle 和第三方工具。使用方法:http:/hostname:5500/em详细说明参见:Oracle Enterprise Manager Product Documentation ID 67209.1.htm1.2 巡检范围巡检报告提供的检查和建议主要针对以下方面:1.主机配置2.数据库配置3.数据库性能本报告的提供的检查和建议不涉及:-具体的性能调整,如sql优化方法-应用程序的具体细节检查方面具体检查内容硬件配置主机配置共享内存参数信号量操作系统中与数据库相关主要参数操作系统数据库相

14、关要求补丁系统配置硬盘可用空间CPU利用率内存利用率网络性能数据库配置数据库版本数据库产品选项数据库参数运行日志和跟踪文件控制文件Redo log文件归档Redo log文件数据文件表空间回滚段管理监听器的设置数据库简单风险评估数据库sql*net配置SQL*Net设置TNSNAMES设置数据库各项命中率数据库性能等待事件AWR统计信息分析数据库I/O性能索引/行迁移/行链接Sort信息统计Enqueue等待分析Latch分析Resource Limit分析Top SQL 语句数据库备份策略评估根据客户要求只能检查一项2 巡检总结2.1 巡检评价检查方面本次检查评价/发现情况主机配置主机配置/

15、目前业务数据库的硬件配置合理,操作系统的大部分内存核心参数和信号量相关的核心参数设置能够满足目前应用系统的需求。操作系统性能目前主机的性能合理,能够满足当前系统的要求目前业务数据库当前系统的CPU和内存配置也比较合理,CPU idle基本在50%左右,能够满足目前应用系统的需要。数据库配置目前业务数据库配置基本合理,数据库表空间管理方式都是采用ASSM本地管理,提高表空间管理性能。数据文件全部采用裸设备,提高I/O性能。回滚表空间采用自动管理方式,方便数据库管理。数据库参数大部分都是经过精心调整的,能够满足当前系统的要求。数据库安全有非SYS/SYSTEM用户具有DBA权限,建议确认应用程序不

16、需要DBA权限的情况下取消其DBA权限。数据库sql*net配置网络配置正常。目前帐务系统生产数据库的NET8使用情况属于正常,SQLNET.ORA和TNSNAMES.ORA配置都正常情况。目前暂时还不需要修改NET8的配置情况。数据库性能目前数据库性能正常,数据库的响应时间也比较符合应用系统的需求,能够满足目前应用系统的需求,从AWR报告来分析,SGA的命中率基本都在90%以上,目前最主要的事件是CPU time,属于正常情况。数据库备份与恢复数据库当前使用归档模式,同时物理逻辑备份策略较完善2.2 巡检建议问题描述类型处理状态建议解决时间1数据库可以考虑安装10.2.0.4稳定PSU补丁集

17、10.2.0.4.4,也可以考虑最新的补丁集10.2.0.4.9 Patch Set Update 配置未处理长期2数据库报了大量的关于JOB执行失败的ORA错误,建议对相关JOB及其执行存储过程进行确认配置未处理近期3数据库中存在大量失效对象,建议对这些对象进行及时确认是否仍需要使用,如果不需要及时删除,如果需要对象进行手工重新编译。配置未处理近期4数据库中出现过几次ORA-600kkocxj : pjpCtx错误。建议应用补丁或者采用临时方案,修改参数_optimizer_push_pred_cost_based=false;配置未处理近期5优化数据库资源消耗高的SQL语句性能未处理长期6

18、主机 /acct目录,磁盘空间采用率90%,建议清理日志或扩容配置未处理近期3 系统描述3.1 硬件配置机器名dlsdb用途 (Prod, Test, Development)Test所在城市,物理位置(机房,远程)硬件供货商HP型号ia64 hp superdome server SD32B操作系统HP-UX操作系统版本B.11.31操作系统Block Size8K内存32701 MBCPU 个数8剩余磁盘空间(in %)具体看下面4.1数据库文件是否裸设备是ORACLE实例数量1可用性需求(e.g. M-F 8-5, 7x24, etc.)7x24建议:1. 通过操作系统命令,获取补丁安装

19、信息:l prtconfl machinfol prtdiagl dmidecode3.2 操作系统数据库相关要求补丁3.2.1 共享内存参数以下列出有关内存使用的系统核心参数的设置情况。kctune | grep shmParameter NameValuemax shared memory segment size (SHMMAX)53687091200shared memory identifiers (SHMMNI)3072max attached shm segments per process(SHMSEG)20483.2.2 信号量以下列出有关信号量系统核心参数的设置情况,其中数

20、据库服务器的系统信号量参数如下。kctune | grep semParameter NameValuesemaphore identifiers (SEMMNI)8192semaphores in system (SEMMNS)96767undo structures in system (SEMMNU)28000max semaphores per id (SEMMSL)10000max undo entries per process (SEMUME)100semaphore maximum value (SEMVMX)32767adjust on exit max value (SEM

21、AEM)16384建议:1. 通过官方认证文档,获取数据库安装所需的操作系统、补丁信息:a) Oracle Database on Unix AIX,HP-UX,Linux,Mac OS X,Solaris,Tru64 Unix Operating Systems Installation and Configuration Requirements Quick Reference (8.0.5 to 11.2) ID 169706.12. 通过操作系统命令,获取补丁安装信息:l lslpp -l | morel swlist | morel pkginfo | morel rpm -qa |

22、 more3. 检查数据库SGA使用的共享内存是否分为多段,如果有多段共享内存,需要检查SHMMAX参数设置是否合理,通过 ipcs -ma | grep oracle 命令检查。3.3 数据库配置是否RAC否实例名服务器名用途(oltp,dss,batch)oltpRDBMS 版本10.2.0.4Clusterware 版本-SQL*Net版本10.2.0.4所有数据文件所占磁盘空间1076.93 GB使用到的磁盘数-SGA sizeShared pool size15968MBDatabase Buffers4000MBRedo Buffers14688256PGA size2GDB_BL

23、OCK Size8192表空间个数61数据文件个数164控制文件个数3日志文件大小572MB日志组数目3每组日志文件成员数量2归档方式No Archive Mode并发用户量235数据库访问方式(C/S,3 layer)3 layer可用性需求 (e.g. M-F 8-5, 7x24, etc.)7x24分析:1. 通过AWR报告或数据库脚本获取数据库参数:a) 查询数据库名称相关试图:l V$INSTANCEl V$DATABASEb) 查询数据库版本相关试图:l V$VERSIONc) 查询数据库是否是集群命令、试图:l show parameter cluster_database;l

24、V$OPTIONd) 查询表空间、数据文件相关试图:l DBA_DATA_FILESl DBA_TEMP_FILESl DBA_TABLESPACESe) 查询内存结构相关试图、命令:l V$SGAl show sga;l show pga_aggregate_target;f) 查询控制文件相关试图:l V$CONTROLFILEg) 查询重做日志文件相关试图:l V$LOGl V$LOGFILEh) 查询系统归档模式命令、试图:l archive log list;l SELECT LOG_MODE FROM V$DATABASE;3.4 基于Oracle 数据库的应用应用名称帐务系统应用

25、类型(OLTP,DSS,batch)OLTP开发工具Java, C+数据库访问方式(C/S,3 layer)3 layer分析:由应用厂商提供相关信息。4 数据库主机性能4.1 磁盘空间利用率bdfFilesystem kbytes used avail %used Mounted on/dev/vg00/lvol3 2097152 390720 1693160 19% /dev/vg00/lvol1 2051553 428498 1417899 23% /stand/dev/vg00/lvol7 10485760 3954168 6484584 38% /var/dev/vg00/lvol6

26、 8388608 3083728 5263440 37% /usr/dev/vg00/lv_nbu 5242880 3917691 1242399 76% /usr/openv/dev/vg00/lvol5 5242880 1517688 3697720 29% /tmp/dev/vg00/oralog_lv 8290304 1168731 6676518 15% /oraclelog/dev/vg00/ora_lv 10485760 9069111 1328897 87% /oracle/dev/vg00/lvol4 10485760 5721328 4727224 55% /opt/dev

27、/vg00/lvol8 2097152 711200 1375168 34% /home/dev/vgjftest02/lv_acct 51380224 47493306 3644718 93% /acct分析:1. 数据库服务器中硬盘空间使用率不得大于90%。如果有大于90%,需要检查是因为数据增加导致,还是由于日志或core文件导致。由于日志或core文件导致的空间使用率过大,建议进行清理操作,如果由于数据增加导致,建议增加磁盘空间。2. 通过操作系统命令,获取磁盘空间信息、挂载点信息:l dfl bdfl dul mount建议:1. 主机 /acct 目录空间使用率超过93%,建议清理

28、日志或增加磁盘空间。4.2 CPU利用率CPU利用率通过统计单位时间(YYYY-MM-DD HH24:MI - YYYY-MM-DD HH24:MI)内CPU的使用情况获取。sar / top / glancevmstat 2 20分析:l 最大CPU使用率:60%-70%l 系统进程与用户进程占用CPU最大比率:40/60l 执行队列值不大于CPU数l 大量的换页操作、IO等待都会造成CPU使用率过高实例 xxxx procs memory faults cpu r b w avm free in sy cs us sy id 8 6 0 5360472 33575135 28526 431

29、257 9498 8 2 91 8 6 0 5360472 33573794 41668 406150 14426 15 2 83 10 7 0 5241242 33574885 40924 392735 14010 16 2 83 10 7 0 5241242 33570066 38353 347502 13112 14 2 84 12 5 0 5121249 33564344 37850 349364 13464 14 2 85 12 5 0 5121249 33568509 38183 341637 13416 14 2 84 9 6 0 4901960 33568953 36838 3

30、12697 12646 15 2 83CPU空闲率在80%以上。建议:1. 当CPU的使用率超过80%,要注意监控是否有僵死进程,如果有僵死进程占用CPU,需要将僵死进程kill掉。如果有正常进程占用大量CPU,需要查看是否属于正常业务进程,是否需要优化相应SQL语句等。2. 建议使用OSW,EM等类监控工具,对CPU的使用情况形成图表,便于监控和评估。4.3 内存利用率内存利用率通过统计单位时间(YYYY-MM-DD HH24:MI - YYYY-MM-DD HH24:MI)内内存的使用情况获取。top / glancevmstat 2 20分析:l 最大内存使用率:60%-70%l 不存在

31、大量的换页操作实例 nmjftestMemory: 130875 MB (127.81 GB)System Page Size: 4Kbytes memory page avm free re at pi po fr de sr 3020165 13919591 0 0 0 0 0 0 02937555 13921389 0 0 0 0 0 0 02937555 13921615 0 0 0 0 0 0 02880350 13919318 0 0 0 0 0 0 02880350 13919702 0 0 0 0 0 0 03120172 13914004 0 0 0 0 0 0 031201

32、72 13911345 0 0 0 0 0 0 02949046 13914348 0 0 0 0 0 0 02949046 13917518 0 0 0 0 0 0 0内存使用率 = (free * Page Size / 1024 / 1024) * 100 / 130875 = 41.5%CPU空闲率在50%以上。建议:1. 当内存的使用率超过80%,要注意监控数据库进程占用大量内存,是否有应用程序运行在数据库主机上消耗大量内存或存在内存泄露。2. 建议使用OSW,EM等类监控工具,对内存的使用情况形成图表,便于监控和评估。4.4 网络性能(待补充)5 数据库配置5.1 数据库版本和单独

33、补丁数据库产品信息如下:Product Versions from V$VersionBannerOracle Database 10g Enterprise Edition Release 10.2.0.4.0 - 64biPL/SQL Release 10.2.0.4.0 - ProductionCORE 10.2.0.4.0 ProductionTNS for HPUX: Version 10.2.0.4.0 - ProductionNLSRTL Version 10.2.0.4.0 - Production目前已经安装的单独补丁列表如下:PatchSetsNameVersionInst

34、alled onOracle Database 10g Release 2 Patch Set 310.2.0.4.022-Sep-200823:15:30GMT+08:00Interim PatchesPatchBase Bug(s)Installed on71504707150470MLR BUG FOR 10.2.0.4 FOR CPUJUL200827-Oct-200816:50:12GMT+08:0071552487155248DB-10.2.0.4-MOLECULE-001-CPUJUL200827-Oct-200816:50:17GMT+08:0071552497155249DB

35、-10.2.0.4-MOLECULE-002-CPUJUL200827-Oct-200816:50:22GMT+08:0071552507155250DB-10.2.0.4-MOLECULE-003-CPUJUL200827-Oct-200816:50:28GMT+08:0071552517155251DB-10.2.0.4-MOLECULE-004-CPUJUL200827-Oct-200816:50:35GMT+08:0071552527155252DB-10.2.0.4-MOLECULE-005-CPUJUL200827-Oct-200816:50:42GMT+08:0071552537

36、155253DB-10.2.0.4-MOLECULE-006-CPUJUL200827-Oct-200816:51:52GMT+08:0071552547155254DB-10.2.0.4-MOLECULE-007-CPUJUL200827-Oct-200816:53:21GMT+08:0071975837197583DB-10.2.0.4-MOLECULE-008-CPUJUL200827-Oct-200816:53:30GMT+08:00分析:1. 上述信息可通过RDA报告或V$Version 和 opatch lsinventory -oh $ORACLE_HOME命令获取。2. opa

37、tch 命令在补丁目录下。5.2 数据库产品信息当oracle软件安装时,会选择要安装的产品。有某些产品的安装是需要license的,本次检查不涉及license问题。一般,很多系统安装的数据库产品选项根本未被使用。以下列出的安装产品选项可供未来的应用开发参考,或是可以被确认有哪些产品选项未在原计划之内。Installed ProductsNameVersionPatch(es)Agent Required Support Files10.2.0.1.010.2.0.4.0Assistant Common Files10.2.0.1.010.2.0.4.0Bali Share1.1.18.0.

38、0Buildtools Common Files10.2.0.1.0Character Set Migration Utility10.2.0.1.010.2.0.4.0Database Configuration and Upgrade Assistants10.2.0.1.010.2.0.4.0Database SQL Scripts10.2.0.1.010.2.0.4.0Database Workspace Manager10.2.0.1.010.2.0.4.0DBJAVA Required Support Files10.2.0.1.010.2.0.4.0Enterprise Edit

39、ion Options10.2.0.1.0Enterprise Manager Agent Core10.2.0.1.010.2.0.4.0aEnterprise Manager Agent DB10.2.0.1.010.2.0.4.0Enterprise Manager Baseline10.2.0.1.010.2.0.4.0Enterprise Manager Common Files10.2.0.1.010.2.0.4.0aEnterprise Manager Minimal Integration10.2.0.1.0Enterprise Manager plugin Common Fi

40、les10.2.0.1.010.2.0.4.0Enterprise Manager plugin Common Files10.2.0.1.0Enterprise Manager Repository Core10.2.0.1.010.2.0.4.0aEnterprise Manager Repository DB10.2.0.1.010.2.0.4.0Generic Connectivity Common Files10.2.0.1.010.2.0.4.0HAS Common Files10.2.0.1.010.2.0.4.0HAS Files for DB10.2.0.1.010.2.0.

41、4.0Installation Common Files10.2.0.1.010.2.0.4.0Installer SDK Component10.2.0.4.0iSQL*Plus10.2.0.1.010.2.0.4.0Java Runtime Environment1.4.2.14.0JDBC Common Files10.2.0.1.010.2.0.4.0LDAP Required Support Files10.2.0.1.010.2.0.4.0OLAP SQL Scripts10.2.0.1.010.2.0.4.0Oracle Advanced Security10.2.0.1.010

42、.2.0.4.0Oracle Call Interface (OCI)10.2.0.1.010.2.0.4.0Oracle Clusterware RDBMS Files10.2.0.1.010.2.0.4.0Oracle Code Editor1.2.1.0.0IOracle Configuration Manager10.2.7.1.0Oracle Containers for Java10.2.0.1.010.2.0.4.0Oracle Core Required Support Files10.2.0.1.010.2.0.4.0Oracle Data Mining RDBMS Files

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号