《Oracle数据库巡检报告.docx》由会员分享,可在线阅读,更多相关《Oracle数据库巡检报告.docx(15页珍藏版)》请在三一办公上搜索。
1、Oracle数据库巡检报告XXX数据库巡检报告 1 第一部分 操作系统参数检查 . 2 1.1 检查数据库cpu、I/O、内存性能 . 2 1.2 检查Oracle服务进程 . 2 2 第二部分 Oracle数据库检查 . 3 2.1 数据库状态 . 3 2.1.1 检查oracle环境变量 . 3 2.1.2 检查监听状态 . 3 2.1.3 查看Oracle初始化参数 . 3 2.1.4 检查Oracle的实例状态 . 3 2.1.5 检查数据库读写状态 . 3 2.1.6 查看oracle数据库的版本 . 4 2.1.7 查看sga、pga详细信息 . 4 2.1.8 检查控制文件状态
2、. 4 2.1.9 检查日志文件状态 . 4 2.1.10 检查alter日志 . 4 2.1.11 检查当前crontab任务 . 4 2.2 数据库空间监控 . 5 2.2.1 检查数据库的大小,和空间使用情况 . 5 2.2.2 查看数据库是否处于归档模式 . 6 2.2.3 检查表空间物理文件的名称及大小 . 6 2.2.4 数据库数据文件等所在目录使用情况 . 6 2.3 数据库性能、资源、对象检查 . 6 2.3.1 负载情况 . 6 2.3.2数据库内存命中率 . 7 2.3.3监控等待事件 . 7 2.3.4检查无效的数据对象 . 7 2.3.5检查碎片程度高的表 . 7 2.
3、3.6 检查排序区 . 8 2.3.7 检查日志缓冲区 . 8 2.3.8 检查Oracle初始化文件中相关参数值 . 8 2.3.9 检查数据库连接情况 . 8 2.3.10 检查system表空间内的内容 . 8 2.3.11 检查表空间碎片率 . 8 2.3.12 检查死锁 . 9 2.4 数据库备份检查 . 9 2.4.1 检查数据库备份日志信息 . 9 2.4.2 检查backup卷中文件产生的时间 . 9 2.4.3检查oracle用户的email . 9 3 第三部分 总结 . 10 1 第一部分 操作系统参数检查 1.1 检查数据库cpu、I/O、内存性能 # top 检查结果
4、: 正常 1.2 检查Oracle服务进程 检查所有oracle相关进程 # ps -ef|grep ora_ 查看是否有僵死进程 SQL select spid from v$process where addr not in (select paddr from v$session); 检查结果: 正常 在检查 Oracle 的进程命令输出后,输出显示至少应包括以下一些进程: Oracle 写数据文件的进程,输出显示为:“ora_dbw0_CKDB” Oracle 写日志文件的进程,输出显示为:“ora_lgwr_ CKDB” Oracle 监听实例状态的进程,输出显示为:“ora_smo
5、n_ CKDB” Oracle 监听客户端连接进程状态的进程,输出显示为:“ora_pmon_CKDB” Oracle 进行归档的进程,输出显示为:“ora_arc0_ CKDB” Oracle 进行检查点的进程,输出显示为:“ora_ckpt_ CKDB” Oracle 进行恢复的进程,输出显示为:“ora_reco_ CKDB” 2 第二部分 Oracle数据库检查 2.1 数据库状态 2.1.1 检查oracle环境变量 # cat /home/oracle/.profile 检查结果: 正常 2.1.2 检查监听状态 $ lsnrctl status 检查结果: 正常 2.1.3 查看
6、Oracle初始化参数 SQL show parameter 检查结果: 正常 2.1.4 检查Oracle的实例状态 SQL select status from v$instance; 检查结果: 正常 其中STATUS表示Oracle当前的实例状态,必须为OPEN;DATABASE_STATUS表示Oracle当前数据库的状态,必须为ACTIVE。 2.1.5 检查数据库读写状态 SQL select open_mode from v$database; 检查结果: 正常 2.1.6 查看oracle数据库的版本 SQL select * from v$version; 检查结果:正常
7、2.1.7 查看sga、pga详细信息 SQL select * from v$sgainfo; SQL select * from v$pgastat; 检查结果:正常 2.1.8 检查控制文件状态 SQL select name,status from v$controlfile; 检查结果:正常 2.1.9 检查日志文件状态 SQL select group#,status,type,member from v$logfile; 检查结果:正常 2.1.10 检查alter日志 SQL show parameter background_dump_dest $ tail -1000 al
8、ert_实例名.log 检查结果:正常 查看有无“ORA-”,Error”,“Failed”等出错信息。根据错误信息进行分析并解决 2.1.11 检查当前crontab任务 任务清单 $ crontab -l Oracle Job是否有失败 SQL select job,what,last_date,next_date,failures,broken from dba_jobs Where schema_user=CAIKE; 检查结果:正常 2.2 数据库空间监控 2.2.1 检查数据库的大小,和空间使用情况 查所有表空间总量: SQL select sum(tablespace_size
9、* 8192 / 1024 / 1024 /1024) dba_tablespace_usage_metrics; datafile占文件系统的空间 SQL select sum(bytes)/1024/1024/1024 GB from dba_data_files; 查所有表空间使用量 SQL SELECT /* + RULE */ df.tablespace_name Tablespace, df.bytes / (1024 * 1024) Size (MB), SUM(fs.bytes) / (1024 * 1024) Free (MB), Nvl(Round(SUM(fs.bytes
10、) * 100 / df.bytes),1) % Free, Round(df.bytes - SUM(fs.bytes) * 100 / df.bytes) % Used FROM dba_free_space fs, (SELECT tablespace_name,SUM(bytes) bytes FROM dba_data_files GROUP BY tablespace_name) df WHERE fs.tablespace_name (+) = df.tablespace_name GROUP BY df.tablespace_name,df.bytes UNION ALL SE
11、LECT /* + RULE */ df.tablespace_name tspace, fs.bytes / (1024 * 1024), SUM(df.bytes_free) / (1024 * 1024), Nvl(Round(SUM(fs.bytes) - df.bytes_used) * 100 / fs.bytes), 1), Round(SUM(fs.bytes) - df.bytes_free) * 100 / fs.bytes) FROM dba_temp_files fs, (SELECT tablespace_name,bytes_free,bytes_used FROM
12、 v$temp_space_header GROUP BY tablespace_name,bytes_free,bytes_used) df WHERE fs.tablespace_name (+) = df.tablespace_name GROUP BY df.tablespace_name,fs.bytes,df.bytes_free,df.bytes_used ORDER BY 4 DESC; totalmsize(G) from 检查一些扩展异常的对象 SQL select Segment_Name,Segment_Type,TableSpace_Name, (Extents /
13、Max_extents) * 100 Percent From sys.DBA_Segments Where Max_Extents != 0 and (Extents / Max_extents) * 100 = 95 order By Percent; 检查结果:正常 2.2.2 查看数据库是否处于归档模式 SQL archive log list; 检查结果:正常 2.2.3 检查表空间物理文件的名称及大小 SQL col name for a55 SQL select file#,ts#,status,name from v$datafile; 检查结果:正常 2.2.4 数据库数据文
14、件等所在目录使用情况 # df -h 检查结果:正常 2.3 数据库性能、资源、对象检查 2.3.1 负载情况 生成awr报告 SQL ?/rdbms/admin/awrrpt 检查结果:正常 如果DBtime远小于elapse说明数据库比较空闲 如果Logons大于每秒12个、Hard parses大于每秒100、全部parses超过每秒300表明可能有争用问题 2.3.2数据库内存命中率 检查结果:正常 Buffer Nowait表示在内存获得数据的未等待比例。Buffer Nowait的这个值一般需要大于99%。否则可能存在争用,可以在后面的等待事件中进一步确认。 Redo NoWait
15、表示在LOG缓冲区获得BUFFER的未等待比例。如果太低,考虑增加LOG BUFFER buffer hit表示进程从内存中找到数据块的比率。常应在95%以上。否则,小于95%,需要调整重要的参数,小于90%可能是要加db_cache_size。 In-memory Sort:在内存中排序的比率。如果低于95%,可以通过适当调大初始化参数PGA_AGGREGATE_TARGET或者SORT_AREA_SIZE来解决 library hit表示Oracle从Library Cache中检索到一个解析过的SQL或PL/SQL语句的比率。如果library hit ratio低于90%,可能需要调大
16、shared pool区。 Soft Parse:软解析的百分比小于95%,需要考虑绑定,如果低于80%,那么就可以认为sql基本没有被重用 Execute to Parse:是语句执行与分析的比例。该值99%,否则存在严重的性能问题。 Parse CPU to Parse Elapsd:解析实际运行时间/(解析实际运行时间+解析中等待资源时间)越高越好。 Non-Parse CPU :SQL实际运行时间/(SQL实际运行时间+SQL解析时间),太低表示解析消耗时间过多 2.3.3监控等待事件 检查结果:正常 一个性能良好的系统,cpu time应该在top 5的前面,否则说明你的系统大部分时
17、间都用在等待上。 2.3.4检查无效的数据对象 SQL col OBJECT_NAME for a35 SQL SELECT owner, object_name, object_type,status FROM dba_objects WHERE status = INVALID; 检查结果: 正常 如存在状态为N/A的表示分区对象,不用理会 2.3.5检查碎片程度高的表 SQL SELECT segment_name table_name,COUNT(*) extents FROM dba_segments WHERE owner NOT IN (SYS, SYSTEM) GROUP BY
18、 segment_name HAVING COUNT(*)=(SELECT MAX(COUNT(*) FROM dba_segments GROUP BY segment_name); 检查结果:正常 2.3.6 检查排序区 SQL select name,value from v$sysstat where name like %sort%; 检查结果:正常 如果disk/(memoty+row) 的比例过高,则需要调整 2.3.7 检查日志缓冲区 SQL select name,value from v$sysstat where name in (redo entries,redo bu
19、ffer allocation retries); 检查结果:正常 如果 redo buffer allocation retries/redo entries 超过 1% ,则需要增大 log_buffer。 2.3.8 检查Oracle初始化文件中相关参数值 SQL select resource_name,max_utilization,initial_allocation, limit_value from v$resource_limit; 检查结果:正常 若 LIMIT_VALU-MAX_UTILIZATION select sid,serial#,username,program
20、,machine,status from v$session; 检查结果:正常 建议通过 sid 查到操作系统的 spid,使用 ps ef|grep spidno 的方式确认 spid 不是ORACLE 的后台进程。使用操作系统的 kill -9 命令杀掉连接),SID 为 1 到10(USERNAME 列为空)的会话,是 Oracle 的后台进程,不要对这些会话进行任何操作。 2.3.10 检查system表空间内的内容 SQL select distinct(owner) from dba_tables where tablespace_name=SYSTEM and owner!=SY
21、S and owner!=SYSTEM Union select distinct(owner) from dba_indexes where tablespace_name=SYSTEM and owner!=SYS and owner!=SYSTEM; 检查结果:正常 如果记录返回,则表明 system 表空间内存在一些非 system 和 sys 用户的对象。应该进一步检查这些对象是否与我们应用相关。如果相关则把这些对象移到非 System 表空间,同时应该检查这些对象属主的缺省表空间值。 2.3.11 检查表空间碎片率 查看fsfi值,如果碎片率小于30则说明碎片过多 SQL sele
22、ct a.tablespace_name, trunc(sqrt(max(blocks)/sum(blocks)* (100/sqrt(sqrt(count(blocks),2) fsfi from dba_free_space a,dba_tablespaces b where a.tablespace_name=b.tablespace_name and b.contents not in(TEMPORARY,UNDO,SYSAUX) group by A.tablespace_name order by fsfi; 查看dba_free_space 采用字典管理的表空间碎片超过500就需
23、要对表空间进行碎片整理 SQL select a.tablespace_name ,count(1) 碎片量 from dba_free_space a, dba_tablespaces b where a.tablespace_name =b.tablespace_name and b.contents not in(TEMPORARY,UNDO,SYSAUX) group by a.tablespace_name having count(1) 20 order by 2; 检查结果:正常 2.3.12 检查死锁 SQL select sid,serial#,username,SCHEMA
24、NAME,osuser,MACHINE,terminal,PROGRAM,owner,object_name,object_type,o.object_id from dba_objects o, v$locked_object l, v$session s where o.object_id = l.object_id and s.sid = l.session_id; 检查结果:正常 2.4 数据库备份检查 2.4.1 检查数据库备份日志信息 # cat XX.log|grep i error 检查结果:正常 2.4.2 检查backup卷中文件产生的时间 # ls lt /XXX/XXX 检查结果:正常 2.4.3检查oracle用户的email # tail -n 300 /var/mail/oracle 检查结果:正常 3 第三部分 总结