《用友资料查询引擎(数据仓库220_UAP).ppt》由会员分享,可在线阅读,更多相关《用友资料查询引擎(数据仓库220_UAP).ppt(15页珍藏版)》请在三一办公上搜索。
1、,数据仓库,2003年7月4日,BI的含义,ERP应用中积累了大量数据清理、转换后装入数据仓库利用分析工具进行信息处理将知识呈现于用户面前最终转变为决策,CRM,SCM,商业智能,HR,MM,DM,DW/ETL,OLAP,QA,BI的地位,NC-DW设计目标,支持多数据源,多种DB数据采集提供数据抽取规则的定制功能提供数据定时入仓的服务功能提供仓库数据的查询分析功能NC决策支持系统的数据基础,数据仓库1,指标数据,DB2,SQL,表2,表3,业务系统,数据入仓,查询分析,管理指标,数据仓库,ORA,表1,业务数据,数据仓库,管理指标,业务数据,数据仓库,数据仓库2,一般流程,数据源定义数据字典
2、编辑入仓任务定义(create table)入仓规则定义(Q=select)入仓任务管理(insert into Q)日志查询报表展现,建立入仓任务审核入仓任务建立数据表,入仓任务定义,直接取数自定义SQL自定义函数,入仓规则定义,自动启动手动启动增量式覆盖式,入仓任务管理,增量入仓方式,对增量式入仓在入仓任务启动后又发生的业务数据的变更的处理:a对没有时间戳的业务库,无法提供增量方式,所以忽略该情况。b对NC这种有时间戳的业务库:每次入仓处理先确定本次处理的截止时间。每个入仓任务启动时首先确定本任务本次处理的数据范围是上次处理的截止时间到本次处理的截止时间,本次入仓后又发生的业务数据的变更,
3、只能等到下次入仓处理。c.入仓速度快,但数据不够准确,建议定时使用覆盖方式入仓。,覆盖入仓方式,对覆盖式入仓任务启动后又发生的业务数据的变更的处理:a.无时间戳限制,任何数据库均可。b.对覆盖方式是无起始时间,截止时间也是本次处理的截止时间,同样这次入仓后发生变化的数据只能等到下一次入仓更新。c.覆盖式运行速度比较慢,但数据准确。,日志查询,查询入仓任务的入仓情况,有以下几种:0:备份开始,尚未成功1:成功2:任务失败2次不在启动3:备份文件成功,入仓尚未开始4:时间到,备份未完成5:备份失败6:时间到,入仓未完成7:入仓失败,入仓机制,在入仓过程中为避免一次提交数据太多数据库服务器崩溃,采用分批向数据仓库中加载的方式。将提取出的数据先写到外部文件中,完毕后从文件分批读入数据仓库。,