《数据仓库-ETL开发流程.ppt》由会员分享,可在线阅读,更多相关《数据仓库-ETL开发流程.ppt(14页珍藏版)》请在三一办公上搜索。
1、NCR-DW2_,张雷勇 上海天正软件公司,数据仓库-ETL开发流程,ETL开发 准备工作,ETL开发 SDM设计,ETL开发 脚本开发,ETL开发 脚本自测,ETL开发 流程图,议程,ETL开发 提交物,议程,ETL上线包示例模板,ETL开发模板统一和规范,ETL开发 依赖关系配置,ETL开发流程图,ETL开发 准备工作,主要任务:确定开发所需资源是否具备输入:PDM变更完成,提交 CASENO实体DDL.DDL完备实施方案,提交 CASENO实施方案计划表.doc 输出:无,ETL开发 SDM设计,主要任务:完成SDM设计开发 按照SDM开发规范,确定实体加载策略,变更内容,变更记录,能够
2、真实准确反应模型设计输入:SPDB-EDW-LDM.ER1(模型设计-逻辑模型成果)变更实体表定义语句(模型设计-物理模型成果)实施方案计划表.doc 输出:SPDB-DW-ETL-数据映射表(SDM)-主题.xls,ETL开发 脚本开发,主要任务:初始脚本开发 周期脚本开发 变更历史数据处理脚本开发 变更相关代码表开发输入:SPDB-DW-ETL-数据映射表(SDM)-主题.xls SPDB-EDW-LDM.ER1 实施方案计划表.doc 实体DDL.DDL输出:初始/周期/数据处理/代码表脚本/SQL PERL 文件,ETL开发 脚本自测,主要任务:开发人员自测初始脚本 开发人员自测周期脚
3、本 开发人员自测数据处理脚本 开发人员自测代码表脚本 开发人员自测依赖关系脚本输入:初始/周期/数据处理/代码表脚本输出:自测文档.XLS 初始/周期/数据处理/代码表脚本LOG日志文件,ETL开发 依赖关系配置,主要任务:完成 SPDBPDM依赖关系配置 根据依赖关系配置生成知识库变更SQL 填写主要参考:SPDB-依赖关系填写规范.doc输入:CASENO-依赖关系配置.xls输出:CASENO-依赖关系SQL.PL CASENO-依赖关系SQL.LOG,ETL开发提交物,主要任务:进行上线资源整合工作输入:初始,周期脚本和数据处理脚本变更视图脚本 view_ddl.pl变更代码表脚本 c
4、ode_sql.pl变更初始化脚本 init.plSPDBPDM依赖关系配置.xls特殊上线步骤说明输出:CASENO上线包 CASENO上线包上线步骤 CASENO上线包脚本运行LOG日志,ETL开发上线包示例,主要任务:主要介绍上线包结构和实施步骤图示如下:实施步骤:上线影响资源备份上线知识库变更操作上线初始化上线变更操作上线临时资源清理操作上线回滚操作,ETL开发上线包示例(续),主要任务:主要介绍上线包文件组成图示如下:,ETL开发模板统一和规范,主要任务:统一初始和周期开发脚本模板统一数据处理变更脚本模板统一应用开发脚本模板统一SQL PERL 文件脚本模板统一上线资源出口统一SDM设计文档模板规范SDM填写规范数据类型转换规范历史数据处理规范脚本测试和自测规范依赖关系配置说明:统一开发设计模板就是为了杜绝因为文件不统一导致的上线错误,各种规范主要为了保证开发质量。,谢谢聆听!,