《企业级省大数据平台数据治理系统.docx》由会员分享,可在线阅读,更多相关《企业级省大数据平台数据治理系统.docx(61页珍藏版)》请在三一办公上搜索。
1、企业级省大数据平台数据治理系统1 .范围12 .规范性引用文件13 .术语定义和缩略语54 .总体说明81. 1.概述84. 2.目标94. 3.原则95.数据治理体系IO5.1. 总体框架105.2. 组织架构Il5. 2.1.组织构成Il5. 2.2.角色职责125. 3.系统架构135.3.1.系统功能框架135.3.2.系统模块流程145.4.系统边界155.4.1.与企业级省大数据平台关系165.4.2.与对外能力开放平台关系165.4.3.与平台运维系统关系166.数据治理核心模块176.1. 数据标准管理176.1.1. 背景176.1.2. 错误!未定义书签.6.1.3. 目标
2、及原则186.1.4. 业务分类和定义186.1.5. 技术功能要求226.1.6. 本期建设范围及内容256.1.7. 实施要求错误!未定义书签.Il6.2.1.背景和定义266.2.2.元数据运营模式276.2.3.元模型标准286.2.4.元数据运维326.2.5.本期重点建设内容326.3.数据质量管理336.3.1.与传统经营分析系统的区别336.3.2.范围和原则346.3.3.与其它功能模块的关系346.3.4,本期数据质量功能需求376.3.5.本期数据质量运维要求386.4. 数据资产管理396.4.1. 数据资产概述396. 4.2.数据资产范围406.4. 3.与其它功能
3、模块的关系416.4.4.本期数据资产功能需求416.4.5.本期建设内容446.5.数据安全管理456.5.1.数据安全概述456.5.2.建设原则456.5.3.建设内容456.5.4.边界关系466.5.5.技术功能466. 5.6.管理要求477.数据治理场景517.1. 背景描述517. 2.场景一:银行伪卡交易判别527.1.1. 背景介绍527. 2.2.场景描述52Ill7. 3.场景二:银行手机贷业务537.1.1. 背景介绍537. 3.2.场景描述548. 附录54附录一:数据标准框架55附录二:数据标准体系定义内容示例55本规范的制订是为了更好地实现企业级省大数据平台数
4、据治理子系统的建设和管理,为省大数据平台上的各类基础技术和应用提供支撑,加强省大数据平台上数据的管控力度,增强数据治理子系统自身管理能力。本规范主要包括以下几方面的内容:总体说明、数据治理体系、数据治理核心模块、数据治理场景等。本规范是企业级大数据平台系列规范之一0该系列规范的结构、名称或预计的名称如下:序号标准编号标准名称IQB-Y-*-2015企业级大数据平台目标架构2QB-Y-*-2OI5企业级省大数据平台技术规范总册QB-Y-*-2015企业级省大数据平台技术规范分册14JQB-Y-*-2OI5企业级省大数据平台技术规范技术方案分册QB-Y-*-2015企业级省大数据平台技术规范数据模
5、型分册16QB-Y-*-2O15企业级省大数据平台技术规范外部接口分册171qB-Y-*-2015企业级省大数据平台技术规范服务开放分册8QB-Y-*-2015企业级省大数据平台技术规范服务开放技术方案分册19JQB-Y-*-2015企业级省大数据平台技术规范数据治理分册10qB-Y-*-2()15企业级省大数据平台技术规范数据治理技术方案分册11QB-Y-*-2015企业级省大数据平台技术规范运营维护分册12QB-Y-*-2015企业级省大数据平台技术规范安全管理技术方案本规范由技()X印发Q本规范由XX集团公司业务支撑系统部提出,集团公司技术部归口。本规范起草单位:XX集团公司业务支撑系统
6、部。本规范主要起草人:XXo范围本规范规定了企业级省大数据平台数据治理子系统的建设内容,适用于各省(直辖市、自治区)公司企业级省大数据平台数据治理子系统的建设。2.规范性引用文件下列文件中的条款通过本规范的引用而成为本规范的条款。凡是标注B期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范。然而,鼓励根据本规范达成协议的各方对是否使用这些文件的最新版本进行研究。凡是不标注H期的引用文件,其最新版本适用于本规他。1C省级经营分析系统业务规范(VI.0)XX通信有限公司12省级经营分析系统技术规范(V1.0)XX通信有限公司13)QB-J-OIO-2(X)6省级经营分析系
7、统数据质量管理系统建设方案(vl.5)XX通信有限公司14QB-J-006-2006省级经营分析系统数据仓库逻辑数据模型说明(VI.5)XX通信有限公司15QB-J-007-2006省级经营分析系统数据集市业务技术规范(Vl.5)XX通信有限公司16QB-J-8-2006省级经营分析系统与源系统接口规范(VL5)XX通信有限公司RlQB-J-(X)9-20()6省级经营分析系统与BOSS系统互动技术规范(vl.5)XX通信有限公司QB-J-003-2006省级经营分析系统业务规范(vl5)一基础业务分册XX通信有限公司19QB-J-004-2006省级经营分析系统业务规范(vl.5)一数据业务
8、分册XX通信有限公司10QB-J-005-2006省级经营分析系统业务规范(vl.5)一集团客户分册XX通信有限公司HHQB-J-(M)I-2(XX)业务运营支撑系统(BoSS)业务技术规范营销资源管理分册(2.0版)XX通信有限公司1121QB-J-(X)I-2(X)6业务运营支撑系统(BOSS)业务技术规范客服信息分册(2.0版)XX通信有限公司业务运营支撑系统(BoSS)业务技XX通信有限公司13QB-J-(K)I-2(X)6术规范(2.0版)省级经营分析系统数据仓库逻辑数XX通信有限公司14QB-J-()21-2(X)7据模型规范(VW省级经营分析系统与源数据接口规XX通信有限公司(1
9、5QB-J-020-2007范(v2.0)省级经营分析系统数据集市业务技XX通信有限公司16QB-J-022-2007术规范(v2.0)省级经营分析系统业务规范渠道运XX通信有限公司7QB-J-019-2007营管理分析览控分册(VLo)省级经营分析系统业务规范客户服XX通信有限公司18QB-J-Ol8-2(X)7务分册(v2.0)省级经营分析系统业务规范集团客XX通信有限公司19QB-J-Ol7-2007户分册(v2.0)省级经营分析系统数据质量管理系XX通信有限公司(201QB-J-016-2007统业务技术规范(V2.0)121业务支撑网4A安全技术规范XX通信有限公司省级经营分析系统技
10、术规范总册XX通信有限公司(22(v2.0全量版)省级经营分析系统技术规范逻辑模XX通信有限公司(231型分册(v2.0全量版)省级经营分析系统技术规范数据集XX通俗有限公司124市分册(v2.0全量版)省级经营分析系统技术规范数据质XX通信有限公司251量管理子系统分册(v2.0全量版)省级经营分析系统业务规范20XX通信有限公司(261全量版)省级经营分析系统技术规范源系统XX通信有限公司1271接口分册(v2.0全量版)省级NGl-BASS技术规范总册集团公司128QB-J-002-2008(VL0)省级NGI-BASS技术规范数据集市XX集团公司(291QB-J-003-2008分册(
11、VL0)省级NGl-BASS技术规范逻辑模型XX集团公司30QB-J-Oo4-2008分册(vl.O)省级NGI-BASS技术规范源系统接XX集团公司131QB-J-OO5-2OO8口分册(Vl.0)省级NGI-BASS技术规范兀数据管XX集团公司32QB-J-(K)6-2008理分册(vl.O)省级NGI-BASS技术规范数据质量XX集团公司331QB-J-(X)7-2(X)8管理子系统分册(Vl0)省级NGl-BASS业务技术规疝齐,XX集团公司34QB-J-Oo8-2008分析及运营分册(VL0)(351QB-J-OOI-2008省级NGl-BASS业务规范(Vl。)XX集团公司省级NG
12、I-BASS技术规范总册XX集团公司36QB-Y-003-2009(v2.0)省级NGl-BASS技术规范数据集市XX集团公司37QB-Y-(N卬2009分册(v2.0)省级NGl-BASS技术规范逻辑模型XX集团公司网QB-Y-Oo5-2009分册(v2.0)省级NGI-BASS技术规范外部接口XX集团公司39QB-Y-006-2009分册(V2。省级NGl-BASS技术规范元数据官XX集团公司(401QB-Y-007-2009理分册(v2。)省级NGI-BASS技术规范数据质量XX集团公司(411QBY0082009管理子系统分册(v2。)(42QB-Y-002-2009省级NGl-BAS
13、S业务规范(V2。)XX集团公司(43QB-Y-052-2010省级NG2-BASS(v3.0)业务规范XX集团公司省级NG2-BASS(v3.0)技术规范总XX集团公司(441QB-Y-053-2010册省级NG2-BASS(v3.0)技术规范数据XX集团公司(451QB-Y-054-20I0集市分册省级NG2BASS(v3.0)技术规范逻辑XX集团公司(46)QB-Y-O55-2010模型分册.省级NG2-BASS(v3.O)技术规范外部XX集团公司(471QB-Y-056-2010接口分册省级NG2-BASS(v3.O)技术规范元数XX集团公司48QB-Y-O57-2O1O据管理分册省级
14、NG2-BASS(v30)技术规范数据XX集团公司49QB-Y-058-20I0质量管理子系统分册省级NG2-BASS(v3.0)技术规疝多XX集团公司(501QB-Y-059-20I0OP能力交互分册省级增值业务综合运营平台业务规XX集团公司|511QB-Y-()6()-2010范(vi.O)省级增值业务综合运营平台技术规XX集团公司52QB-Y-061-2010范(VL)省级增值业务综合运营平台技术规XX集团公司53QB-Y-062-2010范.数据管理分册(vl.O)省级增值业务综合运营平台接口规XX集团公司1541QB-Y-063-2010范55QB-Y-O39-2011的级NG2-B
15、ASS(v35)业务规范XX集团公司省级NG2-BASS(v3.5)技术规范总集团公司156QB-Y-038-2011册省级NG2-BASS(v3.5)技术规范数据集团公司(571QB-Y-040-20H集市分册省级NG2-BASS(v3.5)技术规范也辑集团公司(58QB-Y-O41-2011模型分册省级NG2-BASS(v3.5)技术规范外部XX集团公司(59QB-Y-042-2011接口分册省级NG2-BASS(v3.5)技术规范元数集团公司(6()1QB.Y.043-2011据管理分册省级NG2-BASS(v3.5)技术规范数据集团公司(611QB-Y-044-2011质量管理子系统分
16、册省级NG2-BASS(v3.5)技术规范PXX集团公司162QB-Y-O45-2011能力交互分册省级增值业务综合运营平台业务规XX集团公司(631QB-Y-046-20H范(VL5)省级增值业务综合运营平台技术规XX集团公司(64QB-Y-047-2011范(vi.5)省级NG2-BASS技术规范系统安全XX集团公司65QB-Y-O48-2OH管理分册(Vl.5)66QB-Y-044-2012省级NG2-BASS(v40)业务规范XX集团么司省级NG2-BASS(v4O)技术规范总XX集团公司(671QB-Y-M5-2012册省级NG2-BASS(v4.0)技术规范数据XX集团公司68QB
17、-Y-O45.1-2012集市分册省级NG2-BASS(v4.()技术规范逻辑集团公司(691IQB-Y-045.2-2012模型分册省级NG2-BASS(v4.0)技术规范外部辨团公司110QB-Y-(M5.3-2012接口分册省级NG2-BASS(v40)技术规范无数集团公司72QB-Y-()45.4-2()12据管理分册省级NG2-BASS(v4.0)技术规范数据XX集团公司(731QB-Y-045.5-2012质量管理子系统分册,省级增值业务综合运营平台业务规XX集团公司(74QB-Y-O4&20I2范丫2。.。省级增值业务综合运营平台技术规XX集团公司115QB-Y-047-20I2
18、范丫2.0。省级增值业务综合运营平分技术规XX集团公司76QB-Y-047.1-2012范数据管理分册V2.0.0(771QB-Y-044-2013省级NG2-BASS(v4.5)业务规范XX集团公司省级NG2-BASS(v45)技术规范总集团公司(78QB-Y-045-2013册省级NG2-BASS(v4.5)技术规范数据XX集团公司79QB-Y-045.1-2013集市分册省级NG2-BASS(v45)技术规范逻辑集团公司180QB-Y-O4522013模型分册省级NG2BASS(v4.5)技术规范外部集团公司181QB-Y-O45.3-2O13接口分册省级NG2-BASS(v4.5)技术
19、规范元数XX集团公司(82QB-Y-045.4-2013据管理分册省级NG2-BASS(v4.5)技术规范数据集团公司83QB-Y-045.5-2013质量管理子系统分册省级NG2-BASS(v45)技术规范安全集团公司84QB-Y-045.6-2013管理技术方案省级增值业务综合运营平台业务规XX集团公司|85|QB-Y-()46-20I3范V2.5.0省级增值业务综合运营平台技术规XX集团公司86QB-Y-047-2013范丫250省级增值业务综合运营平台技术规XX集团公司187QB-Y-047.1-2013范数据管理分册V2.5.03,术语、定义和缩略语下列术语、定义适用于本规范:字母名
20、词解狎CCWMCWM标准是OMG组织定义的数据仓库和相关系统的国际元数据标准,给出了各种元数据结构的标准定义。CWM标准的目的在于:使数据仓库和商业智能软件的元数据在异构的数据分析工具、数据仓库平台、元数据存储库等系统之间进行交互.EETL特指从数据源系统到大数据平台的数据抽取、转换和加载。G管理元数据描述大数据平台中管理领域相关概念、关系、规则的数据,主要包括人员角色、岗位职责、管理流程等信.息。Il核心元模型大数据平台核心元模型是以CWM为基础扩展形成的,针对大数据平台的物理模型、逻辑模型、数据处理过程、接口单元、指标和维度编码等主要实体进行精确定义,并要求各省大数据平台统一遵循的元模型。
21、定义核心元模型的口的是建立大数据平台的统一元数据管理标准,为元数据管理的功能层与应用层解耦、为企业级总部大数据平台和企业级省大数据平台的无数据交换和相互理解提供统一的语义基础。H核心元模型参照表核心元模型参照表是对核心元模型中的枚举类型属性进行枚举值定义的编码表。参照表为枚举类型属性的每个枚举值定义了唯一的编码,并明确该编码的语义,是核心元模型标准化定义的垂要组成部分。J技术元数据描述大数据平台中技术领域相关概念、关系、规则的数据。主要包括对数据结构、数据处理方面的特征描述,年盖大数据平台数据源接口、数据仓库、ETL.0LAP、数据挖掘、前端展现等全部数据处理环节。S数据处理过程数据从数据源系
22、统到大数据平台前端使用的整个处理过程,包含大数据平台数据仓库内部的数据抽取、转换和加载。S数据采集点覆盖大数据平台数据处理环节的、获取每个环节运行状态的实体。该实体可以是程序实体也可以是任务实体S数据质量报告数据质量报告是对数据质量日常监控以及质量评估等过程累积的各种信息进行汇总、梳理、统计和分析,形成的统计报告字母名词解狎S数据质量监控通过获取大数据平台各环节的数据质量监控信息.,结合元数据库中的有关检件规则,对各个环节的数据质量情况进行判断,并及时向数据质量监控人员报告。S数据质量规则库数据质量规则库是对数据质量管理活动所用到的各种判断及校验规则进行归类和存放的存储结构,存储的内容包括采集
23、规则、监控规则、告警规则和审计规则等S数据质量信息库数据质量管理子系统存储层上的存储结构,用于存储数据质量信息采集程序采集的数据质量信息、质量评估信息、问题解决方案和问题处理流程信息等S省公司XX集团各省(直辖市、自治区)移动XX通信有限公司。SSQL脚本自动解析SQL脚本白动解析指通过对SQL脚本的词法、语法和语义进行分析,自动生成满足CWM规范要求的数据处理过程的技术元数据的功能。Y业务元数据描述大数据平台中业务领域相关概念、关系、规则的数据。主要包括业务术语、信息分类、指标定义(指标口径)、业务规则等信息。Y元模型元模型是描述元数据的基础模型结构,用于说明元数据对象的各种属性、结构和关系
24、。Y元数据元数据是描述数据间关系的数据。大数据平台中元数据泛指描述数据概念(Concepts).数据间关系(Roles)、数据处理规则(Rules)的数据,其中,领域语义(Semantics)和知识(Knowledge)也属于元数据的范畴。D数据标准指在台企业级省大数据平台下为了使企业内外部使用和交换的数据是致和准确的,经协商致制定并由大数据治理委员会主管机构批准,具有行业特点且共同使用和重更使用的一种规范性约束。D数据标准体系指数据标准按照企业级省大数据平台需求对数据进行标准化的划分归类。字母名词解狎D数据标准内容按照数据标准体系划分的要求分别给出各数据标准制定的规范内容。D行业参考模型实体
25、规范中原定义或新增加的逻辑数据模型LDM实体。D公共代码标准需要引用外部公共标准机构的标准。如:世界各国和地区名称代码等。下列略缩语适用于本规范:缩写英文描述中文描述ASTAbstractSyntaxTree抽象语法树BOSSBusinessOperationSupportSystem业务运营支撑系统CWMCommonWarehouseMetamodel公共仓库元模型ETLExtractionTransfonnationLoading抽取、转换和加载OLAPOn-lineAnalysisProcess在线分析处理XMIXMLMcladataInterchangeXML元数据交换BlBusine
26、ssIntelligence商务智能RESTRepresentationalStateTransfer表述性状态转移4 .总体说明4.1. 概述本规范用于指导企业级省大数据平台数据治理子系统建设,规定了省大数据平台数据治理的范围和要求,明确了数据治理子系统的体系结构,制定了数据治理子系统的功能和处理流程。数据治理子系统包含数据标准管理、元数据管理、数据质量管理、数据资产管理、数据安全管理等功能模块。本方案借鉴资产管理的方法理论来管理数据,将数据作为种特殊的资产,对进入平台的数据进行标准化的规范约束,并以元数据作为驱动,连接数据的标准管理、数据质量管理、数据数据安全管理的各个阶段,形成统、完善的
27、数据治理体系,以解决实际业务问题为导向,增强数据治理子系统对业务发展的支撑能力。4.2. 目标数据治理子系统的建设为数据治理工作提供强有力的系统支撑。本期规范建设目标是以元数据为驱动,建立省大数据平台完整的数据治理体系。从组织架构、系统功能等方面增强数据宏观管控,并实现精细化管理,具体包括: 数据治理组织架构管理:定义数据治理所需人员组织上的岗位和职责,从管理角度支撑数据治理工作的落地和执行。 数据标准管理:建立企业级省大数据平台数据标准体系,并制定数据标准运维管控制度和流程。 元数据管理:降低元数据使用难度、提升用户体验,使大数据平台各类用户均能参与到元数据运营维护当中。 数据质量管理:为内
28、、外部用户提供平台化的数据质量监控:通过扩充和优化公共规则库、保证数据的完整性、一致性、准确性、及时性、合法性,提升用户使用感知;并提供数据质量应用满足个性化需求。 数据资产管理:重点建设从规划、注册、运维到注销的全流程管理体系,使数据资产管理系统化、可视化。 数据安全管理:建立体系化的数据安全管控策略,通过用户安全管理、数据安全管理实现全方位数据安全管控机制,通过技术手段与管理措施相结合的方式落实数据安全,做到事前可管、事中可控、事后可查。4.3. 原则企业级省大数据平台数据治理子系统建设应遵循以下基本原则:1 .有效性原则体现大数据平台数据治理过程中数据的标准、质量、价值、管控的有效性、高
29、效性。2 .价值化原则体现数据治理过程中以数据资产为价值核心,最大化大数据平台的数据价值。3 .统一性原则体现大数据平台架构统一、标准统一、元数据统一、质量流程统一、资产价值统一的一体化管控平台体系。体现平台化、开放性运维思想,实现人人参与数据治理、人人参与数据运维。5 .产品化原则体现大数据平台数据治理能力的显性化,通过产品化互联网思维服务大数据平台数据生态圈用户。6 .安全性原则体现安全的重要性、必要性,保障大数据平台数据安全和数据治理过程中数据的安全可控。5.数据治理体系5.1. 总体框架数据治理总体框架包括组织架构、数据治理模块、数据运维三部分。通过组织架构建立管理办法,制定工作流程,
30、确定角色职责。数据治理模块主要包括数据标准管理、元数据管理、数据质量管理、数据资产管理、数据安全管理,各模块协同运营,确保大数据平台的数据一致、安全、有效。数据运维贯穿整个数据治理体系的流程中,实现平台化的运维管理思路。数据治理总体框架如图5-1所示:批注W2:是否模糊化,简要说一下数据治理需要由专 人、专职负责,不明说建立专业机构。5. 2,忸织架构数据治理组织的构建旨在通过建立数据治理组织架构明确各级角色和职责,保障数据治理的各项管理办法、工作流程的实施,推送数据治理工作的有序开展。5.2.1. 组织构成数据治理组织架构主要由数据治理委员会、数据治理中心和各业务部门构成。组织架构划分和角色
31、设定如图5-2所示:角色职责 I数据治理中心数据业务部门 数据支撑部门 数据使用部门外部用户图5-2数据治理组织架构图5.2.2. 角色职责组织责任体系是数据治理责任落地的保障,数据治理组织架构通过明确各角色职责,实行认责制度,让数据治理工作更好的融入到数据H常使用和相关的工作中,从而推动数据运维自治的实现,如表57。表5-1数据治理组织架构角色职责定义内容组织结构角色角色描述角色主要职责数据治理委员会数据管理决策者由公司主管领导和各业务部门领导组成负责牵头数据治理工作:制定数据治理的政策、标准、规则、流程,协调认货冲突:对数据事实治理,保证数据的质量和隐私;在数据出现质量问题时负责仲裁工作。
32、数据治理中心数据平台运营者数据管理中心机构的平台运营人员负责提交数据标准的要求及数据质量规则和业务规范,解释数据的业务规则和含义;监督各项数据规则和规范的约束的落实情况;负责数据治理平台中整体数据的管控流程制定和平台功能系统支撑的实施:负责平台的整体运营、组织、协调。各业务部门数据提供者相关数据开发提供人员负责数据及相关系统的开发,有责任执行数据标准和数据质殳内容:负责从技术角度解决数据质量问题:作为数据出现质量问题时的主要责任者。数据维护者数据维护人员制定相关数据标准、数据制度和规则:遵守和执行数据标准管控相关的流程,根据数据标准要求提供相关数据规范;作为数据出现质量问题时的次要责任者。数据
33、消费数据使用人员,包作为数据治理平台数据管控流程的最后参与使用者;者含内部用户和外部用户是数据资产价值的获益人;作为数据治理平台数据闭环流程的发起人。5.3.系统架构5.3.1. 系统功能框架数据治理功能框架明确了数据治理在企业级省大数据平台中的定位,并以合理的功能层次划分指导数据治理系统相关功能建设。系统功能框架如图5-3所示。大数据平台门户企业内部用户企业外部用户第三方独立开发者+L-:一能力开放平台寻故据之家3MApP治理助手APP标准道APP数据地图APP数据治理系统数据标准管理标准发布标准执行标定S控近蜴一stkM数据质量管理数据奥卢管理资产注册资产发布7三季口数据安全管理数据安全管
34、理用户安全管理数据治理功能元数据管理数据运维资产运维质量运雉大数据平台图5-3数据治理功能框架图企业级省大数据平台门户:企业级省大数据平台统的访问接口,供企业内、外部用户、第三方独立开发者访问及使用数据治理相关产品或功能,并负责统一访问认证及日志记录。 能力开放平台:企业级省大数据平台统一的对外服务层,数据治理相关的产品及应用均通过这个层次进行注册、发布,并对内、外部开放。 数据治理系统: 数据标准:在数据标准管理组织架构推动和指导下,遵循协商一致制定的数据标准规范,借助标准化管控流程得以实施数据标准化的整个过程。 无数据:采用集中式管理模式进行元数据管理,全公司无数据逻辑集中,即元数据管理模
35、块作为公司元数据的统一发布源,集中管理元数据,提供元数据集中创建、维护、查询功能。 数据质量:时数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。 数据资产:规划、控制、提供数据及信息资产的一组业务职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、提高数据资产的价值。 数据安全:通过计划、制定、执行数据安全政策和安全策略措施,为企业级大数据平台的数据和信息提供行之有效的认证、授权、访问和审计。 I数据运维|
36、:包括数据资产运维、数据质量运维,借鉴互联网思维,通过产品化批注W3:在左侧目录里缺少一个模块运维工具来整体提升企业级大数据平台数据运维效率。企业级省大数据平台:大数据基础平台,负责数据的接入、存储、管理、应用及相关基础功能支撑。5.3.2.系统模块流程图5-4数据治理系统功能各模块关系图如图5-4所示,数据治理系统各模块之间,根据数据操作的流程产生相互关联,各模块业务流程关系说明如下:L1:数据标准管理模块将标准定义映射到元数据信息上,实现数据标准的规范要求落地。L2:元数据管理模块为数据资产管理模块提供存储模型、屈性信息查询服务。L3:元数据管理模块为数据质量管理模块提供元数据相关属性信息
37、。L4:用户通过元数据定义大数据平台的数据结构。L5:数据质量管理模块根据采集需求从大数据平台采集数据。L6:数据质量管理模块将数据质量问题反馈给大数据平台。L7:数据质量管理模块向资产模块提交数据质量评估结果。L8:元数据管理模块为数据安全管理模块提供隐私级别定义服务。L9:数据资产管理模块发起资产访问申请,由数据安全管理模块控制用户访问权限,控制数据资产的增加、删除、变更操作权限,对访问的数据内容、数据属性等操作进行管控。LIO:数据安全管理模块为大数据平台提供数据访问权限策略。5.4. 系统边界企业级省大数据平台数据治理子系统与其它子系统之间存在数据交互、功能调用、流程穿插等关联。数据治
38、理子系统与大数据平台系统内其它子系统的关系示意如图5-5所示:数据服务平台图5-5数据治理子系统与各子系统边界图5.4.1. 与企业级省大数据平台关系企业级省大数据平台上的数据资产是数据治理的主要对象;数据治理为企业级省大数据平台提供数据标准指导、元数据定义、数据质量监控、数据安全等方面的全面支掾,使人数据平台上的数据资产清晰、有序、安全、可控。5.4.2. 与对外能力开放平台关系数据治理为对外能力开放平台提供元数据杳询、数据安全管理支持;对外能力开放平台为数据治理提供统一的数据治理产品及功能注册、发布、使用服务。5.4.3. 与平台运维系统关系数据治理了系统支撑大数据平台的数据管控流程,并与
39、平台运维交互协调,共同支撑大数据平台整体的安全运维、数据运维和管理运维。6.数据治理核心模块6.1. 数据标准管理6.1.1. 背景企业级省大数据平台数据标准是在经营分析系统数据管控要求基础之上,借鉴互联网企业数据治理的经验而提出的。数据标准是指在企业级省大数据平台下,保障企业内外部使用和交换数据的一致性和准确性,具有行业特点且共同使用的一种规范性约束。数据标准是企业级省大数据平台数据治理的基础性工作,是数据治理建设中的首要环节。首先,数据标准为企业级省大数据平台提供统一的数据标准定义和平台逻辑模型。其次,数据标准是企业级省大数据平台进行数据治理的依据和根本。再次,数据标准是衡量企业级省大数据
40、平台数据资产运营和管理的评估依据.最后,通过数据标准管理的实施,实现对企业级省大数据平台全网数据的统运营管理。企业级省大数据平台数据治理体系中数据标准管理如图67所示,包括制定数据标准的规范性文件、进行数据标准化管控及数据标潴管理组织。数据标准 管理组织数据标 准管理图数据标准管理内容企业级省大数据平台数据标准管理与原经营分析系统数据管控的区别如下表6-1所示:表61企业级省大数据平台数据标准管理与原经营分析系统数据管控区别企业级省大数据平台数据标准管理原经营分析系统数据管控涉及企业内外部数据运营相关的数据,包含BOM三域数据、外部数据.数据仅限于布场经营活动的B域和部分0,M域数据。以数据标
41、准为基础的数据治理体系,实现数据的资产化,贯穿整个数据运营的全流程,形成以大数据平台为核心的大数据生态圈,服务于企业内外部客户。以支撑企业内部经营分析为主。服务于整个大数据生态圈。原经营分析系统使用人员。6.1.2,目标及原则数据标准管理的总体目标:通过统一的数据标准制定和发布,结合制度约束、系统控制等手段,实现企业级省大数据平台数据的完整性、有效性、一致性、规范性、开放性和共享性管理,提虑企业级省大数据平台数据治理水平。数据标准制定的原则: 开放性:标准制定人人参与。 共享性:数据标准化信息在大数据生态圈共享使用。 完粘性:涵盖客户、产品、服务、帐务、资源、网络等全部重要数据信息。 有效性:
42、信息准确度高、理解上不存在歧义。 致性:做到五统,定义统、口径统、名称统、来源统、参照统-O 规范性:制度规范、流程控制、系统管理等。6.1.3. 业务分类和定义6.1.3.1. 数据标准体系分类数据标准制定如图6-2所示,包括数据标准体系划分和数据标准内容制定,数据标准体系可分为基础类数据标准和指标类数据标准.据港系义救标体定6.1.3.2. 数据标准内容制定数据标准内容的制定按照数据标准体系分类的要求分别给出数据标准制定的规范要求。1、基础类数据标准基础类数据标准是通过各种业务处理产生或各类渠道采集的基础性数据,在全国范围内必须是唯一定义的,如“用户品牌”、“归属地市”。基础类数据标准分为行业参考模型实体标准和公共代码标准。行业参考模型实体标准指按照行业需求和省级数据逻辑模型实体规范要求,继承以往数据逻辑模型实体规范,将各域的逻辑模型实体定义抽象为模型实体标准要求。行业参考模型实体数据标准体系定义内容如表6-2所示。表6-2行业参考模型实体数据标准体系定义内容行业参考模型实体标准标准体系属性说明数据标准编码根据数据标准编码命名规则进行编写。标准主题数据标准归属主题标准子类数据标准归属类型中文名称数据标准中文名称。英文名称数据标准英文名称。实体编号根据行业参考模型实体编号命名