核心元数据标准SDBCM及其应用.ppt

上传人:小飞机 文档编号:6475015 上传时间:2023-11-03 格式:PPT 页数:54 大小:386KB
返回 下载 相关 举报
核心元数据标准SDBCM及其应用.ppt_第1页
第1页 / 共54页
核心元数据标准SDBCM及其应用.ppt_第2页
第2页 / 共54页
核心元数据标准SDBCM及其应用.ppt_第3页
第3页 / 共54页
核心元数据标准SDBCM及其应用.ppt_第4页
第4页 / 共54页
核心元数据标准SDBCM及其应用.ppt_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《核心元数据标准SDBCM及其应用.ppt》由会员分享,可在线阅读,更多相关《核心元数据标准SDBCM及其应用.ppt(54页珍藏版)》请在三一办公上搜索。

1、核心元数据标准(SDBCM)及其应用,胡良霖中科院计算机网络信息中心2004.8.25 北京,科学数据库技术培训,目录,科学数据库元数据框架体系科学数据库核心元数据标准(SDBCM)科学数据库核心元数据标准的应用,1.科学数据库元数据标准框架体系,扩展原则,1.科学数据库元数据标准框架体系,科学数据库元数据标准体系研究成果科学数据库核心元数据标准三个版本:1.0版、1.1版、2.0版基于SDBCM的主体数据库元数据应用方案1.0版生态研究元数据标准1.1版生态研究元数据国家标准进行中大气数据元数据标准1.0版多媒体元数据标准图像通用元数据规范(草案)视频资源元数据规范(进展中)音频资源元数据规

2、范(进展中),学科相关应用方案,类型相关应用方案,2.科学数据库核心元数据标准,SDBCM发展历程SDBCM的内容修订内容唯一标识符命名规范数据集元数据服务元数据,2.科学数据库核心元数据标准,SDBCM发展历程,2.科学数据库核心元数据标准,标准的研究、修订完善思路科学数据库项目的需求对国内外元数据成果和发展趋势的研究融合信息技术领域的最新研究成果兼顾标准在高于项目层面上的普遍使用性本次修订前有目的的进行了用户调查调查对象为项目内各单位调查内容全面反馈结果总体上肯定了前述标准的实用性,但也反映了存在的问题,2.科学数据库核心元数据标准,本次修订主要内容规范了数据集URI命名规则、服务URI命

3、名规则增加“质量信息”模块在“范围信息”模块中增加了“垂向信息”独立描述服务元数据服务描述通用模型科学数据库数据集服务实例增删了个别元素,修订了部分元素的有关属性,2.科学数据库核心元数据标准,数据集唯一标识命名规则 基础事实在线服务资源均有注册的Internet域名项目内各主体数据库已拥有注册分配的域名方法把已注册的网络域名“反向”解析构造其数据集标识主部,而后续辅部可以根据需要灵活的自主为资源命名 标识字符组成:26个英文字母,不区分大小写;0,1,2,3,4,5,6,7,8,9十个数字;“-”(英文中的连词号)。,2.科学数据库核心元数据标准,DatasetURI:.科学数据库项目内数据

4、集URI命名:DatasetURI:cn.csdb.,标识符主部,标识符辅部,标识符主部,标识符辅部,2.科学数据库核心元数据标准,项目内三级域名标识均已注册,并分配使用辅部(四级及以下级别)标识即数据集实体标识,有注册用户单位内部控制使用保证内部标识唯一,不冲突向科学数据库中心备案 示例纳米科技基础主体数据库的数据集URI为“”化学专业主体库中药物与天然产物数据子库下的专利信息子集的数据集URI可为“cn.csdb.organchem.medicament.patent”。,2.科学数据库核心元数据标准,服务标识命名规则 采取和数据集唯一标识命名规则同样的思路科学数据库项目内数据集URI命名

5、:ServiceURI:=sdbs:/+/service/,sdbs 标识服务的归属来源,表示科学数据库项目内所定义的各种服务,统一分配的项目内所有主体数据库的域名,服务类型,当前有dbms、www、iddleware、grid、ftp五类,服务提供者自行命名,可以是由“/”分隔的层次名字空间,示例:微生物所的网格服务之数据查询服务标识可命名为:,2.1 SDBCM总体结构和说明,数据集描述信息,数据集质量信息,数据集分发信息,元数据参考信息,服务参考信息,结构描述信息,覆盖信息,联系信息,辅助模块,2.1 SDBCM总体结构和说明,XML Schema描述:,描述信息元数据,数据集描述信息

6、数据集名称 数据集中文名称 中国水资源属性数据库 数据集别名 Tabular Water Resources Database of China 数据集标识 主题 学科主题词 主题词 降水 主题词 地表水:主题词 水资源评价 主题词 水资源利用 主题词表 资源科学主题词典(施慧中主编,中国科学技术出版社,1991年出版)自由关键词 降水 自由关键词 水资源:自由关键词 水利工程 自由关键词 径流,记录科学数据库数据集资源基本的内、外部特征引用“范围信息”模块可与DC、CSDGM通过映射交换元数据,描述 中国水资源属性数据库记录了中国全国范围内分省区、流域、城市、水资源利用分区、流域、水利工程和

7、水文站的水文水资源数据,包括水资源数量、水资源开发利用情况、水利工程情况、水文径流等资料.目的水是一种可重复使用的重要的自然资源,人口增长和经济发展对水资源的需求不断扩大。我国部分地区,特别是北方地区,水资源供求矛盾日益严重,水资源供给短缺已经成为我国可持续发展的一大瓶颈。建立中国水资源数据库对于了解我国水资源现状、分布、开发利用状况、实现社会经济的可持续发展具有重要意义.类型 关系型数据库 数据量 记录数 21669 存储量 10M 数据来源 中华人民共和国水利部;中华人民共和国建设部;水资源研究;相关课题。数据集提供者 地理科学与资源研究所 数据集贡献者 中华人民共和国水利部(数据源);中

8、华人民共和国建设部(数据源);水资源研究(数据源);相关课题(数据源);李泽辉(数据集设计、数据源选择及数据采集);向世芳(数据录入)更新频率 每年 数据集时间 创建时间 1987-12-31 最近修改时间 2003-08-10 语种 汉语 url 关联数据集 关联数据集名称 中国自然资源数据库 关联类型 父数据集 关联URL,*本实例参考了中科院地理所李泽辉老师提供的元数据记录,数据集质量信息元数据,数据日志,质量报告,日志联系人,日志描述,处理步骤,处理因由,处理描述,处理时间,数据集质量信息元数据,数据志(数据采集、生产、整理等过程中有关信息的日志记录)数据志描述 处理步骤 理由 处理描

9、述 处理时间 日志联系人 数据质量报告 链接指向数据集的数据质量评测行为或评测结果等有关信息、文档等的地址信息,数据集分发信息元数据,帮助用户了解如何访问和获取所需的数据集资源及其他相关信息,元数据参考信息元数据,帮助用户了解与元数据记录有关的信息帮助元数据维护人员进行元数据的修改与维护有效支持互操作,服务参考信息元数据,服务描述信息元数据服务元数据服务参考信息元数据,为用户或者系统提供指向服务元数据引用的链接信息,服务元数据实现对有关服务信息的详细描述,服务参考信息元数据,实例指示信息服务唯一标示:服务名称:纳米网格服务之数据查询指示信息服务唯一标示:服务名称:中国生物信息检索引擎,结构信息

10、元数据,数据集存储实体的结构的描述信息主要是指关系数据库中的数据表及其属性信息,结构描述信息元数据,检索点:数据库中做为检索起点的主表或视图 实体:数据集存储实体的基本信息 实体名称:实体的存储名称 实体类型:实体定义 主键 属性属性名称 属性中文标签 属性类型 存储长度 计量单位 精度 默认值 属性描述 关联实体 关联类型 是否只读 可否空值,关系 关联实体 关联实体属性 关联子实体 关联子实体属性 关联类型,检索点 数据表Jive 实体一实体名称 jiveattachment实体中文标签 数据表Jive 实体类型 数据表 实体描述 数据表Jive是 主键 附件标识 属性一属性名称 ATTA

11、CHMENTID 属性中文标签 附件标识 属性类型 文本类型 属性长度 100 计量单位精度默认值属性描述 附件的唯一标识符 关联实体 jiveattachmentpro关联属性 一对多是否空 是 是否只读 是 属性二属性名称 MESSAGEID,属性中文标识 信息标识 属性类型 未指定类型 属性长度 50 计量单位精度默认值关联实体关联属性 属性描述 信息的唯一标识符 是否空 是 是否只读 是实体二实体名称 jiveattachmentprop 实体中文标签 附件属性 实体类型 数据表 实体描述 附件文件的属性 主键属性 附件标识 属性一属性名称 ATTACHMENTID 属性中文标识 附件

12、标识 属性类型 文本类型,结构描述信息元数据实例,属性描述 附件文件的名称 关联实体关联属性 是否空 否 是否只读 是 关系关联实体 jive 关联实体属性 ATTACHMENTID关联子实体 jiveattachmentprop关联子实体属性 ATTACHMENTID关联类型 一对多,属性长度 100 计量单位精度默认值属性描述 附件的唯一标识符 关联实体 Jive关联属性 一对一是否非空 否 是否只读 是 属性二属性名称 NAME 属性中文标识 附件名称 属性类型 文本类型 属性长度 50 计量单位精度默认值,结构描述信息元数据实例,覆盖范围信息元数据,辅助模块描述数据资源内容所归属的分类

13、、跨越的时间和覆盖的空间范围的信息,覆盖范围信息元数据,地理范围信息,联系信息元数据,辅助模块与描述对象有关的个人和组织的联系信息,服务元数据,服务为满足顾客的需要,供方与顾客接触的活动和供方内部活动所产生的结果。*在科学数据库,服务可理解为网格信息服务系统为其各节点(包括数据节点和功能节点)提供的各种功能服务标准规定一项服务应满足的要求,以确定其对用途的适应性的标准。#服务元数据(项目内)访问节点为获取服务与被访问节点交互中需要“提交”的参数的描述,*定义摘自ISO9004-2:199l质量管理和质量体系要素之第2部分:服务指南#定义摘自ISO/IEC第2号导则(1991年第6版),服务元数

14、据模型,数据集连接服务元数据,数据库连接服务名称:IAPConn数据库连接服务唯一标识符:数据集连接服务描述:数据库系统:Oracle数据库系统版本:9i数据库连接主机IP:端口号:1521数据库名称:iap用户名:admin密码:sysadmin关联数据集URI:,中间件服务,网格服务名称:纳米数据访问中间件服务网格服务URI:网格服务描述:此服务描述了获取纳米数据库的数据访问中间件中间件服务主机地址:中间件服务端口:6666,网格服务,网格服务名称:数据服务网格服务URI:网格服务描述:此网格服务提供了获取大气科学与环境数据库的数据的接口网格WSDL:网格服务句柄:http:/159.22

15、6.2.147:8080/ogsa/services/sdg/cactus/data/DataFactoryService服务关联数据集URI:,WWW服务,服务名称:中国生物信息检索引擎WWW服务唯一标识符:WWW服务描述:描述了中国生物信息检索引擎服务的信息WWW服务网址:http:/服务相关数据集URI:,FTP服务,服务名称:大气数据下载服务FTP服务唯一标识符:FTP服务描述:用户通过下载服务获取大气数据的有关信息 FTP服务URL:ftp:/data/是否匿名服务:否相关数据集URI:,核心元数据标准的应用,应用方案标准使用定制内容著录工具,元数据标准扩展是必要的元数据应用方案(A

16、pplication Profile)从一个或多个元数据标准(或名称空间,Namespaces)中选择元素,并可能创建一些新的元数据元素,所有这些元素共同组成一个新的元数据标准。优点模块性可扩展性互操作性,核心元数据标准的应用方案,资源整合和交换,扩展行为与原则总原则必保留标准中所有的必选模块的必选元素保持标准稳定的基础上扩展,支持互操作性均衡个性化与互操作性、专指度与通用性、简单易用与描述能力增在确定不存在语义重复的前提下,可以定义新的模块/元素新增元素不可替换标准中现有元素的名称、定义或数据类型应将扩展元素合理地组织到标准的语义树结构中,核心元数据标准的应用方案,扩展行为与原则(续)改施以

17、更严格的可选性限制,如可选属性改为必选允许将元素的值域替换为一个合适的值代码表允许缩小元素的值域允许对已有代码表进行扩充删允许根据需要,裁减元素不允许对标准进行上述原则所没有允许的任何扩展,核心元数据标准的应用方案,描述对象数据资源,需求分析,客观需求,需求满足度分析,SDBCM,可以满足需求?,是,否,保留并应用,增加模块/元素?,更改可选性?,紧缩值域?,删减模块/元素?,是,是,是,是,形成满足需求的Application Profile,扩展方案设计流程,据需要扩展,核心元数据标准的使用,标准定制根据描述目标需要,确定所用元数据标准的内容选定或者删减先有标准的模块、复合元素和元素,甚至

18、对有关模块、复合元素、元素属性的约束和确定对未涵盖内容的扩展定义,以及元素值域约束的紧缩等问题,这些是需要通过扩展方案实现扩展方案的原则和行为说明了标准扩展所应遵循的原则和允许的行为,而定制则是说明了如何在遵循原则的前提下实施“合法”行为,核心元数据标准的使用,定制原则选定模块的必选子元一定要保留定制应根据需要,对照标准的定义和规约,针对不同的对象采取不同的策略实现不同的对象主要指不同类型的元素、复合元素、模块,以及元素定义时采取的不同实现方法(引用还是类型定义等)定制方法或策略因类型、定义的不同而不同,核心元数据标准的使用,两种定制情况保留整个标准的框架体系仅对具体模块、复合元素和元素的进行

19、必要的增减,或属性改变引用标准体系中部分模块、元素来构建新的标准体系,核心元数据标准的使用,完整框架体系的定制主要的内容是元素增减,属性的变更定制思路树结构的标准体系视为语义树,而树的分支是对其父节点语义的分解对语义树深度优先遍历发现不需要的元素或为增元定位属性为可选的叶子元素可直接据需要保留或裁减遍历中经由的所有可选的复合元素节点,确定不用时可直接删除在语义一致的位置为所需要增加的元素定位对语义树广度优先遍历发现不需要的元素或为增元定位同上,标准语义树深度优先遍历策略,标准语义树广度优先遍历策略,核心元数据标准的使用,引用局部模块、元素于构建新的标准体系根据需要在标准体系中发现所需要的模块或

20、者元素对象发现的方法建议仍采取语义树遍历策略根据定位到的目标模块或者元素的特点引用:如果目标元素为独立定义的元素,可直接借用;如果目标元素为非独立定义的简单元素,其必为一复合元素的子元:如果其父元为单独定义的独立元素,那么在使用目标元素时应直接使用其父元,需权衡其他兄弟元素的去留如果父元和该子元的关系是父元通过其定义类型继承得到该子元,用户应该放弃引用其父元,转而使用子元所归属的复杂类型,在其目标体系中定义新的元素,把新元素的类型为设定为元所归属的复杂类型;如果目标元素为复合元素,应注意在使用该复合元素的同时有效的引入与之相关的元素和类型,相关的元素主要是指目标元素子元所引用的元素,而相关的类

21、型则是指目标元素子元类型为用户自定义的元素类型。,核心元数据标准的使用,定制实现标准实现了XML Schema的描述,体现了标准制定与技术支持相协调融合的同时,更提供了对标准定制的灵活性实现的支持标准的XML Schema描述实质上是定义了一个元数据标准描述的命名空间,任何基于该标准的定制均可通过对命名空间的引入实现本标准的XML Schema描述已经在网上发布,其网址为,可以通过在其标准描述中直接引入该命名空间实现对标准的定制,在文档中嵌入xmlns:sdbcm=,核心元数据标准的使用,工具的实现目标元数据著录和管理工具是为元数据标准开发的辅助用户实现元数据著录和管理的工具软件工具在实现中应

22、充分遵从标准的体系、内容和结构在技术实现时尽量与标准保持完全一致支持用户灵活定制工具应实现的知识约束:必选模块的必选元素必定要著录可选模块、可选复合元素在被选用后,其必选子元必定要著录内容用户可以把不需著录内容的可选模块、可选元素在著录项中隐去支持用户自主决定可以多次著录元素和模块的次数,模块的重复必重复其子元条件必选模块、元素之间的制约关系应给予充分的重视,在条件模块、元素内容著录后,其相关的必选对象应必定著录内容根据元素的值域、属性及其他相关约束构建的知识库,自主校验著录内容的有效性,核心元数据标准的使用,元数据著录在著录元数据时,需明确的识别判断模块、复合元素的语义和属性著录时应该根据存

23、在的关系及属性实现内容的著录:必选模块中的必选元素必定要按照格式要求著录内容,这是标准强制规定的必选模块、必选复合元素所包含的可选元素是可以不著录的可选模块、可选复合元素在其被选择使用后,其必选子元需强制著录内容,而可选子元则需据实际情况确定可重复模块、复合元素在多次使用时,其必选子元也将必定随之同次重复,而其可选子元则需据实际情况确定条件必选模块、元素在条件模块、元素被选用著录后,其条件关联的其他必选对象应同时著录对于各种情况中出现的可选元素,如果不存在条件关联元素时,可根据需要著录相应内容;如存在条件关联元素,应根据情况5著录内容,核心元数据标准的使用,通用元数据管理工具为科学数据库元数据标准体系开发符合书写规范的XML Schema均可导入,实现所描述元数据规范的元数据著录和管理两种版本本地版部署在各建库单位著录和管理本单位数据集元数据中心版部署在科学数据库中心收集和管理所有建库单位所著录的元数据,核心元数据标准的使用,核心元数据标准近期工作建库单位参照标准,借助工具,结合实际情况完成元数据著录和提交元数据著录时应尽可能详尽科学数据库中心收集元数据评估元数据利用元数据,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号