第四章数字档案馆元数据体系课件.pptx

上传人:牧羊曲112 文档编号:1474429 上传时间:2022-11-29 格式:PPTX 页数:74 大小:982.39KB
返回 下载 相关 举报
第四章数字档案馆元数据体系课件.pptx_第1页
第1页 / 共74页
第四章数字档案馆元数据体系课件.pptx_第2页
第2页 / 共74页
第四章数字档案馆元数据体系课件.pptx_第3页
第3页 / 共74页
第四章数字档案馆元数据体系课件.pptx_第4页
第4页 / 共74页
第四章数字档案馆元数据体系课件.pptx_第5页
第5页 / 共74页
点击查看更多>>
资源描述

《第四章数字档案馆元数据体系课件.pptx》由会员分享,可在线阅读,更多相关《第四章数字档案馆元数据体系课件.pptx(74页珍藏版)》请在三一办公上搜索。

1、第四章 数字档案馆元数据体系,本章要点,简要论述了元数据的一般知识;介绍了国内外主要的电子文件与数字档案元数据集的构成和应用情况;分析了档案元数据互操作的基本原理、存在的问题以及国外的进展情况,关键词,元数据电子文件元数据数字档案元数元数据互操作据,EADISAD(G)ISAAREACDCOAIPMH,第一节 元数据的一般知识,元数据是信息资源管理的有力工具,广泛应用于数据库与数据仓库、软件构造、图书馆、档案馆、博物馆、地理信息系统等各个领域元数据最先是作为计算机科学领域的专用术语出现的,从狭义上讲,主要针对数字资源和网络环境下的资源描述,第一节 元数据的一般知识,一、元数据的含义元数据(Me

2、tedata)被认为是关于数据的数据,其主要功能是描述数据以及数据环境。从广义上讲,元数据是一种标准化的框架,用来描述和表征某一类信息资源的基本特征,对资源进行定位和管理,为用户提供获取该信息资源的线索。从狭义上讲,元数据主要指网络环境下,针对数字资源进行描述的元数据。信息资源的管理、开发、利用、维护、挖掘与共享离不开元数据标准的支持。事实上,网络信息资源的海量、异构与分布模式,以及网络资源共享的内在要求,使得元数据的重要性大大增加,第一节 元数据的一般知识,二、元数据的分类(一) 根据应用领域的划分根据应用领域的不同,可以将元数据划分为图书资料元数据、电子公文元数据、数字档案元数据、手稿资料

3、元数据、艺术品元数据、数字博物信息元数据、地理空间信息元数据、气象信息元数据、数据库元数据、软件构建元数据、商品元数据、服务元数据等等。,第一节 元数据的一般知识,二、元数据的分类(二) 根据功能的划分在一套元数据体系内部,不同的元数据元素承担着不同的功能。根据元数据的应用需求,王浒等人将元数据划分为内容元数据和服务元数据。内容元数据主要是以一种特定的形式描述资源本身的内容。服务元数据是对信息资源所提供的服务的描述,包括信息资源的连接方式、服务内容和联结参数,如何有效地管理这些服务信息,就是服务元数据的任务。,第一节 元数据的一般知识,二、元数据的分类(三)本书将信息资源元数据划分为:1、资源

4、内容元数据资源内容元数据主要描述资源的内容特征,包括题名、文摘、主题词或关键词以及相互参照等,是任何一个元数据体系所必不可少的组成部分。对于特定的信息资源,如化学文献信息资源、空间地理信息资源等,还有一些特殊的揭示资源内容特征的栏目,比如分子号、空间域等。,第一节 元数据的一般知识,二、元数据的分类(三)本书将信息资源元数据划分为:2、资源责任元数据为了确保资源描述的准确、真实与可靠,需要对各类相关的责任者进行详尽描述。3、资源表示元数据所谓资源表示,是指关于信息资源的数据结构、文本格式、载体形态、文体风格、文种与语言等的不同形式。,第一节 元数据的一般知识,二、元数据的分类(三)本书将信息资

5、源元数据划分为:4、资源获取元数据公众在获取信息资源时常常遇到获取途径、资源来源、使用限制等一系列问题,比如资源密级、隐私权与版权保护、资源阅读需要的硬软件条件等。为帮助公众有效地获取资源,需要对这类元数据进行描述,第一节 元数据的一般知识,二、元数据的分类(三)本书将信息资源元数据划分为:5、资源管理元数据为了使资源得到长期保存,保证其原始记录性并对资源价值进行评价,需要对资源的使用、备份、升级、更新维护等管理活动的信息进行记录,其实质是对资源管理属性的描述。6、元数据管理元数据管理元数据是关于元数据的元数据。它包括元数据的责任者、元数据发布日期、元数据的流通与使用状态等描述,对于元数据的有

6、效管理十分重要。,第一节 元数据的一般知识,三、元数据的标准化元数据标准体系的制定有利于信息化的健康发展。以电子政务为例,电子文件元数据、空间地理元数据、数字档案元数据标准的制定,对于我国电子政务、数字档案馆建设、数字城市的健康发展有着重要的意义,可以减少重复浪费,降低信息化建设的成本,第一节 元数据的一般知识,三、元数据的标准化元数据标准体系的制定应该遵循两项原则:(一)可扩展性在数字环境中,信息资源的内容与形式复杂多样,包括不同的数据类型、不同的格式、不同的载体等等,而且新的资源形式还在不断出现,为了使所制定的标准适应未来的发展,并且能够最大限度地兼容同类信息资源的各种表现形式和各个阶段的

7、存在形式,元数据标准的制定应具有充分的可扩展性。,第一节 元数据的一般知识,三、元数据的标准化元数据标准体系的制定应该遵循两项原则:(二)互操作性在互操作研究领域,将由不同组织管理的、采用不同技术、异构的分布式系统所组成的团体称为联盟,比如数字档案馆联盟、数字图书馆联盟都是典型的联盟,甚至电子政务系统也可以看做是一个联盟互操作的实现不仅需要元数据的标准化和广泛执行,同时也需要相应的网络技术标准的支持。,第二节电子文件元数据,一、国外电子文件元数据研究项目自1999年以来,电子文件元数据的研究受到各国政府、档案馆、大学和研究机构的重视,相继出台了一系列电子文件元数据。我国学者金更达整理了部分国外

8、电子文件元数据研究项目以及元数据标准,第二节电子文件元数据,一、国外电子文件元数据研究项目(一) InterPARES永久保护电子文件真实性国际研究项目(International Research on Permanent AuthenticRecords in Electronic Systems,InterPARES)始于1999 年,由包括美国、英国、加拿大、中国等10 余个国家的档案馆以及一些大学和研究机构共同参与研究。,第二节电子文件元数据,一、国外电子文件元数据研究项目1、第一阶段:19992001 年研究聚集于如何保存那些对于创建主体而言已不再需要的电子文件的真实性,这些文件主

9、要由产生于数据库和文档管理系统中的文本文档组成。,第二节电子文件元数据,一、国外电子文件元数据研究项目1、第一阶段:19992001 年第一阶段的研究领域分为五个部分:(1)保护电子文件真实性有何要求;(2)怎样挑选应保存的电子文件;(3)如何保管真实的电子文件;(4)哪些方针、策略及标准可用来长期保护电子文件的真实性;(5)建立InterPARES 术语学。,第二节电子文件元数据,一、国外电子文件元数据研究项目2、第二阶段:20022006 年这一阶段是使用有经验的、交互的、动态的计算机技术开发和明确那些可以确保文件创建和维护的可靠性、真实性,以及长期保存产生于艺术、科学和政府行为中的真实文

10、件所需要的概念、原则、标准和方法,以确保社会记忆在未来的时代中能够被准确访问。,第二节电子文件元数据,一、国外电子文件元数据研究项目2、第二阶段:20022006 年该模板将元数据划分为以下五个部分:(1)载体说明。(2)外部特征。(3)内容特征。(4)背景信息(5)附注说明。,第二节电子文件元数据,一、国外电子文件元数据研究项目(二) BAC:The Pittsburgh ProjectBAC是源自于美国匹兹堡大学的“Function Requirements for Evidence in Records”项目,由美国著名档案学者戴维比尔曼负责实施。该研究项目的主要目标是开发一整套定义明确

11、的文件保管功能要求,一方面满足各种法律、行政以及特殊机构的需要;另一方面用于电子信息系统的设计与执行。同时该项目也不断思考文件保管功能如何受到组织的政策、文化、信息技术标准的使用、系统设计及执行等的影响。,第二节电子文件元数据,一、国外电子文件元数据研究项目(二) BAC:The Pittsburgh ProjectBAC 元数据模型包括六个层次:(1)处理层(Handle Layer):描述文件特征、文件来源、文件价值以及查找内容所采用的叙词规范和文件检索、利用或处理时的限制状况。(2)条件层(Terms and Conditions Layer):文件检索、利用和处理时所遵循的限制条件。(

12、3)结构层(Structural Layer):与文件相关信息的数据结构及软硬件设备信息的描述,主要包括案卷说明、文件说明、内容结构、文件来源等信息。,第二节电子文件元数据,一、国外电子文件元数据研究项目(二) BAC:The Pittsburgh ProjectBAC 元数据模型包括六个层次:(4)背景层(Contextual Layer):文件的形成背景,主要包括对文件形成负有责任的机关、团体或个人的说明;系统和过程记录情况的说明。(5)内容层(Content Layer):有关文件的主题、主要内容的描述。(6)利用历史层(Use History Layer):文件利用的详细记录描述(包括

13、利用者、利用时间和利用效果)。,第二节电子文件元数据,一、国外电子文件元数据研究项目(三) DoD 5015 2DoD 5015 2是美国国防部发布的,用于美国国防部及军事部门实现电子文件管理的元数据标准。根据联邦政府文件保管的要求,DoD 5015 2明确规定了电子文件管理应用软件的设计标准。同时它依据文件生命周期理论,建立了文件保管理论模型,并依据此模型于1998 年开发出文件保管应用元数据标准DoD 5015,第二节电子文件元数据,一、国外电子文件元数据研究项目(三) DoD 5015 2DoD5015 2 元数据模型可划分为七个层次:(1)文件实体(Record):是文件管理的一个实体

14、,它包含了文件所固有的各种信息,包括形成者、形成时间、主题、内容等等。(2)案卷(File):定义案卷的信息,包括案卷的名称、形成时间、终止时间、案卷标识、文件集等,其作用是将相关的文件收集到同一集合中。(3)案卷计划(File Plan):定义案卷所包含文件的种类、案卷处置、权限证明等信息。,第二节电子文件元数据,一、国外电子文件元数据研究项目(三) DoD 5015 2DoD5015 2 元数据模型可划分为七个层次:(4)文件类别(Record Category):定义文件的种类,包括文件标识、描述、部署指令等信息。(5)处置指令(Disposition Instruction):定义文件

15、的保持期限并对当达到文件保持期限时应执行的行为进行描述。(6)案卷类别(File Category):定义案卷的类别。(7)中止指令(Cutoff Instruction):定义案卷中止的指令。,第二节电子文件元数据,一、国外电子文件元数据研究项目(四) RMSCA联邦机构文件保持元数据标准RMSCA (Recordkeeping Metadata Standard for Commonwealth Agencies)是澳大利亚国家档案馆制定的用于帮助联邦政府机构识别、鉴定、描述和管理各文件管理系统中的电子文件的元数据标准,该标准的制定为联邦政府机构文件管理系统的设计提供了统一的结构与框架,从

16、而实现了电子文件的互操作功能,同时也为档案馆捕获联邦政府机构产生的电子文件提供了统一的标准。,第二节电子文件元数据,一、国外电子文件元数据研究项目(四) RMSCARMSCA参照了戴维比尔曼设计的元数据模型BAC,将元数据划分为六个层次:处理层、条件层、结构层、背景层、内容层和利用历史层,并定义了20 个基础元素和65 个子元素。,第二节电子文件元数据,二、我国电子文件元数据标准2008年3月24日,国家档案局中央档案馆办公室下发了关于电子文件元数据标准和电子文件管理细则两项档案行业标准征求意见稿的通知。标志着我国电子文件元数据标准的制定已经基本成熟。其中,电子文件元数据标准(征求意见稿)的总

17、体框架表揭示了我国电子文件元数据核心元素集、标识与限定元素等,从文件、责任者、业务、关系与保存五个实体出发,为电子文件的内容、现行业务、机构背景与长期保存提供了较为全面的描述框架,第三节 国内外档案元数据标准,一、数字档案元数据的含义与类型数字档案馆的元数据是用来描述档案数据本身的内容、结构及其背景特征的数据,它是一个元数据系统,其目的是加强对数字档案信息资源的发现、识别、开发、组织和评价,而且对相关的数字档案资源进行选择、定位,并追踪档案在管理和使用过程中的变化,实现档案信息资源的整合、有限管理、利用和长期保存。,第三节 国内外档案元数据标准,一、数字档案元数据的含义与类型数字档案馆元数据的

18、主要功能有:(1)描述功能,这是最基本的功能;(2)检索功能,为用户提供方便快捷、多层次、多途径的检索体系;(3)选择功能,支持用户在不浏览档案信息的情况下,对信息对象有基本的了解,从而决定对信息的取舍;(4)定位功能,提供档案信息资源本身所在位置的信息;(5)管理功能,保存对档案日常使用、管理方面的相关信息,便于数字档案馆的管理。,第三节 国内外档案元数据标准,一、数字档案元数据的含义与类型目前常见的档案元数据格式主要有:第一,对档案内容进行描述的元数据,如国际档案著录标准(总则)ISAD(G) 、编码档案著录标准EAD;第二,描述档案背景信息的元数据,如法人、个人及家庭背景信息国际档案规范

19、文本ISAAR、编码档案背景规范EAC;第三,其他标准,如档案、个人论文和手稿规范APPM,文本编码项目TEI等等,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(一)国际档案著录标准(总则)ISAD(G)ISAD(G)是国际档案理事会ICA(International Council on Archives)制定的第一个档案著录标准,适用于传统档案与电子档案,在世界许多国家和地区得到广泛应用,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(一)国际档案著录标准(总则)ISAD(G)1、历史背景 ISAD(G)于1990年由联合国教科文组织与ICA合作制定。ISAD

20、(G)指定了世界各地档案共同著录的26个项目,要求这些项目尽可能地以ISAD(G)的名称来建立档案信息的智能控制与存取,对传统档案和电子档案资料进行著录。1994年ISAD(G)第一版正式形成,19962000年对第一版进行了修改,2000年年初正式出版了第二版。如今ISAD(G)已经被翻译为多种语言,包括葡萄牙语、荷兰语、法语、英语、德语、威尔斯语,遗憾的是还没有汉语版本,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(一)国际档案著录标准(总则)ISAD(G)2、结构ISAD(G)由以下七个部分组成:(1) 识别著录(Identity Statement)(2) 背景(Con

21、text)(3) 内容和结构(Content and Struture)(4) 检索和利用的条件(Conditions of Access and Use)(5) 相关资料(Allied Materials)(6) 附注(Notes)(7) 著录控制(Description Control),第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(二)编码档案著录标准(EAD)编码档案著录标准格式主要用于描述档案和手稿资源,包括文本文档、电子文档、可视材料和声音记录。EAD目前已经是美国档案著录的国家标准,并逐渐在其他国家得到应用。,第三节 国内外档案元数据标准,二、国外主要档案元数据标

22、准介绍(二)编码档案著录标准(EAD)1、背景EAD最早是在美国伯克利加利福尼亚大学图书馆发起的伯克利检索工具项目(Berkeley Find Aids Project,BFAP)中提出的,1998年完成了第一版EAD标准。EAD主要由四部分组成,其中EAD DTD是该标准的主体部分。EAD DTD是基于国际档案著录标准(总则)ISAD(G)之上的一部档案著录交流标准。它是以通用标准语言(SGML)和扩展标记语言(XML)文件类型定义(DTD)的形式存在的。现在已有了EAD 2002版,此版本在第一版的基础上新增了“实体技术”(phystech)这个元素,由EAD DTD10版的145个元素变

23、为146个元素。,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(二)编码档案著录标准(EAD)2、结构EAD格式的记录由头标Eadheader、前事项Frontmatter及内容描述Arches三个部分组成。头标是必备的项,由EAD标识符Eadid、文件描述Filedesc、背景描述Profiledesc、修订描述Revisiondesc四个元素组成,提供内容部分文本的书目信息。前事项是一个可选项,主要内容是按照本地需要的顺序,重复在头标元素中已经出现的内容。内容描述部分包含了档案材料的主体信息。,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(二)编码档案著录标

24、准(EAD)3、应用自从EAD问世以后,越来越多的国家和地区的档案机构应用EAD,目前几个影响较大的项目主要有:(1) 加州遗产项目(California Heritage Project)(2) 加州联机档案馆项目(The Online Archive of California Project)(3) 核心执行先导项目(Core Executive Pilot Project),第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(二)编码档案著录标准(EAD)4、特点EAD是目前全世界档案界最有影响的档案著录结构标准之一,主要具有以下特点。(1)著录详尽,适用范围广泛。(2)易用

25、性和兼容性。(3)可扩展性。(4)便于检索。,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(三) EAD与ISAD(G)的关系EAD是在ISAD(G)的基础上发展起来的,二者在对档案的著录、定位和检索方面各具优势,相辅相成。ISAD(G)是通用性原则,具有更强的简易性和互通性。,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(四)法人、个人及家庭背景信息国际档案规范文本ISAAR(CPF)ISAAR (CPF)为描述形成档案的法人、个人以及家庭提供了一个标准工具。在著录系统中创建既相互分离又互有联系的档案形成者的描述,为获取以及管理、发现、利用和理解档案的背景信息

26、提供了一个有效而灵活的手段,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(四)法人、个人及家庭背景信息国际档案规范文本ISAAR(CPF)1、背景 法人、个人及家庭背景信息国际档案规范文本(International Standard Archival Authority Record for Corporate Bodies,Persons,and Families,ISAAR(CPF)第一版是由国际档案理事会的著录标准委员会ICA/DDS (ICA Ad Hoc Commission on Descriptive Standards)在19931995年期间发起的,1996

27、年正式出版,2004年又制定了第二版。第二版是第一版的扩展和重构,在内容上由第一版的三个部分变为第二版的四个部分,另外还对此标准如何与档案材料和其他资源(如ISAD(G))相链接进行了描述,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(四)法人、个人及家庭背景信息国际档案规范文本ISAAR(CPF)2、结构 ISAAR(CPF)的元素共分为四大类,每个大类下面又分为很多子元素,具体如下:(1) 身份 (Identity Area)(2) 描述区域(Description Area)(3) 关系(Relationships Area)(4) 控制(Control Area),第三

28、节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(四)法人、个人及家庭背景信息国际档案规范文本ISAAR(CPF)3、发展ISAAR (CPF)将与EAD兼容,以便建立一个传记和历史数据库。这个数据库对形成档案资源的团体机构、个人和家族的文献进行处理,对于分散的和复杂的全宗著录具有重要价值。另外,按照此标准建立起来的文件可以达到跨国、跨语言链接背景信息的目的,如链接关于殖民、移民和贸易等具有跨国特征的文件,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(五)编码档案背景规范(EAC) 编码档案背景规范(Encoded Archival Context,EAC)是一项基于可

29、扩展性语言(XML)的元数据标准,是EAD的延伸和扩展。除了适用于档案领域之外,还可应用于图书馆、博物馆、个人传记和组织历史极大的家谱数据库中,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(五)编码档案背景规范(EAC) 1、背景编码档案著录规范EAD不能提供独立的关于文件作者(Authority)及背景的信息。针对这一问题,温迪达夫(多伦多大学)和理查德萨瑞(耶鲁大学),在1998年最先提出建立一个对创作者和背景信息的编码标准。在发起人的支持下和美国联邦数字图书馆的资助下,他们于1999年在耶鲁大学举行会议,在2001年3月和6月分别在多伦多大学和弗吉尼亚大学举行了两次会议,

30、研究制定关于编码档案背景规范(EAC),第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(五)编码档案背景规范(EAC) 2、结构每个EAC文件(EAC Document)包括两个部分:头标Eacheader和环境描述Condesc,Eacheader提供背景描述,环境描述包含创作者描述。头标和环境描述都包括具体的子元素,有些是必须的而有些是可选择的。,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(五)编码档案背景规范(EAC) 3、EAC与ISAAR(CPF)的关系EAC是ISAAR(CPF)的补充,为了保持EAC与ISAAR(CPF)修订版的一致性,决定参与多伦

31、多会议的许多成员同时也参加ISAAR(CPF)第二版的制定。而且制定EAC的原则与方法将提交到国际档案描述标准委员会,由其来指示ISAAR(CPF)的修订。因此EAC模式将与修订版ISAAR(CPF)完全相一致。,第三节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(六) 文本编码倡议(TEI)文本编码倡议(The Text Encoding Initiative,TEI)主要用于文字信息的转换,但对于其他格式的信息,如图像声音等也有涉及。它不但可用于新建立的电子资源,也可以转换已存在的资料;不但可用于电子文件的著录,也可用于纸质档案的电子化。TEI现在已被称为文字资料的电子格式,第三

32、节 国内外档案元数据标准,二、国外主要档案元数据标准介绍(七)各档案元数据标准之间的关系以上各个元数据各有特点,“从使用的状况来看,大部分欧洲国家如英国、法国、瑞典、德国、西班牙、意大利等均采用国际档案理事会编制的档案著录通用规则(ISAD(G)和档案规范记录国际标准(ISAAR(CPF),第二版2004出版)对档案进行多级著录和多媒体信息管理,而在北美较多的用EAC和EAD进行档案著录。”,第三节 国内外档案元数据标准,三、我国档案著录规则与EAD的比较目前我国实施的档案著录规则(DA/T181999)与EAD元数据标准的关系:首先,两者存在联系。从总的著录对象来说,两者的对象都主要是针对档

33、案资源;在著录项目的设置上存在相同之处,如“正题名、并列题名”与“Titleproper”、“副题名”与“Subtitle”、“作者”与“AutHor”、“其他责任者”与“Sponsor”、“文件形成时间”与“Date”、“附件”与“Note”、“数量”与“Num”等。其次,规则制定的目的是一样的,都是为了便于档案的管理、检索与利用。,第三节 国内外档案元数据标准,三、我国档案著录规则与EAD的比较两者的区别:(1)著录元素的数量和格式不同。在元素数量方面,我国档案著录规则(DA/T181999)的元素共分为7个大项,20个小项,要比EAD元素少得多,且针对电子档案的著录元素极其缺乏,如文件的

34、版本、编程语言、文本类型、应用软件等;EAD是利用XML语言进行层次化和等级式的著录,所有的元素都包含在Ead/Ead结构中,而我国的著录格式目前一般采取段落符号式条目格式,第三节 国内外档案元数据标准,三、我国档案著录规则与EAD的比较两者的区别:(2)著录的层次等级不同。从以上的格式可以看出我国的档案著录规则只是进行案卷级和文件级的著录,而并没有对全宗进行著录,如机构的行政管理历史、档案的历史沿革、传记概况等,这样的著录结果违背了档案全宗的基本原则。而EAD是通过多层和分级来描述档案对象的,通过对文件整体的描述及更多分级描述,第三节 国内外档案元数据标准,三、我国档案著录规则与EAD的比较

35、两者的区别:(3)著录的主要对象不同。我国档案著录规则(DA/T181999)主要针对稳定的物理载体,并且主要是用于档案的后控著录,所以不适宜电子档案的著录;而EAD是为数字资源而制定的。其设计原则具有可扩展性、可选择性、可重复性等特点,有利于揭示各类电子文献的各种特征,进而达到网络资源的组织、分类、索引等目的,第三节 国内外档案元数据标准,三、我国档案著录规则与EAD的比较两者的区别:(4)著录规范化手段不同。EAD是以XML语言格式著录的,XML的标准语法结构“著录内容/”能够保证著录文档的规范和有序化。而我国的档案著录主要靠一些置标标识符来保证目录数据的规范化和有序化,主要的标识符有:“

36、”表示其后的数据项是一个大项、“/”表示其后的数据项是一个责任者项、“:”表示其后的数据项是文种或规格、“;”表示其后的数据项是保管期限等,第三节 国内外档案元数据标准,三、我国档案著录规则与EAD的比较两者的区别:(5)简易程度和扩展性不同。我国档案著录规则的著录虽然元素比EAD少,但是著录规则要烦琐得多,并且扩展性差,对每个项目的先后顺序及格式都具有严格的规定,而在EAD的Frontmatter层次中可以根据实际需要任意地安排元素的顺序。而且EAD是基于XML语言格式的元数据,可以与很多元数据甚至是其他学科领域的元数据交换。,第四节 数字档案元数据的互操作,一、基于OAIPMH协议的档案元

37、数据互操作框架的结构与功能(一) 档案OAIPMH元数据互操作框架基于OAIPMH的档案元数据互操作框架由三部分组成:数据提供者(Data Provider,DP)、服务提供者(Service Providers,SP)及注册服务器。OAI协议是在DP与SP之间的通信协议,OAI协议的核心是其提供的六个命令动词(Verbs):GetRecord、Identify、ListIdentifiers、ListMetadataFormats、ListRecords与ListSets。SP根据注册服务器中有关DP的信息线索,通过这六个动词向DP获取特定资源的元数据。SP在获取不同DP的元数据后,向用户提

38、供增值检索服务,第四节 数字档案元数据的互操作,一、基于OAIPMH协议的档案元数据互操作框架的结构与功能(二) 档案数据提供者的结构与元数据发布在OAIPMH框架中,OAI接口用于实现数据提供者与服务提供者之间的信息传递,执行对六个OAI请求动作的响应处理,其主要功能是封装一个表示响应信息的XML,第四节 数字档案元数据的互操作,一、基于OAIPMH协议的档案元数据互操作框架的结构与功能(三) 服务提供者的结构与元数据收割在OAIPMH元数据互操作框架中,服务提供者主要是通过向注册服务器获取档案数据提供者的地址,在本地建立收集器程序,然后根据获得的地址,向数据提供者通过OAI请求(Reque

39、st)定期、定量收集经过映射转换的、符合OAI协议要求的、XML形式的元数据,存储到本地数据库中,然后通过统一的检索界面为用户提供增值处理和检索服务,第四节 数字档案元数据的互操作,一、基于OAIPMH协议的档案元数据互操作框架的结构与功能(四) 基于OAIPMH协议的档案元数据互操作系统的体系结构根据上述分析,我们可以把档案元数据互操作系统分成以下四个模块。(1)档案数据提供者模块。具体包括对档案数据的扫描、录入、加工、处理与存储,对档案元数据的提取、编辑、加工、存储、检索、显示和输出功能。可以采用SQL等数据库系统软件来实现。(2)档案元数据服务提供者模块。该模块主要定期对数据提供者提供的

40、元数据进行收获、存储并提供检索服务。,第四节 数字档案元数据的互操作,一、基于OAIPMH协议的档案元数据互操作框架的结构与功能(四) 基于OAIPMH协议的档案元数据互操作系统的体系结构(3)基于OAI协议的应用模块。该模块是实现OAI交互功能的核心,前端用于接收档案元数据服务提供者模块发出的OAI请求,后端与数据提供者模块的OAI接口进行交互,获取XML格式的元数据。(4)注册服务器模块。模块的技术实现与数字图书馆或其他的元数据互操作系统相似,这里不再详细介绍,而主要来探讨档案元数据互操作中的难点,即档案元数据EAD与OAI协议所支持的元数据DC之间的映射问题。,第四节 数字档案元数据的互

41、操作,二、DC元数据标准简介都柏林核心元数据集DC(Dublin Core)是为了帮助用户方便检索网络上的资源所提供的一套最小集合的描述性元素。DC由国际性合作项目“都柏林核心元数据首创计划”(Dublin Core Metadata Initiative,DCMI)进行研究设计,由参与合作项目的机构共同维护修改,第四节 数字档案元数据的互操作,二、DC元数据标准简介(一)DC元数据的特点DC元数据具有以下特点:(1) 操作简单。(2) 受控检索。(3) 扩展性。(4) 适应网络搜索工具。(5) 互操作性。(6) 国际化。(7) 采用XML与RDF(Resource Description F

42、ramework)编码规则,第四节 数字档案元数据的互操作,二、DC元数据标准简介(二) DCGovernment与EAD的比较与映射目前,DC元数据多用于欧洲国家的电子政务资源著录与数字档案管理,开放文档互操作协议OAI也以DC为基准。EAD是美国数字档案元数据的国家标准。近年来,随着档案元数据共享程度的加深,以DC标准著录的档案资源与以EAD标准著录的档案资源之间的互操作日益受到人们的重视,第四节 数字档案元数据的互操作,二、DC元数据标准简介(二) DCGovernment与EAD的比较与映射二者在互操作方面的困难具体如下:1、结构层次不同,使电子文件的归档和移交困难2、元素同名异义,互

43、操作困难3、元素的详细程度不一致,映射关系不均衡,导致二者的映射转换困难4、DC缺少元元数据,资源的真实性没有保障,第四节 数字档案元数据的互操作,三、档案元数据EAD与OAIPMH的转换实现(一) EAD的结构EAD针对档案资料的著录,包含不同的层级结构。EAD格式的记录由Eadheader(头标,必备项)、Frontmatter(前事项)及内容描述Archdesc(必备项)三个部分组成,第四节 数字档案元数据的互操作,三、档案元数据EAD与OAIPMH的转换实现(二) EAD与DC间的映射关系由于OAI协议支持的通用元数据是DC,所以EAD需要实现与DC的映射才可以在一定程度上解决互操作的

44、问题档案著录不仅要著录全宗,还要著录从属成分如案卷或文件,在EAD中从属成分的著录由archdesc中的dsc来实现,第四节 数字档案元数据的互操作,三、档案元数据EAD与OAIPMH的转换实现(三) EAD转换为DC的实现建立了DC与EAD之间的映射规则之后,接下来的问题就是在数据提供者模块中,通过元数据映射子模块将EAD记录充分地用DC表达出来。这个映射转换的核心部分可以由一个ASP文件来实现。然后由OAI接口调用这个子模块并通过XSL/DOM将其转换为XML格式,这是档案互操作的关键,也是服务提供者模块中OAI收割器得以完成收割任务的前提,第四节 数字档案元数据的互操作,四、基于OAIP

45、MH档案互操作存在的问题1、 OAI协议的标准元数据过于简单与EAD复杂结构之间的矛盾2、 会丢失原EAD记录中的上下文信息3、转换后的著录不够清晰,可能出现错误指示4、由于EAD选择的灵活性所造成的转换问题5、文档结构不一致的问题,第四节 数字档案元数据的互操作,五、解决问题的思路1、完善EAD与DC之间的映射,提高技术实现的质量正如UIUC所做的那样,需要通过不断实验,更加全面地了解存在的问题,设计出更加有效的映射和更为有效的技术实现。由于EAD与DC之间的完全映射存在较大的困难,因此需要从元素、语法、句法等方面来完善二者的映射。另外,转换后的OAI文件之间相互联系的指示与原EAD文件结构

46、的有效对应,对可选项OAI文件的有效表示,以及对转换后的文件数量及因链接而产生的文件规模的控制,都需要更有效的技术实现,以保证转换的存取效率,第四节 数字档案元数据的互操作,五、解决问题的思路2、利用XSL和DOM接口保持文档结构的一致性使用XSL和DOM接口,对原始XML数据做形式转换,用XSL解析器可以实现XML从单文档到单文档的映射,采用DOM接口可以完全地解析一个XML文档,对其中的元素任意操作3、可以考虑同时以DC、EAD作为OAI协议的标准元数据EAD是基于XML和HTTP协议的元数据格式,满足了OAIPMH对元数据标准编码语言格式(XML)的要求4、提高档案工作者的互操作意识除以

47、上措施外,档案工作者也必须增强互操作性意识。,本章小结,元数据是数字档案馆资源管理必不可少的工具。目前世界各国所应用的档案元数据体系渐趋成熟,其中以国际档案理事会的ISAD(G)等一系列相关标准以及美国的EAD标准应用最为普及。为了实现数字档案资源的共享,基于元数据级的互操作具有重要意义。UIUC数字档案馆项目取得的进展表明,目前基于DC元数据互操作的开放文档协议OAIPMH在数字档案馆资源共享过程中已经有一定的应用,但是在保持档案文件之间的历史联系以及节省元数据存储空间方面还存在着一定的困难,需要进一步的解决方案。,讨论题,1、什么是元数据?它的主要作用是什么?2、目前世界上主要的档案元数据标准有哪些?它们各自的特点是什么?3、电子文件元数据与档案元数据有什么关系?4、谈谈GILS与DCgovernment的不同特点。5、开放文档协议OAIPMH的工作原理是什么?第五章数字档案馆系统的分析与设计,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号