信息组织第三章.ppt

上传人:小飞机 文档编号:5230628 上传时间:2023-06-16 格式:PPT 页数:63 大小:1.24MB
返回 下载 相关 举报
信息组织第三章.ppt_第1页
第1页 / 共63页
信息组织第三章.ppt_第2页
第2页 / 共63页
信息组织第三章.ppt_第3页
第3页 / 共63页
信息组织第三章.ppt_第4页
第4页 / 共63页
信息组织第三章.ppt_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《信息组织第三章.ppt》由会员分享,可在线阅读,更多相关《信息组织第三章.ppt(63页珍藏版)》请在三一办公上搜索。

1、信息组织第三章 信息组织的技术标准,第一节,第二节,第三节,一、信息组织技术标准及意义 1、信息组织技术标准的含义:2、信息组织技术标准的意义:3、数字信息资源组织的现状:4、首要任务:,第一节 信息组织技术标准概述,1)标准:为在一定的范围内获得最佳秩序,对活动或其结果规定共同的和重复使用的规则、导则或特性的文件。该文件经过协商共同制定,并必须通过一个公认的机构批准2)标准化:在一定的范围内获得最佳秩序,对实际的或潜在的问题制定共同的和重复使用的规则活动的过程。包括制定、发布、实施标准的过程。3)标准化的实质和目的:实质是通过制定、发布和实施标准,达到统一;目的是获得最佳秩序和社会效益。4)

2、技术标准:对标准化领域中需要协调统一的技术事项所制定的标准。,5)信息组织技术标准的定义:协调统一信息组织中涉及技术的标准。传统的标准侧重情报文献的编辑、出版、收集、著录、标引、数据加工、检索、交换、和传播流通等领域的标准的制定、实施。从计算机信息技术和传统文献信息管理的角度,都有许多国际和国家范围内的技术标准。网络环境下,须将两者联合、创新、发展,使其协调。)无论何时其信息组织的技术标准都是围绕信息或数据进行的,目的在于为描述和标引其内容特征和形式特征提供规范和统一。,1)是信息组织工作的基础。信息组织在信息管理活动中,起着承上启下的作用。其中标准的统一直接影响到资源库的质量和效果。2)执行

3、有关标准才能保证信息组织的结果规范性和有效性。是信息资源共建共享的前提和根本保障,了解国际标准化组织情报文献工作标准化技术委员会(ISO/TC46),数字化信息资源的信息组织工作也要按照标准进行,并且是国际标准。当前数字信息资源组织的现状:元数据是网络信息的重要组成部分,但存在以下问题:1)没有统一的管理机构。2)各行业自定标准,导致标准太多。3)存在互不相容的标准。,面对数字信息资源的组织,要对元数据规范化、标准化,在众多标准中认定或制定一个国际通用的信息描述标准为好。如:DC数字档案馆建设过程中标准化的意义?,二、信息组织技术标准类型 1、按标准研究对象范围分:1)基础标准:术语、符号等。

4、2)产品标准:如镜像站点数据库标准。3)方法标准:建库时信息描述的标准。4)安全与环境保护类标准:与信息组织有关的标准是信息安全标准。2、传统文献信息工作的两个标准体系:1)ISO情报文献工作标准化委员会的技术委员会的体系。六类标准相互平行的体系2)我国情报文献工作技术标准体系。三个层次构成一个体系,3、国内外信息技术标准:计算机技术标准、电信技术标准、通讯技术标准等。计算机技术标准中有关于数据库的标准,如:中科院的“科学数据库核心元数据标准2.0版”、“科学数据库生态研究元数据标准1.1版”、“科学数据库大气数据元数据标准1.0版”、“科学数据库建库文档规范1.0版”与信息组织有关,但仅在全

5、国范围内的中科院各研究所为管理信息或数据建库时使用。,4、以信息环境划分:1)传统信息资源组织的标准:没有过时,没有被取代,已成为国际通用的成熟标准。如ISBD、AACR2、MARC等2)网络信息组织标准:也称为信息编码标准,如一些信息描述的元数据。ISBD,MARC3)信息编码:为编码对象(指事物或概念)赋予有一定规律性的、易于计算机和人识别与处理的一个或一组有序的符号。如:MARC、DC、置标语言等。4)信息编码的目的:设定编码对象的惟一标识以提高信息处理的效率,便于信息的交流,实现信息资源的共享,促进信息的利用。,回目录,第二节 传统信息组织的技术标准(包括著录标准和机读目录),一、著录

6、标准 1、国际标准书目著录(ISBD)标准:1)主要目的:使不同来源的数据交换成为可能;跨越语言障碍,帮助人们解释书目记录;使书目数据转化为电子格式更容易。2)组成:(54页的表)体系结构的特点:采取总则和分则相结合的方式;遵循客观描述的著录规则;明确规定了获取著录信息的来源;规定各个著录项目、著录单元项目的内容、次序以及著录用的标识符,2)方法:(56页的表、57页的解释)3)应用:(60页的举例)2、中国书目著录标准(卡片式)WORD文档),索书号 著录标目.正题名一般类型标识=并列题名:其他题名信息/第一责任说明;其他责任说明.版本说明/与版本有关的责任说明.文献特殊细节项.出版地:出版

7、者,出版年(印制地:印制者,印制年)登录号 文献数量及其单位:图及其他形态细节;尺寸+附件.(丛编正题名=丛编并列题名:丛编其他题名信息/丛书责任说明,丛编的国际标准书号;丛编号.附属丛编名)附注项 国际标准书号(附加说明):获得方式.书名.责任者.主题词.分类号,化工设备机械基础第一册,制图/化工设备机械基础编写组编2版,修订版北京:石油化学工业出版社,1978(西安:科学技术出版社,1988重印)182页;26cm+光盘北京:北京青苹果电子出版物公司,1988 ISBN7-114-11316-X:RMB48.00 化化,I207.41 苏小妹三难新郎/四川人民出版社编成都:编 S763 者

8、,1982 153页;19cm(农村文化艺术小文库;第六辑古代白话小说丛书/人民文学出版社编,ISSN8891-2001;4)140511 ISSN8891-2005:RMB16.00140512 苏四白话小说-古代-中国-丛书I207.4,补充中国文献编目规则(第二版)档案著录规则,二、机读目录:是以代码形式和特定格式结构记录在计算机存储载体上,能够被计算机识别并编辑输出书目信息的目录形式。1、起源:1)历经6年。2)世界普及。2、MARC格式及其特点:1)字段设置:字段:是由字段标识符标识的被定义的字符串,可包含一个或多个子字段。子字段:字段内被定义的数据单位。设置内容:书目记录所需描述的

9、、信息所有的内、外部特征。主要特点:字段数量多、字段内容详尽、字段作用强大。,2)标记符号:字段标识:用于识别各个字段的三位数字。从001999,第1位表示功能、第2位表示种类、第3位表示种类细分。子字段代码:由两个字符组成的代码,用以识别可变长字段中不同得子字段。第1位是$、第2位是字母或数字,如$a、$f、$1、$4。子段指示符:用以描述或指示可变长字段一些定义的的代码。子段和记录分隔符:一个字段或一个记录结束时的符号。,3)MARC总体结构的特点:记录格式既设置可变长子段又设置固定长字段。采用目次方式节省计算机进行数据值比较时间、提高处理速度。每条记录分4个区。物理记录和逻辑记录有交叉关

10、系,经常出现一字块存放多个记录,或一记录被分存于两个或两个以上字块中的现象。物理记录是字块(每个字块长度是4096个字节)、逻辑记录是实际描述后形成的信息记录。,可变格式可变长字段的记录格式;,采用目次方式;,每条MARC记录分3个区:它们是头标区、目次区和数据区;(数据区又由控制区和可变区构成),物理记录和逻辑记录的关系。,MARC总体结构特点,3、几种主要的MARC格式:1)UNIMARC格式:定义。作用。格式。(71页)2)CNMARC格式:解释:中国机读目录格式。用途:用于中国国内图书情报部门和其他国家书目机构间的书目信息交换。与UNIMARC的关系:依据UNI.制定,又结合中国书目实

11、际。设置:功能块、字段。(7475页)举例:(76页)其数据结构,CNMARC记录结构,不太清楚,参见WORD文档,记录头标区地址目次区 数 据 字 段 区记录分隔符0标识块1代码信息块2著录块3附注块4款目连接块5相关题名块6主题分析块7知识责任块8国际使用块9国内使用块205 2068 215 225 230 题 版 资 载 丛 计 名 本 料 体 编 算与 说 特 形 说 机责 明 殊 态 明 文任 字 细 说 字 件 说 段 节 明 段 特明 说 字 征字 明 段 字 段 字 段段$a$c$d$e 文献数量及 其 尺 附 单位子字段 他 寸 件 子 子 子 段 段 段,实例,CNMAR

12、C著录举例:(001)记录号:019922891 记录状态:n 记录类型:a 书目级别:m 层次等级代码:0 010(ISBN):$a7-5037-1101-9$b$dRMB 29.80(091)统一书号:(100)入档日期:19940927 出版日期类型:d 日期1:1978 日期2:1988 读者对象:em#政府出版物:y 修改记录:0 编目语种:chi 正题名文种:ea,101 著录语种:1#$achi(若译文$c)(106)文字资料的形态特征:r(110)内容特征:z 会议文献:0200 1#$a化工设备机械基础$h第一册$i制图$f化工设备机械基础编写组编205#$a2版$b修订版2

13、10#$a北京$b石油化学工业出版社$d1978$e西安$g科学技术出版社$h1988215#$a182页$d26cm$e光盘(300#$a附有光盘),606 0#$a化工设备$x设备机械 606 0#$a制图$x化工设备$x设备机械690#$aTQ05$v4版711 02$a化工设备机械基础编写组$4编801#0$aCN$bhbu$e19940927$m$n905#$aCN$b理科库$dTQ05$eH123$h183622891,三、置标语言:形象的讲,是一种用来给文本添加标记的计算机语言。置标:就数据本身的信息对数据进行编码的方法。对于信息组织来说,置标语言是记载信息特征的工具。(一)标准

14、通用置标语(SGML):1)定义:是一种通用的文档结构,主要用来定义文献模型的逻辑结构和物理结构。2)适用范围广泛,如书目、文献全文、电子文献、及多媒体信息。它使得信息的描述独立于系统、独立于语种、结构和内容分开,实现共建。但其本质不是用来描述信息的语言,而是一个标准,在此基础上再产生相关的标准。如xml,3)作用:定义文档模型的逻辑和物理结构。是适合各种信息进行描述的一种新的标准。使信息的描述独立于系统、语种,结构与内容分开以利信息共享。作为国际标准,为创建结构化、可交换的数据库提供了工具。可将来源不同的原始资料组装在同一个文件中。可利用文件格式定义文件结构、添加标记或验证电子文件是否遵循D

15、TD所定义的结构。,4)性质:是元语言,即:可派生出其他置标语言。由三部分构成:语法定义、文件类型定义、和文件实例。,(二)超文本置标语言:1.需了解的知识点(共七个)1)性质:是SGML派生的一个实例置标语言,它的DTD(即它的元素集)作为标准被固定了下来。2)定义:是用来制作超文本文档的简单标记语言。适用于编制静态网页。3)HTML文档:用HTML编写的超文本文档。,4)作用:自1990年以来HTML就一直被用作Web上的信息标识语言,用于描述主页的格式设计和它与Web上其他主页的连接信息。5)文档识别:带有.html或.htm扩展名。,6)生成HTML文档的途径:在计算机上直接用熟悉的编

16、辑工具编写。通过某些格式转换工具将文档转换成HTML格式文档。由Web服务器一方实施动态生成。7)工作方法:利用各种标记来标识文档的结构以及标识超链的信息。,2.HTML文档编写的有关问题:(1)HTML标记语法和文档结构:1)单标记:2)双标记:内容,如:TEXT TO EMPHASIZE 3)标记属性:,例,4)文档结构:头部信息 文档主体,(正文部分):(见讲义例),(2)新标记:1)TITLE BODY 表示一个主页文件的总题名,一般出现在标题中。2)注释。3)TEXT H1是第一层标题,共有六层标题(H1至H6)。随着层次增加,字体依次减小。4)是一个单标记,表示在正文段落的当前位置

17、换行。段落。,(3)其他功能的标记:1)物理意义上的标记(字体与颜色)粗体;斜体;定义长宽度字体。带有SIZE属性,属性值可取相对值,如:SIZE=“2”表示比当前字体大两号,SIZE=“-1”表示比当前字体小一号。也可取绝对值(默认值为3),如:SIZE=“4”,代表4号字体。上标字体。,2)逻辑意义上的标记:突出显示,但一般用斜体;重点突出显示;按地址类型显示;按代码类型显示;等等。(见讲义例),(4)超链接标记:需超链接的文本及图像,例:next page,触发超链既可连接。,(5)超链接中指向一个文件内某一特定位置的指针标记:超链文本及图像,例:Appendix A,在同一文件的其他处

18、创建一个超链来指向附录部分:,Appendix A,触发超链,将显示附录部分。用超链标记将附录连到其他文件也可。实际用:TEXT 6、图像、声音、视像和动画:1)图像标记:内嵌图像的单标记,表示为:(解释见85页)2)声音和图像:没有特殊标记,用超链标记链接带有声音文件、视像文件扩展名的目标文件即可。(解释见86页),作业:创建一个有超链接、有图像、并且有文字说明的个人主页。,(三)可扩展的置标语言(其目的是定义一种Internet交换信息的标准):1、XML、SGML与HTML:1)关系:XML与SGML:前者是后者的子集,但都是元语言。XML和HTML:XML有DTD、可做元语言,HTML

19、没有此功能。SGML 和HTML:后者是前者派生出来的实例语言。XML与HTML之间不是竞争关系而是互补关系。,2)开发XML是因HTML的有限性:无法描述数据内容,而这是数据查询必需的。不能描述矢量图形、科学符号等。不适应对新标记需求的发展。,XML的优势:1.可扩展方面(无限标记和属性)2.结构性方面(无限嵌套)3.可校验性方面,稍后再讲3)XML的功用:存储数据。形成结构化文档。存储矢量图形。描述多媒体演示。定义通道。描述软件包及其依赖的软件。在Web上的应用程序之间通信。发送电子商务卡。交换金融信息。创建、管理和使用复杂数字形式进行网络商业交易。,4)XML应用的新认识:网络环境下,异

20、构数据库与数据库之间的信息搜索、抽取和查找这种信息集成,其可用性要求灵活的体系结构,包括开放性、可伸缩性和重用性等特点。新的应用需要统一数据访问,从异构系统中抽取信息,而这些系统都有自己特定的数据格式,因此,需要有一种技术来统一不同格式的数据,XML 作为统一不同格式数据的技术,已被广泛应用于内容管理、应用集成、电子商务等领域,称为信息化的核心技术。,(四)有关XML的应用 1、正确的XML文档结构(其他内容请大家见复印资料教材),2、通过文档类型声明创建有效XML文档:1)文档类型声明的格式:,例:,2)DTD中的元素定义语法:,例:是元素书籍的根元素定义语法。是名称,作者,价格多个元素的根

21、元素定义语法,在XML文件中被限定了出现的顺序,并只能出现一次。,可以包含任意被设定过的元素,出现的次数和顺序也不受限制。例 这个设定说明“书籍”标记在XML中可以不出现或出现多次,“报纸”标记必须出现一次以上,“杂志”标记可以不出现或只出现一次,而“网站”标记必须出现而且只能出现一次。此规定见下表:,符号 代表标记出现的次数?不出现或只出现一次*不出现或可出现多次+必须出现一次以上 无符号 只能出现一次,,可选择的子元素用“|”分隔,在XML文件中选择一个输写成:张三 或,空元素。,3)DTD中的实体定义语法:,例:其在XML中的作用与C语言中的#DEFINE预处理命令有相似之处。,4)DT

22、D中的属性定义语法:例:该属性设定是为“姓名”元素设定一个名为“号码”的属性,属性值类别是ID,意味着在XML文件中为此属性赋值的时候,值在此XML文件中是唯一的。,如果在同一XML文件中出现下面的XML 语句:张三 李四 号码属性值重复了,与文档类型定义不一致,是错误的。(属性的种类和属性值见教学Word文档的文件),(四)XML文档显示的方法XSL:(见Word 文档),四、沃里克框架(WF)统一的数据描述格式是广泛分布的信息资源数据库充分交互性以及可扩展性的基础,并向其他高层协议中间件提供了标准的数据访问接口。从WF开始,就允许在统一的数据描述格式之下包容各种不同的具体数据表现形式。从DAR(分布式主动关系模式)后,又出现了基于CORBA(通用目标查询浏览器构建)的数字对象中间件产品FEDORA(灵活可扩展数字对象和存储体系结构)。随着人们对数据理解的不断深入,具有统一数据描述接口中间件系统的出现是信息组织发展的必然结果。,回目录,第三节 网络协议 是有关数据库建好后如何链接到互联网上的网络协议知识。因有计算机网络课程,所以本课不赘述。,回目录,总结,网络协议,信息组织的技术标准,信息组织技术标准概述,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号