五章信息组织.ppt

上传人:小飞机 文档编号:1303227 上传时间:2022-11-06 格式:PPT 页数:81 大小:344.21KB
返回 下载 相关 举报
五章信息组织.ppt_第1页
第1页 / 共81页
五章信息组织.ppt_第2页
第2页 / 共81页
五章信息组织.ppt_第3页
第3页 / 共81页
五章信息组织.ppt_第4页
第4页 / 共81页
五章信息组织.ppt_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《五章信息组织.ppt》由会员分享,可在线阅读,更多相关《五章信息组织.ppt(81页珍藏版)》请在三一办公上搜索。

1、五章信息组织,五章信息组织,一、教学目的,理解信息组织的基本原则与理论基础,掌握信息组织的基本内容,掌握著录、标引等基本概念,了解通用标记语言,掌握文献信息的分类组织法和主题组织法,掌握网络信息的主要组织方式。,一、教学目的理解信息组织的基本原则与理论基础,掌握信息组织的,二、教学内容,1信息组织的基本原理和理论基础2信息的描述与揭示3信息组织的技术和方法4信息组织的发展方向知识组织,二、教学内容1信息组织的基本原理和理论基础,三、本章重点,1信息组织的内容2信息组织的理论基础3元数据4分类组织法、主题组织法5网络信息的组织方式,三、本章重点1信息组织的内容,5.1信息组织的基本原理,5.1.

2、1信息组织的概念与内容 信息组织,亦称信息整序,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。,5.1信息组织的基本原理5.1.1信息组织的概念与内容,信息特征,信息的外部特征信息的外部特征是指信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征,信息载体的物理形态题名、作者、出版或发表日期流通或传播的标记等方面的特征;信息的内容特征信息的内容特征就是信息包含的内容,它可以由关键词、主题词或者其他知识单元表达。信息组织的基本对象就是信息的外部特征和内容特征。,信息特征信息的外部特征,信息组织的

3、基本内容,(1)信息选择信息选择的目的就是从采集到的、处于无序状态的信息流中甄别出有用的信息,剔除无用的信息。(2)信息分析按照一定的逻辑关系从语义、语用和语法上对选择过的信息内、外表特征进行细化、挖掘、加工整理并归类的信息活动。,信息组织的基本内容(1)信息选择,(3)信息描述与揭示指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。著录,主要描述文献信息的形式特征;标引,主要揭示文献信息的内容特征。(4)信息存储经过加工整理序化后的信息按照一定的格式与顺序存储在特定的载体,(3)信息描述与揭示,5.1.2 信息组织的类型与特征,1.按信息表现形

4、式划分文字信息组织 图像信息组织 声音信息组织 视频信息组织,5.1.2 信息组织的类型与特征 1.按信息表现形式划分,2.按信息加工的程度划分,一次信息组织一般指公开出版的图书、期刊论文、研究报告、会议文献、学位论文、专利说明书、网上未经过再加工的电子化信息等二次信息组织目录、题录、简介、文摘、索引、书目数据库等。三次信息组织综述、述评、学科年度总结、进度报告、文献指南、期刊书目、百科全书、年鉴等。,2.按信息加工的程度划分一次信息组织,3.按信息传播载体对信息组织的划分,文献信息源各种类型的文献,其特点是传播信息完整系统,便于积累,便于保管,便于利用。非文献信息源通常指非记录性信息,这里特

5、指在网络环境下没有以传统文献载体形式出现的信息源,程序执行代码、单机或局域网或互联网上的网页,超文本、超媒体、数字图书馆、虚拟图书馆等等。这类信息源统称为网络信息源,将对这类信息的组织称为网络信息组织。,3.按信息传播载体对信息组织的划分,网络信息资源的特点类型众多。信息发布自由,信息来源广泛,内容庞杂,质量不一。 信息数量急剧上涨,信息资源分布极不均衡,信息处理与利用能力相对下降。 网络信息资源具有多媒体和超级链接性以及交互性。 网络信息资源存在安全隐患。有知识产权保护问题,也有网络信息资源本身的安全问题。 网络信息的使用与提供信息站点的软硬件和服务有关。 ,网络信息资源的特点,4.信息组织

6、的特性,信息组织的渗透性。信息组织的渗透性指信息组织存在于各种信息揭示、存贮和检索活动之中。信息组织的依附性。信息组织的依附性指信息组织无法独立存在,它要以信息的识别、揭示等活动为前提。信息组织的增效性。信息组织的增效性是指信息组织可以增加信息传播、检索、利用的效率。,4.信息组织的特性信息组织的渗透性。,5.1.3信息组织的原则,1.客观性原则客观性原则确定信息描述和揭示的数据来源必须是客观存在的信息本身,信息组织过程中也不能改变信息本身。 2.系统性原则必须把握四个关系:宏观信息组织和微观信息组织的关系。信息组织部门与其他部门的关系。信息组织工作各个环节之间的关系 。不同信息处理方法之间的

7、关系。,5.1.3信息组织的原则 1.客观性原则,3.目的性原则 必须围绕用户的信息需求开展工作,注意信息机构的目标市场的需求状态及其变化特征,满足成本收益对称的原则。 4.现代化原则 信息组织现代化原则包括思想观念现代化和技术手段现代化两个方面。信息组织的思想观念现代化集中体现在信息组织的标准化上。,3.目的性原则,信息组织标准化,信息组织的标准化主要体现在信息组织工作的统一性、信息组织方法的规范性、信息组织系统的兼容性和信息组织成果的通用性方面。主要包括:基本术语标准;有关信息技术标准;信息组织技术标准;其他相关标准。,信息组织标准化信息组织的标准化主要体现在信息组织工作的统一性,5.1.

8、4信息组织的理论基础,信息组织最基础的理论是语言学、逻辑学和知识分类。语言是人类最重要的交流符号系统,是信息的载体,包括语词、词汇和语法。 逻辑学是关于思维规律的科学。进行信息组织工作必然用到形式逻辑的一些方法。 知识分类是一门研究知识体系结构的学问。信息组织活动必须建立在人们对知识体系认识的基础之上。 系统论、耗散结构理论、协同学理论和自组织理论等也被广泛地应用于信息组织。,5.1.4信息组织的理论基础 信息组织最基础的理论是语言学,5.2信息的描述与揭示,5.2.1元数据 元数据(metadata)是关于数据的数据(data about data),关于信息的信息(information

9、about information),或描述数据的数据(data that describes data)。元数据的类型包括:元素名称(Element names)元素描述(Element description)元素表示(Element representation)元素代码(Element coding)元素语义(Element semantics)元素分类(Element classification)。,5.2信息的描述与揭示5.2.1元数据,元数据的作用,识别确认并对要进行组织的信息资源进行个别化描述,使用户能识别被组织的资源对象。定位提供信息资源位置的信息,以便用户访问时使用。检索

10、传统检索系统一般需要确定检索点,组织相应的检索工具,提供各种基本的检索途径:在电子检索系统中,一般利用各种特征进行检索。选择通过记录信息资源的特征,供用户对信息资源的使用价值进行判断,决定是否使用该资源。,元数据的作用识别,5.2.2信息著录与标引,1. 著录著录的基本概念著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程著录的结果是款目,它是反映文献内容和形式特征的著录项目的组合。 标目是从文献内容和形式的某一特征指引排检线索的著录项目。,5.2.2信息著录与标引 1. 著录,著录的标准化文献著录标准化是指在国家或国际范围内,对文献著录的原则、内容、格式等作出具有一定约

11、束力的规范。 1971年,国际图书馆协会联合会(IFLA)编目委员会,单行著作国际标准书目著录(ISBD (M) 。1976年,国际标准书目著录总则(ISBD-(G)1978年,AACR2。,著录的标准化,我国的著录标准化,文献著录总则(GB37921-83)(1983,7月) 普通图书著录规则 连续出版物著录规则 非书资料著录规则 地图资料著录规则 档案著录规则 古籍著录规则 检索期刊条目著录规则 文后参考文献著录规则,我国的著录标准化 文献著录总则(GB37921,2.标引标引的基本概念 信息标引(文献标引):分析文献的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从

12、而赋予文献检索标识的过程。 标引语言是表达文献主题概念和检索需求主题概念的简明性、单义性和关联性的概念标识系统,是根据标引和检索需要而编制的人工语言。 文献标引过程一般包括两个环节: 主题分析 转换标识,2.标引,标引的类型,依据构成原理可将标引语言分为分类语言、主题语言、代码语言。 分类语言可细分为体系分类语言、组配分类语言、体系组配分类语言。 主题语言可进一步划分为标题语言、单元词语言、叙词语言、关键词语言。,标引的类型 依据构成原理可将标引语言分为分类语言,依标识组合时间的分类,先组式语言先组式语言是指标识在编表时(标引前)就已组合好,标引和检索时不必或较少进行组配的标引语言。 后组式语

13、言后组式语言是指标识主要供组配使用,而且标引时不将标识组配在一起,到检索时才将标识组配起来的标引语言。散组式语言散组式语言是指标识主要供组配使用,而且标引时就要将表达主题概念的若干个标识组配在一起的标引语言。,依标识组合时间的分类先组式语言,标引的种类,标引的种类最主要的是分类标引和主题标引。分类标引是指对文献进行主题分析,用分类语言表达分析出的主题,赋予文献分类检索标识(分类号)的过程。文献分类是指根据文献内容及其他相关属性,以分类语言(分类法)为工具,分门别类地系统揭示和组织文献的过程和方法。主题标引是指对文献进行主题分析,用主题语言(主题法)表达分析出的主题,赋予文献主题检索标识(标题词

14、、叙词等)的过程。,标引的种类 标引的种类最主要的是分类标引和主题标引。,5.2.3网络信息资源描述的相关标准,文本编码倡议(Text Encoded Initiative,简称TEI) 都柏林核心集(Dublin Core,简称DC) 政府信息定位服务(Government Information Locator Service,简称GILS) 联合地理数据委员会的数字地球空间元数据(Content Standard Digital Geospatial Metadata,简称CSDGM) 可视资源核心范畴(Core Categories for Visual Resources,简称CCV

15、R) 编码档案描述(Encoded Archival Description,简称EDA) 博物馆信息的计算机交换(Computer Interchange of Museum Information,简称CIMI),5.2.3网络信息资源描述的相关标准 文本编码倡,其他标准,MARC(美国的USMARC、国际标准UNIMARC、中国的CNMARC、日本的JMARC、英国的UKMARC、加拿大的CANMARC、东南亚的SEAMARC)都柏林核心数据(Dublin Core)VRA核心类目(VRA Core Category)艺术作品著录类目(Categories for the Descrip

16、tion of Works of Arts) CDWAREACH著录单元集合(REACH element set)PICS、Web Collections、CDF、MCF、RDF等。,其他标准MARC(美国的USMARC、国际标准UNIMAR,MARC标准,MARC(MAchine Readable Catalogue)机器可读目录起源于美国国会图书馆于1965年1月提出的“标准机器可读目录记录款式的建议”(即MARC)。1967年MARC格式问世。MARC格式的主要特点:共包括001999个字段,其中999字段为用户自定义的字段;字段内容著录详尽,字段下又设子字段以及重复字段;字段作用强化,

17、可检索的字段多;每条MARC记录可分为头标区、目次区、数据区。,MARC标准 MARC(MAchine Rea,USMARC(美国国会图书馆机读目录通信格式),USMARC的前身为MARC 格式,它完全与ISO-2709规定一致,只在其字段标识和内容项目上不同。 每条USNARC记录由头标区、目录区、数据区三部分组成。USMARC格式的主要字段有:目录控制区、主要款目(如个人作者、团体机关、会议或者集会、通用书名标目)、书名出版项、稽核项、丛书项、附注项、主题附加款目、其他附加款目(如个人姓名附加款目)、丛书附加等。,USMARC(美国国会图书馆机读目录通信格式),USMARC的改进,“电子资

18、源地址与存取”字段(856字段)主要记录被著录的数字对象或与之相关的其他电子资源的存储地址和存取方式,为可重复字段,包含27个子字段。增加部分“本馆用”字段以弥补不足。题名字段(245字段)、电子资源地址与存取字段(856字段)为必备字段。尽可能使用责任者字段(1)、主题字段(6)、注释字段(5)。 ,USMARC的改进“电子资源地址与存取”字段(856字段),UNIMARC(国际机读目录通信格式),该标准是IFLA于1976年在USMARC基础上主持制订的。UNIMARC主要特点:UNIMARC将内容标识符标准化,克服以往各国使用本国MARC系统中标识符的专指性。编排字段不是按卡片目录的著录

19、顺序,而是按字段的内在联系组织数据,并把相同性质的字段编排在一起,组成字段的功能块。重视书目文献库中相关文献之间的关系如平行关系、层次关系、从属关系。,UNIMARC(国际机读目录通信格式) 该,CNMARC(中国机读目录格式),CNMARC是我国国家书目机构依据UNIMARC制订的中国机读目录格式(China MARC Format),作为中华人民共和国文化行业标准WHT050396推出,它与ISO2709的规定相一致,以UNIMARC为依据,并补充了中国出版物特有的字段定义。 它增加了以下字段和子字段:091统一书刊号;092订购号;093专利号;094标准号;690中国图书馆分类法;69

20、2中国科学院图书分类法;905馆藏信息。,CNMARC(中国机读目录格式) CNMARC,一条CNMARC记录的记录头标由24个字符构成地址目次区由三位数字表示的字段号、四位数字表示的字段长度和五位数字表示的字段起始字符位置构成。数据字段的长度可变,每个字段之间由字段分隔符隔开。数据字段的结构根据字段号的不同有不同的结构。,一条CNMARC记录的记录头标由24个字符构成,记录结构和地址目次区的结构,记录结构和地址目次区的结构,2. Dublin Core(都柏林核心集),都柏林核心集(Dublin Core Element Set,简称为Dublin Core) 是描述网络信息资源的一种简单元

21、数据,是文献链接的客体,它包括15个数据单元。 Dublin Core的主要优点有:简单易懂:15个标记元素通俗易懂。运用灵活:它既可以用于规范的资源描述领域,也可以用于非专业领域。国际通用:已有德语、日语、葡语、西语等10余种不同语种的版本。可扩展性:不仅15个标记元素和子元素可扩展,Dublin Core还可以与其他元数据元素连接使用。,2. Dublin Core(都柏林核心集),都柏林核心元数据探索项目及设置的限定词 (Dublin Core Metadata Initiative,简称DCMI),都柏林核心元数据探索项目及设置的限定词 (Dublin,序号描述项目限定编码规则6与其他

22、资源的关系版本、代替关系、需,序号描述项目限定编码规则11权限管理12日期创建、有效、可获,3. VRA核心类目格式,VRA (VRA Core Categories for Visual Resources)” 格式的著录类目可以分为两类:视觉文献所记载的原始作品著录的类目为三维作品19个数据单元;记载某一种作品实体的视觉文献特征的视觉文献著录类目9个数据单元:视觉文献类型、视觉文献格式、视觉文献尺寸、视觉文献出版日期、视觉文献收藏者、视觉文献收藏号码、视觉文献视点描述、视觉文献主题、视觉文献来源。,3. VRA核心类目格式 VRA (VRA Core,4.其他的元数据规范,PICS PIC

23、S (The Platform for Internet “Content Selection”) , W3C(WWW Consortium)于1995年组织开发的一种元数据标准。引入内容分类定级机制.对Internet上的资源进行分类定级。,4.其他的元数据规范 PICS,Web Collections Web Collections是较早利用XML应用环境建立起来的一个元数据框架。它采用了与HTML语言相似的样式风格,其数据可以紧紧地嵌入到HTML文档中,便于用户使用,它还引入了一种表示元数据的层次结构的方法,可用于Web页面、Web Map、Email、内容标引、分布式创作等多种应用场合

24、。,Web Collections,CDF CDF频道定义格式(Channel Definition Format),是Microsoft提出的一种元数据规范。CDF借助于HTML语法来对其频道内容进行描述,当浏览者接入到该频道后,这些元数据就会展现出来。,CDF,MCF MCF元数据框架(Meta Content Framework),是1997年Netscape公司向W3C提交的一种元数据方案。MCF力求实现一种“单一的数据模式和相应的互换格式”的元数据框架。其兼容性和包容性好,并允许动态地扩展新的数据类型。,MCF,RDF RDF资源描述框架(Resource Description F

25、ramework),是为解决现存的各种元数据之间的互操作性,由W3C主导、结合多个元数据团体(如Dublin Core等)发展而成的一个框架体系。RDF是一个能对结构化的元数据进行编码、交换、再利用的体系框架,它为元数据提供了一个可操作的载体,提供了在各种不同的元数据体系之间的互操作性。 ,RDF,5.2.4通用标记语言及相关标准,通用标记语言(Generalized Markup Language,简称GML)来描述文件及其格式SGML(Standard Generalized Markup Language)标准。SGML ISO8879:1986。HTML(Hyper Text Mark

26、up Lanaguage)XML(eXtensible Markup Language),5.2.4通用标记语言及相关标准 通用标记语言,1.通用置标语言标准SGML,SGML是一种元语言,是用来描述置标语言的语言,其核心是文档类型定义DTD。DTD文档规定文档可能出现的置标及其组合规则。超媒体文档标记方面的超媒体语言HyTime (HypermediaTimebased Document Structuring Language)、文献样式语义和规范说明语言DSSSL(Document Style Semantic and Specification Language)、可扩展的样式语言XS

27、L(eXtensible Style Language)、可扩展的链接语言XLL(eXtensible Linking Language),1.通用置标语言标准SGML SGML是一种元语言,是,2. 超文本置标语言HTML,HTML是经过简化的SGML的DTD的具体应用实现。HTML提供了一种文本结构和格式,使其能够在浏览器上呈现给访问它的用户。它在文件中加入标鉴,使其可以显示各种各样的字体HTML的缺点:扩展性差。交互性差。语义性差,2. 超文本置标语言HTML HTML是经过简化的SGML,HTML为网络信息的出版和发布提供以下功能:出版在线的文档,其中包含了标题、文本、表格、列表以及照

28、片等内容;通过超链接检索在线的信息;为获取远程服务而设计表单,可用于检索信息、定购产品等;在文档中直接包含电子表格、视频剪辑、声音剪辑以及其他的一些应用。,HTML为网络信息的出版和发布提供以下功能:,3.可扩展的置标语言XML,XML以一种开放的自我描述方式定义数据结构。 XML文档DTD文档类型定义可扩展样式表语言XSLXML路径语言XpathXML指针语言XpointerXML链接语言 Xlink、XHTML、SchemaXML规范ebXML、Biztalk、eCo,ECML。MathMLSMIL。,3.可扩展的置标语言XML XML以一种开放的自我描述方式定,XML具有以下特点:XML

29、文档是纯文本,可用从文本编辑器直到可视化开发环境的任何工具创建和编辑,这使得程序可以更简单。基于内容的数据标识。可格式化。有了XLS以后,数据和显示是分离的,可以为同一数据指定不同的样式表用于不同输出。具有很强的链接能力,可以定义双向链接、多目标链接、扩展链接和两个文档间的链接。易于处理。XML对格式的定义更为严格,并具有层次结构,处理起来更加容易。,XML具有以下特点:,4. MACR DTD,MACR DTD(机器可读的编入目录资料类型定义,MAchine Readable Cataloging Document Type Definition)参考标准的通用标志语言(SGML)执行。 M

30、ARC DTD识别机器可读的目录记录只需一个MARC记录就可以定义所有的元素,而以前要五种MARC格式定义一系列数据元素。,4. MACR DTD MACR DTD(机器,5. MARC XML,MARC XML工具和实体有:MARC21和MARC XML的相互转换JAMES是用来读写MARC21记录的一种Java API,XML Printer类用JAMES API来读取MARC21记录,编写MARC XML记录。MARC XML相互转换格式表单(MARC XML Conversion Stylesheets)MODS结构相互转换Dublin Core相互转换OAIMARC相互转换MARC

31、DTD相互转换MARC XML HTML格式表单Stylesheets,5. MARC XML MARC XML工具和实体有:,MARC XML 的体系结构,MARC21(0729) Records,MARC21 (XML) Records),标签转换,DublinCore记录,字符集转换,MODS记录,其它XML格式,以HTML的形式输出,检查MARC有效性,MARC XML 的体系结构MARC21,对体系结构的说明,MARC数据可在MARC21(2709)和MARC 21(XML)结构之间进行相互转换,该转换是无损的。MARC XML公共汽车(Bus):MARC XML框架的核心是简单、灵

32、活的MARC XML模式(schema)。MARC XML用户(Consumers):MARC XML记录可以用于本地MARC XML格式。,对体系结构的说明MARC数据可在MARC21(2709)和M,MARC XML记录的用户也倾向于将其分为三类:转换(transformation)、描述(presentation)和分析(analysis)。转换是指MARC XML和其他元数据格式之间的转换。描述是指将MARC数据表示和(或)标引为其他可读形式分析是指对MARC数据进行处理,提出可行性的分析结果。,MARC XML记录的用户也倾向于将其分为三类,MARC XML的用途及特点,用途:在XM

33、L中描述完整的MARC记录(for representing a complete MARC record in XML);作为元数据压缩和转换标准的一种可扩展模式(Metadata Encoding and Transmission Standard,简称METS) 描述OAI采集而得的元数据;描述在XML语法中的原始资源;描述与电子资源一起被封装的XML。,MARC XML的用途及特点用途:,优点:该模式支持所有的以MARC压缩的数据而不管其格式如何;MARC XML框架是有确定的组成部分而可扩展的体系结构,它允许用户插入和播放不同的软件单元来构建用户解决方案。 局限性:MARC的有效性受

34、外部软件的影响。,优点:,多记录的MARC XML应用实例,-00834nw 2200193n 4500CF 9100008DLC19960528091722.0910215acaaaaaa-+,多记录的MARC XML应用实例 ?xml versio,5.3信息组织的技术与方法,5.3.1文献型信息组织方法 按照文献的外部特征来组织信息引用法索引法目录法用按文献的内容特征来组织信息分类法主题法文摘法,5.3信息组织的技术与方法 5.3.1文献型信息组织方法,1.分类组织法,文献分类 根据文献所反映的内容性质、形式体裁和用户用途,分门别类地系统组织文献的一种方法。 文献分类由上而下,由大到小,

35、由整体到部分,由一般到特殊,由总论到专论的划分过程。文献归类由下而上,由小到大,由部分到整体,由特殊到一般,由专论到总论的集合过程。,1.分类组织法 文献分类,分类组织法的特点,分类组织法的特点在于:体现学科的系统性,反映事物的从属派生关系,便于按学科体系进行族性检索;按分类号组织分类目录,简单方便。其缺陷在于:以人工语言(数码、字母代号)作为标志符号,不直观,较难记忆;分类体系固定,增补新类目不及时;组配方式机械,较难满足多元检索的要求,分类组织法的特点分类组织法的特点在于:,文献分类表的构成,编制说明包括分类表的编制经过、所依据的编制原则、部类及大类的设置和次序的理由、对各种分类问题的处理

36、办法、标记方法、使用方法等。大纲基本大类的一览表,给用户最基本的概念。简表一个基本类目表。这是分类表的骨架,通过简表就可迅速了解其概貌。小型分类表没有简表。,文献分类表的构成 编制说明,详表(主表)分类表的正文详表,由类目、类号和注释组成辅助表(复分表)标准子目表,对主表中列举的类目进行细分。索引按标题字顺方式利用分类表的一种工具。 附录文献资料分类标引中经常要查阅的参考资料。,详表(主表),2.主题组织法,主题法也称词汇控制组织法,是以语言为基础,用表达概念的词或词组来揭示文献内容的一种方法。标题法。 单元词法。关键词法。叙词法。,2.主题组织法 主题法,标题法,标题法的基本原理按主题(事物

37、)集中文献;用经过规范化的语词直接标引文献主题;用字顺序列直接提供主题检索途径。标题法类型单级标题带说明语的单级标题多极标题(主标题和副标题)倒置标题,标题法 标题法的基本原理,单元词法,单元词法的构成原理一种组配原理,即各种完整的复杂的概念都可以分解成更为一般的单元的概念,或者相反,即任何复杂的概念都可由单元词的组合而成。,单元词法 单元词法的构成原理,关键词法,关键词法 关键词指从文献的题目、正文或摘要中抽出的能表征文献主题内容的具有实质意义的语词。题外关键词索引(KWOC Index):使每个关键词轮流排在作为检索词的固定位置, 题内关键词索引(KWIC Index):也称上下文关键词索

38、引,关键词与非关键词组成一条短语,轮流地将每个关键词抽出,置于前端单纯关键词索引:表征一篇文献主题内容的关键词全部抽出,组成一个复合标识,然后将其中的每一个关键词轮流移到前端作为检索词。,关键词法 关键词法,叙词法,叙词一些以概念为基础的、经过规范化的、具有组配性能、显示词间语义关系和动态性的词和词组。叙词字顺索引的参照系统叙词范畴分类系统叙词等级系统叙词的词族,叙词法 叙词,3.引用组织法,根据有关引证作者姓名并利用来源索引,查清引文篇名的方法。科学引文索引有五种索引及“期刊引用报告”(JCR)。“引证索引”(Citation Index)“来源索引”(Source Index)“专利索引”

39、(Patent Index)“篇名主题词轮排索引”(Permutem Subject Index)团体作者索引”(Corporate Index),3.引用组织法 根据有关引证作者姓名并利用来源索引,查清引,4.文献型信息的宏观组织,把文献信息看作一个特定的整体,从大量的统计资料分析综合,来寻求文献信息的概率分布和利用规律,科学地组织信息的方法就是信息宏观组织方法 。,4.文献型信息的宏观组织 把文献信息看作一个特定,5.3.2网络信息组织技术与方法,网络信息组织的特点: 信息组织的对象从各种类型的数据发展到更加丰富多彩的信息、信息链,甚至知识; 信息组织的范围从文献内外部特征深入到信息单元、

40、知识单元; 信息组织的结果从静态的文本格式发展到动态的多模式的链接; 信息组织的形式从数据结构发展到知识表示,即要求信息组织的透明化、易用性; 信息组织的技术从手工单一发展到半自动化、自动化、智能化,即要求信息组织的标准化、兼容化。,5.3.2网络信息组织技术与方法 网络信息组织的特点:,四种较为广泛的网络信息资源组织方式,1.文件方式 文件方式常作为网络信息资源管理的辅助形式,作为其他信息组织方式的补充。FTP以文件目录的形式来组织信息资源。2.数据库方式将所有已获得的网络信息资源以固定的记录格式存储,用户通过关键词及其主配查询,就可以找到所需要的信息线索,并通过信息线索直接连接到相应的网络

41、信息资源。,四种较为广泛的网络信息资源组织方式1.文件方式,数据库组织方式原理图,服务器,结构化查询,检索结果,输入检索式,数据库,检索结果,启动相应的应用程序,包括相应的ISAPI、CGI、ASP等应用程序,浏览,执行SQL查询,数据库组织方式原理图客户端服务器结构化查询检索结果输入检索式,3.主题树方式信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直至找到所需要的信息线索,并通过信息线索直接找到相应的网络信息资源。Gopher、Yahoo!、InfoSeek 4.超媒体方式 用超媒体方式来组织网络信息资源,就是将网上所能获得的各种

42、媒体的相关信息资源利用超文本技术有机地编织在一起。,3.主题树方式,5.4信息组织的发展方向知识组织,5.4.1知识组织的含义及特征 1.知识组织的历史1929年英国著名的分类法专家H.E.布利斯使用“知识组织” 概念;1989年,在德国法兰克福成立了国际性学术机构“国际知识组织学会”(ISKO);1996年,ISKO华盛顿年会决定将ISKO秘书处移至哥本哈根皇家图书馆学院。1993年1月1日起,历史悠久、影响广泛的国际性学术刊物国际分类法(IC)更名为知识组织(KO),由ISKO主办。我国图书情报学界1985年由刘迅首次将“知识的组织”作为图书馆学情报学研究的一个内容提出。,5.4信息组织的

43、发展方向知识组织 5.4.1知识组织的含,2.知识组织的定义,王知津等认为有广义和狭义之分。狭义的知识组织是指文献的分类、标引、编目、文摘、索引等一系列整序。蒋永福认为“知识组织是指为促进或实现主观知识客观化和客观知识主观化而对知识客体所进行的诸如整理、加工、引导、揭示、控制等一系列组织化过程及其方法。” 布鲁克斯所指的知识组织是 “知识地图”的绘制。 S.塞恩 认为知识组织是“找出知识生产和创造过程的关键数据(知识单元),然后用图来标示其联系与结构,实现知识的有序化”。,2.知识组织的定义 王知津等认为有广义和狭义之分。狭义的知识,5.4.2知识表示,知识表示是指把知识客体中的知识因子和知识

44、关联表示出来。1.主观知识的表示 逻辑(Logic)表示法 产生式规则(Production Rules)表示法 语义网络(Semantic Network)表示法 框架(Frame)表示法 面向对象的知识表示,5.4.2知识表示 知识表示是指把知识,2.客观知识的表示分类标引法分类标引法是语法组织和语义组织的综合,基本上属于族性组织体例。主题标引法。主题标引法是以语法组织为主、语义组织为辅的综合组织,基本上属于特性组织体例。,2.客观知识的表示,5.4.3知识组织技术与方法,1.分类法和主题法是客观知识组织的基本工具 2.数据仓库和知识挖掘是主观知识组织的基本工具 联机分析处理(OLAP)知识发现(KDD) 数据挖掘(DM)。,5.4.3知识组织技术与方法1.分类法和主题法是客观知识组织,感谢聆听,感谢聆听,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号