第二章 信息检索的理论与基本方法课件.ppt

上传人:牧羊曲112 文档编号:1588729 上传时间:2022-12-09 格式:PPT 页数:150 大小:1.07MB
返回 下载 相关 举报
第二章 信息检索的理论与基本方法课件.ppt_第1页
第1页 / 共150页
第二章 信息检索的理论与基本方法课件.ppt_第2页
第2页 / 共150页
第二章 信息检索的理论与基本方法课件.ppt_第3页
第3页 / 共150页
第二章 信息检索的理论与基本方法课件.ppt_第4页
第4页 / 共150页
第二章 信息检索的理论与基本方法课件.ppt_第5页
第5页 / 共150页
点击查看更多>>
资源描述

《第二章 信息检索的理论与基本方法课件.ppt》由会员分享,可在线阅读,更多相关《第二章 信息检索的理论与基本方法课件.ppt(150页珍藏版)》请在三一办公上搜索。

1、第二章 信息检索的理论与基本方法,第一节 信息检索语言与检索途径,一、定义信息检索语言(retrieval language)又称为情报语言、情报存储和检索语言、信息组织语言,是用来描述文献特征,表达主题提问的一种专门的人工语言,是由给定领域中的一切可用来描述信息内容和信息需求的词汇或符号,及其使用规则构成的供标引和检索的工具。是沟通信息存储与检索两个过程,标引人员与检索人员的桥梁。 信息检索语言是检索系统的语言基础,主要作用是:表达描述信息内容和信息需求;用于信息的组织和整序;用于对检索系统中索引标识或提问标识的规范和控制。,不同的检索系统由于所覆盖的学科领域不同,包含信息资源类型不同,通常

2、采用不同的信息检索语言;同一个检索系统往往也同时采用多种检索语言,以形成多种检索途径和角度。,二、分类,1、根据结构原理划分 (1)分类语言 (2)主题语言 (3)分类主题一体化语言 (4)代码语言 (5)引文语言,(1)分类语言:用分类号和类名来表达信息的内容主题概念,并按知识门类的逻辑次序将信息资源系统地加以划分和组织的语言。其意义在于根据文献信息的内容特征和分类表,把相同内容的文献、信息集中在一起,同时又把不同内容的文献信息区别开来 ,以实现相关集中的功能。 分类语言的主要特点:按学科、专业集中相关文献信息,从知识分类的角度揭示文献信息之间的区别和联系,提供从学科专业领域检索文献信息的途

3、径。,分类语言主要可分为等级体系型分类语言和分面组配型分类语言两种。等级体系型分类语言:是一种最传统的分类语言,是一个直接体现知识分类和概念逻辑的标识系统。所有类目按照学科专业的等级、层次划分,一一列举,构成一个由总体到个体,由一般到特殊,由全部到局部的分类标识体系。这种结构符合人们通常的研究思维习惯,能保证较高的查全率。 目前我国广泛采用中国图书馆分类法(简称中图法)进行分类,该分类法由5大部类、22个大类组成,I 文学 (中图法片断) 0 文学理论 1 世界文学 2 中国文学 21 作品集 22 诗歌、韵文 23 戏剧 24 小说 242 古代作品 246 五四以后作品 247 建国以后作

4、品 .4 章回小说 .5 新体长篇、中篇小说 .7 新体短篇小说 .8 故事、微型小说,分面组配型分类语言:在体系分类语言的基础上,吸收了概念分析与综合的方法而发展起来的。其分类标识可以进行灵活地组合,极大地提高了分类语言标引和检索能力。但在实际操作,灵活的组配往往较难在使用上达到很好的一致性,因此在传统信息检索的实际使用中并不多见。如:文学类百科全书 IZ28 或者 Z28 I,(2)主题语言:以主题词来表达信息主题概念的语言,它按事物对文献信息进行浓缩、描述和整序,借用自然语言的语词,作为文献信息和检索提问的内容标示。 特点:按特定的事物集中文献信息,有较强的直接性。 构成原理:利用自然语

5、言中的名词术语,经过一定程度的规范化处理,作为表达文献和提问内容的主题词;利用参照系统中的各种手段,显示主题标识之间的各种关系,并以此把主题词表中的众多主题词相互联系起来,构成多维的主题词体系;利用主题词的字顺序列,按事物的名称来排列和检索文献信息。,标题语言:采用规范化了的自然语言,即经过标准化处理的名词术语作为标识,来表达文献所论述或涉及的事物-主题,并将全部标识按字顺排列。例:一篇文章用“微型计算机”这个术语来叙述它的研究对象,另一篇文章用“微型电脑”这个术语来叙述它的研究对象,第三篇文章用“微机”这个术语来叙述,虽然都表示同一概念,这时就不能直接用“微型电脑”或“微机”来作标题词了,这

6、三篇文章都必须用“微型计算机”作标题词(根据词表决定)。因为这三个术语是等同概念,如果同时用三个术语来标引,便会导致文献被分散。当然,读者若从“微型电脑”或“微机”入手检索时,都可以在标题词表中看到“见:微型计算机”的参照指示。,标题词的组织形式有单级标题和多级标题两种。a. 单级标题 例:电子计算机例:一篇关于计算机的设计和另一篇计算机维修的文章,都可以直接用“电子计算机”来作标题词。它们在标题词系统中都是按“电”字排列集中在一起的。,b. 多级标题:由于主标题与副标题组成。标题语言的主标题与副标题的搭配一般是固定的,其特点是直观、特指、先组、特别符合检索操作的要求,查准率高,但是灵活性不够

7、。 例: 电子计算机 设计 制造 修理例:前面例子中和两篇论文即可以集中在“电子计算机”这个标题词下,将与电子计算机相关的论文集中起来,又分别放在“电子计算机设计”、“电子计算机修理”中。,主标题的构成方式有3种:正叙式:用事物或过程名称直接以自然语言的正常词序作为主标题。例:Air Pollution (空气污染)并列式:将两个表示关联事物的词并列起来,一起作为主题。例:Roads and Streets倒叙式:将事物名词或过程名词放在前面,后面加上表示特性的修饰词,两者之间用逗号隔开,构成倒置复合标题。倒置标题的作用:实现族性检索功能例:Bridge,Wood (木桥) ,Steel (钢

8、桥),交叉参见系统: see(见)、see also(参见)(1)see的作用:1)同义概念 如:Aeroplane see Aircraft例:一篇文章用“微型计算机”这个术语来叙述它的研究对象,另一篇文章用“微型电脑”这个术语来叙述它的研究对象,第三篇文章用“微机”这个术语来叙述,这三篇文章都必须用“微型计算机”作标题词(根据词表决定)。读者若从“微型电脑”或“微机”入手检索时,都可以在标题词表中看到“见:微型计算机”的参照指示。 2)下位概念 如:Communication(通信) see Data Transmission (数据传送),Electric Communication(电

9、信)3)上位概念 如:Alloy(合金钢) see Steel(钢),(2) see also的作用:引导检索者找到隐没在其他标题词下的有关文献,扩大会查找线索。COMPUTERS,DIGITAL See also COMPUTER SYSTEMS,DIGITAL,关键词语言(keyword):以关键词(从文献题名或文摘以及正文中抽取的,能够表达文献主题并具有实质意义的未经规范化处理的自然语言词汇)作为文献内容标识和检索依据的一种信息检索语言。 关键词与其他主题语言的区别在于:前者是没有经过规范处理的自然语言。属于非受控语言。后者是经过规范处理的自然语言,属于受控语言。,元词语言:以元词(从文

10、献中抽选出来的,从字面上不可分割的表达最基本的概念单元的词汇)作为主题标识,通过字面组配来表达主题概念的例:“物理”、“贸易”就是元词 “知识组织”就不是元词,而要拆分为:知识、组织 元词语言创立了检索时进行组配的后组方式 ,可以用较少的词汇表达几乎无限的主题,但由于元词不象标题词那样采用词组或说明语搭配词语之间的组合关系,其仅为字面组配,因而利用元词检索时错搭配、假联系的现象在所难免,已被淘汰。,叙词语言(descriptor):以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主题语言,提高标引的专指性和检索的灵活性。叙词是经过规范化处理的以基本概念为基础的表达文献

11、信息和检索提问的主题的词和词组。叙词语言对元词语言的单词组配原理,标题语言的词汇规范和参照系统,以及分类语言知识分类的方法进行了继承和发展。叙词语言的基本原理是概念组配,与元词语言的字面组配有本质区别。前者是词语概念意义的拆分和组合,其本质是语义层次上的组合,后者是词语字面的拆分和组合,其本质是字符层次上的组合。如:“儿童病理学”用元词为“儿童”和“病理学” 叙词为“儿童”“消化系统病理”、“内分泌系统病理”、 “呼吸系统病理学,叙词的组配,按照叙词意义之间的语义关系,存在如下几种类型:a.交叉组配:指两个或两个以上语义交叉的叙词之间的组配。例:“人工林”和“防护林”的组配表达“人工防护林”的

12、主题b.限定组配:指将一个表示事物的叙词与表示事物属性、部分或方面的叙词进行组配。例如:“电子计算机”和“存取速度”的组配表示“电子计算机的存取速度”c.组合组配:又叫并列组配,是指除上述两类叙词组配之外,任何两个或两个以上的叙词之间的组配。例如:“计算机”、“应用”和“图书馆”的组配表达“计算机在图书馆中的应用”,叙词语言的特点是:规范性强,叙词语言事先进行规范化处理,列于叙词表中,标引和检索都从叙词表中选词,保证了标引和检索的一致性。利用叙词的组配,可使用有限的叙词表达各种复杂的主题,尤其是最新出现的主题。叙词语言从单元概念出发提示文献内容,有助于准确、全面地揭示文献的主题,提高标引深度和

13、专指度。检索入口多,能满足多元检索的需要,检索范围改变也相当灵活,大提高了检全率。同时适用于手工检索和计算机检索系统。叙词语言是我国目前使用最广泛的受控主题语言。,(3)分类主题一体化语言: 指在一个检索系统中,对它的分类表部分和主题词表部分,就术语、参照、标识、索引等实行统一的控制,即一个分类系统与一个主题系统互相兼容,既能充分发挥各自独特的功能,满足分类或主题标引和检索的需要,又能融为一体,发挥最佳的整体效应。简而言之,分类主题一体化语言理分类语言与主题语言的有机结合。如:中国分类主题词表即是在中图法和汉表主题词对应的基础上分类法与主题法、先组与后组融为一体析文献标引和检索工具。其中的分类

14、号主题词对应表和主题词分类号对应表是分别从分类角度和主题角度进行分类主题一体化标引的工具。,(4)代码语言: 用某种符号代码系统来标引信息特征并排列组织信息的语言,如:化合物分子式、专利号、标准号、合同号、报告号、化合物登记号等。是给特定行业的行家提供一条简捷的检索途径。(5)引文语言: 利用文献之间引用与被引用的关系作为文献内容主题标识,并以此标引和检索文献的语言。,2、根据组配方式划分(1)先组式语言:表达信息主题概念的标识已事先用固定关系组配好,并编制在词表中,标引人员在标引信息或用户在检索信息时,必须根据词表选用组配好的主题进行操作。如:体系分类法和标题词法。(2)后组式语言:表达信息

15、主题概念的标识在编制词表时不曾预先规定组配关系。当标引信息时,只能根据词表中选用单独的主题词来描述信息的主题概念;检索时,用户可以根据需要将不同的检索词组配在一起,用来表达复杂的主题概念。如:元词、叙词。,3、根据规范化程度划分(1)规范化语言(2)自然语言(3)两者结合的发展趋势,三、检索途径及其选择,1、内容特征检索途径:内容特征是指表征文献实质意义的特征,如主题词、关键词、分类号、内容摘要等。(1)分类途径(2)主题途径(3)分类主题途径2、外部特征检索途径:外部特征是指文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书名(题名、篇名)、人名、各种符号标识(专利号、标准号、报

16、告号等)、机构名、文献出处等(1)责任者途径(2)题名途径(3)序号途径(4)引文途径,作业:给下列文献标出适当的中图法分类号提示:http:/202.207.192.109/poweb/class_china.jsp博文非书资料管理系统,001 博客在新闻信息传播中的作用 【作者】李晓鹏;【作者单位】辽宁大学文化传播学院;【文献出处】沈阳教育学院学报, 2008年 06期【关键词】博客; 信息; 交谈;【摘要】从信息传播主体、信息内容和传播方式、传播效果三方面探讨了博客给新闻业带来的变化,认为随着博客的普及、发展和功能的完善,它将进一步带动新闻业从说教走向交谈。【分类】,002 股权结构与会

17、计信息质量关系的实证研究 【作者】宋理升;【作者单位】山东大学管理学院;【文献出处】工会论坛(山东省工会管理干部学院学报), 2008年 06期【关键词】会计信息质量; 实际控制人; 股权集中度;【摘要】本文以20032005年被注册会计师出具非标准无保留审计意见的上市公司为样本,对其与股权结构之间的关系进行了实证研究。结果表明,公司实际控制人为国有控股公司、股权制衡度与会计信息质量正相关,而股权集中度对会计信息质量没有显著影响。【分类】,003 花生EST资源的SSR信息分析【作者】柳展基; 孙萍; 步迅【作者单位】山东省农科院高新技术研究中心山东省作物与畜禽品质改良生物技术重点实验室;【文

18、献出处】花生学报, 2008年 04期【关键词】花生; EST; SSR; 频率; 特性【摘要】微卫星或简单重复序列存在于表达序列标签中。为了在花生中开发EST-SSR功能性标记,利用生物信息学对NCBI公共数据库中的41501条花生ESTs序列进行EST-SSRs特征分析。剔除冗余序列,得到全长为5125.94kb的无冗余EST8391条。在这些序列中搜索出1109个SSR,分布于946条EST中,出现频率是11.27%。这些EST-SSR的平均长度为18.16bp,平均分布频率1/4.62kb。在16bp的重复基元中,三核苷酸重复基元的SSRs出现频率最高(49.23%),其次是二核苷酸(

19、32.83%)、单核苷酸(14.88%)。AG/CT和AAG/CTT是二、三核苷酸中的优势重复基元,分别占二、三核苷酸重复的71.43%和31.50%。本研究为开发多态性花生微卫星标记提供了候选序列。,S565.2,004 基于SMS平台的图书馆信息延展服务 【作者】周爱民;【作者单位】南京森林公安高等专科学校图书馆;【文献出处】赤峰学院学报(自然科学版), 2008年 11期【关键词】短消息; 信息服务; 图书馆【摘要】本文分析了短消息服务的功能、特点和在图书馆应用的优势,提出了图书馆短消息服务系统的具体形式及服务内容,结合实例从技术和设计上对手机短消息服务平台的构建给予了重点阐述,介绍了该

20、系统的设计结构及实现方法并对其发展前景进行了展望.,005 基于信息融合的模拟电路故障诊断方法分析【作者中文名】冯志红; 林志贵; 王炜;【作者单位】天津工业大学信息与通信工程学院;【文献出处】电子测量与仪器学报, 2008年 06期【关键词】模拟电路; 故障诊断; 信息融合; 神经网络; 证据理论;【摘要】采用2种基于信息融合故障诊断方法,说明用于模拟电路故障诊断的特点。首先利用指定频率下可测点电压、不同测试频率下输出端电压和测试元件的温度3组测试数据,分别用一个改进的BP网络对电路状态进行预处理,得到每个传感器对各待诊断元件的隶属度函数分配,再分别用模糊融合和D-S融和算法进行决策层信息融

21、合并进行故障定位。仿真结果表明:信息融合方法能够克服基于单一信息诊断的不足,提高电路故障诊断的正确率,对单、多软、硬故障均可识别,D-S融合算法在解决电路故障诊断中的不确定性问题方面优于模糊融合。,006 教育信息化背景下高校英语教师的素质结构【作者】杨发青;【作者单位】平顶山工学院外语系【文献出处】河南社会科学,2008年 S2期【关键词】教育信息化; 信息技术; 信息素养; 素质结构;【摘要】在信息时代,教育信息化的发展和现代信息技术在大学英语教学中的日益运用,给大学英语教学带来机遇和挑战,同时给大学英语教师的素质结构注入了新的时代内容。文章在分析信息时代大学英语教学特点的基础上,全面探讨

22、了教育信息化背景下高校英语教师的素质结构。,007 两种空间索引结构在供水信息系统中的应用和对比 【作者中文名】刘荣; 周宏军; 田为春;【作者单位】东华理工大学地球科学与测绘工程学院; 宜兴荆邑测绘有限公司;【文献出处】东华理工大学学报(自然科学版), 2008年 04期【关键词】空间索引; R-Tree; 格网索引; 数据结构【摘要】空间索引是空间位置到空间对象的映射关系,当前数据库尤其是地图数据库搜索的关键问题就是速度,而提高搜索速度的核心技术就是空间索引。介绍了几种不同的空间索引技术,探讨了利用格网单元索引和R树索引装封边界的过程。通过实验比较了两种索引技术加载数据库时的搜索时间,得出

23、了有益的结论。并根据实际应用比较各索引技术之间的优劣。,008 浅谈高校教学档案管理的信息化 【作者】张金来;【作者单位】天津电子信息职业技术学院教务处;【文献出处】中国电力教育2008年 23期【关键词】高校; 教学档案; 档案管理; 信息技术;【摘要】信息技术应用于高校教学档案管理,是实现教学档案信息化、数字化的必然选择,对提高高校教育教学水平具有重要的现实意义。高校档案工作是高等学校重要的基础性工作,教学档案管理是各高校教学管理的重要组成部分,为此,将信息技术引入高校教学档案管理是各高校实现教学档案信息化、科学化管理的重要标志。,009 论信息不对称条件下的基层政府治理与新农村建设 【作

24、者】唐斌【作者单位】华南农业大学公共管理学院;【文献出处】长春工业大学学报(社会科学版)2008年 04期【关键词】治理; 信息不对称; 新农村【摘要】在农村基层政府治理过程中,广泛存在着信息不对称现象及其引发的逆向选择与道德风险。由于公共权力的特殊属性以及参与各方的普遍“经济人”行为,使得基层政府治理中每一个信息源都有着隐瞒自己所拥有信息的冲动,从而导致政治市场中的信息不对称表现出不同于一般市场的多重双向的特点。这一信息落差使参与各方处于一种互不信任的状态,进而使得基层政府治理中呈现主体行为保守,成果显现低效等“柠檬市场”的特征。,010 社会转型条件下的网络信息伦理思考 【作者】史雯;【作

25、者单位】浙江传媒学院图书馆;【文献出处】浙江高校图书情报工作, 2008年 05期【关键词】图书馆; 网络环境; 信息伦理;【摘要】网络技术的迅猛发展和广泛应用带来了一场跨越时空的信息网络革命。本文主要研究在当前中国社会转型条件下的图书馆网络信息伦理的现状、原因和解决途径等问题。,第二节 事实数据信息的检索工具,第一章已学习过检索所获得的信息有文献信息与事实数据信息之分。 事实数据信息-直接提供用户所需的事实或数据,如名词术语、概念、定义、理论、方法、数据、公式、定律、事件等等。工具书是检索这些信息的最主要信息源。一、字典、词典(辞典)二、百科全书三、手册四、年鉴五、名录,一、字典、词典(辞典

26、):字典是为字词提供音韵、意思解释、例句、用法等等的工具书。在西方,是没有字典的概念,全是中国独有的。 字典收字为主,亦会收词。词典或辞典收词为主,也会收字。为了配合社会发展需求,词典收词数量激增并发展出不同对象、不同行业及不同用途的词典。 例:新华字典、现代汉语词典牛津英语词典、建筑大辞典 西文词典一般都是按本国文字的字母顺序排列,查询时按字顺查找;日文字典大多按五十音顺排列,查找时按音顺查找;中文字典排列方法较多,有部首法、笔画笔顺法、汉语拼音法、四角号码法等。,二、百科全书:常被誉为“没有围墙的大学” 概要记述人类一切知识门类或某一知识门类的工具书 。百科全书在规模和内容上均超过其他类型

27、的工具书,它集各类。百科全书的主要作用是供人们查检必要的知识和事实资料,其完备性在于它几乎包容了各种工具书的成分,囊括了各方面的知识。 百科全书可按收录范围分为综合性百科全书(如:中国百科全书、专业性百科全书(如:化工百科全书;还可按编辑规模分为:大百科全书(20卷以上)、小百科全书(10卷以下)、百科词典(单卷)。 编排方式有三种:按字顺编排、按分类编排和分类与字顺相结合编排。目前,按字顺编排条目已成为百科全书编排方式的主流,也有采用分类与字顺相结合的形式编排的。 百科全书一般都有各种索引,其中最主要的是主题索引,就是把条目的条头、释文的隐含主题和参见主题按字顺排列以供检索。,例:中国大百科

28、全书,中国大百科全书是中国第一部大型综合性百科全书,也是世界上规模较大的几部百科全书之一。1978年,国务院决定编辑出版中国大百科全书,并成立中国大百科全书出版社。中国大百科全书总编辑委员会和中国大百科全书出版社先后组织2万余名专家学者,取精用宏,历时15载,终于纂成这部煌煌世制。全书按学科或领域,如哲学、社会科学、自然科学和工程技术等各个学科领域分卷,每卷不标卷号,只标学科名称,共74卷。共收7.8万个条目,计1.26亿字,并附有近 5 万幅图片。适于高中以上、相当于大学文化程度的读者使用。中国大百科全书的第二版计划在21世纪初出版。,世界ABC三大百科全书:美国百科全书、不列颠百科全书、科

29、利尔百科全书,美国百科全书名为Encyclopedia Americana,简称EA,于1829一1833年问世,初版是德国移民F.李勃以德国 布罗克豪斯社交词典 第七版为范本编成的,共13卷。 19031904 年经过改编增为 16卷。后又经多次修订,1912年修订版为22卷。 1918 1920年再经重编改版,现共30卷,遂成为后来历次修订版的基础,并从此采取了连续修订制。每年修订约10的内容。是标准型的综合百科全书,为ABC三大百科全书之A。美国百科全书采取两种更新内容的方法,其一是对动态性资料,如选举结果和重大政治变动,采用连续修订制;其二是对于一般性的资料在一定时期内“逐卷全面修订”

30、,改写或删除旧条目,及时增加新条目。 全书条目按字顺编排,主要读者是普通成年人至高级知识分子。,全书最新重印本30卷,约3150万词,收有 6万条目。采取狭主题、小条目的编法。但对重大主题也设置大条目,如“第二次世界大战”条长达 169页。全书约有插图2万幅,另有许多彩色插页 。条目释文内共有地图 1100 幅。全书图文比为11500词 。条目之间建立有严谨的参见系统,采取集中参见和随释文参见相结合的方式。 美国百科全书在选收内容上的特点是:虽称“国际版”,但内容仍不免偏重美国和加拿大的历史、人物和地理资料;前者约占40,后者占30多。给读者以全世界政治、社会和文化的世纪总览,提供完整的历史背

31、景情况。,不列颠百科全书(Encyclopedia Britannica)(又称大英百科全书,简称EB),是苏格兰启蒙运动的产物,被认为是当今世界上最知名也是最权威的百科全书。不列颠百科全书诞生于18世纪。第一个版本的大英百科在1768年开始编撰,历时三年,于1771年完成共三册的不列颠百科全书。在1901年EB的出版与编辑工作逐步转移到美国;现在我们熟知的大英百科全书公司已是总部位于芝加哥的美国公司。1929年,大英百科更投入大量人力与物力,邀集近140个国家和地区的4000位学者专家参与撰述,大量收录欧洲以外地区的资料,完成全部二十四册的第14版,确立了它在百科全书界中最崇高、最具权威的地

32、位。,科利尔百科全书(Collier Encyclopedia)简称EC,美国科利尔出版公司1949年创编出版的,现出版者为美国纽约麦克米伦教育公司。共24卷,是二十世纪新编的大型英语综合性百科全书。内容主要是反映中学、大学及研究生课程内容,从人文科学到物理学、生命科学、地球科学等, 不仅可指导自学者学习,也可满足有关学科专业人员的知识深化的需求。该书的特点是:适用对象广泛;材料新颖及时;参考书目的编选为各家百科全书之冠;分析索引范围广泛。,三、手册: 顾名思义是放置于手边可以方便地参考的一种工具书。是汇集某一学科或某一主题等需要经常查考的资料,供读者随时翻检的工具书。手册就是各行各业、不同地

33、域、不同职业的人在进行某种行为时所需要的一种了解相关信息的材料。手册主要为人们提供某一学科或某一方面的基本知识,方便日常生活或学习。手册中所收的知识偏重于介绍基本情况和提供基本材料,如各种公式、规章、条例、事实、数据、图表等等。通常按类进行编排,便于查找。 如:图书情报工作手册、数学手册,四、年鉴:是一种按年编纂出版的参考工具书。以全面、系统、准确地记述上年度事物运动、发展状况为主要内容的资料性工具书。汇辑一年内的重要时事、文献和统计资料,按年度连续出版。年鉴内容丰富、新颖,叙述简明,编排得当,具有可靠性、统计性、新颖性、连续性、知识性、检索性等特点。其主要作用是向人们提供一年内全面、真实、系

34、统的事实资料,便于了解事物现状和研究发展趋势。它所收集的材料主要来源于当年的政府公报、国家重要报刊的报道和统计部门的数据。因此,年鉴有较大的总结、统计意义和比较系统的连续参考作用。通过年鉴,可查找近年来国际国内时事,各部门各行业的进展及各学科各专业的研究动态;可查找政府颁布的重要法规文献和逐年可比的统计数据资料。 年鉴大体可分为综合性年鉴和专业性年鉴两大类,前者如百科年鉴、统计年鉴等;后者如经济年鉴、历史年鉴、文艺年鉴、出版年鉴等。,五、名录:名录是提供有关专名(人名、地名和机构名录等)简要工具书,内容涉及比较广泛。人们可以从名录中查找关于人物生平、机构组织和某一行政区划沿革等信息。名录是一种

35、事实便览性的工具书,虽只提供有关机构、人物等的简要资料,但能起指引情报源的作用,对沟通信息、促进交流、加强协作提供了很大的方便。名录按收集信息的内容的不同,可分为人名录、地名录和机构名录。 1、人名录又称“名人录”,是介绍某一方面人物生卒年、学历经历、荣誉、著作等资料的检索工具。如:世界名人录。 人名录分为综合性、国别或地区性的、专业或职业性的三类 ,每类又有回溯性的(也称人名辞典)和当代人物两种。,2、地名录 是收录经审定的规范化的地方名称,并注明所属的国家、行政区划以及在地图集上的具体位置的工具书。主要提供各行政区域(国家、城市、省、县、乡、街道)、山川、河流、岛屿等的规范化名称、地理位置

36、、人口、历史沿革、地产和矿产等资料。如:中国行政区划大辞典、世界地名录。 3、机构名录又叫机构指南 是汇集机构名、人名、地名等专名及与之相关的资料的一种工具书。一般提供公司或组织机构的名称、地址、电话号码、历史与现状、机构的主要业务与人事、主要负责人等情况,许多公司和厂商名录还要介绍其规模、资产、经营范围、产品、设备等情况。具有简明、新颖、确实等特点。如:中国企事业名录大全,第三节 文献检索工具简介,文献检索工具是用于报道、存贮和查找文献线索的工具,它通过对文献特征的描述,并按一定的科学方法排列、提供多种检索途径,使我们能从文献的汪洋大海里找到特定的文献。 检索工具必须具备四个条件:第一,必须

37、详细描述文献的外部特征和内容特征。第二,每条描述记录都必须具有各种检索标识。(所谓检索标识是指描述文献外部体制和内容特征的专门用于信息检索的词、词组或代码,如主题词、分类号、著者姓名、文献序号等。)第三,全部描述记录要科学地组织成一个有机的整体第四,能够提供多种检索途径。,检索工具的类型:,按检索手段分,有手工检索工具、机械检索工具和计算机检索工具;按出版形式分,有书本式、期刊式、卡片式、缩微式和机读式;按收录范围分,有综合性、专业性、专题性和单一性;按文种分,有中文、西文、日文、俄文等;按著录方式分,有目录型、题录型和文摘型。其中按著录方式划分体现了检索工具对文献内容揭示的深浅程度,体现了检

38、索工具的性质,这是检索工具最主要的划分方法。,一、 目录型检索工具,目录是以出版物(如一本图书、一种期刊等)为报道对象,揭示出版物外部特征的检索工具。所以目录对文献的描述比较浅显,一般只描述文献的外部特征,有时也通过简单的内容提要介绍文献的内容,但它不涉及文献中的具体章节或具体文献。目录主要用于报道、登记出版物的出版发行情况,揭示其收藏情况,供人们选购、查阅和获取文献时使用。目录的著录项目通常包括出版物名称、责任者(著者、编者或译者)、出版项(出版者、出版地、出版时间、版次等)和稽核项(页数、开本、价格等)。目录型检索工具主要有图书馆馆藏目录、联合目录、出版社目录、国家书目等。,1、馆藏目录是

39、报道图书馆馆藏的。 传统的馆藏目录是卡片式目录,一般一种图书或期刊著录一张卡片,随着现代化技术的普遍使用,我国大多数图书馆已经采用计算机编目,并向读者提供计算机查检书目。所以,现在许多图书馆正处于卡片目录和机检目录并存的阶段,一些图书馆为了照顾不会使用计算机的读者,在提供机读目录的同时还保留了卡片目录;但大多数图书馆采用分段处理的方法,即没有机读数据的文献采用卡片目录检索,有计算机数据的文献采用计算机检索,一般以一定时间为界。如浙江大学图书馆的中文图书机读数据是从1988年开始积累的,一般来说,1988年以前的图书通过卡片目录进行检索,1988年以后的图书则通过计算机检索。对于联网的图书馆,馆

40、外读者可以通过联机公共检索目录(Online Public Access Catalog,简称OPAC)来查询馆藏文献。,期刊目录,2、联合目录:报道两个馆以上的馆藏,一般以地区、系统、专业编制联合目录,如全国西文期刊联合目录、华东地区医药期刊联合目录等。目前这些联合目录都可以在网上检索。 在信息查检过程中,最后往往要归结到查找原文这一步,馆藏目录和联合目录就是查找和获取原文的必备工具。,3、出版社目录大多由出版社编制,对将要出版发行的书刊或已经出版的书刊进行报道,它是图书贸易的工具,以称营业书目,通常连续出版。如科技新书通报、全国新书目、邮发报刊目录、外国报刊目录、Book in Print

41、。4、国家书目则由国家图书馆或由全国性书目机构出版发行,是报道一个国家图书出版发行情况的目录,如中国国家书目、民国时期总书目、British National Bibliography(英国国家书目)。目前许多国家还发行国家书目的光盘,我国也出版发行了中国国家书目光盘(19881997)、中国国家书目回溯光盘(19491974)、中国国家书目回溯光盘(19751987)。出版社目录和国家书目能及时、全面地提供图书出版情况,是有效地进行图书采购、整理、利用及开展参考咨询服务的重要工具。,二、 题录型检索工具,题录是以单篇文献作为报道单位,揭示文献外部特征的检索工具。由于它是以单篇文献为单位来报道

42、和存储文献的,所以对文献的揭示程度比目录要具体、深入。但题录与文摘相比,对文献内容的揭示又相对较浅,不过,它也因此具有加工容易、可以缩短报道的时差、文体简短、可以增加检索刊物的容量的优点。题录的著录项目一般包括题录号、文献题目、作者及其工作单位、出处、原文文种、主题词、文中所附图表数及参考文献数等。,例:全国报刊索引 全国报刊索引,月刊,前身是1951年4月由山东省图书馆编印的全国主要资料索引。1955年3月改由上海图书馆编辑出版。1980年分为“哲学社会科学版”与“自然科学技术版” 两种,分别按月出版。正文按中国图书馆分类法分类编排,是查找建国以来报刊论文资料最重要的检索工具。 TP24机器

43、人技术 951207895 机械臂力控制系统的分析与设计/史福元/机电工程. 1995,(3) . 38-40分类号分类类目名称入藏号文献篇名著者姓名文献名称出版年、期所在页码,对会议文献的报道一般采用题录的形式。如Conference Paper Index(会议论文索引)、Index to Scientific & Technical Proceedings (简称ISTP,科技会议录索引)。 Conference Paper Index是检索世界上有关科技、工程和医学、生物学等方面会议论文的主要检索工具之一。它的正文按会议的学科分类编排,每个条目著录有会议事项和资料订购信息,并列出该会的

44、各篇论文的题录。,Index to Scientific & Technical Proceedings是由美国科学信息研究所(ISI)出版的,是专为检索会议录、会议出版物及其会议论文题录而编制的综合性检索刊物,内容涉及基础学科、工程技术及应用科学等领域,每年收录约4000次重要科学会议的论文。目前,全球正式出版的重要会议文献约有75%90%被ISTP收录,是快速、全面了解会议文献的重要检索工具,并作为评价科研工作者学术水平的重要指标,它与SCI科学引文索引(Science Citation Index)、EI工程索引(The Engineering Index )、并称为“三大索引”。其正文

45、按会议号的顺序排列,著录每个会议的名称、会议事项、会议录及其出版情况和该会论文的题录。,三、文摘型检索工具,文摘(abstract)是指对一份文献或一个文献单元的内容所做的简略、准确的描述,通常不包含对原文的补充、解释和评论。文摘的报道对象与题录相同,但它对文献内容的揭示程度较题录更深入具体,它不仅描述文献的外部特征,还进一步描述文献的主题内容。对内容的介绍主要由其中的“文摘”部分完成。文摘是最常用的文献检索工具。,文摘的主要著录项目为:(1)文摘号、入藏号(abstract number ,reference number , accession number )。它是在文献处理完以后,为每

46、条文摘编的号码,起排序并帮助读者识别特写文摘的作用。它可以是简单的顺序号,也可以是含有某种情报内容的代码符号。(2)文献名称(document title)。即文献的题目(篇名),它是读者识别特定文献的重要标志之一。文献名称一般是逐字照录,有时也可以删去某些引导性的词,或对含义不清及不完整的名称加以改写、补充。外文文献一般要同时著录译名和原名。有些英文检索工具对非拉丁文字的文献一般不著录原名,而著录原名的音译名。(3)著者(author)及其工作单位(affiliation)。是读者迅速鉴别文献的依据之一,著录著者姓名可以用全称,也可以用简称。许多国家的人名表述是名在前,姓在后,一般姓用全称,

47、名可以缩写。但大多数检索工具都采用姓在前、名在后的形式。英文检索工具对非拉丁文姓名用音译法著录。,(4)合同号(contract number)或拨款号( grant number)。如果该文献是在某项合同或拨款的支持下进行的,一般都要标明该项合同的编号或拨款文件的编号。科技报告都有这一项目。(5)原文出处。指刊载原文的地方。原文如果是某种期刊中的论文,出处包括该刊的刊名、出版地、卷期号、出版日期和起讫页码;如果是图书或其中的一部分,出处就是书名、编著者、出版地、出版者、出版时间和起讫页码。科技报告的出处就是入藏号、订购号或原来的报告号。专利说明书的出处就是专利申请书或专利说明书的编号。原文出

48、处的著录是读者顺利找到原文的重要线索。(6)原文文别和译文来源。原文文别一般用某种语言的简称标明,放在文献出处之后,有的放在文献的译名之后。若所摘录的文献是一篇译文,应给出译文的来源(被译文献的出处),如“译自X刊X卷X期X页”。此项的用处是免得使读者去找他所不能阅读的东西。,(7)主题词或索引词。指用来描述该文献的主题内容的若干个词或词组。该项的用途很多,既可以帮助读者了解原文主题,也可以用以查找其他相关文献,或供计算机识别和进行逻辑组配检索。(8)文摘正文。对文献内容所做的简略描述。可以有报道性文摘和指示性文摘之分。前者需概述原文的内容要点,特别是创新点,向读者提供原文中的定量信息(如距离

49、、最大值、最小值、公式等)和定性信息(如发现、结果、新方法、新设备、结论等)。它是原文内容的浓缩,基本上能反映原文的技术内容、信息量大,字数也较多。后者则是为了把原文的主题范围、目的和方法概略地指示给读者的一种文摘,一般不包含具体的数据、方法、设备、结论等内容。它指示读者将在原文中发现什么,帮助读者判断原文是否与自己的需要相关以及是否需要阅读原文,字数也相对较少。,例:计算机应用文摘 9609321 复杂的混合信号集成电路的参量成品率预测刊,英/Oleary,M. /Int.J.Electron. 1995,78(2) . 267-394 借助图象处理技术能从硅片图象提取文摘号文献篇名文献类型

50、、文种著者姓名文献出处:刊名缩写、年卷期起讫页码文献摘要,第四节 索引介绍,一个完整的检索工具包括四个部分:1、说明部分2、正文部分3、辅助索引部分4、附录部分,索引就是将文献中一些重要的、有检索价值的知识单元,如人名、题名、分类号、主题词等,根据需要分别摘录出来,并注明它们所在的位置(页码或文献号),再按一定的规则排列和组织,附在检索工具之后,或单独编辑成册,便于人们“按图索骥”地获取隐含于文献中的各种数据和资料。 索引通常不提供文献内容本身,只指明文献的物理位置,是一种检索文献的系统指南,使读者能准确地找出文献或文献集合体中的特定信息。索引的排列次序也与文献集合体本身的排列次序不同,这样能

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号