科技文献检索第二章检索基础知识.ppt

上传人:小飞机 文档编号:6010815 上传时间:2023-09-14 格式:PPT 页数:45 大小:1.72MB
返回 下载 相关 举报
科技文献检索第二章检索基础知识.ppt_第1页
第1页 / 共45页
科技文献检索第二章检索基础知识.ppt_第2页
第2页 / 共45页
科技文献检索第二章检索基础知识.ppt_第3页
第3页 / 共45页
科技文献检索第二章检索基础知识.ppt_第4页
第4页 / 共45页
科技文献检索第二章检索基础知识.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《科技文献检索第二章检索基础知识.ppt》由会员分享,可在线阅读,更多相关《科技文献检索第二章检索基础知识.ppt(45页珍藏版)》请在三一办公上搜索。

1、,第二章 检索基础知识,2.1 检索定义2.2 检索语言2.3 检索系统2.4 检索方法2.5 检索步骤2.6 检索效率,2.1.1 文献检索概念文献检索 广义上讲包括文献信息的存储和检索两个过程。狭义是指有目的地开展对于经过有序化后的文献信息的集合体所开展的查找活动及过程。,信息存储与检索过程图,文献信息,分析,检索课题,文献信息特征,检索提问信息,分析,著录,标引,选用,检索语言和名称规范,文献信息标识(检索项),检索提问标识(检索词),形成,形成,检索系统,输入,检索,检索结果,输出,存储过程,检索过程,2.1.2 信息检索的原理,文献检索的过程就是检索提问标识与存储在检索工具中的著录标

2、引标识相匹配的过程.,2.1.3 检索的类型,1、按检索对象划分3类 文献检索(Document Retrieval)数据检索(Data Retrieval)事实检索(Fact Retrieval),2、按信息检索手段划分2类 手工信息检索 计算机信息检索,3、按检索系统的工作方式划分4类 脱机检索(Off-line Retrieval)联机检索(On-line Retrieval)光盘检索(CD-ROM Retrieval)因特网检索(Internet Retrieval),4、按检索工具类型划分6类 目录检索(Catalog Searching)题录检索(Title Searching)文

3、摘检索(Abstract Searching)索引检索(Index Searching)全文检索(Full Text Searching)参考工具检索(Fact and Data Searching),2.2 检索语言,信息检索语言(Retrieval language)是用来描述文献的内容特征、外表特征和表达用户信息提问的一种专门语言。当存储信息时,检索系统对文献内容进行分析,概括分析出若干能代表文献内容的词语,并赋予一定的标识,如题名、著者、主题词等,作为存储与检索的依据,然后被纳入到数据库中。当检索信息时,检索人员首先要对检索课题进行分析,同样形成若干能代表信息需求的词语,然后通过检索系

4、统在数据库中匹配具有同样词语和标识的文献,找到自己所需要的信息。,信息检索语言,2.2.1 分类语言,分类语言又称分类法,是将文献主题概念按知识学科性质进行分类和系统排列,并用号码(分类号)表达各种概念的检索语言,包括体系分类法和组配分类法。,中国图书馆图书分类法 中国科学院图书馆图书分类法 中国人民大学图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法,中国图书馆分类法,T 工业技术TP 自动化技术、计算机技术 TP1自动化基础理论 TP2 自动化技术及设备 TP3计算技术、计算机技术 TP30一般性问题 TP31计算机软件 TP311程序设计、软件工程 TP311.1程序设计 TP3

5、11.11程序设计方法 TP311.12数据结构 TP311.13数据库理论与系统 TP311.131数据库理论 TP311.132数据库系统:按类型分 层次数据库 网络数据库 关系数据库 面向对象的数据库.TP6射流技术 TP7遥感技术 TP8远动技术,杜威十进分类法(DDC)1873年美国图书馆学家杜威所创,目前该分类法已经被翻译成30多种语言,在全球超过135个国家的 20多万个图书馆使用,在美国,95%的公共图书馆,25%的学院图书馆大学图书馆以及20%的专门图书馆使用该分类法。,杜威十进分类法(DDC),310 普通统计学000 总类 320 政治学 371 学校管理、100 哲学类

6、 330 经济学 特殊教育200 宗教类 340 法律 372 初等教育300 社会科学类 350 公共行政管理 373 中等教育400 语言类 360 社会机构社会团体 374 成人教育500 纯科学类 370 教育 375 课程600 应用科学类 380 商务、通讯、运输376 妇女教育700 艺术类 390 习俗、礼仪、民俗 377 学校与宗教800 文学类 378 高等教育900 地理历史类 379 政府法规 管理与资助,分类语言的特点,(1)分类法符合人们认识事物的规律和处理事物的习惯。(2)由于分类法是按学科、专业集中文献,能系统地揭示文献内容特征,因此能够实现族性检索,获得较高的

7、查全率。(3)便于组织图书资料的排架。(4)分类检索语言是一种先组式语言,不能随时修改补充。,2.2.2 主题语言,主题语言主题语言,也称主题法,是一种用语词标识处理原始信息、组织主题检索工具或检索系统的检索语言。主题语言又分为标题词语言、单元词语言、关键词语言和叙词语言。主题词就是指以规定概念为基准,经过规范化和优先处理后,具有组配功能、能够显示词间语义关系动态性的词或词组。主题检索适合特性检索,系统性不强。,关键词语言 关键词语言是直接选用文献信息中的自然语言作基本词汇,并将那些能够揭示文献信息题名或主题意旨的关键性自然语词作为关键词进行标引的一种检索语言。,叙词语言 叙词语言是以自然语言

8、词汇为基础,以概念组配为基本特征,适应现代信息需求而发展起来的一种信息检索语言类型。叙词又称描述词、叙述词,是以概念为基础,经过优选和规范化处理并具有概念组配和词间语义关系显示功能,用以表达文献主题和检索需要的语词。叙词语言的特点:直观,专指性强,组配性高,结构严谨,标引能力强。叙词语言示例:汉语主题词表、英国科学文摘使用的INSPEC Thesaurus、美国工程索引93年后使用的Ei Thesaurus等。,2.3.1 文献检索系统定义 是指按某种方式、方法建立起来的供文献信息用户查检文献信息及原始文献的一种有层次的体系,是表征有序的信息特征的集合体。(包括各种手工检索工具和各类计算机检索

9、系统),2.3 检索系统,2.3.2 检索系统的类型 1.目录(catalog)它主要用于反映文献的出版情况或收藏情况。目录是对一批相关文献外部特征的揭示和报道。通常以一个完整的出版或收藏单位为著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,著者,出版事项等)。目录一般按分类或字顺编排,主要供人们了解出版或收藏机构是否拥有所需图书、期刊等出版物。目录类型:馆藏目录:反映一个图书馆文献收藏情况的目录。联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、信息服务机构文献收藏情况的一种统一目录。,按出版类型划分:图书目录、期刊目录、会议论文目录。按物质形式划分:卡片目录、书本目录

10、、机读目录(MARC)、联机公共检索目录(OPAC,Online Public Access Catalog)等。,OPAC:是指以计算机编码形式存贮在计算机系统内,供读者通过终端设备进行联机检索的图书馆目录,即书目数据库的一种形式。,2.题录(bibliography)题录在揭示文献内容的深度方面,比目录深入,但又比文摘简单。题录是单篇文献外表特征的揭示和报导,即对某一文献外部特征的描述,由一组著录项目构成一条文献记录。题录的著录项目一般有著者,篇名及出处等,常以一个内容上独立的文献单元(如一篇文章,图书中的一部分,有时也可以是整本出版物)为基本著录单位。示例1:,3.文摘(abstract

11、)更有利于用户判断检索结果的准确性。文摘是指对一份文献(或称一个文献单元)的内容所做的简略、准确的描述,文摘的著录项目除了著者,篇名及出处等外,还有表示文献内容特征的摘要。,4.索引(index)索引是对一组信息集合的有系统的指引。索引是一种附属性的检索工具,通常称为辅助索引。索引具有便于检索,揭示事物比较深入、全面、明细等方面的优点。索引的用途在文献检索中体现得极为突出,科技文献数量庞大、内容复杂多样,使用面广且频繁。虽然已将其中绝大部分加工压缩成文摘或题录等。但如果没索引,查检起来还是很不方便。严格地说,没有索引的检索工具不能称为完善的检索工具。最常用的索引是主题索引、分类索引和著者索引等

12、。,目录:单位出版物题录:单位出版物中的单篇文献文摘:单位出版物中的单篇文献索引:单位出版物或单篇文献中的知识单元,检索工具的著录对象,手工信息检索工具的著录项目目录:出版物名称-编著者-出版项附注项题录:题目/著者/出处文摘:题目/著者/出处、文摘索引:知识单元-顺序号(或页码)期刊论文的文献出处:刊名、年、卷、期、页码,(三)文献检索系统的功能 报道文献信息 存储文献信息 检索文献信息,2.4 检索的方法,信息检索方 法,工具法,引文法,循环法,2.4.1 工具法概念:利用文献检索系统(工具),根据已经掌握的相关线索(如书名、刊名、篇名、作者姓名、主题词、分类号等等),进行系统而全面的文献

13、检索的方法。类型:顺查法、倒查法、抽查法,2.4.2 引文法概念:利用文献后面的参考文献查找信息的方法特点:所检文献专指度较高、信息越来越旧、容易误导;在检索工具短缺时采用此法.,2.4.3 循环法概念:工具法和引文法交替使用的检索方法 特点:优势互补 了解课题发展动态,选择信息检索方法的原则:,1、有检索工具时用工具法或循环法2、无检索工具时用引文法3、新兴学科或知识更新快的学科课题用倒查法4、查全率要求高用顺查法5、已经掌握课题发展的规律特点用抽查法,2.5 检索步骤,分析检索课题,明确检索要求选择检索工具,确定检索途径确定检索标识,确定检索运算构筑检索提问,获取初步结果调整检索策略,获取

14、所需信息,2.6 检索效果的评价及其优化 检索效果评价的意义(1)提高检索效率(2)改善系统性能,检索效果评价的指标 评价检索效果的常用指标有:查全率(Recall ratio)-用R表示查准率(Precision ratio)用P表示漏检率(Omission ratio)-用O表示误检率(Fall-out ratio)-用F表示 高查全率和查准率是人们在检索活动中通常所追求的目标。,查全率 查全率是指被检出的相关文献量与系统文档中实有的相关文献量之间的比率。它是衡量信息检索系统收录内容及其用户检索结果的完整程度的指标。可用下式表示:被检出相关文献量查全率(R)=100%系统中相关文献总量,查

15、准率 查准率是指检出的相关文献量与检出文献总量之间的比率。它是衡量信息检索系统收录内容及用户检索结果精确度的尺度。可用下式表示:检出相关文献量 检准率(P)=100%检出文献总量,影响用户查全率与查准率的不良因素(1)对检索目标把握不准确(2)对检索系统选择不洽当(3)检索词和逻辑组配不当(4)检索途径和方法选择不当(5)系统功能不熟悉、检索技能不熟练,检索效果的优化手段 提高检索系统的功能 提高数据库的质量 提高检索人员的素质 优化检索策略,提高查全率的主要方法(1)准确把握检索对象及目的,选择合适的数据库。(2)降低检索词或分类号的专指度。(3)更多地采用学科分类途径来扩大检索范围。(4)减少逻辑“与”及逻辑“非”的使用。(5)增加逻辑“或”及截词检索技术的使用。(6)采用“全文检索”。(7)不限定检索对象的文献类型、时间段、文种等。,提高查准率的主要方法(1)准确把握检索对象及目的,选择合适的数据库。(2)提高检索词或分类号的专指度。(3)更多地采用专用名词及特性检索的途径。(4)选择逻辑“与”及逻辑“非”的使用。(5)减少或不采用逻辑“或”及截词检索技术的使用。(6)限定检索词出现的字段及在段落、文句中的位置。(7)不选“全文检索”.(8)限定检索对象的文献类型、时间段、文种及其它特征。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号