《文献信息检索的方法和途径.ppt》由会员分享,可在线阅读,更多相关《文献信息检索的方法和途径.ppt(50页珍藏版)》请在三一办公上搜索。
1、第 2 章 文献信息检索的方法和途径,2.1 信息检索:查找符合特定需要的信息的过程。信息的来源:自然界人类社会 信息资源的分类,体载信息资源实物信息资源文献信息资源网络信息资源,体载信息资源:存在于当事者的头脑中,通过口语、体语传递的信息资源。特点:不易保存。获取方式:参加学术会议、报告、辩论会、沙龙等。实物信息资源:存在于实物当中(产品、模型、样机、化学药品),需通过观察、解剖、测试、化验等手段才能得到相关的信息。特点:直观、真实。获取方式:参加展览、博览会。,文献信息资源:存在于文献中,通过阅读、视听获得。是收集、获取和整理信息资源的主要来源。图书 期刊科技报告 会议文献专利文献标准文献
2、政府出版物(一般单独成学位论文 册,有些不公开发表,产品资料 难于获取。)技术档案,连续出版物,特种文献,网络信息资源:(数据库)存在于网络中,通过上网获取。特点:丰富、覆盖面广,超文本、超媒体、集成地提供信息,来源分散、无序、难以控制,方便、及时、快速和交互性。优越性:廉价,新颖、深入,广泛、直接交流,非正式和自由发表的园地。,因特网上有哪些信息,1、政府信息 2、科研信息 3、教育信息 4、文化信息 5、休闲娱乐信息-最成功的领域 因特网上不可能有的信息 1、有关企业、公司的战略发展规划 2、商业性数据,2.2 文献检索:,将众多的文献按一定的规律排列、储存起来,并查找出符合特定需要的文献
3、的全过程。2.2.1 文献检索的对象,事实检索 数据检索 书目检索 全文检索,事实检索以事实为检索对象,查找有关个别性的知识或信息。,文字类词语类语句类器物类史事类时间类地理类人物类机构类10.典制、约章类,数据检索以数据为检索对象,从文 献中查找所需的的数据资料,1.统计数据2.调查数据3.实验数据4.标准数据,书目检索以文献资料为检索对象,围绕特定研究课题利用书目、索引、文摘等进行检索,1.收集有关课题研究的现有成果2.收集有关课题的原始资料3.收集与课题相关学科成果的文献全文检索以文献原文为检索对象 从文献中查找所需的的章节或某一知识单元以及字、词在该文献中的出处。,2.2.2 文献检索
4、的意义和作用,开发利用信息资源,提高经济效益 再学习的工具,可防止自身知识老化 节省时间和资金 避免重复研究及资源的浪费,全面性 尽可能全面地查检有关该课题的文献资料。尽量做到不遗漏、查全率高。准确性 对所查资料针对课题的需要进行适当的鉴别、考证,以求准确、翔实、可靠、无误。,2.2.3 文献信息检索的基本要求,快速性 快速性是文献信息检索中的一个非常重要的问题。为了提高检索速度,检索者不仅要具有文献信息检索知识,熟悉各类检索工具,还要具备必要的检索技能,会利用各种先进的现代化检索设施。灵活性 通过不同的检索途径和方法,灵活运用各种检索工具,多角度进行检索,才能达到全面、准确、快速获得所需文献
5、资料的目的。,2.2.4 文献检索的类型,一、手工检索 用手直接翻检纸质检索工具(书目、索引、文摘等查找文献资料的工作过程。)优点:不需要附加设备,又符合人们传统的阅读习惯,能长期保存,随手可用,免去了机检中经常发生的数据丢失、乱码、不兼容等麻烦。二、计算机检索 利用计算机存贮与查找文献资料的工作过程。优点:节省人力和时间,大幅度提高工作效率;检索点多,组配灵活:内容更新快;不受馆藏与地域的限制;节省空间。,2.2.5 文献检索的方法与途径,文献检索的方法:1.浏览法 定期浏览阅读本专业或本学科的核心信息,及时了解本学科发展的动态和水平。2.常用法 直接利用检索工具来查找文献的方法。顺查法:以
6、检索课题的起始年代为起点,按时间顺序由远 近地查找。倒查法:是一种逆时间由近 远查找文献的方法。抽查法:是针对研究课题发展特点,抓住学科发展迅速、发表文献较多的一段时期,(即文献高峰期),逐年进行查找的一种方法。3追溯法:又叫回溯法,是利用现有文献后面的参考文献由近 远进行追溯查找原文的方法。4综合法:是常用法和追溯法两种方法的综合。它可得到较高的查全率和查准率。,文献检索的途径:1分类途径:利用分类目录和目次表检索文献。这一方法可把同一学科的文献信息集中检索出来,但新兴学科、边缘学科的文献易造成误检和漏检。必须掌握学科的分类体系。2主题途径:按照文献信息的主题内容进行检索。如:关键词 3题名
7、途径:按照书名、刊名查找文献。如:书名目录刊名目录等。4蓍者途径:通过著者姓名检索某作者对某一专题研究的主要文献信息。5代码途径:按已知号码来查找文献的途径。如专利文献按专利号、标准文献按标准号、科技报告按报告号、期刊可按国际标准刊号ISSN、国内统一刊号、邮发代号等查找。,2.2.6 文献检索的步骤与效果,文献检索步骤:1.分析研究课题分析主题内容 根据课题内容要求,找出关键词。分析问题类型 一般来说自然科学领域的研究分为:基础研究 寻求对自然界的认识 所属信息类型侧重专 著、学术期刊论文、学术会议论文及原始性的科学考 察、实验和述评等;应用研究 应用和开发研究属于解决应用工程技术问题,所需
8、文 献侧重于科技图书、技术性期刊、报告、专利、手 开发研究 册、标准、样品和产品目录等。如:自然科学领域的研究分为:分析查找年代 通过分析查找年代,获取学科发展的历史背景,如初期、高峰期和稳定期,高峰期的信息一般较多,可重点查找,以便节省时间和精力。,2.确定检索工具,首先必须对各种检索所覆盖的学科范围有清楚的了解,然后从信息的类型、文种、发表时间等方面来考虑选用检索工具。选择检索工具应考虑以下四个方面的因素:1.学科、专业范围;2.信息类型;3.文种;4.课题内容。对类型相似的检索工具,不仅要注重权威性的综合性检索工具,而且还要注意选择针对性强的专业性检索工具。,3.选择检索方法,(1)根据
9、检索工具的条件 在没有检索工具的情况下,可采用追溯法。在检索工具较齐全的情况下,可采用常规法和综合法,这两种方法的查全率、查准率都较高。,(2)根据检索课题的要求,科研主题复杂、研究范围较大、研究时间较长的科学研究以查全、查准为主。应采用顺查法。新兴的课题研究以快、准为主。宜用倒查法。学科处于兴旺发展时期,信息发表得特别多,则在该时期内采用抽查法检索效果好。,(3)根据学科发展特点,课题属于年轻学科,起始年代不太长,一般采用顺查法(也可采用倒查法);课题检索属于较老课题,起始年代较早或无从考察,则可采用倒查法;有的学科在一定的年代里处于兴旺发展时期,信息发表得特别多,则在该 时期内采用抽查法检
10、索效果好。,4.确定检索途径和检索策略,确定检索途径 若所需文献范围较广,选用分类途径较好;若检索专指性较强,即所需文献比较专深,则选主题途径为宜。确定检索策略 根据课题研究的特点和检索要求制定检索策略。选择检索方法、检索工具以及检索范围(专业、时间、语种、文献类型等),其中最关键的是确定检索标识,如关键词、主题词、分类号、作者、作者单位等。,5.实施检索并调整检索策略,6.索取原始文献 当查到研究课题的相关信息后,判定是否符合检索需要,如符合需要,则要准确记录下题名、作者、出处、以获取原始文献。,检索步骤如图所示:主题词、分类号、作者 分析研究课题、制定检索标识 利用检索 工具书、索引、文摘
11、工具 查找文献线索 调整 检索文献检索策略 索取原始文献(借阅、复制、远程传输、下载)。,2.2.7 文献检索的效果,1.检索效果的评价指标 收录范围 查全率 两个最重要的指标 查准率 响应时间 用户负担 输出形式,2.提高检索效果的措施(1)提高检索工具或检索系统的质量(2)提高用户利用检索系统的水平,最大限度 地发挥检索系统的能力(3)合理调整查全率和查准率 如:申请专利、科技查新、开题、立项要求查全率高,检索 新课题,查准率要求高。,3.如何提高查全率?,选择上位词和相关词;如:查找关于孙中山的文献,先用孙中山查,再用孙文、国父查找。进行族性检索 用分类检索增加检索途径。4.如何提高查准
12、率?提高专指度(用下位词或换专指性强的自由词)用文献外部特征限制输出结果;(题名途径、著者途径、号码途径、其他途径:分子式、动植物索引、药物名称等)。用“二次检索”、“条件检索”排除误检。,2.3 计算机检索的原理与步骤,介绍内容:计算机检索概念和发展历程计算机检索的基本技术计算机检索步骤计算机检索的发展趋势,2.3.1 计算机检索概念和发展历程计算机检索概念 计算机检索:是通过计算机(单机、网络)可以查找、利用各种信息资源。包括图书馆的公共书目(OPAC-Online Public Access atalogue)、各种联机数据库、Internet上的信息资源等。,计算机检索的发展历程 脱机
13、检索 联机检索 国际联机检索 单机光盘检索 光盘网络检索 Web信息资源检索,(1)脱机检索(50年代末60年代中期)这时是计算机检索的原始时期。只能进行简单的检索。为满足专业检索人员定期批量处理用户的情报要求。用户不能立刻获得检索结果。,(2)联机检索(60年代末70年代初)1963年-1964年间,美国洛克希德导弹与宇航公司的情报实验室建立了”人机“对话的联机情报检索系统(DIALOG的前身),此后在60年代末到70年代初联机检索系统得以快速发展。国际著名的DIALOG系统、ORBIT系统、MEDLINE系统都是从这个时期发展起来的。用户可随时浏览检索结果由于这个阶段的计算机网络主要是通过
14、电话线联接,因而联机检索受到地区的限制,(3)国际联机检索(70年代中期)卫星通讯技术的出现,使得联机检索系统打破了地域限制。而数据库生产的迅速发展及微机大量的涌现,更使得国际联机检索蓬勃发展。联机检索系统进入发展的黄金时期。实现了人类情报资源的共享。,(4)单机光盘检索(80年代-)CD-ROM技术促使计算机检索成本迅速下降(一张光盘可存贮600MB兆字节机读数据、成本价格便宜,而一张DVD光盘的容量最少可达4.7G)(5)光盘网络检索(90年代)光盘网络是一种计算机网络,如图书馆局域网 实现多用户光盘资源共享,(6)Web信息资源检索(90年代末)进入90年代后,随着网络技术的发展,尤其是
15、互联网的迅猛发展,使计算机检索进入一个崭新的时期。检索方法更简单,检索结果更全面 2.3.2 数据库检索概念 数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也是信息检索的重要资料来源。,数据库分类根据载体的不同,数据库可分为:联机数据库、光盘数据库、网络数据库根据数据库的内容与功能不同,数据可划分为:全文数据库(full text database)是存储文献全文或其中的主要部分的数据库。书目数据库(bibliographic database)是以文档的形式组织起来的、提供书目信息的数据库,包括各种目录、文摘与索
16、引数据库。,(3)图像数据库(image database)提供人们存储和检索图像及其文字说明资料的一种源数据库。(4)交易(执行)数据库(transactional database)是指各种用于交易的数据库,如股票、房地产交易数据库、中国科技成果交易数据库。(5)专利、标准、会议录数据库(6)视频数据库(提供视频信息的数据库。),2.3.3 计算机检索的基本技术,布尔逻辑检索(boolean logic)是当今检索理论中最成熟的理论之一,也是构造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过布尔逻辑算符来实现的,这些运算符能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂
17、概念的检索式,用以表达用户的检索要求。逻辑运算符有三种:与(AND)、或(OR)、非(NOT)逻辑运算符的优先顺序为NOT、AND、OR 如克林顿 and 莱温斯基;文学评论or文学研究;克林顿 not莱温斯基;,截词检索 截词检索就是使计算机保留检索词中的相同词干部分,允许检索词可有一定范围的变化。截词有前方一致、后方一致和中间截词几种形式。例:前方一致:cat?,可检索出cat,cats,catalog,category后方一致:?ther,可检索出mother,father中间截词,只替代一个字符,允许检索词中间有若干变化。例如wom?n,检索到woman、women,字段限制检索(fi
18、eld limiting)字段限定也是调整检索策略的一种重要手段。字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索的查准率。,2.3.4 括号检索(phrase search)用于改变运算的先后次序,括号内的运算优先进行。例:A AND(B OR C),2.4 计算机检索步骤,确定检索目标 选择数据库制定检索策略 上机检索 整理检索结果并对检索效率进行评价,确定检索目标1.明确检索的目的 明确用户是要查新、查参考资料还是查询论文被收录或引用情况等,以便对检索的查准、查全和时间范围的指标要求有一个大致的了解,从而制定出符合情况的检索策略。2.课题分析 对课
19、题内容进行分析,找出核心概念和隐含概念,排除无关的概念,明确概念之间相互的逻辑关系。,3.选择数据库根据检索目标分析所确定的检索目的、涉及的学科范围和信息类型,选择合适的数据库。具体选择过程中还应考虑数据库的类型(参考、全文还是电子期刊)、内容(专利、标准、会议)、收录的数据学科范围、数据库的更新周期,收录文献的语种等因素。例如,要看全文就要选用全文数据库或电子期刊;要查标准或专利就要选择标准库或专利库,4.制定检索策略考虑运用顺查法,倒查法,追溯法,还是综合法 上机检索(1)输出篇数过多时 此时多数是由误检造成的,原因主要有以下几点:1)没有对检索词进行限制。包括字段限制,时间限制,分类限制
20、等。2)主题概念不够具体或具有多义性导致误检。例如,仅使用mathematics进行检索结果很多,将概念具体化。,如:mathematics and economic 再如,检索世界贸易组织仅输入“WTO”,系统可能会检索出“World Tourism Organization”(世界旅游组织)3)对所选的检索词截词截得过短。例如,使用math?将有太多的检索结果。,(2)输出篇数过少时 此时多数是由漏检造成的,原因可能有以下几点:1)选用了不规范的主题词或某些产品的俗称、商品名作为检索词。例如,没有使用学名“马铃薯”而使用了俗名“土豆”又如,没有使用“表面活性济”而使用了商品名称“迪恩普”,都会造成漏检。2)同义词没有充分考虑。例如,“检索物理化学”,没有考虑到“物理有机化学”,“物化”等同义词,导致漏检。,2.5 计算机检索的发展趋势,可视化 相对于纯文本,图像的表达方式生动、形象,从多角度揭示主题。简单化 多样化(1)提供多媒体检索功能(2)多语种检索(3)服务多元化,个性化 例:Google在”My Preference”中根据用户个人偏好对检索用语种、网站语种进行设置,还可将检索范围限制在商业网站、教育网站、政府网站等域名中。商业化 网络检索系统拥有全世界数量众多的用户,吸引了大量的广告,为电子信息的增值服务。网络检索系统已成为新的投资热点。,