信息检索的思路、方法与技巧张红凌.ppt

上传人:小飞机 文档编号:5230018 上传时间:2023-06-16 格式:PPT 页数:81 大小:345.99KB
返回 下载 相关 举报
信息检索的思路、方法与技巧张红凌.ppt_第1页
第1页 / 共81页
信息检索的思路、方法与技巧张红凌.ppt_第2页
第2页 / 共81页
信息检索的思路、方法与技巧张红凌.ppt_第3页
第3页 / 共81页
信息检索的思路、方法与技巧张红凌.ppt_第4页
第4页 / 共81页
信息检索的思路、方法与技巧张红凌.ppt_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《信息检索的思路、方法与技巧张红凌.ppt》由会员分享,可在线阅读,更多相关《信息检索的思路、方法与技巧张红凌.ppt(81页珍藏版)》请在三一办公上搜索。

1、信息检索的思路、方法与技巧 张红凌,信息,最初的含义是指音信和消息,南唐李中暮春怀故人诗“梦断美人沉信息,目穿长路倚楼台”及宋代陈亮梅花诗“欲传春信息,不怕雪埋藏”中的信息就是这个概念。随着社会的进步和科技的发展,信息远远超出了原先的含义,是指通过各种手段传递的一切符号,它已经成为我们使用频率最高的词汇之一。,信息检索是一种专业性、学术性很强的工作,从它的内容、方法到手段都透析出非常强的科学性和学术性。通过越来越多的工作实践我们清楚的看到,信息检索过程不是一个单纯的技术性过程,它是一个包含有高效的思维活动在内的脑力劳动过程。因此,作为检索者本人所具有的思维方法与检索能力就显得尤为重要。,三咨询

2、工作几种有效的检索方法,二图书馆信息咨询所涉及的主要类型,一正确的思维方法对检索思路的影响,文献检索活动包含有两种知识结构在里面,一种是方法技能,也就是我们通常所说的工具书、数据库的使用和上网技巧,我们可以把它称之为“硬知识”,另一种是属于思维性、智能性的东西,即思谋,是选择检索方略和查寻手段的心智能力,我们把它称作“软知识”。在整个文献检索活动过程中,方法技能这种“硬知识”表露于外,正确的思维方法这种“软知识”作用于内,两者有机结合,相辅相成。,一正确的思维方法对检索思路的影响,1.正确的思维方法是开启检索思路的钥匙,2.正确的思维方法是构成检索者心智能力的 关键因素,3.正确思维方法贯穿于

3、检索活动的全过程,不少学者对人类思维的实际运动过程以及解决实际问题的过程进行过研究。总结这些研究成果,发现高效思维者与低效思维者思考过程的区别在于,前者思考问题条理清晰,后者则乱无头绪。高效的思维方法有哪些呢?,1正确的思维方法是开启检索思路的钥匙,逐步接近法,图表解析法,重新表述法,分割限定法,充分列举法,系列连环法,异常跳跃法,经过简单的步骤来解答难题;把问题划为几个部分,从而使问题的解答变的容易。从问题中归纳出简单的“如果那么”的关系,从而得到结论。,逐步接近法,画出简图、表格、图解以及其他形象化的图形来启发帮助你思考。,图表解析法,以你自己的语言、表达方式将问题或中间结论加以重新表述、

4、等值变化(推论),使你对问题理解得更清楚,使结论的获得更容易。,重新表述法,通过某些简化的推论或直接抛开无关因素来缩小问题的范围,就像放一个篱笆在问题的周围,使它同无关因素隔开,使其范围得到限定,问题的解答自然变的更加清晰,容易。,分割限定法,简单地但不能有遗漏地列举出所有你在寻找答案时应当加以考虑的各种方案、各种可能性、各种情况、各种安排、各种组合等。,充分列举法,把各种可选择的方案,以及可能派生出来的方案按一定的逻辑关系整理出来。或按时间的序列,或按空间的序列,或按其他的某种关系,画出树形的图解或其他形式,使其系统全面的连环起来。以便于你去追踪、考察,说明所有已知的、看起来有可能的办法和答

5、案。,系列连环法,遇到异常的,或走不通的路,或路太“漫长”,应及时停下来,重新考虑你的思路;跳跃到完全不同的思路,完全不同的观点或方法上重新开始思考;扩大视野;把那些不寻常的、奇特的思路也包括进去。有时要借助于创造性思维、形象思维的跳跃来达到目的。,异常跳跃法,优秀的思维方法对开拓检索思路有着出奇制胜的作用。检索思维就是要训练对各种纷繁复杂的信息现象背后本质规律的认知、洞悉,在不断的检索实践中,及时调整自己的思维方式和检索行为,使之得到进一步的完善。,所谓“检索能力”,它不仅表现为使用“工具”的技巧能力,更是反映人们在检索文献,利用信息过程中那种善于探悉谋划、选优择佳的心理品质。检索思维是指检

6、索者以已有的知识、经验为中介,进行分析、推断和解决问题的心理过程,它显示检索过程个体思维的水平、能力和个性特征。检索者的水平和能力着重表现为个体思维的深广度与灵活性,而思维的深广度与灵活,又集中体现为检索思路的畅通性与开阔性。,2正确的思维方法是构成检索者心智能力的关键因素,所谓“思路”,是指人们思维活动的行进路线和程序。我们办任何事(如求学问、查文献),大体都有动手“做”与动脑“想”这相互结合的两个方面,欲“做”的好,就要“想”的顺,就要按照一定的目标、方向、路线进行合理而有序的思考。,检索文献,也是一个既“动手”(使用工具、翻检文献)又“动脑”(围绕“如何查”而进行的思考)的过程,在此过程

7、中,如果检索者的思路通达,那么检索就会顺畅而少阻塞;思路宽广,检索就会灵便而多收效。,纵观咨询活动的全过程,实际就是一个分析问题与解决问题的过程。从受理咨询课题到了解情况,查找文献,直至于解决问题,是一个完整的工作程序。而各阶段又具有不同的特点、方法与要求。,3正确思维方法贯穿于检索活动的全过程,在整个分析课题与文献检索的过程中,要求检索者手脑并用,开展活跃的思维活动,如分析与综合、联想与推断、比较与选择,既着重于抽象的逻辑思维,也需要生动的形象思维。而涉及的思维方式也是多种多样,如聚合或辐射、顺向或逆向、求同或求异等等。,事实性或知识性咨询,方法咨询,专题性或情报性咨询,二图书馆信息咨询所涉

8、及的主要类型,即查找具体的人物、事件、产品、数据、名词、图像等。这类咨询的特点一是范围广,涉及到科学、技术、社会、文化、生活等各个方面。二是特指性强,读者往往要求某一事实的具体信息,如市委政策研究室要查“99年全国规模以上企业工业总产值数据,其中国有工业、集体工业、股份合作制工业、外资投资工业、私营企业工业等数字”,某教师要查“古代三国时期疆域图”等。三是答案要具体,要能够切实解决读者的问题。,事实性或知识性咨询,解决读者在查找文献过程中,因不熟悉检索方法而遇到的困难。这类咨询的特点是主动性强,咨询人员可以充分发挥自己熟悉馆藏,熟悉检索工具的优势,给予读者检索方法的辅导。方法咨询还包括读者对网

9、络的使用、对各种数据库的使用及文检课的各种知识等方面的辅导。解答这类咨询要求咨询人员熟悉大学文检课授课内容,熟悉各种大型数据库的使用方法及计算机使用知识。,方法咨询,围绕读者提出的某一特定问题查找文献、文献线索及动态进展性情报。这种咨询的特点是系统性和回溯性强。由于是高校图书馆,这类咨询所占的比重很大,有些专题咨询的解答,实质就是一次科学研究过程。解答这类咨询要求咨询人员具有较好的专业知识水平和综合分析能力,更重要的是需要有良好的敬业精神。因为在物欲横流的社会中,这种“甘当人梯”和“为他人做嫁衣裳”的境界是需要有较崇高的精神来支撑的。,专题性或情报性咨询,检索方法就是实施检索策略,搜寻所得文献

10、信息的过程。如何查找,并没有一定之规可供遵循。同一个问题不同的检索者可能就有不同的查找方法,这是因为他们在主观上受到的实际经验、知识结构、对检索工具了解的广度和深度、认识问题的方法、心理品质等因素的影响;,三咨询工作几种有效的检索方法,在客观上又受制于检索工具、检索时间和物理环境等因素的影响。在实际工作中,我们注意到任何一种检索方法的使用,都不会是最完善、最全面的,它都需要有其他的方法、途径以及综合的思维来配合。我们通常所说查找信息的方法大部分是文献资料的检索方法。研究检索方法的目的在于寻求一种有效的方法,达到广、快、精、准地检索有用文献。我们在日常工作中,经常是将手工检索、计算机检索和专家咨

11、询等方法相结合进行。,1手工检索,2计算机检索,3实际工作中的一些方法,手工检索就是传统意义上的文献检索,它是咨询服务的基础与核心。,追溯法,常用法,分段法,1手工检索,利用文献著者在文献末尾所附的参考文献,进行追溯查找有关文献资料的方法。,追溯法,优点:这种方法在没有检索工具或检索工具不全的情况下,借助于原始文献引用的参考文献,跟踪追溯扩大检索范围,查得一批有关文献。,缺点:原文著者引用的参考文献是有限的,不可能列出全部有关文献,而且有的引用文献又与原文关系不大,用此方法查找文献比较费时,只适用于较为经典问题的查找和原始文献收藏较多的机构。,利用文摘、题录或电子数据库查找文献的方法,是文献检

12、索的有效手段和常用方法。有顺查、逆查和抽查三种情况。,顺查法,逆查法,抽查法,常用法,这是一种以课题起始年代为起点从远到近按时间顺序的查法。顺查法适应于主题复杂,研究范围较大,研究时间较长的课题。,顺查法,逆查法又称倒查法,与顺查法相反。这是利用选定的检索工具,由近而远的按时间逆序的查法。逆查法适用于新兴的学科或课题。,逆查法,抽查法就是针对学科发展特点,抓住该学科发展迅速及文献发表较多的年代,抽出一段时间再进行逐年检索的方法。使用这种方法检索效率较高,但必须在熟悉学科发展特点的情况下才能使用。,抽查法,也称“循环法”或“混合法”,实际上是常用法和追溯法的综合。在查找文献时,既利用检索工具查找

13、又利用文后所附参考文献追踪查找,两种方法分期分段交替使用。,分段法,计算机检索主要包括数据库检索和网络检索。由于计算机技术在社会生活中广泛使用,图书馆的信息检索咨询工作也发生了根本性的变化。我们如今的日常检索工作,除了在检索策略的制定上还需要传统信息检索的思路外,检索手段基本使用计算机检索。,2计算机检索,计算机检索概述,数据库基本知识,检索基本知识,利用计算机进行文献检索(简称“机检”),有三个必备条件:,硬件,软件,检索数据库,计算机检索概述,硬件,即计算机主机及配套使用的各种外围设备。,硬件,包括系统软件和应用软件。系统软件现在常用的有Windows98、WindowXP、Unix等等,

14、检索应用软件则非常多,每个检索数据库都有其配套应用软件,如维普期刊全文数据库的检索软件即为本身自带的阅读器,利用这个阅读器可以阅读数据库中的PTF格式的全文(PTF格式为国际通用格式)。,软件,假如我们把硬件比作图书馆的馆舍,把软件比作图书馆的管理人员,那么,数据库就好比是图书馆里装满图书的一间间书库。因此,数据库是机检的生命线。,检索数据库,检索数据库有不同的类型,各有不同的用途,现简介如下:根据数据库内容可分为全文数据库、目录数据库、事实数据库等等。,全文数据库,目录数据库,事实数据库,数据库基本知识,检索最终结果为文献原文。我馆的中国学术期刊全文数据库、维普中文期刊全文数据库、中宏数据库

15、、中国学位论文全文数据库就有此类数据。,全文数据库,又称书目数据库,检索最终结果的书目、索引或文摘,仅提供文献线索,读者根据所提供的线索查找文献原文。我馆的全国报刊索引数据库、万方数据资源检索数据库就有此类数据。,目录数据库,提供人物生平、机构状况等基本事实,如中国科技信息研究所研制的中国科研机构数据库、中国科技名人数据库。,事实数据库,检索途径,检索表达式,精确匹配和模糊检索,检索基本知识,数据库由一条一条记录集合而成,而一条记录又划分为若干字段。如中国学术期刊全文数据库存贮了我国自1994年以来发表在6,600多种报刊上的800万篇文献。一篇文献用一条记录来揭示,一条记录又划分为分类、题名

16、、著者、出处、年份、(题中)人名、主题等字段。其中大部分字段都是可检索字段,这些可检索字段,我们就称之为检索途径。,检索途径,一般来说,每个数据库都有多个检索途径,常用的有:篇名、作者、关键词、摘要、全文、出处、分类等。检索前用户要告诉计算机,以什么检索途径来进行检索。如果要查找篇名中含有某个词的文献,则检索途径选择“篇名”;如果要按文献的分类来检索,则检索途径选择“分类”。,确定检索途径后,就可以在检索式输入窗口中输入检索表达式。检索表达式可以是一个检索词或者是一个逻辑表达式。简单的检索只要输入一个检索词即可,复杂的检索则需要输入检索表达式。将多个检索词用布尔运算符组合在一起来进行检索,我们

17、称之为布尔逻辑检索。利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。,检索表达式,常用的布尔逻辑算符有三种,分别是:,用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。,逻辑或“OR”(+),逻辑与“AND”(*),逻辑非“NOT”(-),A+B,表示A或B中任何一个词存在都可以(当然A和B同时存在也可以)。“逻辑或”表达式,有助于提高查全率。,A,B,逻辑或“OR”(+),使用逻辑或可连接同一组面的多个同义词、近义词和相关词,扩大检索范围。如“计算机”OR“文献检索”,表示查找文献内

18、容中含有“计算机”或含有“文献检索”以及两词都包含的文献。例如某用户想查找研究杜甫的文献,检索途径选择题名后,输入“杜甫”,命中540篇。但考虑到研究杜甫的文献题名中未必都出现“杜甫”两字,也可能会出现“杜诗”、“李杜”,于是改用“杜甫+杜诗+李杜”表达式,结果命中608篇。,假设A和B是两个检索词,则A*B表示A与B必须同时存在。运用“逻辑与”表达式,可增强检索的专指性,缩小检索范围。,A,B,逻辑与“AND”(*),如“计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。例如用户想在题名中检索有关新闻美学的文献,如只输入“新闻”或“美学”,则命中文献太

19、多,且有许多不是自己所要的。如果输入“新闻*美学”,则检索出题名中同时含有“新闻”和“美学”的文献,检索结果大大缩小。,换一个角度看,“逻辑与”又能防止漏检。例如,用户输入“新闻美学”作为检索词,可命中戈公振的新闻美学实践这样的文献,但漏检了新闻的美学属性、新闻标题中的美学这些文献。如果用“新闻*美学”来进行检索,则上述三篇文献都检中。,A-B,表示A必须存在,但不能有B。“逻辑非”表达式,主要用于排除那些与检索意图无关的文献,增强检索的准确性。,A,B,逻辑非“NOT”(-),如“计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。例如我需要中国旅游

20、方面的资料,但不包括地图,检索式为:中国*旅游-地图,关于“优先级”问题 当布尔运算符在一个检索式中连续出现时,它们的“级别”是不同的。大部分数据库是这样规定的:-优先级最高,*次之,+最低。例如要查找研究唐宋诗歌的文献,可以用“(唐+宋)*诗”、“唐*诗+宋*诗”,而不能用“唐+宋*诗”。“唐+宋*诗”查找的是含有“唐”的文献或者同时含有“宋”和“诗”的文献,这样就把涉及到的唐代、唐姓的文献都找出来了。,不同的数据库,检索途径设定的检索规则有所不同,有的检索途径允许用户用“任意一致”的方式检索,有的只允许用“完全一致”或“前方一致”的方式检索。,精确匹配和模糊检索,“完全一致”即精确匹配,要

21、求输入的检索词,与数据库中的文献标识完全匹配,才能命中。如要查找作者“刘开扬”的文献,则必须准确输入“刘开扬”三字,如输入“刘开杨”或“刘开”,则不能命中。,“前方一致”属于模糊检索的一种。如在作者字段中输入“刘开?”便可查到作者“刘开”、“刘开扬”、“刘开强”的文章。又如以关键词为检索途径,输入“经济?”,便可查到“经济”、“经济法”、“经济学”、“经济预测”、“经济效益审计”等等。(注意,匹配符通常用“?”,但也有的数据库用“*”),“任意一致”是模糊检索中的最为自由者。如用篇名作为检索途径,输入“出版”,则可检出篇名中任一处含有“出版”一词的文献,如出版系统探讨、广东出版史概述、商务印书

22、馆与近代教科书的出版等。,检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。,从理论上看,读者咨询工作与检索工具的使用法是既有联系又有区别的不同规定的概念,二者不能等同。从实践上看,在读者咨询工作中,有一部分咨询是无工具可查的,需要直接查找,那么就存在一个方法问题,下面列举几种方法,供参考。,3实际工作中的一些方法,分析法,排除法,限定法,跟踪法,假设法,合取法,各方面的综合知识,是指对所提问题的对象分解为

23、各个部分,逐一加以考察研究。如我们接到一个研究生提出的咨询,需要关于“明清中国对外关系史”方面的资料,这个题目很大,但将它分解成许多小问题,如“明清对外政治史”、“经济史”、“文化史”、“军事史”、“外交史”等就比较好解决了。,分析法,是指对所询问的对象产生和存在状态在时间、空间上的外在的否定,由于这种外在否定的直接结果就在时间和空间上极大地收缩了范围。如我们要查一首七言律诗或一首词,了解到唐以前无律诗,唐五代以前无词。因此,利用排除法就可以从唐和五代查起,这样就缩小范围时间,省时省力。,排除法,是指对所查对象在状态、在时间和空间上加以内在的肯定(限定)。这是由于我们对所查对象存在的规定性有所

24、了解,将其限制在它存在的时间和空间中加以考察,集中了精力、集中了问题,容易得到事半而功倍的效果。,限定法,如某厂技术部门要查有关“锅炉设计”的资料,显然这一提问太含糊,须要弄清其特定需求,加以概念限定。经交谈,知道读者需要的是“90年代国际竖式旋风炉的研究情况”,据此,我们在检索时,就可以把学科范围限定在动力工程类,把文献主题限定在竖式旋风炉方面,把时间限定在90年代,空间则为世界各国,文献类型与文种不限。于是,我们选择国内编的动力工程文摘及有关书刊查寻,在很短时间为读者提供了百余篇题录索引。,当不能一次揭示问题的较深层次时,往往通过表层结构连续跟踪查找,从而达到较深层结构的方法。,跟踪法,如

25、查找“木秀于林,风必催之;堆出于岸,流必湍之;行高于人,众必非之”的出处及原文时,首先从诗词典故词典查出“木秀”词条,得出“木秀于林”为李康的命运论,李康何人也?再查中国人名大词典得知有(魏)李康、(宋)李康和(元)李康三人,到底是哪个李康?经过一系列查找,对宋、元两位李康的否定,最后在全上古三国六朝文找到(魏)李康命运论全文。这一系列的跟踪查找,就从不完整明确的表层结构达到了完整准确的最后结果。,运用联想与假设进一步扩大资料线索、深入查找的一种查检方法。在检索的过程中,有时会碰到运用已知或一般的方法得不到解决的情况。这时就需要开动脑筋,进一步运用联想与假设的方法,“由此及彼、去伪存真”,以扩

26、大查找线索,求的问题的解决。,假设法,例如,某读者编写著作时引用了一句马列主义经典作家的话:“有条件的相对的同一性的无条件的绝对的斗争性相结合,构成了一切事物的矛盾运动。”注明出于列宁的哲学笔记161页,现需要核对原文。这个咨询问题,初看起来囊中探物,一检即得。其实不然,查遍了哲学笔记,都没有找到这句话。我们有理由怀疑引文出处有误,可是到那里去找呢?这句话的主题讲事物的矛盾性,讲同一性和斗争性问题。我们很自然就联想到毛泽东的重要哲学著作矛盾论,假设就处于矛盾论,不妨试试查一番。果然在矛盾论的“矛盾诸方面的同一性和斗争性”这一节中,查到了所要找的这句话。,就是在不同资料中都没有一个系统、完整的资

27、料,因此我们就需要把各种资料当中的不同部分的记载取录下来加以汇集,从而构成一个完整的资料的方法。如有读者要求查东北的邮电史料,专门记载这方面的材料是没有的,我们就从奉天通志、北满概况、东北史地考略、中国近代邮电史等十余中书中将材料汇集而成,读者非常满意。这种方法就是合取法。,合取法,是指图书馆的工作人员应该了解各方面的知识,天文、地理、博古、通今,甚至音乐、美术等各方面的知识,这样才能更好的为读者服务。,各方面的综合知识,一次一位读者连续查找中国民歌选均没有找到他需要的东西,经过询问,他要找“红米饭,南瓜汤”这首歌。我们分析,这首歌的歌名肯定不是“红米饭,南瓜汤”,把歌哼一遍,里面有两句“毛委员和我们在一起,天天打胜仗”,对!歌名就是“毛委员和我们在一起”,“打胜仗”表示是部队歌曲,马上就从解放军建军五十周年歌曲选中查到。,当然,在检索过程中,所采用的方法是很多的,特别是在网络环境下的今天,资料信息的丰富和检索方法的快捷已经不能和往日同日而语。但是,要防止在检索过程中出现“纯工具论”,要用我们检索者充满智慧的头脑和娴熟的检索技巧来解决一个又一个的难题。,Thank You,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号