《文献信息检索基础知识.ppt》由会员分享,可在线阅读,更多相关《文献信息检索基础知识.ppt(108页珍藏版)》请在三一办公上搜索。
1、第一讲 文献信息检索基础知识,第一节 信息与信息素养 第二节 科技文献的类型 第三节 信息检索与文献检索工具 第四节 信息检索原理 第五节 信息检索的方法和途径 第六节 信息检索常用技术及检索效果评价,第一节 信息与信息素养,一、信息的基本含义,1、图书馆学和情报学领域,信息被定义为事物或记录。2、综合学术界对信息的定义,可以认为信息是以物质介质为载体,传递和反映世界各种事物存在方式、运动规律及特点的表征。,从生产力的角度可以将人类社会划分为四个发展阶段:原始社会、农业社会、工业社会和信息社会。信息社会的主要标志是信息与知识成为社会最重要的基础性资源。,(一)信息与社会,在人类漫长的发展历程中
2、,物质、能量、信息三种资源支配着人类最基本的生产活动。物质-向人类提供材料及生活必需品 信息-向人类提供知识和智慧 能量-向人类提供动力 信息社会的主要标志是信息与知识成为社会最重要的基础性资源。,1.客观性2.时效性3.载体性4.传递性5.可塑性6.共享性7.可开发性8.可增值性,(二)信息的基本特征,一个完整的信息传递过程必须具备信源(信息的发出体)、信宿(信息的接受体)、信道(信息的传递媒介)和信息四个基本要素。,1.知识知识是人们对客观事物的认识和经验总和。知识与信息的关系:知识是信息的一部分,不直接等同于信息;知识是人类大脑活动的产物,是系统化、精炼化的信息。2.情报情报是传递中的有
3、用的知识或信息,是为解决特定问题所需要的知识。,(三)与信息有关的基本概念,3.文献文献是记录知识的一切载体。三个基本要素:,1)文献含有知识信息;,2)负载知识信息的物质载体;,3)记录知识信息的符号和技术;,二、什么是信息素养,信息素养有广义狭义之分。广义指信息社会对个人品质、道德观念、知识体系和能力要求的总合,或信息时代国民应有的素质,包括品质和能力两个方面。狭义指获取信息和使用信息的能力与品质。美国信息产业协会主席保罗.泽考斯基(Paul Zurkowaski)1974年在美国全国图书馆与情报学委员会上,最早提出了信息素养的概念,他把信息素养概括为:“利用大量的信息工具及主要信息源使问
4、题得到解答的技术和技能。”,信息素养为什么重要,在科技飞速发展、信息资源激增的当今时代,信息素养越来越显示其重要性联合国教科文组织(UNESCO)2003年把信息素养定为终身学习的基础和未来公民的必备能力之一国外发达国家早已把信息素养融入到自己的教育体系中,而我国在信息素养教育领域尚处于探索和起步阶段我国教育界在面向21世纪教育振兴行动计划中明确提出到2010年在全国建立起终身学习体系,信息素养是终身学习的条件。,IL的简明定义,To be information literate,a person must be able to recognize when information is n
5、eeded and have the ability to locate,evaluate,and use effectively the needed information.具有信息素养的人能够知道什么时候需要信息,能够有效地获取、评价和利用所需要的信息。美国图书馆协会ALA,1989发现、检索、分析、评价与利用信息的 技能或能力。,信息素养的主要内容,信息意识信息技能信息评价及利用信息安全及信息道德,信息意识,研究策略信息需求对新信息的敏锐,时刻追求新知识的热情提高学生的信息关注程度,信息技能,信息源:了解信息如何产生及其传播途径;了解各种不同的信息源及其特征;选用适当的信息满足个人的信
6、息需求。信息检索策略:分析个人的信息需求,检索并利用基本的信息制定信息检索策略,识别重点概念并提练检索用的关键词,利用基本检索技巧构建检索式,将课题或是问题纳入一个合适的研究范围内。检索路径:查找图书目录,期刊索引,中外文电子文献数据库,有效的网络搜索信息获取的能力和技巧。,信息评价及利用,信息评价的重要性信息评价的准则:对获取的信息进行辩识、选择,创新知识的能力,养成批判性地分析、评价信息资源的能力(评价指标:准确性、权威性、时效性、经济性、易获取性)对信息的分类、整理、保存、创造性地利用等。,信息安全及信息道德,对于网络安全和计算机犯罪的认识、对计算机病毒的防范行为等;继承已有的知识成果,
7、尊重知识产权,不抄袭剽窃,培养学生用一定的信息伦理与道德准则规范自身行为的能力;(例如:不标注参考文献),IL是一种基本能力,“21世纪的能力素质”的5个方面:基本学习技能(指读、写、算)信息素养 创新思维能力 人际交往与合作精神 实践能力 美国教育技术CEO论坛 2001年第4季度报告,IL是一种综合能力,信息素养需要诸多知识背景;信息素养需要信息技术的支持,信息技术是它的有力的工具;信息素养是一种信息能力;信息素养是一种了解、搜集、评价和利用信息的知识结构。,IL在中国的研究和实践,信息素养概念在20世纪90年代中期被介绍到中国国内。1997年起,开始有论文发表。2002年8月,教育部高校
8、图书情报工作委员会第三次会议上,信息素养教育成为一个重要的讨论议题。将以文献检索课为核心的高校图书馆用户教育发展为信息素养教育,已在图书馆界达成共识。,IL在中国的研究和实践,IL在我国的基础信息用户教育新生入馆教育图书馆参观与导读帮助读者熟悉图书馆资源和各种服务。专题讲座与培训帮助读者掌握专门检索工具的使用。文献检索与利用课帮助学生学习和应用检索知识。国家教委在1982年发出正式文件,高校应开设文献检索和利用课程,第二节 科技文献的类型,一、文献的主要类型,(一)按载体类型分:印刷型、缩微型、电子型、声像型(二)按出版类型分:图书、连续出版物、特种文献(三)按加工深度分:一次、二次、三次,(
9、一)根据文献的载体形式划分,印刷型,缩微型,电子型,声像型,图 书,连续出版物,资 料,缩微平片,缩微胶卷,缩微胶片,磁带、磁盘,光 盘,联机网络版,录音带、录像带,唱片、幻灯片,电影胶卷,印刷型文献,载体:纸张实例:教科书记录手段:油印、石印、铅印、胶印、复印特点:可直接阅读,方便 使用;但难于实现机 械化和自动化;收藏 文献占用空间大。,利用纸张为存储介质,以手写、印刷为记录手段而产生的文献。包括油印、铅印、胶印、复印等印刷品及手稿。,缩微型文献,载体:感光材料 实例:缩微平片、缩微胶片记录手段:光学缩微技术特点:体积小;价格低;不能直接阅读,是以感光材料为存储介质,利用缩微照相技术使文献
10、缩微化的文献。,声像型文献,载体:磁性材料、感光材料实例:录像带、幻灯片记录手段:磁记录、光学技术特点:直观、生动、形象;成 本高;不易检索和更新。,以磁性或感光材料为存储介质,利用特定的设备及技术,直接记录声音、图像信息的文献。,电子型文献,载体:磁性材料实例:磁盘、光盘记录手段:计算机输入特点:存储密度高、速度快;易复制;成本高;不能 直接阅读。,以电子数据的方式将图、文、声、像等信息存储在磁光介质上,通过网络通信、计算机或类似设备再现的信息资源。,按出版形式及内容的不同,图 书,连续出版物,特种文献,科技报告会议文献政府出版物专利文献标准文献产品资料学位论文,期刊报纸,(二)根据文献的编
11、辑出版形式划分,图书的含义,凡篇幅达48页以上并构一个书目单元的文献称为图书。,国际标准书号(ISBN),国际标准书号(ISBN)(International Standard Book Number)每一种正式出版的图书的唯一标识代码,是专门为识别图书等文献而设计的国际编号。例如:信息检索原理与方法教程,赵岩碧主编,化学工业出版社,2005年3月出版。其ISBN号为:7-5025-6431-4 ISBN 7-5025-6431-4(旧号)ISBN 978-7-5025-6431-5(2007年后出版图书采用的新号)第一段:978是由国际物品编码(EANUCC)系统专门提供给国际ISBN管理系
12、统的产品标识编码。第二段:7 语区号,代表国家、地区、语种如0和1英,2法,3德,4日,5-俄,7中,88-意大利,9971-新加坡第三段:5025 出版社代号,由国家或地区ISBN中心分配;第四段:6431 出版图书号,由出版社按出版顺序所给;第五段:校验位,期 刊,期刊又称杂志,它是指采用统一名称定期或不定期出版的连续性出版物。,国际标准刊号(ISSN),国际标准连续出版物号(ISSN)正式出版的期刊有ISSN代码,即国际标准连续性出版物编号,是国际连续出版物数据系统国际中心为在该系统登记的连续出版物分配的号码。采用ISSN编码系统的出版物有期刊、会议录等。如:中国图书馆学报国际标准刊号:
13、ISSN10018867全长8位,前7位为刊名代号,末位为校验位,期刊的特点,A、期刊以品种为单位形成知识流;B、报道文献速度快,内容新颖,能及时反映世界科 技水平,但不如图书成熟;C、品种多,数量大,覆盖了人类所以知识领域及各 学科专业,具有很强的容纳性。D、科技期刊 是最重要的一次文献。,核 心 期 刊,*少数刊载某一学科大量高质量专业论文的期刊。*特点(1)刊载专业文献密度高,信息含量高;(2)水平较高,代表本学科的最新发展水平;(3)出版相对稳定,所载文献寿命较长;(4)利用率和被引率较高。目前,许多单位核心期刊的判定是以 中文核心期刊要目总览为标准,是以报道新闻及评论为主,出版周期比
14、期刊更短,多为活页性连续出版物。其特点是内容丰富、信息量大、出版迅速、发行量大、读者众多。,报 纸,科 技 报 告,科技报告是科技工作者对科学、技术研究结果或研究进展的记录。,科技报告的特点(1)反映新的科研成果迅速;(2)内容多样化;(3)质量参差不齐;(4)保密性强;(5)每份报告独立成册,有连续编号。,会议文献,会议文献是指在各种会议上宣读、交流的论文、报告及其它有关文献。,政府出版物,政府出版物是指由政府机构制作出版或由政府指定出版商出版的文献。,政府出版物的类型(1)行政性文件(2)科技文献,专 利 文 献,专利文献是指实行专利制度的国家申请、审批专利过程中所产生的专利申请书、说明书
15、及官方文件或出版物。其中最重要的是专利说明书。,标准文献,与标准化活动有关的一切文献都称为标准文献。其主体是标准,还包括标准形成过程的各种档案、宣传推广标准的手册及其它出版物。,标准是按规定程序制订,经权威机构公认或主管部门批准的在特定范围内执行的规格、规则、技术要求等规范性文件。,产 品 资 料,指厂商为推销产品而印制的各种宣传资料、技术资料。如公司介绍、产品目录、样本、说明书等,它反映厂家、公司及产品的有关信息,对产品采购,仪器设备的维护、使用及新产品开发具有重要价值。,按文献的加工深度分,一次文献,二次文献,三次文献,(三)不同加工层次的文献信息,一 次 文 献,*作者以自己的研究成果为
16、基础创作或撰写,并通过某种渠道而公开的文献;*对知识的第一次加工;具有创造性;*大多数期刊论文、科技报告、学位论文、会 议文献、专利文献、技术档案等。,*对一次文献进行浓缩、整序及加工处理而成 的具有报道和检索作用的文献;*对知识的第二次加工;有序化;提供一次文 献线索;*目录、题录、文摘等检索工具。,二 次 文 献,*指从一次文献中提取数据、事实和有关结论,并经过综合分析与重新组合而编写的文献。*对知识的再加工;提供文献检索;*综述、专著;字词典、百科全书,三 次 文 献,一次文献是检索的对象(目标)二次文献是检索的工具(手段)三次文献是情报研究的成果(检索目标+检索手段),从检索的角度来看
17、,一次、二次、三次文献三者之间的关系,从知识加工角度来看,一次、二次、三次文献三者之间的关系,从一次文献到二次文献、三次文献是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走想有序、由一种有序结构演变为另一种完善的有序结构的过程。,第三节 信息检索与信息检索工具,一、信息检索的定义及类型(一)信息检索的定义广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。全称为“信息存储与检索”。狭义的信息检索:指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。人们多用“文献检索”的概
18、念,强调了检索对象。,(二)信息检索的类型1、按检索内容划分:文献检索、数据检索、事实检索2、按信息检索手段划为:手工检索、计算机检索3、按信息组织方式划分:全文检索、超文本检索、超媒体检索,第四节 信息检索原理,将文献检索标识与文献存贮标识进行类比,二者若取得一致(即二者匹配),就可将文献库中符合检索提问要求的文献取出来。,信息检索的原理,简而 言之,检索标识,存贮标识,匹配,检索命中,将文献检索标识与文献存贮标识进行类比,二者若取得一致(即二者匹配),就可将文献库中符合检索提问要求的文献取出来。,检索过程分析,检索者,检索系统,信息源(大量信息)充分标注(检索语言)可检索(检索技术、规则等
19、)可显示(屏幕显示或打印)信息之间的连接等,表达需求,反馈结果,信息检索的本质,实际上就是信息集合与需求集合的匹配与选择。,第五节 信息检索的方法和途径,(一)信息检索语言,检索语言主要有:,1、分类语言:以学科体系为基础,将各种概念按学科性质进行分类和系统排列,并用分类号予以编排组织成一个完整的体系。2、主题语言:用词语来表达各种概念,即用规范化或未规范化语言中的名词、名词性词组或短语作为主题词,来表达各种概念,将各种概念不管其相互关系,完全按字顺排列。3、号码语言:按文献代码,如专利号、标准号、报告号等的顺序排检。,中图法体系结构:,基本部类(5个)基本大类(22个)1马列、毛泽东思想:A
20、 马列、毛泽东思想2.哲学:B 哲学3.社会科学:C 社会科学总论;D 政治、法律;E 军事;F 经济;G 文化、科学、教育、体育;H 语言、文字;I 文学;J 艺术;K 历史、地理4.自然科学:N 自然科学总论;O 数理科学和化学;P 天文学、地球科学;Q生物科学;R 医学、卫生;S 农业科学;T 工业技术;U 交 通运输;V 航空、航天;X 环境科学、劳 动保护科学(安全科学)5.综合性图书:Z 综合性图书,中图法22大类是基础,每一大类下根据学科的具体内容层层细分为二级、三级、四级类目,这逐级划分下去就形成了等级分明的科学系统。如:O 一级类目 数、理、化 O1 O3 O4 O6 O7
21、二级类目 数学 力学 物理化学 晶体 O11O12 O13 三级类目古典数学 初等数学 高等数学 O121 O122 O123 O124 四级类目 算术 初等代数 初等几何 三角,中图法全称为“中国图书馆分类法”所有图书按中图法编制成相应的索书号进行排架,什么是关键词直接选用文献中的自然语言作为基本的词汇,出现在文献标题(篇名、章节名)、摘要和正文中,能揭示和描述文献主题内容具有实质意义的的那些词语,且不加规范化处理。,(二)文献信息检索方法,常用法回溯法循环法,常用法(又称工具法),1.顺查法:由远及近,从后向前。,如:已知某研究课题的最初产生年代(1990),了解 发展过程,从最初的年代(
22、1990)开始,逐步往近期查,2.倒查法:由近及远,从前向后。一般查1-5年,重点:在近期文献,只要查到基本满足需要为止。,3.抽查法:是抓住某学科发展迅速,研究成果发表较多的时期,进行重点检索。,前提:熟悉学科发展特点。,指直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。,回溯法(引文法),回溯法是指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地回溯查找“引文”的一种最简便的扩大情报来源的方法。它还可以从查到的“引文”中再回溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。,优点:,在没有检索工具或检索工具
23、不全的情况下能借助一些引文索引,述评或专著的参考文献查找。,缺点:,查得的文献不全面,比较陈旧。,循环法(又称为分段法),它是把上述两种方法加以综合运用的方法,既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行回溯检索,分期分段地交替使用这两种方法。,(三)文献信息检索途径,分类途径主题途径著者途径其他途径,1.分类途径,分类途径是指按照文献资料所属学科(专业)类别进行检索的途径,它所依据的是检索工具中的分类索引。分类途径检索文献关键在于正确理解检索工具的分类表,将待查项目划分到相应的类目中去。,2.主题途径,主题途径是指通过文献资料的内容主题进行检索的途径,它依据的是各种主题索引或
24、关键词索引,检索者只要根据项目确定检索词(主题词或关键词),便可以实施检索。主题途径检索文献关键在于分析项目、提炼主题概念,运用词语来表达主题概念。主题途径是一种主要的检索途径。,3.著者途径,著者途径是指根据已知文献著者来查找文献的途径,它依据的是著者索引,包括个人著者索引和机关团体索引。,4.其他途径,其他途径包括利用检索工具的各种专用索引来检索的途径。专用索引的种类很多,常见的有各种号码索引(如专利号、入藏号、报告号等),专用符号代码索引(如元素符号、分子式、结构式等),专用名词术语索引(如地名、机构名、商品名、生物属名等)。,课堂讨论题:找一些有关翻译技巧的书刊,用馆藏查询的哪些途径可
25、以获得?,(四)文献信息检索步骤,文献信息检索是根据课题的要求,利用检索工具,按照一定的步骤和方法查找文献信息的过程。完成这个过程一般需要经过五个基本步骤:,1、分析课题与确定检索要求2、选择检索方式与检索工具3、确定检索途径与方法4、优化检索提问与策略5、整理检索结果6、获取原文,第六节 信息检索常用技术及检索效果评价,一、信息检索常用技术,布尔逻辑检索截词检索位置检索字段限制检索,1、布尔逻辑检索,在计算机文献检索中,用户的检索需求是通过检索提问式表达的,用逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。布尔逻辑运算符
26、:系统中采用的逻辑组配算符是布尔代数中的逻辑运算符AND/*(与)、OR/+(或)、NOT/(非)。(1)AND 或*算符 实现逻辑“与”组配,检索时,命中信息同时含有两个概念,专指性强。如:traffic AND control,(2)OR 或+算符 实现逻辑“或”组配,(3)NOT 或 算符 实现逻辑“非”组配,检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围比AND扩大。如:railway OR railroad,命中信息包含逻辑A、不包含逻辑B或同时有A和B的,排除了不需要的检索词。如:fruit NOT apple,布尔逻辑算符优先顺序,执行优先顺序通常是:NOT
27、ANDOR。优先处理算符-“()”。与布尔逻辑算符搭配使用调整逻辑运算符的运算顺序,使某些算符优先进行逻辑匹配。,课堂讨论题:试分析以下检索内容,利用布尔逻辑算符,构建出相关的检索式1、检索数控机床的产品信息的相关文献 2、检索计算机算法或计算机程序语言的相关文献 3、检索除因特网之外的计算机相关文献 4、检索工业模具设计与制造的相关文献,2、截词检索,截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这个截词所有字符(串)的记录,系统都为命中。截词检索主要是利用检索词的词干或不完整的词形进行检索。截词检索在西文数据库中广泛使用。是在词干后可能变化的位置加上截词
28、符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既可减少检索词的输入量,又可扩大查找范围,提高查全率。按截词位置分:前截断、后截断、中间截断、左右截断;按截词的字符数量分:有限截词、无限截词。“?”、“*”表示截词的截断符号,各检索系统有不同的规定,没有统一标准。,前截断在检索字符串前方(左方)截断有限或无限的字母。如:输入*chemistry 可检出:microchemistry(微量化学)macrochemistry(常量化学)abiochemistry(无机化学)iatrochemistry(化学疗法)这种方法可以省略输入各种词头有变化的检索词的麻烦。,后
29、截断在检索字符串后(右方)截断有限或无限的字母。如:librar*library,librarian,libraries这种方法可以省略输入各种词尾有变化的检索词的麻烦。主要用于 单复数检索(如Econom*:Economy,Economics,Economical)词根检索(buil*:building,built)年代检索(199*:1990,19911999)等,中间截断在检索词中间嵌入截断符号,允许检索词中间有若干形式的变化。如:输入wom*n 可检出:woman,women 输入defen*e 可检出:defence(防卫),defense 主要解决一些英美拼写不同,单复数形式不同的
30、词的输入。,左右截断将检索词左右词头、词尾部分同时截断,检索词中间一致。如:输入*biolog*可检出:neurobiology(神经生物学)neurobiologist microbiology(微生物学)microbiologist 适用于广泛课题的资料检索,有限截词对词干以外可以出现的字母数量进行限定。如:输入computer?表示截断处有0-2个字母变化,可检出:computer,computers,输入stud?表示截断处有0-3个字母变化,可检出:study,studies,studied,student,,无限截词不限制被截断的字符数量。在检索词后加一个“*”,表示该词后可加任意
31、个字符。如:输入educat*可检出 educate,educator,educators,educated,educating,education,注意:使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。,3、位置检索,通过位置运算符来规定和限制检索词之间的相对位置,弥补布尔逻辑运算符构造某些提问式的不足,表达复杂专深的概念,从而提高检索的专指度。位置算符通常只出现在英文数据库中,多用于全文检索。Dialog等一些大型检索系统才支持位置算符。在检索提问式中同时出现位置算符和逻辑算符时,执行的先后顺序为:先位置算符,后逻辑算符注:不同的机检系统,位置算符的功能及算符不同,也有的
32、检索系统不支持位置运算符,检索之前应该先看看数据库的帮助信息。,字段算符 F、L,相邻位置算符W、nW;N、nN,句子位置算符 S,相邻位置算符:WnW,W:with的缩写 两词相邻,词序不变,中间不可插词,但两词之间可有一个标点、连字符或空格。例:输入CD(W)ROM 将命中 CD ROM 或 CD-ROM输入solar(W)energy 检出 solar energy,nW,nW:nword的缩写 两词之间允许插入0-n个词,词序不变。例:communication(2W)satellite 将检索出含有communication satellite、communication via s
33、atellite、communication on the satellite的记录,NnNN:near的缩写 两词中间不可插词(但两词间可有一个标点,连字符或空格),允许词序发生颠倒。例:输入cross(N)section 可检出 cross section 和 section cross,nN:nnear的缩写 两词中间可插0n个词(两词间可有一个标点,连字符或空格),允许词序发生颠倒。例:输入cotton(2N)processing可检出cotton processing、processing of cotton、processing of Egyptian cotton,字段算符:FF
34、:field的缩写 两词必须出现在同一字段中(如篇名、文摘、叙词等),词序与词量不限制。如:输入pollution(F)control/AB检出的结果中 pollution和 control同时出现在文摘(abstract)字段中,句子位置算符:S S:Sentence的缩写 两词必须出现在同一句子或子字段中,词序与插入词量不受限制。如:输入computer(W)control(S)system 可检出文摘中含有“This paper is concerned with an application of the computer control technique in a intellig
35、ent system for testing inner walls of pipes.”这样一句话的文献记录。,短语检索,字段检索,4、限制检索,短语检索 将检索词用双引号”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度。例:”Global Positioning System”(GPS,全球定位系统)只检索出规定字段中包含完整词组的记录。,字段检索 为了缩小检索范围,可利用字段代码来限制检索词出现的字段,以提高检索速度和查准率。如:rice in ti(表示只在题目字段中查找文献)rice in ab(只在文摘中查找)au=Smith,J.C(查作者为Smith,J.C 的 文章
36、)py=1998(只查1998年的文章)la=Chinese(只查语种为中文的文献),常用检索字段中英文对照,查全率(检全率)查准率(检准率),二、检索效果评价,漏检率误检率,二、影响检索效果的主要原因,信息系统组织结构、检索系统功能问题检索策略、检索方法问题,三、提高检索效果的措施,熟悉各种信息系统特征认真分析课题需求灵活掌握检索方法和提高制定检索策略的能力,(1)输出篇数过多时,此时多数是由误检造成的,原因主要有以下几点:1)没有对检索词进行限制。包括字段限制,时间限制,分类限制等。2)主题概念不够具体或具有多义性导致误检。例如,仅使用mathematics进行检索结果很多,就需要整检索策
37、略,将概念具体化。如:mathematics and economic 再如,检索世界贸易组织仅输入“WTO”,系统可能会检索出“World Tourism Organization”(世界旅游组织)3)对所选的检索词截词截得过短。例如,使用math?将有太多的检索结果。等等,检索结果的反馈调整,缩小检索范围的措施提高检索词的专指度。增加AND连接,进一步限定主题词。把检索词限定在主要字段,如标题字段、主题词字段等。缩短检索年限,或限定某些刊物。,(2)输出篇数过少时,此时多数是由漏检造成的,原因可能有以下几点:1)选用了不规范的主题词或某些产品的俗称、商品名作为检索词。例如,没有使用学名“马
38、铃薯”而使用了俗名“土豆”又如,没有使用“表面活性济”而使用了商品名称“迪恩普”,都会造成漏检。2)同义词没有充分考虑。例如,检索“物理化学”,没有考虑到“物理有机化学”,“物化”等同义词,导致漏检。3)上位概念或下位概念没有完整运用。例如,“燃料”是上位概念,下位概念可以有“固体燃料”、“液体燃料”、“气体燃料”,甚至还有“煤”、“油”、“煤气”、“天然气”等,这些概念在检索“燃料”时都应该加以考虑。等等,检索结果的反馈调整,扩大检索范围的措施降低检索词的专指度,可从词表或检出文献中选择泛指词。调节检索式的网罗度,如删除某个不重要的检索词。进行族性检索,可用分类号或用OR连接一组同义词和近义词。取消某些限制过严的限制符。,