《文献检索步骤与策略.ppt》由会员分享,可在线阅读,更多相关《文献检索步骤与策略.ppt(59页珍藏版)》请在三一办公上搜索。
1、文献检索策略与步骤,2005.7,一、文献检索基本要求,1 检阅要全面,即全面性 不仅要广泛查阅自己特定范围内的国内外有关研究成果,而且要把视野放宽,广泛测览特定范围以外的有关研究成果。不仅要搜集与自己观点一致的材料,也要搜集那些与自己观点不一致,或与自己构思相矛盾的资料。不仅要广泛查阅中文资料,同时也应查阅外文资料,以便及时掌握最新的研究资料和动向特别是要着力搜集第一手资料,以保证研究的客观全面。,2 检阅要认真细致,即准确性,通过细读,基本掌握若干年来所研究的领域内讨论过的问题,分歧意见,代表人物和主要著作,主要倾向。要认真推敲观点和论据,并做好记录。从前人分歧矛盾中发现问题:(1)前人的
2、结论可能是正确的,但论据不充分;结论可能是错误的,但研究过程或研究方法可能有启发;(2)前人的争论焦点,可能是问题的关键所在,也可能只在表面现象上争吵不休,并未触及问题的实质;(3)前人的理论依据及史料依据,可能是准确无误十分丰富,也可能是篡改文献,贫乏薄弱得不足为据。我们要通过细致查阅,搞清来龙去脉。,常见论据失误:(1)曲解引伸,主观臆断;(2)只知其一,不知其二,或突出其一,忽略其二,断章取义;(3)脱离实际,追赶时尚,将马克思主义词句作为教条,生吞活剥并未真正理解。,3 勤于积累,我们应养成不断学习、善于积累的好习惯,并有意识地培养自己读书治学的能力,掌握查阅文献的方法,逐步积累自己所
3、需要的资料目录。还要善于做摘要、札记、卡片,编制自己的文摘、提要、综述,建立个人资料库,同时又会使用国家的信息库。,4 善于思索,由于文献是在一定的历史条件下产生的,带有时代和个人的局限性,应在批判中继承,在扬弃中创新,必须靠理论思维。在阅读中进行比较、分析、联想和构思,从而产生解决问题的新思路、新观点。,二、什么是检索策略,含义:针对一定的检索目标,围绕信息检索过程而制订的具体实施计划或实施方案。也即在分析检索提问的基础上,确定检索的数据库、检索的用词,并明确检索词之间的逻辑关系和查找步骤的科学安排。无论是作为一种方法还是一种技术,信息检索都表现为一种过程,该过程始于用户的信息提问,而终于检
4、索结果的输出。,三、检索策略步骤,明确课题需求、选择数据库 主题概念分析 编制检索式 检索效果评价和调整检索策略,(1)分析课题需求,选择数据库,分析课题检索的目的开始某一项科学研究需要对课题进行全面的文献普查,选择年限较长,收录较广的相关专业的二次文献数据库,在全面回溯检索的基础上,选出相关的文献,再获取一次文献。为解决某个技术难题,查找关键性的技术资料对这样的课题,可选择工程和技术类数据库或专利数据库。,为贸易与技术引进、合资谈判,了解国外市场、产品与公司的行情。查找科学数据库以了解技术的先进性,查找市场、产品、公司等商情数据库以对手的情况。为申报专利或鉴定成果,查找参考依据,以选择国内外
5、专利数据库为主。为撰写论文查找相关文献等,以期刊论文、学位论文等学术研究性的数据库为主。,明确课题所涉及的学科范围和专业面 根据数据库的主题收录范围进行选择。对文献的新颖性程度的要求 选择数据更新周期短、速度快的数据库。用户对检索的查全与查准要求 为满足查全要求,就要普查多种数据库,为快速满足查准要求,应选择主题范围最专指的数据库。,用户可对检索目标给予可以这样的说明:1)要求高查全率,希望获得所有的相关文章;2)要求高查准率,希望有一定范围的文献量,不限定篇数,但不希望有误查;3)提出某一固定的期望文献量:几篇相关文献;4)有一定比例相关文献量;5)没有特殊要求。,(2)主题概念分析,对用户
6、的课题进行主题概念的分析,并用一定的概念词来表达这些主题内容,同时明确概念与概念之间的逻辑关系。,主题概念分析内容:概念的表达要确切。抓住课题的实质性内容,分析出课题中有几个概念组面。找出核心的概念组面,排除掉无关概念组面,包括意义不大的概念和重复概念。找出隐含的重要概念。如“智力测试”,隐含着“能力测试”、“态度测试”、“创造力测试”等概念。明确概念组面之间的交叉关系,即明确是逻辑“与”、逻辑“或”还是逻辑“非”的关系。,(3)编制检索式,选择合适的检索用词对于分析出来的每个概念组面,用具体的检索用词来表示,如“学校活动”这个概念可以用具体的“班级活动”、“课外活动”、“学生活动”等检索词来
7、表示。选择合适的位置算符 对于每一个概念组面选择出来的检索词,为表达位置关系,可根据各系统的规定,使用位置算符,如,Wn、W/n等。,拟定合适的检索式(检索式是上述各步骤和各种检索技术的综合体现,是检索策略的表达形式。)注意概念组配的逻辑关系不要搞错,正确使用布尔逻辑AND,OR,NOT算符。英文检索词的不同表达方式尽量使用截词技术 正确使用各种位置算符。注意后缀与前缀代码的限定使用。注意逻辑算符与位置算符的先后处理次序,注意括号的使用。,(4)调整检索策略,缩小检索范围将检索词限定在篇名或叙词字段中。增加概念,加入AND算符。用时间期限或其它辅助字段来限定。用NOT算符排除无关概念。将AND
8、改为更精确狭隘的位置算符。,扩大检索范围 增加同义词、相关词,加入OR算符。减少AND或NOT的使用次数。将狭隘的位置算符改成宽泛的位置关系或AND。在文摘或全文字段中检索。必须注意缩小检索范围会降低查全率,扩大检索范围则会降低查准率。,(5)检索效果评价,查全率是指检索出的相关文献量占系统中所有相关文献总量的百分比,用来反映检索的全面性。查准率是指检索出的相关文献量占所有检出文献总量的百分比,用来反映检索的准确性。查全率P=a/(a+c)100%查准率R=a/(a+b)100%R:表示查全率;P:表示查准率;a:检出的相关文献量为;b:检出的非相关文献量;c:系统中未检出的相关文献量。,查全
9、率的互补数就是漏检率查准率的互补数就是误检率。查全率和查准率也是互补的关系。在一个特定的检索系统中,当查全率不断提高的同时,查准率就会降低,而当查准率提高的同时,查全率又会降低。但当查全率和查准率都很低的时候,两者可以通过检索策略的改善同时得到提高。,构造检索策略的主要方法,提高查全率采取的策略 a.去掉AND联结的非主题词;b.增加用OR联结的相关词;c.利用上位类或上位词检索;d.截词方法;f.同义词控制;提高查准率采取的策略 a.利用下位类或下位词检索;b.利用外部特征进行限制检索;c.增加用AND联结的相关词,(6)制定检索策略步骤,提出检索课题,确定检索的主题内容,协商检索目标,查全
10、、准等指标,选择检索系统和服务方式,选择数据库,选择检索途经,选择检索项,选择检索词,拟定检索提问方式,检索匹配处理,浏览检出记录,判别相关性,实现了检索目标吗?,可以输出检索结果?,打印检索结果,分析失误原因评价检索效果给出各种反馈信息和调节方法,再次浏览检出文献,修改检索提问式,重选检索途经,调节检索项,重选数据库或文档,重选检索方式,调节检索指标,修改检索提问,是,是,否,否,(7)检索策略的动态构造及反馈调整,四、制定检索策略应注意问题,(1)制定检索策略的基础是弄清信息需要和检索目的 对信息需求进行正确分析,可以从信息需求的形式和内容 两方面来分析。有关信息的形式需求要明确的问题有:
11、明确检索目的。明确所需的文献量。明确所需文献的语种、年代范围、类型、作者或其他外 表特征。,关于信息的内容需求要明确的主要问题有:明确检索课题内容涉及的主要学科范围,这对以后选 择合适的数据库很重要。分析检索课题的主要内容,用自然语言来表达这些内 容要求,这是联机检索中较为重要的环节。,(2)在明确检索目的基础上,对检索课题进行概念分析。把您的研究课题转换成一个问题。把和概念的同义词陈列开来。把概念放宽,这样可给予您更多检索词组。,分析研究课题应该明确以下问题:明确课题的主要内容以及所涉及的知识点(术语集合、术语之间的关系)。明确需要的文献特征:即需要的文献种类、语种、年代以及文献量。明确查询
12、的侧重点:对查新、查准、查全的指标要求。确定所需要的文献应该具备的内外部特征。,内部特征所需文献的知识构成、术语构成以及术语之间的关系外部特征文献种类、年代、语种、媒体格式等文献可能出现的网络系统的特点,课题检索的类型:查全型:开题报告、综述等查准型:在具体细微的专业问题方面的研究动态型:新技术、新理论的研究查新型:同类研究项目比较,专业与数据库,(3)注意对课题任务的研究 分析课题的内容实质,析出误假主题概念,析出被隐匿的 主题概念;在多个主题概念中析出主要概念和次要概念,以及重复概 念;在建立检索式时,少用主题概念泛而检索意义不大的主题 词;明确主题概念表达的下位与上位概念的关系。,(4)
13、选择检索工具,确定检索方法,根据检索课题的主题及学科范围选择对口的检索工具(数据库);检索工具选择标准:专业对口,检索途径多,收录范围广。注意对数据库系统的研究:数据库品种繁多,选择适当的数据库,十分必要。准确合适的数据库对联机检索获得理想的效果起着决定性作用。,选择数据库具体要注意:,根据检索课题的内容范围和要求来选择数据库,主要包 括:1)数据库的类型是否满足检索需要。2)数据库的学科专业范围是否相吻合。3)数据库收录的文献类型、文献存贮年限、更新周 期是否符合检索需求。4)数据库对文献的描述程度、标引深度、专指度如 何等,是否按标准化著录。5)数据库提供的检索入口是否与检索课题的已知线索
14、 相对应。,(5)确定检索词的基本准则,必须能正确反映检索要求;必须符合数据库的检索用词规则;优先选用具有检索意义学科名词术语;多选常用的基本词汇进行组配。,提取检索词的要领:,选用涵盖主要主题概念的词汇,关键词必须清楚界定研究主 题;选用意义明确的词汇,不用一般的、有共通性的词汇;选用实质意义的概念词,不使用过长的词组 或短语;选用各学科的专门用语来检索各学科的资料库,不能用一般 性的词或通俗用语来作关键词;确定关键词的检索范围:有些数据库有专门的关键词字段;有些数据库的关键词查询范围是题名,或包括摘要等几个主 要字段,这些都会影响检索结果。,进行文献的主题分析,包括审读文献,划分主题类型和
15、分析主题结构,选直接表达文献主题概念的词表中的正式专指叙词;,要利用概念之间的属种关系和相关关系增加检索线索,选择主题词要领,把握概念的含义,注意利用词表,属种关系又称上下位关系,包括概念是属概念,被包括的概念是种概念。利用属概念扩大检索途径,可提高查全率,利用种概念缩小查找范围,可提高查准率。相关关系指属种关系以外的具有交叉、并列、对立关系的概念,以及形式与内容、本质与现象、原因与结果等关系。善于利用这些关系,有利于提高查全率。,词表是文献检索的重要辅助工具,使用时要注意从多角度查词,要充分利用辅助表。当查不到与某个具体概念相对应的专指叙词时,可以把该概念分解为几个较一般的概念(外延相对宽的
16、),然后再去查表。,(6)具体查找文献线索(对检索结果进行阅读、分析,做好记录),使用手工检索刊物或计算机检索数据库进行检索。一般手检是从索引文摘号文摘出处。,五、索取原始文献,根据文摘出处获取原文信息,刊名缩写还原为全称,查本馆书目检索系统或其它馆书目检索系统,判断原文所在地获取原文。获取原文是文献检索的最后一个步骤,也是至关重要的一个步骤。获取原文一般有三个步骤:(1)判断文献的出版类型:期刊、学位论文、专利、会议录、报告等。(2)整理文献出处:将文献出处中有缩写、有音译刊名的还原成全称或原刊名。(3)根据出版类型在图书馆或情报所查找馆藏目录或联合目录确定馆藏。原则上从本单位、本市、本地区
17、、全国的顺序逐步扩大查找馆藏范围。如果是国外资料,在国内查不到馆藏,可通过国际联机向国外订购。,获取原文的方法,方法一:通过校园网查询图书馆的馆藏书目数据库(公共检索)了解图书馆是否收藏所需中外文期刊图书及其它特种文献,以决定自己是否去图书馆借阅。(印刷型文献),方法二:通过查询馆藏全文数据库直接获取原文 Internet全文数据库是近几年发展起来的,使得科研人员不再需要亲自去图书馆查找复印,在办公室或在家中通过网络,就能直接获得许多文献原文的电子版本。(网络版全文数据库的文献),方法三:通过馆际互借系统和联合目录及各图书情 报机构的公共目录获取原文(有偿服务)(1)馆际互借:图书馆为了共享信
18、息资源,在馆与馆之间达成馆际互借协议,当本馆的馆藏文献不能满足读者需要时,向对方馆去借本馆未收藏的文献资料。国内一些著名的大学图书馆就与英国不列颠图书馆文献提供中心(BLDSC)、美国俄亥俄州的联机图书馆中心(OCLC)、美国CARL公司的Uncover中心、美国的UMI公司等订立了原文网上传递的协议,所涉及的文献也包括期刊论文、科技报告、学位论文、专利文献等多种类型。馆际互借服务中,大量的服务是通过复印、扫描、下载等手段把读者所需的信息复制出来,传递手段除了最传统的邮寄以外,可以是传真、E-mail等形式。馆际互借的服务对象也越来越广,高校图书馆除了为本校的师生服务以外,也向社会上的其它单位
19、和用户提供馆际互借的服务。,(2)联合目录 中国高等教育文献保障系统“中国高等教育文献保障系统”简称CALIS,是经国务院批准的我国高等教育“211工程”总体建设规划中两个公共服务体系之一。该系统是高校图书馆进行各种合作的主要依托。CALIS由全国地区各校图书馆共同组建一个整体化、自动化、网络化、数字化的三级联合文献资源保障体系,为我国的高等教育和科学研究提供全方位、高水平的文献保障服务。它已在全国建立了个CALIS全国管理中心、个全国文献信息中心、个地区文献信息中心及以“工程”立项高校为主体的一批高校现代化图书馆。文理、工程、农学、医学四个全国中心分别设在北京大学、清华大学、中国农业大学和北
20、京医科大学;华东南、华东北、华南、华中、西南、西北、东北七个地区中心分别设在上海交大、南京大学、中山大学、武汉大学、四川大学、西安交大和吉林大学。另在哈尔滨工大设有东北地区国防科技文献信息中心。九五期间,CALIS将形成一个以“211工程”院校为主体的高校书刊联合目录数据库和7个地区级书刊联合目录数据库,初步实现系统的公共检索,馆际互借,文献传递,协调采购,联机合作编目等功能。,(3)通过各图书情报机构的公共目录查询系统(OPAC)查得其书目信息后,再采用馆际互借方式获取。(4)利用数据库中的馆藏信息。如:Dialog系统、STN系统等数据库就有馆藏信息,找到馆藏信息后,即可通过馆际互借方式获
21、取原文。,方法四:通过免费的电子期刊网站获取全文 在Internet上还有大量的免费电子期刊供用户使用。这些网站可以通过Google以检索词“免费电子期刊”进行检索。,方法五:利用著者姓名和地址等信息向著者索取原文 大多数外文检索工具的著录款目中有著者姓名。需注意的是:原刊上的著者姓名一般是名在前,姓在后;而检索工具中著者姓名的著录则采用姓在前,名在后(名一般为缩写)的编制形式。著者地址的获取方法有两种:利用检索工具本身的文献款目查找,如CA、BA。利用查找著者地址的工具书,如美国的近期期刊目录的著者索引及地址录;SCI的“来源索引”和“团体索引”等。,方法六:从检索工具中发掘索取原文的信息
22、检索工具正文前的说明语、使用指南、著录注释等有时会提供一些如何索取原文的信息,如中国学术会议文献通报的编辑说明提示:凡标有馆藏号的文献都可向中国科技信息联系查阅或复印、国外科技资料目录的著录事项说明中也指出可通过“馆藏单位代号”索取原文。当确知收藏单位地址后,再通过各级图书情报网络实行馆际互借。,六、文献检索特征,(1)有确定的目标;(2)有一个可能的信息解的集合;(3)有一定的线索(即启发信息);(4)搜索过程是针对一定的目标、遵循一定的线 索,不断缩小搜索范围的求解过程。,七、文献检索能力(信息技能),(1)明确任务(Task Definition):了解问题的症结,确定所需信息和目的,分
23、清任务的轻重缓急;(2)信息查询策略(Information Seeking Strategies):了解各种信息源,能够作出评价并确定优先查找的次序;(3)查找和检索(Location and Access):确定信息藏址,从信息源中找出信息;(4)信息利用(Use of Information):能够读懂(或听懂、理解)查出的信息,了解信息在满足需求中的特定价值;,(5)信息综合(Synthesis):能够组织信息,提供信息产品(论文、报告等);(6)信息评价(Evaluation):评价查找结果和解决问题的过程(效率)。,检索者一方面要弄清文献的组织编排方式,要具有“解构”能力;另一方面
24、要善于分析提问,善于将信息需求转化为可检索的概念术语。这是一个双向分析和匹配的过程,是一个以满足用户信息需求为目标,以用户提问为线索,不断缩小检索范围并查找用户所需信息的过程。,选词技术,1 直接选词法,当检索题目中使用的自由词与规范词相一致时,可直接选取。例如:“光缆(optical fiber)”、“计算机辅助设计(computer aided design)”等,这些词属于范围大、命中率高的选词,检索人员可直接进行检索。这种方法的结果最为接近主题。,2 专指选词法,选用专指性强的主题词越多,则检出的文献针对性越强,查准率就越高。突出检索主题的深度。,3 转换选词法,检索词的确定必须经过对
25、检索主题的正确分析得到。选词过程中还经常会遇到不能直接查到所需文献的词,这中间就需要有一个转变过程。例如:检索COBOL语言设计课题,若不加分析就选用“COBOL language design”,则必然碰壁。而通过正确分析理解就会知道COBOL语言是一种用来编制计算机程序的语言,所以应先确定检索词为“计算机程序语言(computer programming languages)”,然后再进一步与COBOL组配,定能得到满意结果。此种选词法可促使科技人员对主题词表的主题词结构及类型有所了解,锻炼多角度选词的能力。,4 通配符的运用,(1)“?”代表检索词中的一个汉字、西文字符或其他字符。例如:
26、“计算?”,表示“计算机”、“计算器”等词;“航?器”,表示“航空器”、“航天器”等词;“int?net”,表示“internet”、“intranet”等词。,(2)“#”代表检索词中的一个汉字、西文字符或其他字符,也可不代表任何汉字、西文字符或其他字符。例如:“微#机”,表示“微机”、“微型机”等词;“missile#”,表示“missile”、“missiles”等词;“colo#r”,表示“color”、“colour”等词。,(3)“$”代表检索词中的任意多个汉字、西文字符或其他字符,也可不代表任何汉字、西文字符或其他字符。例如:“网络$”,代表“网络”、“网络软件”、“网络计算机”、“网络操作系统”等词;“electron$”,代表“electron”、“electrons”、“electronic”、“electronics”等词。,“?”、“#”和“$”的相同点与不同点:(1)“?”与“#”均代表一个汉字、西文字符或其他字符;“#”与“$”均可以不代表任何汉字、西文字符或其他字 符,检出的词均包括词干本身。(2)不同点:使用“?”,检出的词不包括词干本身;使用“$”,可代表多个汉字、西文字符或其他字符 检出的词包括词干本身。,