文献检索的基本原理.ppt

上传人:小飞机 文档编号:5270990 上传时间:2023-06-21 格式:PPT 页数:118 大小:1.06MB
返回 下载 相关 举报
文献检索的基本原理.ppt_第1页
第1页 / 共118页
文献检索的基本原理.ppt_第2页
第2页 / 共118页
文献检索的基本原理.ppt_第3页
第3页 / 共118页
文献检索的基本原理.ppt_第4页
第4页 / 共118页
文献检索的基本原理.ppt_第5页
第5页 / 共118页
点击查看更多>>
资源描述

《文献检索的基本原理.ppt》由会员分享,可在线阅读,更多相关《文献检索的基本原理.ppt(118页珍藏版)》请在三一办公上搜索。

1、2.0 文献检索的基本概念2.1文献检索的原理、类型2.2文献检索系统和检索工具2.3文献检索语言2.4文献检索技术2.5文献检索方法、途径和步骤2.6文献检索过程与策略,第2讲 文献检索的基本原理,2.0 文献检索的基本概念,广义概念:将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,故全称:“信息的存储与检索”。,信息检索的定义,狭义概念:仅指上述过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search),信息检索的定义,文献检索:文献信息的存储、文献检索两个过程。情报检索模型即是“匹配”模型。目的:为

2、了解决特定的文献需求和满足用户的需要。,图2.1 文献检索的原理,2.1文献检索的原理、类型和方式,根据信息检索或查找的内容可划分为文献检索、事实检索和数据检索。根据信息检索手段可划分为手工检索和计算机检索。,2.1.2 信息检索的类型,文献检索(Document Retrieval)是以文献为检索对象,从已存贮的文献库中查找出特定文献的过程。例如“关于计算机控制系统有些什么参考文献?”这就需要我们根据课题要求,按照一定的检索标识(如主题词、分类号等),从所收藏的文献中查出所需要的文献。,数据检索(Data Retrieval)是以数据为检索对象,从已收藏数据资料中查找出特定数据的过程。例如:

3、查喜马拉雅山有多高,杭州六和塔建于何年等。事实检索(Fact Retrieval)即通过对存贮的文献中已有的基本事实,或对数据进行处理(逻辑推理)后得出新的(即未直接存入或所藏文献中没有的)事实过程。例如:本学年成绩优秀的学生有多少,某同类产品中,那种牌号的销量最大。,数据和事实检索是要检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。文献检索是最典型和最重要也是最常用的情报检索,手工检索 即用人工来处理和查找所需信息的检索方式。计算机检索利用计算机和一定的通信设备所查找所需信息的检索方式。,检索系统 检索系统是根据特定需要利用一定的检索设备,从整理加工并存贮在某种载体上

4、的文献集合中检索出所需情报的系统。它根据检索设备和载体的不同,可以分为手工检索系统和计算机检索系统。,手工检索系统由手工检索设备(如书本式目录、文摘、索引、卡片柜等)、检索语言、文献库等构成。特点:它使用方便,成本低廉,但检索效率和响应时间均较差。,计算机检索系统主要由计算机检索设备(联机检索设备、光盘检索设备、微机检索设备、缩微品机检设备等)、检索语言、文献库等构成。特点:检索效率高,响应速度快等特点,但是成本和检索费用较高。在我国,这两种检索系统将在很长一段时期内并存使用,相互补充。,信息检索工具检索工具的定义 检索工具是人们用来存储、报道和查找文献的工具,它具有存储和检索的功能。4个基本

5、条件:(1)能够详细著录文献的外部特征和内容特征(2)具有即定的检索标识(3)全部文献必须根据标识,系统科学地排列成为一个有机地整体(4)能够提供多种检索途经,检索工具的作用:1、文献高度集中;2、提高检索速度;3、提供有规律的检索;4、消除语言障碍.,检索工具的分类按加工文献和处理信息的手段不同可分为:手工检索工具和机械检索工具;按收录范围分,有综合性、专题性(计算机应用文摘)和专业性(移动云计算文摘);按著录方式分,有目录型、题录型(索引型)、文摘型和全文型;按出版方式分,有印刷型(卡片型、书刊型)、缩微型和电子型(联机数据库型、软盘型、光盘型)。,(一)按著录方式划分:1.目录型2.题录

6、型3.文摘型4.全文型,1.目录型,目录型检索工具是以整本图书或期刊的外部特征为报道对象。报道内容:图书:书名/著者/出版地:出版者,出版时间期刊:刊名/编著 出版地:出版者,创刊年,2.题录型,题录型检索工具是以书刊中的某篇文献(或章节)的外部特征为报道对象报道内容:文献篇名/著者/刊名 出版年、月(卷、期)、页码,3.文摘型,报道对象与题录相同,但对文献内容揭示的程度较题录更深入更具体,增加了文献的摘要文摘按其内容特征可分:指示性文摘、报道性文摘、指示报道性文摘,4.全文型,报道对象与题录相同,但增加了文献的全文 按载体不同:全文数据库(中文、外文)期刊等印刷型,(二)按载体方式划分,印刷

7、型(书本式、卡片式)缩微型电子型:联机型(磁性载体、计算机及通信网络)光盘型(光盘、计算机及光驱)网络型(Internet、网络数据库),2.3 检索语言一、检索语言的概念 检索语言是信息检索系统存储与检索所使用的共同语言。检索语言是一种人工语言,用于各种检索工具的编制和使用,并为检索系统提供统一的、作为基准的、用于信息交流的符号化或语词化的的和语言。,二、检索语言的分类 检索语言可分为描述外表特征和描述内容特征的检索语言。描述外表特征的检索语言有书名、著者、机构、号码;描述内容特征的检索语言有分类语言和主题语言。,分类语言 用分类号表达各种概念,将各种概念按学科性质进行分类和系统排列。,世界

8、上比较著名的分类法有:国际专利分类表(IPC)、杜威十进分类法(DDC)、美国国会图书馆图书分类法(LC)。我国在图书情报系统广泛采用的有中国图书馆图书分类法(简称中图法)和中国科学院图书馆图书分类法(简称科图法)。,中图法使用字母与数字相结合的混合号码,基本采用层累制编号法。将人类的文献分为五个基本部类,22个基本大类。,五大部类是:1、马列主义、毛泽东思想2、哲学3、社会科学 4、自然科学5、综合性图书,基本大类,其中T 工业技术的二级类目采用两个字母标识:,以局域网(LAN)类为例,列出中图法的各级类目:,TP 自动化、计算机技术,T 工业技术,例如要查找“网络计算机(NC)”方面的文献

9、:,根据“TP368.6”这一类号,查找图书馆馆藏分类目录,就能检索到有关“网络计算机(NC)”的馆藏文献。,分类号越长,表示的学科范围越窄。为了醒目和方便读写,分类号中的数字部分由左至右每隔3位加一个圆点“”,如G252.7、TP317.1,TN919.8,索书号,又称索取号,是图书馆藏书排架用的编码,是文献外借和馆藏清点的主要依据。一般由分行排列的几组号码组成,常被印书脊下方的书标上。一个索书号只能代表一种书。,计算机与通信学院 陈多,C53代表分类号126代表种次号2代表第二版4代表第四辑丛书,索书号:C53/126-2:4,四、主题检索语言标题词:是从文献的题目、正文或摘要中抽选出来,

10、经过规范化处理的词或词组,先组式语言。叙 词(单元词):叙词语言是以规范化科学名词为基础的一种主题法检索语言,叙词是主题词表中的所有正式主题词可以根据需要将它们组配起来,用以表达复杂的概念。是后组式语言,可自由灵活组配。关键词:未经规范化处理,直接从文献题名、原文或文摘中选取的能反映原文主题内容的自由词汇,叙词语言的体现形式是叙词表。国内外常用的叙词表主要有我国许多文摘检索刊物使用的汉语主题词表,英国科学文摘使用的INSPEC叙词表,美国工程索引使用的Ei叙词表以及美国政府报告和索引使用的NTIS叙词表等。,主题词与关键词的关系,计算机与通信学院 陈多,布尔逻辑,位置逻辑,截词,字段限制,加权

11、,其他,常用检索算符,2.4 文献检索的技术,2.4.1 布尔逻辑检索技术,布尔逻辑检索技术就是利用布尔逻辑算符进行检索项的逻辑组配,用以表达检索者的提问概念。布尔逻辑算符指规定检索词之间相互关系的运算符号,在检索表达式中起着逻辑组配的作用,复杂概念的检索式,2.4.1 布尔逻辑检索技术,常用的布尔逻辑运算符:逻辑“与(AND)”逻辑“或(OR)”逻辑“非(NOT)”,1 逻辑“与”,运算符:AND 或*用于交叉概念或限定关系的组配,实现检索词概念范围的交集。表达式:,A and B 或 A*B,And两侧的检索词必须同时出现在检索字段中,检出同时含有检索词A和检索词B的记录,2 逻辑“与”,

12、作用缩小检索范围,提高查准率。举例 检索“人口控制”或者“控制人口”方面的文献信息。人口 and 控制,2 逻辑“或”,运算符:OR 或+用于检索词并列关系(同义词、近义词)的组配,实现检索词概念范围的并集。表达式:,A or B 或 A+B,在文献记录中只要含有检索词A和检索词B中的任何一个即算命中,检索出的记录含有检索词A或者检索词B,2 逻辑“或”,作用扩大检索范围,防止漏检,提高查全率。举例 检索“计算机”方面的文献信息。计算机 or 电脑使用的注意事项 如果检索词涉及表达整体概念,要针对具体情况分别列出每个表达部分概念的检索词,否则将出现漏检。,3 逻辑“非”,运算符:NOT 或-一

13、种排斥关系的组配,用来从原来的检索范围中排除不需要的概念。表达式:,A not B 或 A-B,适用于排除含有某个指定检索词的记录,检索出的记录含有检索词A,但同时不含检索词B,3 逻辑“非”,作用缩小检索范围,增强检索的准确性。但使用不当,易排除有用文献信息,从而导致漏检 举例 检索有关协议方面的文献信息,但不包括TCP/IP。协议 not TCP/IP使用的注意事项 两个关系紧密的检索词不宜用not,2.4.1 布尔逻辑检索技术,优先级高,优先级低,优先级运算()NOTANDOR,词位置检索(positional operator)位置运算符,利用布尔逻辑算符对检索词进行逻辑组配时,未限定

14、检索词之间的位置关系,会影响某些课题的查准率并容易造成误检。为了弥补其不足,一般检索系统都提供文中自由词检索功能,也称全文检索功能。所谓全文检索是利用文献记录中任何有实义的关键词、词组或字符串作为检索词,词与词之间的位置关系可以用位置运算符来表达。位置运算符的使用,进一步强化了对概念的限制,比布尔逻辑运算符更能表达复杂的概念,并避免AND逻辑组配产生的词义含糊或误检。,为了提高检索的广度和准确度,常常需要对检索词之间的位置关系加以限定。全文检索的运算方式,不同的检索系统有不同的规定,主要差别有两点:规定的位置算符不同;位置算符的职能和使用范围不同。,下面介绍几种数据库经常使用的位置运算符:,允

15、许两个检索词之间最多可以插入n个单词,且这两个检索词的词序任意,此算符两侧的检索词必须紧密相连,所连接的词间不允许插入任何其他单词或字母,但词序可以颠倒,同词位检索,允许在连接的两个词之间最多夹入n个其他单元词,只强调插入单元词个数没限定插入单元词的具体范围,同时词序不能颠倒,此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除可以有一个空格或一个标点符号或一个链接号外不得夹有任何其他单词或字母,同字段检索,表示此算符两侧的检索词必须同时出现在同一字段内。如:篇名字段、文摘字段、叙词字段等,但两词的词序中间插入的次数不限。,表示此算符两侧的检索词必须同时出现在同一个自然段。,其他

16、位置逻辑检索,(S)(Subfield)表示在此算副辆车的检索词必须出现在同一个子字段中,顺序不变,中间可插入词数不限。举例(basic or cobol or pascal)(S)(program*or compil*),Basic(S)program*basic(S)compil*Cobol(S)program*cobol(S)compil*Pascal(S)program*pascal(S)compil*,其他位置逻辑检索,(C)(Citation)表示两侧的检索词只能出现在同一条记录中,且对它们的相对位置或次序没有任何限制,作用和布尔算符and完全相同,位置逻辑检索技术,严谨,宽松,A

17、dj-adjacency,邻接算符,表示在此算符两侧的检索词必须按所列词序排列,不能颠倒,两词之间不允许有其他的词或字母。相当于短语检索。例:intelligent adj robot*(Elsevier Science SDOS),2.4.4 加权检索是一种定量检索的技术 在每个提问词后面给定一个数值表示其重要程度,这个数值称为权,在检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值总和。权值之和超过阈(yu)值,该记录为命中文献 缩小检索范围提供检索准确率的有效方法,2.4.5 聚类检索,聚类检索是在对文献进行自动标引的基础上,构造文献的形式化表示即文献向量,然后通

18、过一定的聚类方法,计算出文献与文献之间的相似度,并把相似度较高的文献集中在一起,形成一个个的文献类的检索技术。根据不同的聚类水平的要求,可以形成不同聚类层次的类目体系。在这样的类目体系中,主题相近、内容相关的文献便聚在一起,而相异的则被区分开来。聚类检索的出现,为文献检索尤其是计算机化的信息检索开辟了一个新的天地。文献自动聚类检索系统能够兼有主题检索系统和分类检索系统的优点,同时具备族性检索和特性检索的功能。因此,这种检索方式将有可能在未来的信息检索中大有用武之地。,截词检索技术,实质 截词检索就是用截词符号将检索词截断,用检索词的片段进行匹配运算。注意 在截断时,截断的词干不能太短,词干一般

19、应在3个字符以上,以免增加检索时间,产生误检。,截词检索技术,截词形式 按截词的字符数量有限截断、无限截断按截词的位置右截断、左截断、中间截断,按截词数量截断,无限截断 检索词词干可变化两个以上字符时,连续使用若干个“?”或“*”代替变化字符。用法可同时查找含有该词干的所有文献记录,亦可用于年代的查找。,其他截断方式,1.把截词符号置放在一个检索词的中间;2.中截断不允许有限截断,1.将截词符号放在一个字符串左方,表示其左的有限或无限个字符不影响该字符串的检索;2.实质:后方一致检索,1.最常用的截词检索技术;2.放在字符串右方,表示其右有限或无限个字符不影响该字符串的检索;3.实质:后截断是

20、前方一致检索,后截断,前截断,中截断,后截断举例,输入:computer*检索结果,computeracycomputerisecomputerizationcomputers,后截断注意事项,后截断主要使用于如下几种情况:检索词的单复数的描述;如:book?同根词的表达;如:chemi*可以检索出chemical、chemistry、chemist等同根词 年代的表达;如:20?(21世纪),199?(20世纪90年代)作者如:Moyer*可以检索出所有姓Moyer的作者,前截断举例,输入:*computer检索结果microcomputerminicomputer,中截断举例,输入:org

21、ani?ation检索结果organizationorganisation中截断主要使用于如下几种情况:检索词的拼写方式存在美式、英式之分;检索词在某个元音位置出现的单复数不同;如:man与men作用扩大检索范围,提高检全率,减少检索词的输入量,字段限制检索技术,在检索系统中,通常有一些缩小或约束检索结果的方法,称为限制检索。限制检索的方式,字段限制检索,特点及作用使检索出的文献信息达到一定的专指度。将检索词限制在记录的某个特定字段内检索,不但可以减轻机器负担,提高运算速度,还可以使检索结果更准确。用法将需要检索的内容限制在相关的字段内。如:作者姓名作者字段关键词关键词或题名字段,字段限制检索

22、,字段种类基本字段:表达文献内容特征的字段辅助字段:表达文献外表特征的字段字段检索形式1.通过菜单选择检索字段2.用命令的方式输入字段限制算符,篇名字段、文摘字段、叙词字段、分类类目等,作者、机构、文献类型、语种等,2.4.8 其他辅助检索技术,1 信息的浏览式检索与链接技术 2 检索结果的翻译和多语种(或跨语种)检索技术 3 检索结果的后处理技术,文献检索的几种运算方法-总结,计算机检索的实质:匹配运算计算机检索技术,检索提问,检索表达式,扫描、匹配,识别,数据库,检索词的组配技术,计算机检索技术,检索表达式的构成规则,检索词:主题词、关键词、名称、分类号分子式等。,检索表达式:运用各种运算

23、符,把检索词连接组配。,2.5 文献检索的方法和途径及步骤,2.5.1 文献检索方法,文献检索方法是影响检索效果的重要因素,它可分为直接检索和间接检索。间接检索法是常用的一种科学的检索方法,它可分为:工具法(常规法)追溯法交替法,1.工具法,(1)顺查法:根据检索课题的具体要求,利用特定的检索工具,由远及近,逐年查找。用这种方法,查得的文献比较完整,能反映课题研究发展的全过程,查全率高,但工作量大。(2)倒查法:由近及远,按时间逆序查找,重点放在近期新文献。此法省时灵活,效率较高,但会产生漏检而影响查全率。(3)抽查法:针对学科发展的高峰期,选取一定时间段进行查找的方法这几种方法各有适用的条件

24、,各有优缺点。,根据检索入手的时间不同可分为:,2.追溯法,利用最新发表的文献后所附的参考文献,由远及近,追溯查找相关文献。形成类似链锁反应的检索网络。利用此法进行检索,不需要利用检索工具,查找方法简单。但检索效率不高,漏检率较大。这种方法是不少科技人员常用的方法,方便实用。,2.追溯法,计算机与通信学院 陈多,3.交替法,又称循环法、分段法、综合法。综合利用工具法(常规法)和追溯法进行检索。首先利用检索工具查找出所需文献,再利用文献后所附参考文献,追溯查找相关文献。如此交替使用工具法和追溯法,直到取得满意的效果。,2.5.2 文献检索途径,1.分类途径2.主题途径3.著者途径4.其它途径,1

25、.分类途径,是从学科分类角度来查找文献的一种途径。利用目次表或目录来查找。检索文献的关键:分析课题,确定课题所属的类目与检索工具目次表中的类目相匹配,才能查准。特点:族性检索(适合从学科体系出发泛指性比较强的课题的检索,但不适合专指度高的课题以及新兴学科、交叉学科、边缘学科的课题的检索),2.主题途径,从文献主题内容角度来检索文献的一种途径。利用检索工具后所附的主题索引,以主题词作为检索入口。检索文献的关键:分析课题,选准主题词,并了解主题索引的结构和编排。特点:特性检索(适合比较具体专深的课题以及新兴学科、交叉学科、边缘学科的课题的检索),3.著者途径,在已知著者姓名的情况下,利用著者索引作

26、为工具检索文献的途径。一般著者索引(个人或团体)均按著者姓的字母顺序编排,姓在前,名在后,姓用全称,名用缩写。,4.名称途径 根据文献的名称查找文献的途径。一般多用于查找图书、期刊、会议名称。常用于目录性检索工具/系统,如书名目录期刊目录期刊联合目录等。5.序号途径 以文献的编号为特征,检索文献的途径。根据一些文献类型的特有标识,如科技报告的报告号;专利文献的专利号、入藏号,合同号,技术标准的标准号;ISSN,ISBN等作为检索点。6.其他途径 如分子式、元素符号、数字等。,2.5.3 文献检索的步骤文献检索一般分为5大步骤:1)分析研究课题,明确检索要求、时间、范围 2)查找文献线索 3)确

27、定检索策略 4)索取原始文献信息 5)检索结果评价,计算机与通信学院 陈多,检索步骤的流程图,1)分析研究课题,明确检索要求、时间、范围1、分析课题的实质内容以及所涉及的学科范围及相互关系,抽出主题概念,确定逻辑组配2、明确需要的文献种类、语种、年代以及文献量。3、明确检索的侧重点:对查新、查准、查全的指标要求。,2)查找文献线索1、做好检索记录2、文献类型的识别,1、选择检索工具:内容、专业性、技术手段、更新、性价比等2、确定检索途经3、优选检索方法4、确定、调整检索策略,3)确定检索策略,检索策略是为实现检索目标而制订的计划和方案,是对整个检索过程的谋划和指导。也就是在分析课题内容具有哪些

28、概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等。检索策略考虑得是否周全,直接影响文献的查全率和查准率。,4)索取原始文献信息1、利用馆藏目录、公共查询系统、联合目录获取原始文献2、向著者索取原始文献3、利用网上全文数据库获取原始文献4、利用网上全文传递服务检索原始文献5、利用网上出版社、杂志6、利用文摘数据库的原文服务,5)检索结果评价提高查全率和查准率降低漏检率和误检率,1检全率 检全率(简称R)是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,可用下式表示:,检全率是衡量从信息检索系统中检出相关

29、文献能力的尺度。,2检准率 检准率(简称P)是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,可用下式表示:,检准率是反映每次从该系统文献库中实际检出的全部文献中有多少是相关的,是衡量信息检索系统精确度的尺度。,漏检率是指漏检相关文献量与在检索系统中相关文献总量的比率,是衡量信息检索系统漏检文献的尺度,可用下式表示:,漏检率,4误检率 误检率是指误检(检出不相关)文献总量的比率,是衡量利用信息检索系统误检文献的尺度。可用下式表示:,查全率与查准率是呈反比关系的。要想做到查全,势必要对检索范围和限制逐步放宽,则结果是会把很多不相关的文献也带进来,影响了查准率。企图使查全率和查准率都

30、同时提高,不是很容易的。强调一方面,忽视另一方面,也是不妥当的。应当根据具体课题的要求,合理调节查全率和查准率,保证检索效果。,计算机与通信学院 陈多,同义词(计算机与电脑)、近义词(如实验与试验)、学名和俗名(发动机与马达)、不同译名(激光与莱赛)、简称与全称(如中国与中华人民共和国)、不同写法(发X射线与爱克斯射线)等进行选择;对多义词、同形异义词进行限定说明,如杜鹃既表示一种鸟,也表示一种花,就须限定说明为,杜鹃(动物)、杜鹃(植物)。,计算机与通信学院 陈多,选词步骤:研究对象为最重要的概念,其次是研究方法(手段),再次是研究目的。,计算机与通信学院 陈多,概念提取的原则:研究对象 a

31、nd 方法(技术方案)and 目的 and(技术特点 or 创新点),如何提高查准率?,提高专指度(用下位词或换专指性强的自由词)用逻辑乘“*”(and)或 not 相关检索项;如查找克林顿,但不要关于莱温斯基的信息。检索式:克林顿 not 莱温斯基用文献外部特征限制输出结果(在中文图书中查找);用“二次检索”、“条件检索”排除误检;限制检索字段,指定邻接和优先关系。,检索时常见问题分析,造成误检或漏检的原因:1)课题分析不透;“学科归属”不清2)“语言”不通3)主题概念不是大了,就是小了4)“同义词库”不全5)核心词太多6)选择的检索工具专业性不够,1)课题分析不透;“学科归属”不清,对课题

32、的真正含义和学科归属不清楚,会造成最大的失误。如查找有关“玻璃钢”制造工艺方面的资料,如果从字面含义着手,以为它属玻璃工业或金属材料的范畴,而事实上,玻璃钢既不属硅酸盐工业里的玻璃类,也不属金属材料里的钢铁制品,而是合成树脂与塑料工业里的增强、填充塑料制品。如果没有认真分析课题的真正含义和学科归属,就匆匆着手检索,往往会欲速不达,或多走弯路,甚至导致失败。,2)“语言”不通,基于计算机的文献检索的特点与其说是人机对话,不如说是标引人员与检索人员的对话,只有标引人员与检索人员所表达的“语言”一致,才能顺利实现文献检索。往往检索工具使用的是标引语言,而检索者使用的多数是自由词,未经规范化,这样在表

33、达方式上有差异,造成了检索障碍。如:自由词:维生素 C(vitamin C);标引词:抗坏血酸(ACID,ASCORBIC)自由词:艾滋病(AIDS);标引词:ACQUIRED IMMUNODEFICIENCY SYNDROME(后天免疫缺陷综合症);又如“沙示”(SARs),禽流感(Bird flu).,3)主题概念不是大了,就是小了,检索者不知道如何正确定位课题的主题概念,往往会不是大了,就是小了,初学者更容易把概念偏大。主题概念的范畴太大造成大量没用的文献被误检,太小造成重要的的文献被漏检。如“石油工业的废水处理”,若用“废水处理”作为主题概念,就会太大,在中国期刊网中有1400多篇,如

34、果我们知道石油工业主要排放的是毒性较大的含酚废水,那么主题概念定位在“含酚废水处理”就比较恰当了,此时查出的文献大概有2030篇。,4)“同义词库”不全,往往同一件事情或事物,不同作者喜欢用不同的词来表达,这就造成了庞大的同义词库,如果偏偏你头脑中的“同义词库”不是那么全,造成漏见就不足为怪了。例:艾滋病艾滋病、爱滋病碳纤维碳纤维、炭纤维聚四氟乙烯PTFE,polytetrafluoroethylene,Teflon设备apparatus,equipment,device汽车car,automobile,vehicle,计算机与通信学院 陈多,同义词(计算机与电脑)、近义词(如实验与试验)、学

35、名和俗名(发动机与马达)、不同译名(激光与莱赛)、简称与全称(如中国与中华人民共和国)、不同写法(发X射线与爱克斯射线)等进行选择;对多义词、同形异义词进行限定说明,如杜鹃既表示一种鸟,也表示一种花,就须限定说明为,杜鹃(动物)、杜鹃(植物)。,例:,5)核心词太多,对于由A、B、C、D、E多个主题组合的多主题概念课题,如果将所有主题混在一起同时组配,会造成“零结果”现象。因为,只要A、B、C、D、E其中之一的检索结果为零,则经过布尔逻辑“和”的运算,检索结果=A*B*C*D*E=0。,6)选择的检索工具专业性不够,E-journals:中文:中国期刊网、万方数据库系统、维普.英文:Elsev

36、ierSearch engine:北大天网,百度,GooGle,Yahoo!Openfind,.,解决上述问题的方法,1、掌握文献和文献检索的基本知识2、熟悉各种文献信息的分布3、掌握文献检索的基本技巧:检索算符、检索语法、常用搜索引擎和数据库的特殊技巧4、不断实践、不断归纳总结,如:关键词的选择技巧,我们了解常规搜索方式,但每个人都会搜索出不同结果,为什么?核心问题在于关键词选择不同。在当今互联网上,你永远不会愁你找不到东西,而是东西太多,你无法找到你需要的东西,因此搜索效率便成为最重要的一环,搜索效率直接关系到搜索的关键词的选择。,关键的分析必须保证两点:一是专业性,即这个词是很精的,可能

37、简化你的搜索结果,因而词甚至可以怪一点,尽量避免大众化的词,如net,site等。即使需要大众化词,如password,username,但若加入一两个特征词,则结果将大大简化。二是具有代表性,也即这个词具有代表意义,也即它在包含你所需网页内,它在出现的可能,以免一些有用信息被遗漏。,有机检索理念,强调的是有计划,有组织,协调检索过程,使检索变得简单化,高效化,为工作和学习带来更多的便捷。首先应该了解为什么要检索,什么东西需要我检索,在什么地方检索?如何高效率地检索到自己的所需?如何应对检索不到的文献和资料?检索后应该怎么做?,有机检索的精髓,在知识层面上要了解全球数据库的概况,使检索具有方向

38、性和合理性。需要大家熟悉全球大的数据库(不包括个人主页等检索方式了),数据库不仅是文献数据库,如OVID,sciencedirect,human press,blackwell,BP,ACS,CA,BA,还包括专业数据库。当然,检索内容还包括用google对图像,PPT,PDF,等检索(下一代检索也许会用微软的longhorn的新的检索工具了),因此要求大家对检索知识必须有个初步的掌握,检索不要贪多,一定要精,使检索达到最简化和最优化。尤其是检索文献,有人喜欢一次性下载一两百篇文献,所谓“通吃”,最终看了多少?十有八九是浪费!paper是用来读的,不是用来收藏的。如何高效地检索也包括这一点:只

39、要必需的!不是必需的,不必找!同时看paper只看重要的paper,一般的,或比较差的paper最好少看,有时会误导你的思路的。文献读多了,会被文献套牢了,你没有思路了。相反,一篇好文献,值得你反复回味,多读数遍都可以,一直到读懂,读透为止。,要求一次检索服务终生,使检索效率达到最大化!这便是高效!许多朋友在需要时便检索,检索完毕,东东就没了,或者不知道放到哪了,或者随手扔了,下次需要时再检索。但一定要知道,有时候当你需要的时候,它并不容易被你检索到。如何避免这种情况呢,这便是我讲的重点之一。,建立自己的数据库是达到有机检索的重要方法之一,也是检索后应该做的主要事情!personal data

40、base,或private database。将你所查过的有用信息(因为你现在查了,如果你学习和工作的方向不变,将来可能还会有用),尤其是精华的,有用的信息,及时进行归类整理,相信时间长了,自然便有了自己的小数据库,如果要查什么内容,首先想到的是自己的数据库,如果刻盘,可以随身携带,多么方便快捷,即使不能上网的地方也可以用!,所有经过你手头的文献都要入库!建议文件采用reference manage或endnote软件进行管理,并进行适当地分类,按软件的编号给你的文献编上相应的序号(如1.pdf,2.pdf,3.pdf.),并将文摘导入到软件中。录入时每篇花个几分钟,这样随时间积累,你的数据库将越来越大,这样查找起来非常方便,只要知道关键词或某个词,便能发现不仅仅是一篇你需要的文章,而是很多,应助别人,帮助自己,都很方便。因此我个人希望我们生物谷的每个人都学会这种习惯,backup your finding。,完,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号