《文献检索(信息检索技术-11.8.29).ppt》由会员分享,可在线阅读,更多相关《文献检索(信息检索技术-11.8.29).ppt(29页珍藏版)》请在三一办公上搜索。
1、/29,1,文献检索,文献检索,电子科学与工程学院高福斌,检索技术部分,/29,2,文献检索,第二部分 计算机信息检索技术,2.1 布尔逻辑检索(Boolean Logic)2.2 位置检索(Position Search)2.3 截词检索(Truncation)2.4 字段限定检索(Field Limiting)2.5 短语检索(Phrase Search)2.6 自然语言检索(Natural Language Search),/29,3,2.1 布尔逻辑检索(Boolean Logic),第二部分 计算机信息检索技术,文献检索,(1)逻辑“与”算符:用 AND 或*表示;A概念和B概念的“
2、与”关系表示为:A AND B A and B A*B,/29,4,2.1 布尔逻辑检索(Boolean Logic),第二部分 计算机信息检索技术,文献检索,(2)逻辑“或”算符:用 OR 或+表示;A概念和B概念的“或”关系表示为:A OR B A or B A+B,/29,5,2.1 布尔逻辑检索(Boolean Logic),第二部分 计算机信息检索技术,文献检索,(3)逻辑“非”算符:用 NOT 或-表示;A概念和B概念的“非”关系表示为:A NOT B A not B A-B,/29,6,2.1 布尔逻辑检索(Boolean Logic),第二部分 计算机信息检索技术,文献检索,(
3、4)运算符的优先级运算 顺序如下:()NOTANDOR。,例如:(激光器 OR 调制器)AND 制备方法,先进行括号内的检索,然后再将其检索结果与制备方法组配,目的是检索激光器或者调制器的制备方法。,/29,7,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,也叫邻近检索(Proximity Search),定义:位置算符检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的邻近关系。目的:用于确定词语的相对次序或位置。,/29,8,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索
4、系统的位置算符的用法:,(1)(W)With(W)表示该算符两侧的检索词相邻,且两者之间只允许有一个空格或标点符号,不允许有任何字母或词,顺序不能颠倒。(W)也可以简写为()。,检 索 式:information()retrieval检索结果:information retrieval检 索 式:computer()aided()design检索结果:computer aided design,/29,9,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的位置算符的用法:,(2)(nW)nWords(nW)表示在此算符两侧的检
5、索词之间最多允许间隔n个词(实词或虚词),且两者的相对位置不能颠倒。,检 索 式:laser(1W)printer检索结果:laser printer laser color printer,/29,10,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的位置算符的用法:,(3)(N)Near(N)表示该算符两侧的检索词相邻,但两者的相对位置可以颠倒。,检 索 式:computer(N)network 检索结果:computer network network computer,/29,11,2.2 位置检索(Position
6、 Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的位置算符的用法:,(4)(nN)nNear(nN)表示此算符两侧的检索词之间允许间隔最多n个词,且两者的顺序可以颠倒。,检 索 式:computer(2N)system 检索结果:computer system computer code system computer aided design system system using modern computer,/29,12,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的位置算符的用法
7、:,(5)(S)Subfield(S)表示其两侧的检索词必须是在文献记录的同一子字段中,而不限定它们在该子字段中的相对次序和相对位置的距离。在文摘字段中,一个句子就是一个子字段。,检 索 式:computer()control(S)system检索结果:“This paper is concerned with an application of the computer control technique in a intelligent system for testing inner walls of pipes.”,/29,13,2.2 位置检索(Position Search),第二
8、部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的位置算符的用法:,(6)(F)Field(F)表示其两侧的检索词必须是在文献记录的同一字段中,而它们在该字段中的相对次序和相对位置的距离不限。,例如:water()pollution(F)control 表示在同一个字段中(如篇名、文摘、叙词等)同时含有 water pollution 和 control的文献记录均可检索出来。,/29,14,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,Ei Village检索系统中的位置算符(只有一种):,(N)Near(N)表示两个检索词彼此接近且
9、两词之间最多不超过5个词,前后顺序不限。,例如:water()pollution(F)control表示在同一个字段中(如篇名、文摘、叙词等)同时含有 water pollution 和 control的文献记录均可检索出来。,/29,15,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,CSA Illumina检索系统中的位置算符:,词间无算符,即表示将检索词作为一个词组来检索;WITHIN“x”,表示在指定的半径内(x个词)查找输入词,词序不限;NEAR,设定在相距不大于10个词的范围内查找输入词,相当于within 10;BEFORE,按照输入
10、检索词相应的顺序查找;AFTER,按照第1个词在第2个词之后的相应顺序查找。,/29,16,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,IEL检索系统中的位置算符:,,表示算符两边的检索词必须出现在同一短语内,两个检索词的顺序可以前后颠倒;,表示两个检索词相邻,中间相隔最多n个词,两个检索词的顺序可以前后颠倒。,/29,17,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,截词检索是计算机检索系统中应用非常普遍的一种技术。由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致
11、;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等。为了保证查全,就得在检索式中加上这些具有各种变化形式的相关意义的检索词,这样就会出现检索式过于冗长,输入检索词的时间太久,同时也占太多机时。,/29,18,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,截词检索就是为了解决这个问题而设计的,它既可保证不漏检,又可节约输入检索式的时间。所谓截词,就是指在检索词的适当位置截断,保留相同的部分,用相应的截词符代替可变化部分,计算机会将所有含有相同字符部分词的记录全部检索出来。,/29,19,2.3 截词检索(Truncation),第二部分 计算机信息检
12、索技术,文献检索,美国Dialog系统用“?”表示截词符,有以下几种截词方式。(1)后方截词 后方截词,也称前方一致。它是将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。后方截词又分为词尾的有限截断和词尾的无限截断两种情况。,/29,20,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,美国Dialog系统用“?”表示截词符,有以下几种截词方式。,(1)后方截词 词尾的有限截断相同字符串后可能变化一个字符时,则在其后使用一个“?”、空格、再加一个“?”,常用来表示检索词的单复数变化。例如用system?可以查出system和syste
13、ms的文献。相同字符串后可能变化两个以上字符时,则在其后连续使用若干个“?”代替可能变化的字符。例如,?表示两个字符,?表示三个字符,以此类推。,/29,21,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,词尾的无限截断相同字符串后可能变化任何字符串时,则在其后使用一个“?”。这种方法可以查找出含有相同字符串的所有检索词。例如,comput?可查出 compute,computer,computing,computation,computerisation等。,/29,22,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,(
14、2)中间截词 中间截词又称中间屏蔽,是一种用截词符屏蔽词中不同字符的方法。例如“woman”和“women”,可用“wom?n”代替;“defence”和“defense”可用“defen?e代替。截词符具有“OR”运算符的功能,能够扩大检索范围,而且减少了输入检索词的时间,节约了机时。常用的截词符有?”、“*”,、“”、“”等多种表示形式,不同的检索系统其截词符的表示形式和截词检索的方式是不同的,,/29,23,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,例如:输入optic*,可检索出optic,optics,optical等;“?”用于词中表示可以代
15、替一个字符,例如,输入wom?n可检索出woman,women.,Ei Village中的截词符为:“*”用于词中或词后表示可以代替多个字符,检索出相同词干的任意多个变化的词:,/29,24,2.4 字段限定检索(Field Limiting),第二部分 计算机信息检索技术,文献检索,字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在检索系统中,数据库设置的可供检索的字段通常有两种:表达文献主题内容特征的基本索引字段和表达文献外部特征的辅助索引字段。基本索引字段包括篇名、文摘、叙词、自由标引词四个字段;辅助索引字段包括除基本索引字段以外的所有字段,像著者字段、
16、著者机构字段、文献类型字段、语种字段等。每个字段都有用2个字母表示的字段标识符(或称字段代码)。,/29,25,2.4 字段限定检索(Field Limiting),第二部分 计算机信息检索技术,文献检索,在DIALOG检索系统的命令检索模式中,使用字段限制检索时,基本索引字段用后缀表示,即由“”与基本索引字段标识符组成,放在检索词或检索式的后面,例如,computer and net-work/TI,DE表示将检索式限定在篇名字段(TI)和叙词字段(DE)中;辅助索引字段用前缀表示,即由辅助索引字段标识符与“=”组成,放在检索词或检索式的前面,例如,要查找著者Smith D.发表的文献,检索
17、式可表示为AU=Smith D.。,/29,26,2.4 字段限定检索(Field Limiting),第二部分 计算机信息检索技术,文献检索,不同的检索系统其字段限定检索的表示方法也不尽相同。El Village中的限定字段检索采用within命令(简化为wn)和字段代码限定在特定的字段内进行检索,限定字段检索的输入格式为:检索词 wn 字段代码。ISI Web of Knowledge中的字段限定检索格式为:字段代码检索词。USPTO中的字段限定检索输入格式为:字段代码检索词,如TTL/computer。,/29,27,2.4 字段限定检索(Field Limiting),第二部分 计算机
18、信息检索技术,文献检索,PQDD中的字段限定检索的规则是:字段名或字段代码后跟用括号括起来的检索词,例如:title(biology);,au(Smith,Robert)。IEL中的字段限定检索采用算符,其格式为:检索词字段代码,例如:(fiber opticnetwork)ti。,/29,28,2.5 短语检索(Phrase Search),第二部分 计算机信息检索技术,文献检索,将短语用双引号“”括起来,表示检索出与“”内形式完全相同的短语,以提高检索的精确度,因而也称之为“精确检索”(exact search)。1.6 自然语言检索(Natural Language Search)即直接采用自然语言中的字、词、句进行提问式检索,同一般口语一样。这种基于自然语言的检索方式又被称为“智能检索”,特别适合不太熟悉网络信息检索技术的人们使用。,/29,29,检索技术部分结束谢谢!,数据库,