《计算机检索的基原本理及过程.ppt》由会员分享,可在线阅读,更多相关《计算机检索的基原本理及过程.ppt(29页珍藏版)》请在三一办公上搜索。
1、计算机检索的基本原理及过程,目 录,文献数据库的概念文献数据库检索步骤主题词关键词的选取文献数据库的字段检索检索效果评价常用检索技术计算机信息检索实例,1 文献数据库,文献数据库是将各个学科领域、各种专业技术方面的文献信息汇集在一起,经过分门别类的组织、加工、编排后形成的数据库。它能够提供人们方便而快速地,更具针对性地查找各种文献资料的线索或者全文。,文献数据库基本知识,1.1 文献数据库的类型,按收录文献的类型划分,按提供信息的详略划分,图书文献数据库,期刊文献数据库,专利文献数据库,会议文献数据库,文摘数据库,作者,全文数据库,全文,+,文献数据库基本知识,2、文献数据库检索步骤,确定检索
2、要求和目标,拟定检索对象范围主题词,选择数据库及检索途径,实施检索并显示检索结果,用检索技术优化检索结果,选择输出(打印、拷贝或发送至电子邮箱),2.1 选择检索词,利用主题词表选取规范化的主题词或词组利用印刷版的检索工具书手工试检,根据检出文献的主题词标引情况,选取合适的主题词。选用自由词由于词表规模的限制,不可能对某一专业作全面检索时,应考虑选用自由词,尽可能多地选用与课题有关的同义词,以防漏检。,检索词选取时应注意的问题,避免冷僻词找出隐性概念使用核心概念注意同义词近义词词型变化,2.2 检索途径,作者(文章的责任者)篇名(或题名)机构(如浙江工业大学)关键词(如污水处理、高层建筑)主题
3、词(规范化的主题概念,如用激光不用雷射)文摘(论文或图书的摘要或内容提要)引文(即参考文献)基金(如国家自然科学基金项目)刊名(期刊的名称)全文(或者全记录),逻辑算符位置算符截词符常用命令,2.3 常用检索技术常用算符,逻辑检索概念示意图,A,B,A,B,A,B,A and B,A or B,B not A,与、AND、*用于概念交叉和限定。起缩小检索范围和提高文献查准率的作用。例 Solar*Energy,常用算符逻辑算符,或、OR、用于概念之间并列关系的组配。增加主题的同义词,以扩大检索范围,避免文献漏检。例 www+internet+network,常用算符逻辑算符,非、NOT、从原检
4、索范围中剔除一部分不需要的内容。例 EnergyNuclear除核能以外的有关能源方面的文献才被命中。,常用算符逻辑算符,常用算符位置算符,布尔算符中的逻辑“与”只要求两个检索词必须同时出现在同一篇文献中,而没有限定算符两侧检索词之间的位置关系,有时难免造成误检。,常用算符位置算符,例如,查找“细菌对染料破坏”方面的文献,检索词:细菌、破坏、染料逻辑“与”组配检索结果:命中同时用这三个词标引的文献有“细菌对染料的破坏”方面的文献,也会有“染料对细菌的破坏”方面的文献,要排除后一部分的文献,就需用位置算符限定词与词之间的位置关系。,(W)或()算符:“With”的缩写词序不许颠倒两词之间不许插词
5、,只许空格或连字符号例 CD(W)ROM 将命中 CD ROM 或 CD-ROM solar()energy 检出 solar energy,常用算符位置算符,常用算符位置算符,(nW)算符:“n words”的缩写(nW)是从(W)算符引伸出来检索词之间允许插入0n个词词序不许颠倒例 anticorrosion(1W)paint 可检出 anticorrosion paint 和 anticorrosion of paint例 检索“材料磨损”(WEAR OF MATERIALS)方面的文献,检索式:WEAR(1W)MATERIALS,常用算符位置算符,(N)算符:“Near”的缩写词序可以
6、颠倒两词之间不许插词例 cross(N)section 可检出 cross section 和 section cross,常用算符位置算符,(nN)算符:(nN)是从(N)算符引伸出来检索词之间允许插入0n个词词序可以颠倒,常用算符位置算符,(F)算符:“Field”的缩写算符两侧的检索词必须在同一字段内词序及两词间插入的词数不限例 digital(F)computer/TI,AB,常用算符位置算符,(S)算符:“Sentence”和“Sub-field”的缩写算符两侧的检索词必须在同一句子词序及两词间插入的词数不限,常用算符位置算符,上述位置算符可以混合用于同一检索式中,由于检索系统是按从
7、左到右的顺序处理检索式,因此,应将限制最严的算符放在最左边。,非限制性截词:“?”加在词干或不完整的词上,对词的完整意义进行检索。computer?代表 Computer,computers,computerized等限制性截词:analy?er 命中记录中将出现analyzer 和analyser;work?命中记录中将出现,work,works,worker,workers,working,常用算符截词符,3、检索效率,检索系统进行检索时产生的有效结果它直接反映了检索系统性能的好坏。衡量检索效果的指标查全率(recall ratio)查准率(precision ratio),检索出的相关文
8、献量,数据库中的全部相关文献,查全率R=,x100%,检索出的相关文献量,检出的文献总量,查准率P=,x100%,最理想的检索结果是查全率和查准率都达到100。R100表示数据库中收录的全部相关文献都被检索出来P100表示检索出来的文献全部都是相关文献但事实上,检索中有许多因素使这个指标很难达到。,R,0,P,查全率R与查准率P的关系曲线,C,A,D,B,C.W.Cleverdon(英)进行Granfield试验,得出查全率R与查准率P曲线。RP之间存在着互逆关系 A点检索词数量多,泛指性强,查全率较高但查准率却非常低B点检索词专指性较强,查准率就高查全率因此降低 C,D两点两种极端的折衷。查
9、全率一般在6070查准率一般在4050无论怎样调整检索策略和改进系统效率,都无法使P和R同时接近100。,4、计算机检索实例,课题名称:高层建筑的抗震结构设计 课题分析该课题涉及的主要概念有:高层、建筑、抗震问题和结构设计等方面。,作 业,1、信息素质包括哪几个方面?2、信息检索活动的功用有哪些?3、文献按加工深度、出版形式和载体形态分别可分成哪几类?4、文献检索的工具有哪些?文献数据库可分成哪几种类型?请列举五种检索途径。5、请查询本校图书馆的馆藏目录,写出5本有关“计算机应用”或“国际贸易”的图书的索书号并简要说明索书号的构成。6、什么是检索语言,检索语言有几种?请详细列举并进行比较。7、文献检索的方法有哪些?各自的优缺点是什么?8、如何提高检索文献的效率并查全查准文献?9、检索词选取时应注意的问题有哪些?10、国际商业经济活动中应了解的信息有哪些?(非经贸专业不做)11、请说明计算机检索系统的基本原理及检索过程。12、布尔逻辑检索、截词检索、词位置检索、加权检索各举一例。13、通过浏览浙工大图书馆网页,说明图书馆的资源布局,服务项目(包括网上服务项目至少8项)并对网页加以评论(200字以上),