《信息检索与管理方法陈庄.ppt》由会员分享,可在线阅读,更多相关《信息检索与管理方法陈庄.ppt(20页珍藏版)》请在三一办公上搜索。
1、信息检索与管理方法,信息资源组织与管理之第4章,陈庄 博士 教授重庆市经委企业信息化专家组专家重庆市科委制造业信息化专家组专家重庆市软件协会理事;,2005/03/24,第4章 信息检索与管理方法,4.1 信息检索的内涵4.1.1 信息检索的定义(掌握)4.1.2 信息检索的分类(掌握)4.1.3 信息检索的作用(了解)4.2 信息检索的原理与流程4.2.1 信息检索的原理(了解)4.2.2 信息检索的流程(掌握)4.2.3 信息检索案例(了解)4.3 信息检索的方法和技术 4.3.1 信息检索方法(掌握)4.3.2 信息检索技术(了解)4.4 信息检索的效果及其评价4.4.1 信息检索效果的
2、评价指标(难点,基本掌握)4.4.2 提高检索效果的方法(了解)4.4.3 工程技术学术资源检索实例评价(了解)作业(),4.1.1 信息检索的定义,信息检索(Information Retrieval)又称为情报检索,产生于图书馆的情报咨询工作,是信息组织的逆过程。信息组织是将分散的信息组织成一个有序的、有具体目标的体系,而信息检索则是迅速地从这个体系中搜寻满足用户需求的信息。信息检索是从大量相关信息中利用人-机系统等各种方法加以有序识别与组织,以便及时找出用户所需部分信息的过程,信息检索“行业”案例介绍:美国的EI、SCI;北京超星、电子书生、万方;重庆的维普(聚合公司)。,4.1.2 信
3、息检索的分类(1/2),1、按检索内容的分类(3类)1)数据信息检索 数据信息检索(Data Information Retrieval)是将经过收集、整理、加工的数值型数据存入检索数据库中,然后根据用户需求检索出可回答某一问题数据的过程。2)事实信息检索 事实信息检索(Fact Information Retrieval)是将存储于检索数据库中的关于某一事件发生的时间、地点、经过等信息查找出来的检索。3)文献信息检索 文献信息检索(Document Information Retrieval)是将存储于检索数据库中的关于某一主题文献的信息查找出来的检索。(最多!检索案例:科技成果检索、论文文
4、献综述;检索工具案例:重庆聚合维普、超星、goole等),4.1.2 信息检索的分类(2/2),2、按组织方式分类 1)全文检索:全文检索(Full Text Retrieval)是将存储于检索数据库中整本书、整篇文章中的任意内容查找出来的检索。(维普、超星)2)超文本检索:超文本检索(Hyper Text Retrieval)是对每个结点中所存信息以及信息链构成的网络中信息的检索。(goole、百度)3)超媒体检索:超媒体检索(Hyper Media Retrieval)是对存储的文本、图像、声音等多种媒体信息的检索,它是多维存储结构。(数字图书馆)3、按检索设备分类 1)人工检索:是人直接
5、用手、眼、脑组织、查找印刷型文献的检索。2)自动检索:又称计算机检索,是通过计算机对已数字化的信息,按照设计好的程序进行查找和输出的过程。按处理方式,自动检索又分为:脱机检索和联机检索;按存储方式,自动检索又分为:光盘检索和网络检索。,4.1.3 信息检索的作用,1、较全面地掌握有关的必要信息2、提高信息利用的效率,节省时间与费用3、提高信息素质,加快人才的培养。(信息素质(Information Literacy):是指具有信息获得的强烈意识,掌握信息检索的技术和方法,拥有信息鉴别和利用的能力。),4.2.1 信息检索的原理(1/2),文献检索过程的系统表述,4.2.1 信息检索的原理(2/
6、2),文献检索简化流程,相关性评估层次示意图,4.2.2 信息检索的流程(1/2),图4.3 信息检索步骤流程图,4.2.2 信息检索的流程(2/2),0、明确信息需求:1)普查型:需要全面收集有关某一检索需求的文献资料;2)攻关型:需要收集有关某一检索需求的某一特定方面的文献资料,其目的在于解决生产管理中的关键问题;3)探索型:需要了解和掌握某一领域最新研究动向或研究成果的检索需求,1、选择检索系统:DIALOG、万方、SCI、EI、超星 2、确定检索词:1)是表示主题的检索词,如标题词、单元词(最基本的词汇)、叙词、关键词(指从题目、正文或摘要中抽出的能表征信息主题的词语);2)表示作者的
7、检索词,如作者姓名、机构名等;3)表示分类的检索词,如分类号等;4)表示特殊意义的检索词。如ISBN号、ISSN号、引文标引词等。3、构造检索表达式:构造一个既能表达检索需求,又能为计算机识别的检索表达式,主要使用布尔逻辑运算符、位置运算符、截词运算符、限制符等,将检索词进行组合。4、实施检索策略:扩检、缩检、索取原始信息。5、修改检索策略:检索需求差别、检索系统的性能各不同,加上检索人员水平不一,所以,构造的检索词往往具有较大的局限性、随机性和盲目性,有可能导致检索的失败,这就要求在检索时不断了解反馈信息,及时修改检索策略。,信息检索案例:造纸黑液废水的治理技术,1、信息需求分析:属于环境科
8、学领域,所查文献类型应包括书目文摘、事实和全文性信息。2、确定检索词:paper pulp,paper making,waste water,treatment,treat 3、拟定检索表达式(“w”表位置算符,paper w making 表找paper making 记录)(paper w making or paper w pulp)and waste water and(treatment or treat)4、进入检索系统:OCLC的主页(http:/www.ref.oclc.org)5、选择主题范畴:根据OCLC的13个主题及课题领域,选主题General Science 6、选择
9、检索数据库:OCLC WorldCat,OCLC ArticleFirst,OCLC ContentsFirst,OCLC PapersFirst 7、输入检索表达式:输入第3步的检索表达式 8、提交检索式:单击“StartSearch”按钮完成了提交。9、显示结果:系统将返回检索结果:共119条记录,以每屏10个记录格式显示。10、优化结果:返回记录太多,所以需要对检索式进一步限定,用高级检索将检索词进行不同字段的组合。,Pulp:使.化成纸浆(vt);变成纸浆(vi),4.3.1 信息检索方法,1、常规检索法 1)直接检索法:直接利用检索工具进行信息检索的方法。2)间接检索法:利用检索工具
10、间接检索信息资源的方法。包含检索课题的分析、检索策略的制定、检索技术的应用等方面。3)顺查法:按年限顺序查找。4)倒查法:与顺查法相反。5)抽查法:一种利用检索工具进行重点抽查检索的方法。2、回溯检索法:以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。(参考文献的重要性!)3、循环检索法:交替使用回溯法和常规法来进行文献检索的综合检索方法。,4.3.2 信息检索技术,1、信息检索技术的概念 信息检索技术是应用于检索提问与文献表示的匹配比较的技术。2、信息检索技术的类型(1)准确匹配(exact match):要求文献(标识)中包含的需求模式必须与检索提问式所表达的模式完全匹配,才能
11、作为命中文献输出,目前大型实用系统采用的布尔逻辑检索、原文检索和字符串检索技术均属于准确匹配技术。(2)局部匹配(partial match):只要求文献(标识)中包含的需求模式与检索提问式表达的模式部分匹配,即为命中文献输出。它又可分为个体匹配和网络匹配两种类型。(3)其他综合技术(聚合公司):数据库技术、分布异构资源导入技术、输出技术等,4.4.1 信息检索效果的评价指标(1/3),一、信息检索效果的评价指标应包含的指标内容 1)数据库的规模和内容:覆盖范围、索引组成、更新周期;2)索引方法:自动索引、人工索引、用户登录;3)检索功能:布尔查找、复杂布尔、相邻和相邻ANDOR查询、截词查找
12、、字段查找、大小写有别、概念检索、词语加权、词语限定、特定字段限定、默认值、中断退出、重复辨别、上下文关键词、查询集操作等;4)检索结果:相关性排序、显示内容、输出数量选择、显示格式选择;5)用户界面:帮助界面、数据库和检索功能说明、查询举例;6)用户负担:用户界面、相关文献和信息过滤功能等。7)其他:查准率和响应时间。二、有关指标的描述 以下介绍:信息检索查全率、信息检索查准率、信息检索漏检率、信息检索误检率、信息检索响应时间。,4.4.1 信息检索效果的评价指标(2/3),1、信息检索查全率 查全率=,相对查全率=,式中,a为相关的文献的命中数;c相关文献的遗漏数。,2、信息检索查准率 查
13、准率=相对查准率=,式中,b为不相关的文献数(噪声)。,4.4.1 信息检索效果的评价指标(3/3),3、信息检索漏检率 漏检率=,4、信息检索误检率 误检率=,5、信息检索响应时间及其他指标 传统的评价指标还有:1)收录范围:一个系统收录的文献是否齐全,包括专业范围、语种、年份与文献类型等,这是提高查全率的物质基础;2)工作量:从系统获得相关文献,必需消耗的精力和工作时间;3)可用性:按可靠性、年代与全面性的因素看检出文献的价值;4)外观:检索结果的输出形式。,4.4.2 提高检索效果的方法(1/2),1、提高检索人员素质1)提高检索人员的知识素质2)提高检索人员的思想素质2、优选检索工具和
14、数据库3、优化检索策略与步骤4、精选检索词1)不使用常用词 2)避免使用多义词3)避免使用错别字4)学会使用截词5)使用大小写字母6)尽量使用专指性强的词或短语,4.4.2 提高检索效果的方法(2/2),5、巧构检索提问式6、熟悉检索代码与符号7、鉴别检索结果1)信息来源与出版(Parentage and Provenance)2)权威性(Authority)3)用户(Audience)4)网站内容(Content)5)时效性(Currency),4.4.3 工程技术学术资源检索实例评价,1、分析检索内容 2、选择检索词 3、选择检索工具 4、检索工具使用分析比较,作 业,P131:2、3、4、7,