计算机检索概论课件.ppt

上传人:牧羊曲112 文档编号:1547895 上传时间:2022-12-04 格式:PPT 页数:31 大小:495.50KB
返回 下载 相关 举报
计算机检索概论课件.ppt_第1页
第1页 / 共31页
计算机检索概论课件.ppt_第2页
第2页 / 共31页
计算机检索概论课件.ppt_第3页
第3页 / 共31页
计算机检索概论课件.ppt_第4页
第4页 / 共31页
计算机检索概论课件.ppt_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《计算机检索概论课件.ppt》由会员分享,可在线阅读,更多相关《计算机检索概论课件.ppt(31页珍藏版)》请在三一办公上搜索。

1、计算机检索概论,参考教材:P74-80,周满英 信息检索机检概论,计算机检索相对手工检索的优势,速度快,耗时少 途径多 种类齐全 数据更新快 组配灵活 结果输出多样,周满英 信息检索机检概论,计算机检索目前主要方式,1.光盘检索(1980s-) 光盘的优点是存贮量大、稳定性好、使用方便、成本低廉等,能存贮数据、文字、图象、声音、动画等各种信息,且不受通信线路的影响。 2.网络检索(1990s-) 因特网具有广泛性、方便性,还增加了许多新的动态信息服务,同时以搜索引擎为核心的网络搜索技术也日益发展。,周满英 信息检索机检概论,计算机检索的原理,计算机信息检索就是利用计算机进行信息的存储和检索的过

2、程,存储和检索对应于数据库的建立和利用。将大量的文献信息加工处理,以一定的结构有序地存储在计算机的存储介质上,建成数据库,这是计算机的存储过程。将检索需求以一定的方式输入计算机中,由计算机对其进行处理,与已存储在数据库中的信息进行查询和匹配,并按要求的格式输出检索结果的过程,就是计算机的检索过程。,周满英 信息检索机检概论,计算机检索原理图,信息存储,信息检索,信息源,主题概念,文献标识,数据库,信息需求,提问概念,检索提问式,检索结果,分析,标引,存储,匹配,分析,检索,检索语言,规范,周满英 信息检索机检概论,数据库的类型,书目数据库 包括文摘、目录、题录等书目数据,如文章的标题、作者、文

3、献出处(刊名、年、卷期、页码)、馆藏单位、文摘信息等,又称二次文献数据库。如:PubMed、CBM(中国生物医学文献数据库)全文数据库提供原始文献的全文,实现检索的一次到位。如:OVID、维普数据库、CNKI期刊全文数据库 数值数据库提供数值、参数、公式等信息,包括统计数据、实验数据、人口数据、化学品理化参数等如:美国国立生物技术信息中心(NCBI)的Genbank(基因库)、世界卫生组织的统计信息系统(WHOSIS),周满英 信息检索机检概论,数据库的类型,事实数据库提供事实信息,如人物、机构、事件、疾病的诊断和治疗、药物的用法和不良反应等。如:疾病诊疗数据库、中国非处方药数据库 图像数据库

4、以图像为信息主体,配有文字解释,如解剖图谱、中草药图谱、诊断图谱、手术图谱等。如:美国国立医学图书馆的The Visible Human Project(可视人计划)、哈佛大学医学院的The Whole Brain Atlas(全脑图谱)多媒体数据库将文字、数值、声音、图像等不同信息形式进行统一处理和管理的数据库,周满英 信息检索机检概论,常见的生物医学文献数据库,中文 中国生物医学文献数据库(CBM) 中文科技期刊数据库(重庆维普,VIP) 中国期刊全文数据库(清华同方,CNKI) 万方数据库资源系统 外文 Medline/PubMed OVID EM(荷兰的医学文摘) BA(美国的生物学文

5、摘) CA(美国的化学文摘),周满英 信息检索机检概论,数据库的结构,字段(field) 是组成记录的数据项,如篇名、著者、来源、主题词等。记录(record) 由字段组成,每条记录都描述了原始信息的外部特征和内容特征,一条记录代表一篇文献。文档(file) 是数据库中一部分记录的集合。,周满英 信息检索机检概论,数据结构举例,周满英 信息检索机检概论,常用的记录字段,AB 文摘 MH 主题词AD 地址(第一著者) PP 出版地AU 著者 PY 出版年TI 文章标题 PT 文献类型TT 翻译标题 CN 分类号TA 刊名 CT 特征词TW 关键词 CRF 参考文献LA 语种 PG 页码MMH 主

6、要主题词IS ISSN(国际标准连续出版物编号) SO 出处(刊名、年、卷、期、页),周满英 信息检索机检概论,常用计算机的检索途径,自由词途径 主题词途径 分类浏览 著者检索 引文检索 索引检索 期刊检索 基本检索 高级检索 专业检索,周满英 信息检索机检概论,计算机的检索技术,布尔逻辑检索 截词检索 限制检索 位置算符,周满英 信息检索机检概论,布尔逻辑检索,反映概念之间交叉和限定关系的一种组配,常用“AND”或“*”表示。 表示检索结果中的每一条记录必须同时包含有检索词A和B。,A,B,逻辑与,周满英 信息检索机检概论,举 例,查找“冠心病的舌诊研究”方面的文献 冠心病 AND 舌诊 查

7、找“吸烟与肺癌关系”的文献 吸烟 * 肺癌,周满英 信息检索机检概论,布尔逻辑检索,反映概念之间并列关系的一种组配,常用“OR”或“+”表示。 表示一篇文献中A、B两者中有一即可,也包括两者同时存在。,A,B,逻辑或,周满英 信息检索机检概论,举 例,查找“消渴”方面的文献 消渴 + 糖尿病 查找“维生素C”方面的文献 维生素C OR 抗坏血酸,周满英 信息检索机检概论,布尔逻辑检索,是从原检索中排除一部分,常用“NOT”或“”表示。 表示检索结果中每一条记录必须包含检索词A,但不能包含检索词B。,B,A,逻辑非,周满英 信息检索机检概论,举 例,查找“非儿童哮喘”方面的文献 哮喘 儿童 查找

8、“肝炎非流行病学”方面的文献 肝炎 NOT 流行病学,周满英 信息检索机检概论,优先级说明,可以在一个检索式中同时使用多个逻辑运算符,还可以用括号来改变运算次序: ()NOTANDOR 例如:检索有关“微量元素铜、铁、锌与儿童营养不良”方面的文献。 (铜 OR 铁 OR 锌)AND(婴儿 OR 幼儿 OR 儿童)AND 营养不良,周满英 信息检索机检概论,截 词 检 索,用符号取代检索中部分字母,保留检索词中的相同部分。常用的截词符号有“*”、“?”。不同的检索系统中采用不同的符号。按照截断的字符数量,可分为无限截断和有限截断两种。按照截词的位置,可分为前(左)截断、中间截断、后(右)截断。,

9、周满英 信息检索机检概论,截 词 检 索,有限截断 一般用“?”表示有限截断,一个“?”表示一个字符或零个字符。 如:输入“computer?”来检索,可以查到含有computer、computers、computering的记录,但对含有computerization的记录检索无效。无限截断 一般用“*”表示无限截断,一个“*”表示0N个字符。 如:输入“immun*”来检索,可以查到含有immune、immunology、immunodeficiency等所有以“immun”开头的单词。,周满英 信息检索机检概论,限 定 检 索,将检索范围限定在某个特定字段或某一时间范围进行检索。常用表达

10、形式有:字段标识符检索词,检索词 in 字段标识符,字段标识符检索词常用的限制符有:“in”、“=”。 English in LA,表示限制检索结果的语种为英语。 PY=1998,表示把结果限定在1998年。等同于PY1998,周满英 信息检索机检概论,位 置 算 符,反映两个检索词在文献中的邻近关系。不同的检索系统的位置算符是不一样的。常见的有near、with两个。with表示检索词在同一个字段中。near表示检索词在同一个句子中,词序可以颠倒,可以在near后面加上数字来限定两个词语之间可以插入的词的数目。,周满英 信息检索机检概论,计算机的检索策略,分析课题,明确检索要求 选择数据库和

11、检索途径 确定检索词,构建检索式 上机检索操作和反馈调节 整理检索结果,获取原始文献,周满英 信息检索机检概论,检索结果的反馈与调整,分析课题,明确检索需求,选择数据库,确定检索途径,确定检索词,编写检索式,输入计算机,进行匹配运算,浏览检出文献,结果是否满意,输出检索结果,分析失败原因调整检索式,YES,NO,检 索,周满英 信息检索机检概论,检 索 效 率,检全率在进行某一检索时,检出的相关信息量与系统信息库中相关信息总量的比率。检全率高则漏检少,但是有可能误检率高。检准率在进行某一检索时,检出的相关信息量与检出的信息总量的比率。检准率高则误检少,但是可能漏检。,周满英 信息检索机检概论,

12、检 索 要 领,有主题词的数据库,尽量选择主题词检索。进行主题词检索时,要尽量借用副主题词的限定来使文献查准,要注意用下位词扩检来避免文献的漏检。用关键词和自由词检索时应选择有实质意义的词,同时要全面考虑其同义词,避免漏检。当检出文献太多或太少时要考虑逻辑运算或者增加或减少同义词、检索词以及限定。,周满英 信息检索机检概论,缩小检索范围,选用专指性较强的下位词或限定副主题词。增加and连接,进一步限定主题概念。用字段限定检索范围,如篇名字段、主题词字段、年份字段等。用位置运算符将检索词限定在一个句子中或者同一字段中用not排除无关概念。,周满英 信息检索机检概论,扩大检索范围,从词表或检出文献中选同义词、相关词补充,用OR连接在检索式中。采用截词符,把所有不同后缀的词都作为检索词。进行族性检索,可采用分类检索,网罗所有同一类目的文献。取消某些限制过严的限制检索。对主题词或副主题词进行扩展检索。,周满英 信息检索机检概论,思 考 题,以下检索式中,哪个查出文献最多,哪个最少?A and B(A or B) and CA and B and CA and B or C,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号