《《计算机检索》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《计算机检索》PPT课件.ppt(30页珍藏版)》请在三一办公上搜索。
1、计算机检索概论,上海中医药大学文献检索教研室 罗晓兰,主要内容,计算机检索基本概念数据库的类型数据库结构计算机检索途径计算机检索技术计算机检索策略,计算机信息检索概念,计算机文献检索经常称为机检,是文献检索的一种方式。计算机信息检索是指利用计算机存储和检索信息。指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息的过程。,计算机检索发展的历史,1.脱机批处理检索阶段2.联机检索阶段3.光盘检索阶段4.网络化检索阶段,计算机信息检索系统的组成,1.计算机2.通信网络3.检索终端设备4.数据库,计算机检索原理,计算机检索的特点,
2、检索速度快检索途径多更新快资源共享检索更方便灵活检索结果可以直接输出,数据库的类型,根据载体不同:联机数据库、光盘数据库、网络数据库根据数据库的内容和功能:书目数据库,如CSDL全国期刊联合目录文摘数据库,如CBM(中国生物医学文献数据库)全文数据库,如CNKI(期刊、学位等全文)数值型数据库,如GenBank(基因库)事实性数据库,如PDR(癌症研究信息)多媒体数据库(图像、音频、视频),如爱迪克森网上报告厅,数据库的结构,文档记录字段文档:数据库中一部分记录的有序集合记录:数据库的信息单元,每条记录描述了一个原始信息的外部特征和内部特征。字段:比记录更小的单位,是组成记录的数据项目。,常用
3、字段,AB 文摘 PO 页码AD 地址(第一著者)PP 出版社AU 著者 PY 出版年CA 索取号 PT 文献类型CN 中国代码 RF 参考文献数CL 分类号 IP 期 SO 出处(刊名、年、卷、期、页)TI 中文题目IS 国际标准连续出版物号 TT 英文题目TA 期刊名称 TW 关键词LA 语种 VI 卷MMH 主要概念主题词 MH 主题词,记录,字段名对应文献的内部特征和外部特征,计算机检索途径,检索途径:用记录的某一特征作为检索切入点进行检索。以文献外部特征为检索途径,如题名(刊名、书名、篇名)、责任者(作者、编者、译者、专利权人、出版机构等)、号码(标准号、专利号、索取号等)。著者:根
4、据已知责任者的名称来检索文献的途径。刊名:根据已知期刊名来检索文献的途径。机构:根据已知机构名来检索文献的途径。引文:根据已知的引文信息,包括被引用文献的作者、主题词、刊名等。以文献内容特征为检索途径分类途径:按照文献资料所属的学科属性进行检索的途径主题途径“按照文献的内容主题进行检索的途径。,计算机检索途径和技术,计算机检索途径和技术,据用户的需求,提供难易程度不同的检索方式:分类浏览/导航、基本检索/简单检索、高级检索、专业检索等。,计算机检索途径和技术,数据库检索中提供的其他检索技术:默认检索:又称“缺省检索”,指按照数据库预先设定的范围进行检索。二次检索:在前一次检索的结果上,再次进行
5、检索,缩小检索范围。扩展检索:主要出现在分类和主题检索中,选择扩展功能,可以对主题词或者分类及其所有的下位词或下位类进行查找。加权检索:出现在主题检索中。检索主要概念主题词的文献。限定检索:对检索范围进行限制,如学科、文献类型、年龄组、性别等。模糊检索:允许被检索信息与检索提问之间存在一定的差异,与检索词相关或者相似的词都会被命中,扩大检索范围。精确检索:检索范围仅限于输入的检索词,与之完全匹配才能够被命中。,计算机检索途径和技术,计算机检索技术,布尔逻辑检索 截词检索 字段限制检索 短语检索,布尔逻辑运算符(Boolean logic operator),布尔逻辑检索的基础,主要运算符有:逻
6、辑“与”AND逻辑“或”OR逻辑“非”NOT(有的数据库也表示为 AND NOT,BUT NOT)运算优先级:NOTANDOR可以用括号改变运算顺序:(),括号里的检索式优先运算。例:(消渴 OR 糖尿病)AND 药物治疗,逻辑与,A AND B 检出记录中同时含有检索词A和检索词B例:胃癌与十二指肠溃疡的关系。胃癌 AND 十二指肠溃疡,逻辑或,A OR B 检出记录中含有检索词A或检索词B的文献例:糖尿病 OR 消渴,逻辑非,A NOT B 在含检索词A的记录中,去掉含检索词B的记录例:能源 NOT 核能,逻辑运算习题,1.检索紫外线与皮肤疾病的关系。紫外线 AND 皮肤病2.艾滋病的治疗
7、(获得性免疫缺陷综合征 OR AIDS OR 艾滋病)AND 治疗3.肝炎的非流行病学研究 肝炎 NOT 流行病学,截词检索与通配符,用符号取代检索中部分字母,保留检索词中的相同部分,可提高查全率 按照位置分为:前截词、中截词、后截词按照截词符代表的字符数量:有限截词、无限截词截词符号:*、?、$、#等各种检索系统采用不同的符号如child*,可以检索出child,children,childhood wom?n,可以检索出woman,women,限定符,在指定的字段中检索。常用字段限制符有:“=”和“in”字段限定的句式为:检索词 in 字段名 字段名=检索词例:张三in au au=张三
8、针灸 in ti 提问:这两种限定方式有什么不同?,查全率和查准率,查全率(recall ratio)查准率(pertinency ratio)检出的相关文献数查全率=系统中相关文献总数*100%检出的相关文献数查准率=输出的文献总数*100%,计算机检索步骤,分析检索课题,明确检索要求选择数据库和检索途径确定检索词,构建检索提问式执行检索(优化检索策略)处理检索结果,获取原文,分析检索概念,分析检索课题,明确检索要求,提取主要概念和限定条件。例:查找2005-2009年高血压引起脑中风方面的学位论文。分析:主要概念:高血压 脑中风(同义词)限定条件:时间限定:2005-2009年 文献类型限定:学位论文,分析检索概念习题,1.查找2000年以来张莉发表的关于乳腺癌诊断方面的综述文献。2.慢性淋巴细胞性白血病的药物治疗3.细胞因子在人肝纤维化中的作用4.2008-2010年动脉粥样硬化动物模型研究进展,优化检索策略的方法,如果检索结果太多,可缩小检索范围,提高查准率。使用规范词、下位类主题词,提高检索词专指度;限定检索字段;(明确不同字段的检索范围)限定文献外部特征,如语种、时间等;,优化检索策略的方法,如果检索结果太少或为0,可扩大检索范围,提高查全率。使用主题词的同义词、近义词、上位类词;使用截词符,以检出所有词干相同的词;选择更合适的数据库。,