《文献检索策略构建.ppt》由会员分享,可在线阅读,更多相关《文献检索策略构建.ppt(43页珍藏版)》请在三一办公上搜索。
1、文献检索策略的构建,一、检索策略的构建,检索策略是根据检索课题的具体要求而制定的一套具体、合理的检索方案。正确制定检索策略,优化检索过程,有助于取得最佳的检索效果。检索策略的制定是否合理,以及在检索过程中能否根据实际情况随时修改原有的策略,使之 更加完善,都会直接影响检索结果。,分析检索课题,明确检索目的 选择检索方式和数据库 确定检索途径与检索标识 编制检索提问式 执行检索式 浏览检出文献,评价检索结果 调整检索策略 输出检索结果 转录、复印等,Yes,No,(一)分析研究课题,明确检索目的 分析研究课题的目的在于明确检索内容和 具体要求。为此,应对课题的背景、以知条件、以及要解决的问题及要
2、求等进行认真分析,明 确所需文献的范围、类型、文种、时间、空间、输出方式等。,(二)选择检索方式与数据库,1、检索方式(机检)的选择 1)脱机检索 2)联机检索 3)光盘检索 4)网络检索,2、数据库的选择 数据库是指在计算机存储设备上按一定 方式存储的相互关联的数据集合。选择数据库时要充分考虑到:学科专业范围是否适用;收录的文献资料是否齐全;揭示的文献特征是否准确和深入;报道时间是否迅速;使用的语种是否熟悉。等等。,1)数据库的类型 文献型数据库 书目型数据库(题录、文摘)全文型数据库 事实型数据库(PDQ等)数值型数据库(GenBANK,PTECS等)图像型数据库 混合型数据库,2)数据库
3、的结构 数据库的基本结构主要由文档、记录、字段三个层次构成。文档(File)数据库可以由一至多个文档构成。文档按其编排结构和功能的不同,可分为顺排文档(Sequential file)和倒排文档(Inverted file)。,顺排文档是若干个记录构成的信息集 合。在书目型数据库中,它以文献记录作 为信息存储单元,按记录入藏的顺序号从 小到大排列。它相当于印刷型检索工具的正文部分。,倒排文档是从顺排文档记录中抽取出 的、以每一个文献特征标识作为信息存储 单元,按一定顺序排列,并在每一个标识 后注明相应的文献记录顺序号。不同的文 献特征标识的组合就构成了不同类型的倒 排文档。如著者倒排文档等。它
4、相当于印刷型检索工具的辅助索引 部分。,记录(Record)记录是构成数据库的一个完整的信息单元,由若干个字段构成。每条记录都描述了与原始信息有关的各种特征,这些特征(字段)为判定检索结果是否符合检索需要提供了依据。书目型数据库中的一条记录相当于一篇完整的文献;其他类型数据库中的记录则是某种信息单元,如一组理化指数、一种治疗方案等。,下面是MEDLARS系统中的MEDLINE数据库的 一条文献记录:AUGINGRASS DJ;MESSER RJ TI-A SIMPLIFIED THCHNIQUE OF INFEIOR BORDER ABTHE INFERIOR BORDER WIRE,AS O
5、RIGINALLY LA-ENG MH-*BONE WIRES;HUMAN;MANDIBLE/*SURGERY ADDEPARTMENT OF ORAL MAXILLOFACIAL SURGERY,MEDICAL COLLEGE OF WISCONSIN,MILWAUKEE.SO-ORAL SURG ORAL MED ORAL PATHOL 2002;81(4):264,字段(Field)字段是构成记录的基本信息单元(数据项),是对原 始信息的具体属性进行描述的结果。书目型数据库中的字 段是描述文献内外特征的各项标识内容,如标题字段、著 者字段、文摘字段等。每个字段都有各自的字段标识符(fie
6、ld tag),以供 识别其所表达的文献特征,例如:标题字段的标识符为 TI、著者字段的标识符为AU等等。字段标识符也参与构建检索策略。检索系统数据库文档记录字段,(三)确定检索标识与检索途径 确定检索途径取决于两方面的条件:一是待查课题的已知条件和检索内容的要求;二是使用的检索工具(数据库)所揭示的文献各种特征是否准确和深入。不同学科、不同类型的检索工具采用不同的文献特征来标引文献,形成不同的检索标识而提供不同的检索途径。,1、文献检索语言(检索标识),文献检索语言(Document language是来描述 文献特征和表达检索提问的专门语言,即根据检 索需要而创建的统一文献标引用语和检索用
7、语的 一种人工语言。检索语言既是汇集、组织、存储文献标准,也是检索提问时所利用的手段及工具。,1)文献检索语言主要类型:描述文献外表特征语言 书刊题名 著者姓名 文献序号 描述文献内容特征语言 分类语言 主题语言(主题词、关键词等)代码语言,2)检索词典(Retrieval thesaurus)检索词典是文献标引用语和检索用语的语源 和依据性文本。它是对各学科中的名词术语、概念、代码、分类号等进行规范化的记录,起着对检索语言规 范控制作用。常见的检索词典是各种分类表和主题词表。例如:中国图书馆分类法和医学主题词表(MeSH)/Thesaurus。,2、检索途径(1)著者途径 这是利用已知著者姓
8、名(团体机构名称)作 为检索标识进行查检文献的一种途径。它适用于了解国内外某著者或团体机构所发 表的文献内容及其所研究课题的最新进展情况。使用著者途径检索文献的关键在于熟悉著者 姓名在索引中的编排规则。(如姓名顺序、音译、排序),(2)分类途径 这是利用检索工具所采用的特定分类体系中 的分类号或分类类目作为检索标识进行查检文献 的一种途径。它能较好地满足按类检索文献的要求,适用 于按学科概念检索文献。使用分类途径检索文献的关键在于熟悉检索 工具所采用的特定分类法。,(3)主题途径 这是根据能反映文献主要内容的主题(包括 主题词和关键词等)作为检索标识进行查检文献 的一种途径。它具有较强的专指性
9、和直接性的特点,适用 于查找内容比较具体、专一的文献。使用主题途径检索文献的关键在于能够选准 代表所需文献主题内容的检索词。,*选用主题词时应注意的问题:1.选用主题词,应从事物的“专有名词”来考虑,不要从“过 程词”来考虑。如“肾结石的诊断”“肾结石/诊断”2.选用主题词的概念要恰如其分,不能太广或太狭。3.利用MeSH表或Thesaurus将非主题词转换成可供检索使 用的正式主题词。包括同义词、近义词、简称与繁称和 俗名与学名等。例如:cancer neoplasms 怀孕 妊娠、子宫纤维瘤 子宫平滑肌瘤 4、要注意主题词的倒置形式。过敏性休克 休克,过敏性,5.主题概念的分析与转换 隐性
10、主题分析“为乳腺癌服务的工作组织”“癌监护组织”“办公室吸烟对他人有害”“吸烟污染”主题概念分解转换“胃十二指肠溃疡”应转换成“胃溃疡”和“十二指肠溃疡”两个主题词 注意英文同义词(解剖名词)的主题词 胃 gastric,stomach、心 heart,cardio-眼 eye,ocul-,ophathalm-、肝 liver,hepat-,6.没有相应主题词时,可采用靠词或上位词检索 靠词检索:“上消化道出血”“胃肠出血”;“红细胞存活”“红细胞衰老”上位词检索:“污水处理”“废弃物处理,液体”7.可使用副主题词与主题词进行组配“肝疾病的早期治疗”“肝疾病/治疗”8.要注意主题词与副主题词组
11、配范围的限定 肺/诊断 肺炎/诊断 9.已有先组的主题词,不用组配“维生素A缺乏症”“维生素A缺乏症”,“维生素A/缺乏症”,10.不能越级组配“胆囊炎的B超诊断”“胆囊炎/超声检查”“胆囊炎/诊断”举例:“加压素治疗休克引起冠心病”显性主题:休克/药物治疗、加压素/临床应用、冠心病/化学诱导 隐性主题:加压素/副作用,(四)编辑检索提问式*检索提问式是用户向检索系统表达文献需求的句式。检索提问式有简单提问式和复合提问式。后者含有两个或两个以上的检索词,表达多维概念的检索,要用检索运算符号相连接。检索系统中常用的检索运算符号有以下几种:1布尔逻辑运算符 用来表达检索词之间或检索词与检索式之间
12、的逻辑运算关系。这种概念组配是检索系统使用 最为广泛的检索技术。,常见的布尔逻辑运算符有“逻辑与”、“逻辑或”和“逻 辑非”3种,其符号分别为“and”、“or”和“not”(有的数据 库则分别用“*”、“+”和“-”或“and not”来表示)。它们的逻 辑运算关系如下图所示:,A,A,A,B,B,A,B,A and B逻辑与,A or B逻辑或,A not B逻辑非,1)“逻辑与”运算 这是具有概念交叉关系或限定关系的一种组 配。它要求检索出的文献记录必须同时含有检索 词A和检索词B。例如:“吸烟与肺癌的关系”检索式为:吸烟 and 肺癌 smoking and lung-neoplasm
13、s“逻辑与”的作用是缩小了检索范围,提高查准 率。,2)“逻辑或“运算 这是具有概念并列关系的一种组配。它要求 检索出的文献记录中含有检索词A,或者含有检索 词B,或者同时含有二者均为命中文献。例如:“食欲亢进与过度饮食”检索式为:食欲亢进 or 过度饮食 hyperphagia or overeating“逻辑或“的作用是扩大了检索范围,提高查全率。,3)“逻辑非“运算 这是具有概念排除关系的一种组配。它要求检索出的 文献记录是在检索词A的记录中去掉含有检索词B的记录,即排除了不希望出现的文献记录。例如:“非儿童性白血病”,检索式为:白血病not儿童“逻辑非“的作用是缩小了检索范围,提高查准
14、率。使用逻辑非运算符号须慎重,容易造成漏检。因为它 会把那些同时出现在检索词A和检索词B的记录排除在外。,在一个复合检索提问式中,各种布尔逻辑运算符是 按照notandor的次序运算。也可用()来改变运算 次序,以符合检索课题的逻辑关系。例如:“用青霉素或红霉素治疗非儿童性肺炎”检索提问式,应为:#1 青霉素 or 红霉素#2 肺炎 not 儿童#3#1 and#2 或者:#1(青霉素 or 红霉素)and(肺炎 not 儿童),2位置算符 位置算符是要求原始记录中检索词之间要满足某些 条件而使用的符号。例如:检索式为A with B,则表示检索词A和检索词B 必须同时出现在同一记录中的同一字
15、段内;检索式为A near B,则表示检索词A和检索词B必须同 时出现在同一记录中的同一句子内。等等。位置算符提高检索结果的准确性。它比“逻辑与”更专 指,是调整检索策略的一种重要手段。,3字段限制符 字段限定符是限制检索词在数据库记录中的特定字段范围内检索的一种符号。常见的字段 限定符有“in”或“”。字段限定检索的表达形式是:“检索词in字段 标记符”或者是“字段标识符检索词”。例如:hepatitis in ti、张志 in au、la=English等 字段限定检索也是缩小检索范围、提高查准率的一种方式。,4.截词符 截词(Truncation)检索是利用截词符附加 在所截取检索词的局
16、部进行检索的一种技术。它 具有将同一词干的词全部查出的功能,扩大检索 范围,提高查全率。按截词的位置,截词检索有前截断、中截断、后截断、前后截断四种方式,最常用的是后截断 检索。不同的检索系统有不同的截词符,常用的截 词符有“?”和“”。,“?”是有限截词符(即“?”的数量就是替代被屏蔽字 符的数量),如输入“leukemi?”,可检索出含leukemia、leukemic、leukemid等词的记录。“”是无限截词符(即表示所截去的字符数量不受限 制),如输入“leukocyt*”,可一次性查出以leukocyt开头 的所有检索词的记录。如输入“*sight”,可查到以sight结 尾的所有
17、检索词的记录,如“farsight”和”nearsight”等。使用截词检索技术,要确定好合适的截词位置,切忌 截词过短,以免造成误检。,检索课题:“胃镜检查胃炎(仅限20002002年的英文综述文献)”。胃炎 gastritis 胃镜 gastroscope gastroscopic gastroscopy 内窥镜 endoscope endoscopic endoscopy 检索提问式为:#1 gastritis and(gastroscop*or endoscop*)#2 la=English 或 English in la#3 pt=review#4 py=20002002#5#1 a
18、nd#2 and#3 and#4,(五)浏览检出文献,评价检索结果 对检出的文献进行综合分析与评价。如果符 合检索要求,可直接输出检索结果(转录、复印 等);如果检索结果与检索期望存在差距时,就 要分析出现误检或漏检的原因,并通过适当的方 法,调整检索提问式,直至其符合检索要求。,(六)检索策略的调整*,检索策略调整的原则通常是以查全或查准为主。当检出的文献量过少时,应以查全(扩检)为 主,可用以下方法加以调整:增加同、近义词和相关词,并用or连接;采用截词检索技术;用检索词的上位词或分类类目进行扩展检索;减少and的组配面;取消某些限制过严的字段限制符和位置算符的使用。,当检出的文献量过多时
19、,应以查准(缩检)为主,可 用以下方法加以调整:利用专指性较强的主题词检索,并用相应的副主题 词进行组配,必要时可进行“二次检索”;增加and的组配面;用not限制与提问不相关文献的输出;限定检索词所在的可检字段或词间的顺序和位置;限制检出文献的类型、语种和年份等特征词。如有必要,可对检索提问式进行多次的反馈修改和调 整,直到检索结果满意为止。,计算机检索中使用的特征词:,新生儿 inf newborn 030天 动物 animal 婴儿 inf 30天24个月 人类 human儿童,学龄前 child fre 2岁5岁 男(雄)性 male儿童 child 6岁12岁 女(雌)性 femal
20、e青年人 adolesc 13岁18岁 体外研究 in vitro成年人 adult 19岁44岁 病例报告 case rept中年人 middle 45岁65岁 对比分析 com st 老年人 aged 65岁80岁 妊娠 pregn 80岁以上 aged,80 and over 古代 ancient中世纪 midieval 十九世纪 19th cent,猫 cats 牛 cattle狗 dogs 兔 rabbitis大鼠 rats 小鼠 mice仓鼠 hamsters 豚鼠 guinea pigs鹌鹑 quail 鸡胚 chick em,二、获取原始文献,1、将文献来源出版物(如期刊名称)还原全称 通过检索工具中相应配套的“引用期刊目录”或“文献来源索引”等将其缩写名还原全称;利用专门供查检出版物缩写名称的工具(如 Periodical Title Abbreviations);有些译文(如俄文、中文、日文等)可按有 关规定还原成原文种。,2、索取原始文献的方式 利用图书馆馆藏目录索取原文;利用本地区乃至全国性馆藏联合目录,了 解和查明 原文收藏单位,最后通过一定 的手段获取原文;利用著者的通迅地址 或E-mail向著者索 取原文;利用计算机全文数据库获取原始文献;其它方式。,谢谢!,