《《医学信息检索》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《医学信息检索》PPT课件.ppt(90页珍藏版)》请在三一办公上搜索。
1、医学信息检索,浙江大学医学院附属第二医院 景继勇,现代科技造成了科技成果的高速发展。大规模、高集成度,边缘学科、交叉学科、横断学科层出不穷,新的成果从出现到应用的时间间隔越来越短等等,“信息爆炸”使得人们获取和利用有用信息越来越困难。,信息检索的目的,医药学信息资源发展的特点,数量巨大,增长迅速,内容广泛、分散,各学科相互渗透,信息更新周期缩短,交流传播速度加快信息由传统的纸质印刷型迅速向电子化、网络化、数字化方向发展,文献检索基本知识,检索途径、检索技术,内容,计算机检索策略,美国科学基金会凯斯工学院基金委员会、日本国家统计局的数字一个研究人员的全部工作时间分配,7.70%,9.30%,50
2、.90%,32.10%,思考计划查阅文献科学实验编写报告,0,不同学科研究人员平均年阅读文献数量45040035030025020015010050,Med,Science,Eng,Soc Sci,Hum,引自,0,不同学科研究人员阅读文章所用时间分/篇45403530252015105,Med,Science,Eng,Soc Sci,Hum,引自,引自田纳西大学Carol Tenopir的研究报告,引自田纳西大学Carol Tenopir的研究报告,一、文献检索基本知识,(一)基本概念,1.信息 information 信息是事物运动的状态与方式的反映,是用文字、数据或信号等形式,通过一定的
3、传递和处理,来表现各种相互联系客观事物在运动变化中所具有特征内容的总称。,2.知识 knowledge 人们在改造世界的实践中所获得的认识和经验的总和。,3.情报 information 情报是指运用一定的形式,传递给用户,并产生效益的知识或消息。三要素:知识性、传递性、效用性4.文献 literature 就是记录着知识的一切载体。四要素:知识或信息、载体、记录手段(文字 图象 声音)、符号,文献,知识,情报,信息,5.信息检索 指运用检索工具或数据库等情报集合,从中查找所需信息的过程。信息检索方式有手检、机检、光盘检索、联机检索和 Internet 联网检索。未来的检索将有人工智能和信息检
4、索相结合的智能情报检索系统。,人们获取信息的来源,对于文献检索来说主要的可检信息。,信息源,信息的加工层次,零次文献:未经出版发行的或未以公开形式进入社会交流的最原始的文献。一次文献 primary literature 即原始文献二次文献 secondary literature 如:目录、索引三次文献 tertiary literature 对二次文献进行综合分析、加工、整理的信息资源,如专门用于检索搜索引擎的搜索工具,被称为“搜索引擎之搜索引擎”(search engine of search engine),按撰写目的和出版类型,图书期刊科技报告会议文献学位论文专利文献,按照发布形式划
5、分,参考数据库全文数据库事实数据库电子图书电子期刊,电子报纸搜索引擎,(GOOGLE),网络学术资源学科导航,FTP 资源,参考数据库(Reference database),指包含各种数据、信息或知识的原始来源和属性的数据库,主要包括书目数据库、文摘数据库、索引数据库,例如:中国生物医学文献数据库,(CBMDisc)、中国生物医学期刊文献数据库(CMCC)、MEDLINE数据库,全文数据库(Full text database),收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息为主例如:中国期刊全文数据库、维普中国科技期刊数据库、EBSCO全文
6、数据库和OVID全文数据库,事实数据库(Factual database),指包含大量数据、事实,直接提供原始资料的数据库,又分为数值数据库(Numeric,database)、指南数据库(directory,database)、术语数据库(terminologicaldatabase)等,电子图书(electronic books),指供在电脑上阅读的一种新型的数字化书籍,是多媒体技术和超文本技术发展的产物一般有专用电子图书阅读器,国内的电子图书系统,超星数字图书馆读秀学术系统,中国数字图书馆有限公司的网上图书馆书生之家“中华图书网”方正Apabi电子图书,电子期刊(electronic j
7、ournals),简称e-journal,指以数字或电子形式出版发行的期刊,电子期刊的类型,一、印刷型期刊的电子版,Electronic version,例如:科学杂志的电子版科学在线,http:/,二、原生(born-digital)数字资源,只在互联网上发行的纯电子期刊Electronic only,新物理学杂志,New journal of physics,电子报纸(electronic newspaper),将电子技术应用到涉及报刊出版、发行、利用的全过程,重要电子报纸举例,纽约时报(Http:/)华盛顿邮报,(http:/,泰晤士报(Http:/)人民日报(Http:/)光明日报(H
8、ttp:/)中国日报(Http:/),搜索引擎、分类指南,搜索引擎主要是使用一种计算机自动检索软件,在互联网上检索,将检索到的网页编入到数据库中,并进行一定程度的自动标引,用户使用时输入检索词,搜索引擎将其与数据库中的信息匹配,产生检索结果,例如:Yahoo、Hotbot、Alta Vista、Google等,分类指南,分类指南是将搜索到的网页按主题内容组织成等级结构(主题树),用户按照这个目录逐层深入,直到找到所需文献。,通常搜索引擎与分类指南结合在一起,例如Yahoo、Google等,网络学术资源学科导航,将互联网上的信息进行科学整理,按学科组织起来,构成完整的学科导航系统,为教学、科研、
9、技术人员提供各类学术信息,FTP资源,FTP:File Transfer Protocol,文件传送协议,用户远程登录到远端的计算机上,把文件传回到自己的计算机上,或把自己的文件上传到远端计算机系统上,FTP资源,是网上的开放 FTP站点,他们允许用户登录上去,从中下载各类数据、资料、软件等天网(http:/),可以专门检索网上的 FTP站点,使用的软件有cuteftp 等,信息检索的原理,将检索提问标识与系统中存贮文献的特征标识进行比较,并输出命中文献,检索过程为字符串匹配和逻辑运算的过程。,1.存贮过程,为纳入检索系统的每一种资料或每一,篇文献标引检索标识,将有关的特征表示著录下来,形成一
10、,条条文献线索,将它们系统地排列到检索系统中去,2.检索过程,首先主题分析,找出若干能代表情报需要的概念,将这些概念转换成情报检索语言的语词,或标识,利用这些语词或标识到检索系统中查,找,将用该语词或标识所标引的文献检索出来,主题分析主题概念情报检索语言的语词或标识 文献检索工具或系统,存储、检索过程,检索途径、检索技术,一 检索语言,检索语言是一种专门的人工语言,是在文献存贮与检索过程中共用的语言。分规范化语言和非规范化语言两种,二、检索途径,(一)主题词检索,主题词:经过主题词表规范后的词称为主题词。,美国国立医学图书馆(National Library ofMedicine,简称NLM)
11、编辑的医学主题词表(Medical Subject Headings,MeSH),AIDS 见 获得性免疫缺陷综合征,(二)分类检索,用分类号或者类名进行检索的方法,国内现在最常用的是中国图书分类法把所有图书分成二十二大类医学 R类,生物学 Q类语言 H类,计算机 TP类,(三)关键词(或自由词)检索,关键词:直接从信息资源名称、正文或者文摘中抽出的代表信息主要内容的重要词语。,(四)著者检索,国内的数据库直接用著者姓名进行检索国外的数据库用著者姓,名的缩写进行检索,Wang xm,(五)题名检索,题名:信息资源的名称,如论文篇名、图书的书名、网站名称等。,(六)引文检索,引文:将文献所引用的
12、参考文献的作者、篇名、来源出版物抽取出来进行标引。SCI,(七)全文检索,全文:从资源的全部内容中自动抽取、查找,是目前网上各类搜索引擎使用的最多的方法。,(八)序号检索如ISSN号检索,三、检索技术,1布尔逻辑检索,AND(逻辑与),例如:A and B,OR(逻辑或),例如:color or colour,NOT(逻辑非),例如:human not animal,优先级运算()NOTANDOR,(Child or children)and lung cancer,常见运算符,2截词检索和通配检索,Truncation searching,在不同的检索系统里用不同的符号,一般为:*、?、#、
13、$,用逻辑OR 对词头同、词尾不同的词汇进行检索,可以避免漏检,另一方面也避免了多次输入的麻烦,前截断:又称左截断,截词符在词的左边,例如:*magnetic,中截断:截词符在词的中间,例如:organi?ation,可以检索organisation organization,后截断:是前方一致检索,又称右截断,截词符放在被截词的右边,是最常用的检索技术,例如:librar*,3、位置算符检索,位置算符(position operator)表示两个检索词间的位置临近关系,又叫邻接检索(proximity)布尔逻辑运算符表示两个概念之间的逻辑关系,位置算符表示的是两个概念在信息中的实际物理位置关
14、系如:lung near cancer,Dialog 联机系统位置算符检索,4、字段限定检索,Limit searching是缩小或约束检索结果的方法,最常用的是对特定字段的限定检索限制符多为:in、例如:Chinese in LA,数据库中常见的字段和代码,5、加权检索,是一种定量检索的技术缩小检索范围提高检索准确率的有效方法通过判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度 例如:CBM,MEDLINE,6、聚类检索,根据不同的聚类水平的要求,可以形成不同聚类层次的类目体系主题相近、内容相关的文献聚在一起,相异的被区分开来例如:CNKI或MEDLINE“related arti
15、cle”,7、扩展检索与缩检,扩展检索扩展检索的方法:概念的扩大;范围的扩大;增加同义词;年代的扩大。缩小检索:二次检索缩检方法:即概念的缩小、范围的限定、年代的减少等。此外,还可以通过以下方法进行限定:核心概念的限定;语种的限定;特定期刊的限定。,检索策略,(一)信息需求分析,明确检索要求(二)选择数据库,确定检索途径,(三)检索方式的选择,确定检索标识(检索词),(四)构建检索表达式,(五)检索结果的判断和检索策略的调整,(六)整理检索结果,获取原始文献,检索要求,掌握的线索 查全?查准?,数据库的选择,英文循证资料数据库Cochrane library-SRUoToDate Nursin
16、g Reference CenterCINAHL护理指南 Drug Essentials(护理人员须了解的实时治疗及临床照护的药品信息)Patient Education(病患教育)Health Nursing News(护理新闻)MD ConsultClinical EvidenceBMJOVID循证数据库,数据库的选择,英文原始文摘数据库Medline or PubMed EmbaseWeb of scienceCochrane Central Register of Controlled Trials英文原始全文数据库Highware press,ProQuest,SD,SPRINGER
17、LINK,WILEY,数据库的选择,中文数据库CNKI维普万方台湾的CEPS中国生物医学文献数据库中国科学引文数据库中華民國期刊論文索引台湾,translation,translation,databaseMedline,queries,Standard(MeSH),透过控制让使用者和作者一致,自由词汇派Free Text,控制词汇派ControlledVocabulary,user,Neoplasms MeSH,MeSH:Neoplasms,authors,articles,使用者要设法和作者心意相通,reference:h,较大型或精致的书目数据库通常同时有这两种机制,武林上有两大派检索机
18、制,OR CancerTIAB,PubMed:PICO方式检索及弹性组合,P,I,O,P I C O,P I C,P C O,C,避免某个面向检索结果很低,影响整体检索结果检索结果低时,易修正检索策略方便后续弹性组合检索PICO何者重要?取决于临床问题特性、检索者目的和时间、文献需求质量,PIO,弹性组合,分次搜寻,一次搜寻,搜寻文献的障碍,不知道怎么定义关键词PICO,plus 同义字,MeSH Terms资源太多,不知道从何下手Filtered Resources FIRST,plus Unfiltered Resources不熟悉搜寻方式只找到/看到片面现象(B),而非贴近事实整体(A)
19、(Information bias),临床人员的处境:Solution,时间有限、情况紧急:Quickly医疗信息太多:Effectively医学进步太快:Current病人的期望:Best,理想的解决方案,以最好的实证信息,快速答复所有的问题把寻找证据、严格评读以及进一步探索的重担交给研究者临床人员在使用信息资源时快速(最好当下即可取得与应用)确实能够提供答案,EBM或EBN Resources,Model from:Haynes,R.B.(2006).Of studies,syntheses,synopses,summaries,and systems:the 5S evolution o
20、f information services for evidence-based health care decisions.ACP Journal Club,145(3),A8.,整合证据提供特定临床问题之概述与建议ACP PIERBMJ Clinical EvidenceDynaMedFirstConsultUpToDate,对单篇研究或回顾性文献作摘要与评述ACP Journal Club,Evidence-Based Medicine(PubMed,Ovid Medline),特定临床问题的系统性评论文献Cochrane Database of Systematic ReviewsD
21、atabase of Abstracts of Reviews of Effects(PubMed,Ovid Medline):Systematic Reviews,连结个别病历的临床知识与支持决策系统,原始文献(PubMed,Ovid Medline,CINAHL,EMBASECochrane CENTRAL,Google ScholarCEPS中文电子期刊,中文期刊篇目索引),3.synopses,4.syntheses,5.studies,1.systems,FilteredResources,UnfilteredResources,Meta SearchTRIPSUMsearch,2.
22、summaries,愈上层信息精萃简单的关键词省时搜寻与评读快速支持决策由下层积累,愈下层文献杂多完整的关键词费时搜寻与评读注重检索技巧信息新颖,Where to start looking for,省力原则:5S 由上往下Summaries(Critically-Appraised Topics)Synopses(Critically-Appraised Individual Articles)Syntheses(Systematic Reviews)Studies(Original Papers)无从下手时:Meta Search、Google Search不熟悉哪个资源可以回答这个临床问
23、题、惯用的资源找不到答案但请谨慎很多来源缺乏critical appraisal订购资源可能不在搜寻范围内只看到片面现象Background Information/Expert OpinionE-TextbookDrug InformationMicromedex,PubMedOvid Medline,Filtered Resources(secondary),我能相信summaries或systematic reviews吗?如果没有利益冲突清楚陈述问题完整搜寻并取得相关研究明确筛选准则,并列出参考书目严格评读原始研究可再现(reproducible)相关决策定期评论与更新,确保新证据没有
24、被遗漏Unsystematic narrative review混合个人意见和证据,而证据也常岀自reviewer个人的选择,Heneghan C,Badenoch D(2006).Evidence-based Medicine Toolkit.Haynes,RB(2006).Of studies,syntheses,synopses,summaries,and systems:the 5S evolution of information services for evidence-based health care decisions.ACP Journal Club,145(3),A8.
25、,structured approach,Unfiltered Resources(primary),何时需要搜寻 Unfiltered Resources系统评论来自于 underpowered(small)trials。Filtered resources还未处理所关注的临床问题。科学研究,Haynes,RB(2006).Of studies,syntheses,synopses,summaries,and systems:the 5S evolution of information services for evidence-based health care decisions.AC
26、P Journal Club,145(3),A8.,计算机检索的效果评价,评价的目的、范围评价标准:查全率 查准率影响检索检索效果的因素,查全率,查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。查全率=检出相关文献量/文献库内相关文献总量 100%,查准率,查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。查准率=检出相关文献量/检出文献总量 100%,影响检索效果的因素,(1)影响查全率的因素(2)影响查准率的因素,全
27、文的获取,IngentaEBSCOOVIDSwetsWisePubMed Central(PMC)freeOhiolink Ontario Scholars Potal万方、CNKI、VIP,综合文献全文数据库,ScienceDirectBlackwell-synergy MetaPress(Springer、Taylor&Francis)KluwerOxford PressWiley interscienceKargerLWWHighWire部分免费注册ProquestNature pressHumana press,出版社全文数据库,查找全文的方法,1.利用所在学校的图书馆定购的数据库,若馆藏有要找的刊,可以到相应阅览室或数据库中查找需要的文献,2.利用网络免费全文资源,。,在GOOGLE中搜索,如freejournal免费注册获得全文,3.利用文献传递服务,。,康健的健康查查,互相帮助寻找有权限的朋友帮忙,。,4.直接向作者索要,现在检索出的文献一般有著者的联系方式,如通讯地址和电子邮箱等。如果所需文献确实难以找到,可以直接和著者联系以获取原文,一名化学家每周阅读40小时,浏览世界上一年内发表的有关化学方面的论文和著作就要48年。,“一个科学家即使目前夜以继日地工作,也只能阅读有关他自己专业世界上全部出版物的5%。”,-德国学者哈根,thanks,