《信息检索综合复习.ppt》由会员分享,可在线阅读,更多相关《信息检索综合复习.ppt(38页珍藏版)》请在三一办公上搜索。
1、信息检索综合复习,试题结构,3.判断题,2.填空题,4.简答题,5.论试题,1.单选题,15个,共30分,10个,共20分,3个,共18分,20空,共20分,1个,共12分,考核内容,信息检索第一讲(绪论部分、信息检索)信息检索第二讲(图书检索、期刊检索)信息检索第三讲(搜索引擎、事实数字检索)信息检索第四讲(特种文献检索)信息检索第五讲(学位论文、综合检索案例),信息检索第一讲,绪论部分一、基本概念1、信息的概念按照狭义的理解,信息是用来消除不定性的东西。按照广义的理解,又有两种认识:从本体意义上说,信息泛指一切事物运动的状态和运动的方式。从认识论的意义上说,信息是关于事物运动状态和运动方式
2、的反映。2、知识的概念知识是人们对客观事物的认识和经验总和。3、文献的概念文献是记录有知识的一切载体4、情报的概念情报是指运用一定的形式,传递给用户,并产生效益的知识或消息。三个属性:知识性、传递性、效益性5、信息资源 广义上是指信息活动中各种要素的总称,既包含信息本身,也包括信息相关的人员、设备、技术和资金等因素;狭义上是指各种载体和形式的信息的集合,包括文字、音像、印刷品、电子信息、数据库等。,二、信息(文献)的类型1、按出版及内容形式划分2、按加工层次划分,按出版形式及内容划分,图 书,连续出版物,特种文献,科技报告会议文献政府出版物专利文献标准文献公司产品资料学位论文档案资料,期刊报纸
3、年度出版物,按加工层次,1)图书:ISBN 国际标准书号例如:ISBN978-7-302-20062-8 在参考文献列表里,图书著录格式如下著者.书名M.版本.出版地:出版者,出版时间.(多作者用逗号分开,超过3个者用“等”)叶继元.信息检索导论.北京:高等教育出版社,1995.2)期刊:是最重要的信息源。国际标准刊号(ISSN)期刊著录格式:作者.题名J.刊物名称,年代,卷数(期数):页数 刘志强.我国农业生态环境可持续发展评价及对策J.农业系统科学与综合研究,2001,17(3):2426.核心期刊:少数刊载某一学科大量高质量专业论文的期刊。三、信息检索与利用的意义1、与时俱进,跟踪学术最
4、新动态2、节省科研时间,提高工作效率3、挖掘分析信息制定高明市场谋略,第二部分 信息检索1、信息检索的概念狭义的信息检索是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献信息的过程。广义的检索包括信息的存储和检索两个过程。2、常见检索工具根据高校图书馆信息资源和大学生信息需求实际情况,常用的检索工具如下:本馆的馆藏目录、超星电子图书数据库、万方数据库、银符题库、网上报告厅、CNKI系列期刊和学位论文数据库、重庆维普咨询公司中文科技期刊数据库、外文Elsevier数据库等。网上免费的检索工具:中国国家知识产权网、欧洲专利局、搜索引擎Google等印刷型的检索工具:
5、百科全书、手册、年鉴等。3、检索方法常规法和引文法 常规法包括:顺查法、倒查法、时间抽样法 引文法包括:追溯法和检索引文法,4、检索途径:一般来讲分为:主题途径、分类途径、著者途径和其他途径。1)主题途径:是采用反映文献主题概念的检索词作为检索入口的一种检索途径,也是最常用、最重要的检索途径。主题词就是表达主题概念的词汇。广义主题词包括关键词、主题词、标题词、叙词。2)分类途径:分类途径就是人们常说的分类号检索。这种检索是根据信息内容的学科分类来进行的。一般说来,可以提高查全率。3)著者途径:著者途径是指根据已知文献著者来查找文献的途径,它根据的是著者索引,包括个人著者索引和机关团体索引,排列
6、规则是“姓+名”次序。,5、计算机检索:(重点考查)1)检索式的拟定A、单元词检索检索标识是具体的检索词或词组,每个检索词表达一个概念。B、布尔逻辑算符组配检索逻辑“或”(和)扩大查找范围用符号“or”或“+”表示,其逻辑表达式为:A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。逻辑“与”缩小查找范围用符号“and”或“*”表示,其逻辑表达式为:A*B 或 A and B 其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。逻辑“非”用符号“not”或“-”,其逻辑表达式为:A not B 或 A-B 其意义为:检索记录
7、中含有检索词A,但不能含有检索词B的文献,才算命中文献。C、截词,6、信息检索的基本步骤1)检索准备 a.弄清楚课题学科属性、专业范围及其相关内容 b.弄清检索课题的信息类型和时间要求 c.考虑课题的特殊要求 d.明确用户自身的信息需求2)选择合适的检索工具3)选择检索途径4)拟定检索式5)实施检索6)筛选文献7)索取文献8)定性定量分析9)得出结论,形成情报,7.信息检索的效果评价指标,1.查全率查全率(R)=100查全率是对所需信息被检出程度的信息量指标。2.查准率查准率(P)=100查准率是衡量拒绝非相关信息的指标。,a,a+c,a,a+b,注:a检出的相关文献量 b检出的不相关文献量
8、c未检出的相关文献量,信息检索第二讲,第一部分 图书检索1、图书检索的两种方式1)文献线索的检索 主要从著录外部特征入手,检索图书的详细信息或获取方式。(1)各类馆藏目录,如本馆馆藏目录、CALIS公共查询;(2)搜索引擎,如百度图书、谷歌图书;(3)网上书店,如卓越网、当当网、京东网。2)获取原文的检索(1)网上免费电子图书,如起点、盛大;(2)商业数据库,如超星、书生之家。,2、超星数字图书馆1)简介:它是目前世界最大的中文在线数字图书馆,提供大量的电子图书资源提供阅读。2)超星阅读器,特色功能(1)书签、标注(2)文字识别(3)异地阅读(4)资源的采集3、超星读秀 读秀学术搜索是超星数字
9、图书馆研发的新产品,由海量中文图书资源组成的庞大知识库系统,其以270万种中文图书资源为基础,为用户提供深入图书内容的书目和全文检索,部分文献的全文试读,以及通过Email获取文献资源,是一个真正意义上的知识搜索及文献服务平台。,第二部分 期刊检索1、常用期刊检索工具1989年重庆维普资讯有限公司中文科技期刊数据库1999年清华大学、清华同方中国学术期刊网络出版总库2000年万方数据股份有限公司中国数字化期刊群2、CNKI中国学术期刊网络出版总库3、万方1)检索方法2)论文详细的著录特征,信息检索第三讲,第一部分 搜索引擎1、基本概念1)搜索引擎搜索引擎(search engine)是指根据一
10、定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。一个搜索引擎由搜索器、索引器、检索器和用户接口4个部分组成。搜索引擎的工作原理,简单地说主要包括以下几个步骤:1.网页信息搜索2.索引库的建立3.用户检索式的处理4.检索结果输出,2)域名域名就是指计算机在Internet上的名字,标示团体、组织和个人在互联网上的地址。常见的一级域名Com 商业机构Gov 政府机构Edu 教育机构,2、搜索引擎的分类按组织信息的方式划分 目录式分类搜索引擎、全文搜索引擎、智能搜索引擎按搜索范围划分 独立搜索引擎、元搜索引擎,3、
11、语法规则,4、Google谷歌1)简介2)检索语法 小贴士使用限定条件、限定词。不同的搜索引擎有不同的搜索语法,请查看其相关的帮助。以Google为例。filetype、define等运算符的运用filetype:(文件格式)Google支持PDF、PPT、SWF、DOC、XLS等文件格式,以搜索特定文件define:英语单词释义,可从不同的在线资源中得到对某词的解释。如使英语缩略词,即可查到全称及其释义 site:网址,可将检索范围缩小在某一网站。,3)类似结果单击某一具体结果下的“类似结果”链接,Google 开始寻找与这一网页相关的网页。4)手气不错 按下“手气不错”按钮将自动进入 Go
12、ogle 查询到的第一个网页。您将完全看不到其它的搜索结果。使用“手气不错”进行搜索表示用于搜索网页的时间较少而用于检查网页的时间较多。,5、百度1)简介2)使用技巧3)百度国学6、免费学术资源搜索1)定义:专门用于检索因特网上学术信息的搜索引擎,可以检索图书、期刊论文、专利文献、标准文献、文档等方面的学术资源和学术站点。2)常用的中文学术资源搜索引擎Google中文学术搜索CNKI知识搜索读秀学术搜索百度国学,第二部分 事实数值型检索1、信息检索的三种类型事实型检索 以特定事实为对象,例如名词术语、机构简况数值型检索 以特定数值为对象,例如元件参数、统计数据文献检索 图书检索和期刊检索2、事
13、实数值检索的概念事实和数值型检索是对事实数值进行检索,提供原始信息,给出直接、确定性的答案,这是一种确定性的检索,也称为事实数据检索。3、主要参考工具书百科全书传记资料地理资料年鉴机构名录词典统计资料,4、百科全书定义:百科全书是人类一切知识门类或某一知识门类概述性的著述,集中各种类型工具书之大成,被称为“工具书之王”。又称大全,是系统地汇集某一领域全部知识的大型参考工具书。世界三大百科全书 ABCA 美国百科全书B 不列颠百科全书C 科里尔百科全书百度百科和维基百科使用方法5、年鉴定义:年鉴的数据资料主要来源于政府文件、权威性报刊及各类统计报告。它按年度编辑出版,反映的是上一年度的情况。使用
14、方法,信息检索第四讲,特种文献1、知识产权的概念 知识产权是指在工业、科技、文学及艺术等广阔领域内所涉及的有关智力行为的法律权利。包括工业产权和版权。2、专利定义:专利是指一个国家授予创造发明人,在一定时间内,对该发明创造的独占实施权,包括专利产品的生产、使用和销售。类型:发明专利、实用新型专利、外观设计专利,获得专利权的条件:(1)发明、实用新型*新颖性*创造性*实用性(2)外观设计*新颖性*独创性*富有美感*适合于工业应用申请号:CN200420034660.3公开/公告号:CN1348826专利号:我国的专利编号与申请号相同,仅在前面加ZL。,国际专利分类表(IPC)IPC是欧洲理事会编
15、制的专利分类表,是类分专利文献和通过主题来检索专利文献的重要工具。IPC共分8个部,20个分部,100多个大类,600多个小类,5.8万多个主组与分组。专利检索工具:中国知识产权网 中华人民共和国国家知识产权局中国专利信息网中国专利信息中心,检索途径:主题途径:课题关键词利用名称、摘要、关键词等字段检索作者途径:姓名利用申请人(专利权人)、发明人字段检索号码途径:专利号利用申请号、专利号字段检索分类途径:专利技术利用国际专利分类表查出IPC号利用主分类号、分类号字段检索专利文献著录格式专利申请者.专利题名:专利国别(或地区),专利号P.发布日期.刘加林.多功能一次性压舌板:中国,9221498
16、5.2P.1993-04-14.,3、商标的概念4、标准标准的概念标准是对工农业产品和工程建设的质量、规格及其检验方法等所作出的技术规定。标准文献的概念标准文献主要是指与技术标准、生产组织标准和管理标准相关的文献,也包括国家颁布的环境保护法、森林法、消费品安全保障法、药典、政府标准化管理机构的有关文件以及与标准化工作相关的其他文献。标准文献著录格式:起草责任者.标准代号 标准顺序号-发布年 标准名称S.出版地:出版者,出版年.全国文献工作标准化技术委员会第六分委员会.GB 6447-86 文摘编写规则S.北京:中国标准出版社,1986.,国际标准化组织ISO国际上最大的标准化组织,涉及除电工和
17、电子工程领域以外的所有技术领域。国际电工委员会(IEC)IEC负责起草和公布所有与电工、电子和相关领域的国际标准。5、科技报告科技报告是指科研工作成果的正式报告或研究过程进展情况的技术文献检索工具6、会议文献会议文献是指在各种会议上宣读的论文、产生的记录及发言、论述、总结等形式的文献 检索工具,信息检索第五讲,第一部分 学位论文1、学位论文的定义 学位论文是指学生为获得专业资格的学位在高等学校或研究院所导师的指导下从事某一学术课题的研究,为介绍其研究成果而撰写的论文。2、学位论文的分类:(1)博士论文(2)硕士论文(3)学士论文 其中博士论文、硕士论文常具有研究参考价值。,3、学位论文的结构1
18、)封面2)题目3)摘要摘要应能客观地反映学位论文主要内容的信息,具有独立性和自含性。一般不超过500字,英文摘要的内容一般应与中文摘要相对应,中英文各占一页。4)关键词关键词是反映论文主题概念的词或词组,一般每篇可选3-8个。中文关键词应尽量从汉语主题词表中选用。未被词表收录的新学科、新技术中的重要术语和地区、人物、文献等名称,也可为关键词标注。中、英文关键词应一一对应,分别排在中、英文文摘的下方。中文关键词之间用空格分隔,英文关键词之间用分号分隔。,5)目录、引言、正文、结论致谢等6)参考文献著录格式专著:序号主要责任者.题名文献类型标志.其他责任者.出版地:出版者,出版年:起止页码(任选).期刊文章:序号主要责任者.题名J.其他责任者.刊名,年,卷(期):起止页码.学位论文:序号主要责任者.论文题目D.学位授予单位所在地:授予单位,授予时间,所在页码.4、学位论文写作步骤,5、CNKI知识搜索 用CNKI知识搜索中的“学术趋势”确定 研究方向是否有价值。用CNKI知识搜索中的“定义”,为概念做最权威的定义第二部分 综合检索案例 略,Thanks!,