文献类型及中文文献获取途径.ppt

上传人:牧羊曲112 文档编号:5986673 上传时间:2023-09-11 格式:PPT 页数:96 大小:5.44MB
返回 下载 相关 举报
文献类型及中文文献获取途径.ppt_第1页
第1页 / 共96页
文献类型及中文文献获取途径.ppt_第2页
第2页 / 共96页
文献类型及中文文献获取途径.ppt_第3页
第3页 / 共96页
文献类型及中文文献获取途径.ppt_第4页
第4页 / 共96页
文献类型及中文文献获取途径.ppt_第5页
第5页 / 共96页
点击查看更多>>
资源描述

《文献类型及中文文献获取途径.ppt》由会员分享,可在线阅读,更多相关《文献类型及中文文献获取途径.ppt(96页珍藏版)》请在三一办公上搜索。

1、网络信息检索与论文写作,信息检索与利用的意义,1、对于个人学习生活工作而言(1)更新知识结构,增强生存能力(2)节省学习、科研时间,提高工作效率(3)善于获取和利用信息,制定高明的市场谋略 2、对于科学研究而言(举例)(1)避免低水平重复研究,节约大量科研经费(2)充分利用信息资源,加速科研的进程,参考教材,1、工程信息检索与论文写作/张振华等编著。-北京:清华大学出版社,2009。92、信息检索教程第2版/王立清主编。-2版北京:中国人民大学出版社,20083.可以借阅:G252.7或G354 情报检索类的相关图书学习。,本次课内容简介,一、信息检索基础知识(一)信息概念(二)信息资源(三)

2、信息检索(四)信息检索工具(五)信息检索方法及检索途径二、计算机信息检索基础知识三、网络信息检索基础知识,(一)信息基本知识-定义,由于不同的物质都会发出不同的信息,事物在不断变化,信息也在不断产生。因此人们称今天的时代为“信息时代”,或“信息爆炸时代”。这一切都说明信息在我们的学习、生活中无处不在,无时不用。当前,我们身边的信息不是少了,而是多了,尤其互联网上70%-80%的信息都是垃圾信息。可见我们学习查找信息的方法就更重要了。,(一)信息基本知识-定义,1、信息:(information)信息从字面看,可被解释为迹象、征兆和消息。但是信息的定义不同的学者有不同的认识,综合各家定义内涵可以

3、将信息理解为:认识主体所感知或所表述的事物存在的方式与运动的状态。信息的分类:(1)按照信息产生的客体性质来划分:自然信息、生物信息、社会信息(2)按照信息依附的载体来划分:文献信息、口头信息、电子信息,(一)信息基本知识-定义,2、知识:人们在改造世界的实践中所获得的认识和经验的总和。知识的产生来源于信息,系统化了的信息才是知识。知识与信息的关系,好比产品与原料,原料是杂乱无章的,原料到了加工厂,通过各道加工程序,产生了产品。,获取知识的途径有两种:,一是直接来源于产生信息的客观事物;二是通过信息载体或媒介。获得的信息能否转化为知识,转化的是否充分、完整,取决于接受主体的认知能力。一个人要获

4、取知识,必须阅读文献,掌握相关的思想、事实、理论和方法等信息,在此基础上进一步分析、综合和分析,才能有所创新.,(一)信息基本知识-定义,3、情报(information):运用一定的形式传递给特定用户并产生效用的知识或信息。具有三个基本属性:知识性、传递性、效用性。,信息、知识、情报关系,三者关系:信息知识情报,情报是知识的一部分,知识是信息的一部分。而信息、知识、情报是文献的实质性内容。,信息、知识、情报三者关系图,信息知识情报,情报,知识,信息,(一)信息基本知识-定义,4、文献:是记载有知识的一切载体。文献是知识的外在表现形式。主要有纸本文献和电子文献等。载体:如:甲骨、竹简、纸张、磁

5、带、光盘、数据库等。图书馆的一楼到六楼都摆放着纸本文献;还有图书馆的主页上链接了大量的电子文献。,(二)信息资源,1、基本概念2、信息资源类型,(二)信息资源-基本概念,信息是普遍存在的,但是信息并非全部是资源,只有满足一定条件的信息才能称之为资源。换句话说,只有经过人类开发与组织的信息才是信息资源。,(二)信息资源-基本概念,1、信息资源概念:广义 指信息活动中各种要素的总称,既包含信息本身,也包括与信息相关的人员、设备、技术和资金等因素。狭义 只限于信息本身,是指各种载体和形式的信息的集合,包括文字、声像、印刷品、电子信息、数据库等。,(二)信息资源-类型,1、按文献信息资源的存储载体来划

6、分,(1)印刷型:以纸张为载体印刷而成的文献 包括:图书、期刊、特种文献。(2)缩微型:以感光材料为载体记录的文献,如:缩微胶卷等。(3)视听型:也叫声像型。包括录音带、录像带、幻灯片、电影拷贝等。,1、按文献信息资源的存储载体来划分,(4)电子型:指以数字化技术将文字、图像、声音等信息存储在光、磁载体上,通过计算机或网络进行阅读的文献资源。可分为数据库文献和网络文献信息。其形式有:电子图书、电子期刊、电子版特种文献等。,缩微型文献,印刷型文献-图书,电子型文献-电子图书,电子图书内容,现代图书馆的文献信息资源,主要的两大部分:1、纸本资源:中外文图书、期刊、报纸等2、电子资源:(1)电子图书

7、:超星数字图书馆(2)电子学术期刊:中国期刊全文库、维普、万方、CBM、EBSCO(3)电子特种文献:专利文献、标准文献、学术会议、学位论文。(4)电子报纸:中国知网中有。每年图书馆购买电子资源的经费占全年经费支出的60%-65%,2、按信息资源的出版类型来划分:,(1)图书:以印刷方式单本发行的出版物,也是指一些记录知识比较系统、成熟的文献。缺点是编著和出版的时间长。不能反映科学研究的最新动态。(2)期刊:定期或不定期的连续出版物,有固定的期刊名和出版形式。优点:出版周期短,信息量大,内容新颖。专业期刊内容主要是能够反映本学科最新技术、理论的论文、综述信息等。因此,期刊深受科技工作者重视,如

8、要对某一问题深入了解时,较普遍的办法是查阅期刊和期刊论文。(3)特种文献:包括会议文献、科技报告、专利说明书、技术标准、学位论文、产品说明书、政府出版物。(4)报纸,(二)信息资源-类型,3、按文献信息资源的开发程度来划分:零次文献一次文献二次文献三次文献,3、按文献信息资源的开发程度来划分,零次文献:未经过系统整理的信息资源。主要包括未进入社会流通使用的手稿、日记、书信、笔记、论文草稿等可称为零次文献 一次文献:指以零次文献信息资源为基础,以作者自己大研究成果、工作经验和实践体会为依据而形成,并已公开发行进入社会流通使用的图书、期刊论文、科技报告、专利说明书、学位论文等。一次文献的信息资源就

9、是原始信息资源,是人们检索利用的主要对象。,3、按文献信息资源的开发程度来划分,二次文献:对一次文献进行加工、整理、提炼、组织,使之成为便于存储检索的系统。为用户提供一次文献信息的查询线索或全文,帮助用户有效的利用原始信息资源。它主要包括目录、索引、文摘、数据库等信息检索工具。三次文献:指为了一定目的,对一、二次文献进行综合分析,加工整理后编辑而成的文献。主要包括综述、述评、字典、手册、指南、百科全书、年鉴名录等。,零次文献,一次文献,二次文献,图书馆的书目检索系统-电子型的二次文献,三次文献,(三)信息检索,1、信息检索概念:狭义 检索即查找、获取的意思。狭义的信息检索仅指信息的查取,从已组

10、织的信息系统中查找并获取所需信息的过程。广义 一般称之为信息存贮与检索,即分为两个过程:信息存储过程和信息检索过程。,信息检索原理图,得到检索结果,信息检索语言-定义,人类语言是人与人用以交流与沟通的重要工具。而人与信息检索系统对话,就需要有信息检索语言。信息检索语言:具体是指在信息检索过程中用来描述文献特征和表达检索提问的一种专门人工语言。,信息检索语言-类型,信息检索语言按描述文献的有关特征,可分为描述文献外表特征的语言和描述文献内部特征的语言。如下图:,描述信息外表特征的语言,如篇名、著者名、序号等,其特点是这些项目与信息内容无直接关系。而描述信息内部特征的语言在揭示信息特征和信息提问方

11、面更有深度。因此,对描述信息内部特征的语言研究才是重点。描述信息内部特征语言主要分为:分类语言和主题语言两种。,分类语言和体系分类法,分类语言也称分类法。是指以数字、字母为基本符号,用分类号作为描述文献信息主题概念的检索标识。将各种概念按学科性质进行分类和系统排列的检索语言。分类语言中最常见的是等级体系分类语言,现在仍然是图书馆组织和检索藏书的重要依据,也是各种中文数据库建设和服务不可或缺的主要参考,分类语言和体系分类法,目前我国通用的主要是中国图书馆图书分类法(简称中图法)和中国科学院图书馆图书分类法(科图法)。,关于中国图书馆图书分类法,中图法分5大部类22大类,类号用汉语拼音字母与阿拉伯

12、数字的混合号码,用一个字母代表一个大类,以字母顺序反映大类的序列,数字表示大类下类目的划分。举例:女工/毕淑敏著/海峡文艺出版社;分类号是I247.57;索书号是I247.57/B763/2。I-文学,I2-中国文学,I247-当代作品,I247.57-中篇小说,5个,22个,22类,利用中图法组织馆藏书目,点击选中的书名,具体馆藏状态,信息检索语言-主题语言,主题语言定义:主题语言也称主题法,是指以自然语言中的词语和规范化的词语来作为描述文献的信息主题概念的检索标识,将各种标识完全按字顺排列并采取参照系统直接表达概念之间关系的检索语言。主题语言在发展过程中,产生了标题词法、关键词法、叙词法和

13、单元法等多种文献组织与检索的方法。计算机检索系统广泛应用了叙词语言和关键词语言。,主题语言-关键词语言,关键词语言定义:是将文献信息中能揭示信息和描述文献信息主题概念的自然词语和词组作为关键词,不作规范化处理的语言。关键词语言构成原理:从文献信息题名、摘要或全文中选取具有实际检索意义的关键词排列在检索入口,并注明文献出处,从而满足用户的检索要求。关键词语言的特点:是不受词表控制,灵活快捷,直接性好,适合于计算机信息检索,但由于关键词比加规范,制约了文献信息的查全率和查准率。,主题语言-叙词语言,叙词语言:是以叙词作为文献信息内容标识和检索依据的主要语言。叙词国内也称主题词,是经过优选的规范化名

14、词术语。叙词语言的构成原理是:对检索用语中的同义词、近义词、同物异名词等进行规范化处理,使每个检索词只能表示一个概念,每个检索概念只用一个唯一的检索词来表达,从而提高信息检索效率,提高查准率。中国的有汉语主题词表,MESH词表是美国编制的。,叙词(主题词)举例,主题词:指能表达文献信息的实质内容,经过规范化处理的名词述语。可以是单词、词组或短语。例:维生素C、抗坏血酸为同物异名词,主题词为抗坏血酸。,(三)信息检索类型,1、按照检索对象不同分 文献信息检索 数据信息检索 事实信息检索2、按照检索手段方式分 手工检索 计算机检索,信息检索分型-1、按照检索对象不同分,1)数据检索:以数据为检索对

15、象,包括各种统计数字、图表、计算式等;如查找长江有多长?2)事实检索:以事实为检索对象,检索结果主要是客观事实。如什么是“CAD技术”?主要研究成果是什么?3)文献检索:是以文献为对象,目的是从检索系统中找出需要的文献全文。当然文献检索有题录检索、文摘检索、全文检索等。,信息检索分型-2、按照检索手段方式分,手工检索:是用人工处理和查找所需信息的检索过程。主要依靠印刷型的二次文献,如:文摘、目录等手工检索工具。不足之处:检索速度较慢,漏检现象较严重。计算机检索:利用计算机和一定的通信设备查找信息的过程。如:光盘检索、网络检索。特点:检索速度快、检索途径多更新快、资源共享、不受时空限制。,(四)

16、检索工具,1、检索工具:1)传统的检索工具如:目录、索引、文摘等 2)现代的检索工具如:计算机检索数据库、导航库、搜索引擎等 它们都是用来查找信息的工具,统称检索工具。无论是手工检索或计算机检索,都需要检索工具!,(1)手工检索工具,手工检索工具主要是指二次文献(目录、索引、文摘等)所组成的检索工具书等。,纸本检索工具的内容显示,(2)计算机检索工具,计算机检索工具:指各种中外文计算机检索数据库、导航库、搜索引擎等。注意:数据库、搜索引擎的具体使用是我们今后课程的重点。,检索工具的作用,检索工具可详细而又完整地提供文献线索,如分类号、篇名、著者、主题词、分类号、文献来源等。用户可根据这些线索找

17、到原始文献。举例:以著者为线索在现代检索工具CNKI数据库中查三峡大学“黄应平”老师19942010年发表的文章中文论文。,(五)信息检索途径与方法,外部特征途径题名途径著者途径序号途径,内部特征途径主题途径分类途径关键词途径,1、信息检索途径(用CNKI说明),1)按文献内容特征查找文献的途径:主题途径:主题途径是根据文献内容的主题特征,以确定的主题词作为检索入口,查找文献的途径。参照体系是主题词表。关键词途径:是以题目、文摘和正文中出现的具有实质意义的词语作为检索标识,以关键词查找文献的途径。分类途径:是按照文献信息的所属学科类别检索文献的途径。以分类号(或类目)作为检索入口,参照体系是中

18、图法。(如:眼科学R77),1、信息检索途径,2)按文献外表特征检索文献的途径 题名途径:是根据文献的题名(包括书名、刊名、篇名)查找文献的途径。号码途径:是以文献出版时所编的号码(专利号、标准号、报告号等)作为检索入口,利用号码索引查找文献的途径。(如:杂志ISSN号:1006-4443)著者途径:是以已知著者(个人、团体、或机构、公司)的名称作为检索入口,通过著者索引查找所需文献的途径。,2、信息检索方法,方法有两种:()手工检索 工具法、追溯法、综合法()计算机检索 脱机检索 联机检索 光盘检索 网络信息检索,二、计算机信息检索基础知识,计算机检索:简称机检,是指利用计算机存储和检信息。

19、具体地说,就是用户对检索课题加以分析,利用检索语言制定检索策略,将检索提问式输入计算机,在数据库中检索进出所需信息,再将结果显示或打印的过程。,二、计算机信息检索基础知识主要内容,(一)计算机信息检索发展阶段(二)计算机检索系统构成1、数据库结构(三)计算机信息检索方法*1、基础检索技术2、检索策略与步骤,(一)计算机信息检索发展阶段,脱机检索阶段(20世纪50年代60年代中期)当时计算机技术还不发达,数据信息存储在磁带上,只能顺序查找,速度慢,无法进行人机对话,检索结果不易控制,效果也不很理想。联机检索阶段(20世纪60年代70年代中期)大容量存储介质(磁盘和磁盘机)的出现,一台计算机可以通

20、过通信线路连接多个终端。如:DLAOLG系统等,(一)计算机信息检索发展阶段,光盘检索的阶段(80年代中期至今),光盘因其存贮量大、价格低廉、使用方便,在信息检索的领域里得到了越来越多的普及、重视和利用。因为其检索可以免除了联机检索必须支付的电讯费和联机系统使用费.网络检索阶段(20世纪90年代以来),世界各国的网络系统已日益完善和成熟。因特网、万维网使信息的存储、检索和利用发生了巨大的变化。因特网已成为世界上最大的信息资源宝库,现在以网络检索为主。,(二)计算机检索系统构成,由计算机硬件、检索软件、数据库、通讯网络等组成。数据库:是能满足某种特定目的或某一特定数据处理系统需要的一种数据集合。

21、是计算机信息检索系统的核心。由一个或多个文档组成。文档由记录构成,记录由字段构成。,1、数据库结构(CNKI演示),文档 file:数据库中一部分记录的集合.按学科或年代分割成若干个文档.如:CNKI中的十个专集。记录 record:构成数据库的一个基本文献单元一条记录在数据库中代表一篇原始文献的相关信息。字段 field:组成记录的基本要素字段在检索中起重要作用如:TI(题名)、AU(著者)、SO(出处或刊名)、AB(文摘)、KW(关键词)举例:查找“长江工程对生态的影响”文献,CNKI数据库为例,字段,记录,计算机检索的方法-1、检索技术,信息检索技术是应用于用户提问与所收集的文献集合之间

22、的匹配比较的技术。信息检索经历了手工检索、脱机检索、联机检索、光盘检索基于Internet的网络检索,从开始的基于关键词检索,发展到基于概念的检索,再到基于内容的检索。当然目前绝大多数中文检索仍停留在关键词检索阶段,运用的是关键字匹配算法,效率低检索精度差。,概念匹配与文字匹配,概念匹配 计算机 微 机 计算机 电 脑 PC 机 文字匹配 计算机 计算机 PC机 PC机 电脑 电脑,(三)计算机检索的方法-1、基础检索技术,1)布尔逻辑检索:通过布尔逻辑运算符(AND、OR)等来连接检索词,表达用户的检索需求,实现检索的方法。2)截词检索 3)邻近检索 4)限定检索,1)布尔逻辑检索(使用数据

23、库时常用到),AND:(逻辑与),表示”相交”关系,可用来缩小检索范围.例 A AND B,检索的文献必须同时包含 A和B 两个检索词才行,图中深黄色部分.例如:检索“吸烟与肺癌的关系”方面的文献 检索式为:吸烟 AND 肺癌,A,B,1)布尔逻辑检索,OR:(逻辑或)表示”并列”关系,可用来扩大检索范围.A OR B,只要满足 A或B 中的一个条件即可.图中所有部分.例如:检索有关“甲型肝炎或乙型肝炎”的文献。检索式为:甲型肝炎 OR 乙型肝炎,A,B,1)布尔逻辑检索,NOT:(逻辑非)表示”排斥”关系,可缩小检索范围.图中红色部分.例:A NOT B 例如:检索“除锌以外的微量元素的分析

24、”的有关文献.检索式为:微量元素 NOT 锌,A,B,2)截词检索,截词检索:把检索词截断,取其中的一部分片段,再加上截词符号一起输入检索。(主要用于外文检索词)截词符:可替代一个字符串的符号为“?”;替代多个字符为“*”。如输入,comput*;wom?n 检索结果为:computer,computing等 检索结果为:woman,women,3)限定检索,限定检索:对数据库特定字段的检索。限定符有:“IN”,“=”,“:”等.(1)molecular and structure in TI 表示将分子及结构检索词限定在题名字段中。(2)CAD IN PT:表示将爱滋病文献限定在综述文献类型

25、中。(3)PY=2000 将文献时间限定在2000年(4)title:CAD,4)扩展与缩小检索,扩展检索:指初始设定的检索范围太小,命中文献不多,需要扩大检索范围的方法。有概念的扩大、范围的扩大、增加同义词、年代的扩大几种主要的检索方法。缩小检索:又称二次检索。指开始的检索范围太大,命中文献太多,查准率太低,需要提高查准率的方法。除概念、范围、年代的缩小外,还可以通过以下方法限定:核心概念、语种、特定期刊的限定等。,5)邻近检索,邻近检索:是用邻近算符,如NEAR、WITH连接两个检索词,要求必须同时出现在同一字段中,相互位置必须符合规定的相邻度。NEAR:A near B,两个词无论先后,

26、要求两个词同时出现在一个句子中。例:CAD near3 仿真,相隔0-3个词。WITH:A with B,两个词无论先后,同时出现在同一字段即可。两个词间的位置比NEAR宽。例:infant with hepatitis,2、检索策略与步骤,主要步骤:分析课题、选择数据库、确定检索标识、编制提问式、查找原文。例1、查三级网络在大学生心理健康教育中的作用中文文献。(1)分析课题内容,选择相关数据库:中文:CNKI或VIP;(2)确定检索标识(检索词):大学生心理健康教育三级网络,2、检索策略与步骤,(3)编制提问式:大学生 and 心理健康教育 and 三级网络(4)浏览检索结果,查找原文。,检

27、索提问式,检索提问式即检索式,是向计算机检索系统表达检索意图的检索语言。提问式有两种,简单与复合式提问式。复合式提问式就是含两个或两个以上的检索词,用运算符相连接。(1)简单式:心理健康教育(2)复合式:大学生 and 心理健康教育 and 三级网络,2、检索策略与步骤,(1)分析课题,明确检索要求 首先要分析课题的主要内容、所属学科性质、本次检索的目的。这是一篇关于健康教育专业方面的论文,具体的是心理健康,研究的人群是大学生。其次要明确所需文献信息的语种、检索年限、研究对象的情况、期望得到文献的数量等。(2)选择数据库和检索途径 首先应考虑数据库的学科覆盖范围,数据库的语种,收录文献类型和期

28、刊数量等情况。常用的检索途径:主题词检索、自由词检索、分类检索,2、检索策略与步骤,(3)确定检索标识,编制检索提问式 检索标识即检索词,检索提问式即检索式,是向检索系统表达检索意图的检索语言。提问式有两种,简单与复合式提问式。复合式提问式就是含两个或两个以上的检索词,用运算符相连接。,提炼检索词,制定检索式注意问题,检索词是用来描述检索课题的简洁、概括性词语。注意事项:1、要提炼关键的、核心的词作为检索词,去掉意义太泛或“无所谓有”的词。例如检索:“从更宽阔的视野观察和思考冶金反应工程学的问题”去掉不具有检索意义的虚词及无专业所属的通用概念 检索词:冶金 反应工程学,提炼检索词,制定检索式注

29、意问题,2、检索词尽可能使用词或词组,然后用布尔逻辑运算符 将检索词连接起来,切忌将整个题名输入检索框中。3、有时不需要死抠文字,意思匹配即可。例如检索:“智能机器人控制系统的研究”控制 控制系统 控制理论 控制方法所以将“控制”作为检索词即可。,提炼检索词,制定检索式注意问题,4、有时要注意隐含主题的揭示 隐含主题需经过分析,推理得到。如:“人力泵”这个课题。人力泵是题目中已有的词,称显性主题。表达人力泵的概念,还有手摇泵、脚踏泵等,手摇泵、脚踏泵就是隐含主题词,检索词应包括隐含主题。因此,要弄清课题实质及用户的真实需求。,提炼检索词,制定检索式注意问题,5、要避免漏检:如:忽略了同义词,或同一个词的多种表达,有可能造成漏检。同义词:自行车单车 脚踏车 airplane aircraft plane 专有名词的固定表达:NC(numerical control)数字控制 中英文混用:网络数据库web数据库,避免漏检的方法,1)将同义词等列出来,然后用布尔逻辑运算符or将其连接起来2)使用规范词3)还要注意字段限定检索功能,以免误检和漏检。如检索作者王明发表的文章,检索时要将王明限定在作者字段。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号