文献信息组织技术.ppt

上传人:小飞机 文档编号:5739581 上传时间:2023-08-16 格式:PPT 页数:73 大小:764KB
返回 下载 相关 举报
文献信息组织技术.ppt_第1页
第1页 / 共73页
文献信息组织技术.ppt_第2页
第2页 / 共73页
文献信息组织技术.ppt_第3页
第3页 / 共73页
文献信息组织技术.ppt_第4页
第4页 / 共73页
文献信息组织技术.ppt_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《文献信息组织技术.ppt》由会员分享,可在线阅读,更多相关《文献信息组织技术.ppt(73页珍藏版)》请在三一办公上搜索。

1、文献信息组织技术,学习内容,概论著录分类法主题法元数据法本体与语义网,参考文献,信息组织学,储节旺等,清华大学出版社&北京交通大学出版社,2007.信息组织,马张华,清华大学出版社。信息组织概论,冷伏海,科学出版社。网络信息资源组织,马张华,北京大学出版社。信息组织,周宁,武汉大学出版社。DC元数据,吴健中,上海科学技术文献出版社。中国图书馆分类法汉语主题词表,概 论,相关概念意义与作用理论基础方法与技术应用领域研究内容现状、热点、难点发展趋势,相关概念,什么是信息,信息有什么特征,作用?信息:泛指信号、音信、消息、数据等 特征:客观性与普遍性;表征性与可识别性;可存储性和传递性;价值性和共享

2、性;不确定性和不完全性;时效性;可处理性;作用:是管理的基础;智慧的源泉;提高国家竞争力的条件。,相关概念,信息组织:使信息有序化的方法。内容:按照信息组织的活动类型分为:信息选择、信息分析、信息描述与揭示、信息存储。按照信息组织流程可分为:筛选鉴别、分类排序、著录标引、编目、分析和研究。类型:语法信息组织、语义信息组织、语用信息组织。,相关概念,数据(data):是能通过直接观察获得的对客观对象的记录,未经过处理。数据处理(data processing):用某种方法记录数据并通过机械化方法即时获得信息的过程,其结果是获得某种信息。文献(literature,document):利用一定的技

3、术手段把一定的信息内容记录到一定载体上形成的存储型传递媒体。信息资源(information resourses)网络信息资源(internet information resourses),信息组织的意义与作用,信息组织实施的必要性:信息的激增和泛滥需要信息组织。信息组织工作从文献机构拓展到各类行政管理和办公部门,并扩展到海量的网络信息。我们创造信息的能力已远远超过我们去寻找和组织报道它们的能力,我们需要信息鉴别能力。失去控制和无组织的信息已不再是一种资源。用户获取和筛选信息的时间成本不能大于信息服务的价值信息组织是信息增值的关键环节。(集成、序化、开发增值)日益差异化的信息需求需要信息组织

4、不断变化的检索环境需要信息组织社会信息化进程的推进需要大力发展信息组织。,信息组织的目的,满足用户的信息检索需求。用户常用检索形式-图书馆书目卡片(基本已弃用)-机检(机读目录)-数字图书馆(如期刊网、超星)-网络搜索引擎,理论基础,信息论信息组织的原理 系统原理 语言学原理 逻辑学原理 知识分类原理,应用领域,从载体形态看:传统的图书、期刊等文献资料的组织;网络信息组织;数字图书馆信息组织;从实践领域看:企业信息组织;政务信息组织;医学卫生信息组织;教育信息组织;,研究内容,理论层面规范层面方法层面技术层面信息组织基本理论方法信息组织的发展及其类型信息描述规范的基本理论方法信息描述理论和技术

5、研究类表、词表的基本理论及方法研究标引理论与技术研究信息检索工具研究计算机技术在信息整序领域应用的研究各种专门类型资源的组织和处理研究信息的布局、建构等信息视角的研究,方法与技术,传统文献信息组织:分类法、主题法网络信息组织:元数据法、本体与语义网知识组织:本体、语义网著录、标引技术和方法,文献信息组织著 录,著 录,相关概念控制与规范著录(文献信息描述)主要参考教材:信息组织,马张华,清华大学出版社,相关概念与术语,著录(description):即“文献著录”或“目录著录”,是指根据文献信息组织和检索的需要,对文献资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。著录的结果是

6、款目。款目(entry):是依据一定的方法,对表示文献内容、外表形式和物质形态的特征所做出的记录,即著录的记录。,傅守灿G250.8 图书馆自动化基础教程/傅守灿,陈文广编著.北 008 京:北京大学出版社,1996 16开;20元 高等院校教材 ISBN7301032102.图.傅 陈.图书馆自动化教材.G250.7,款目,相关概念与术语,标引(indexing):指在分析文献内容的基础上,用某种索引语言或标识符号把文献的主题概念及其他有检索意义的特征标识出来,作为情报存储和检索的依据的处理过程。检索(retrieval):通常是指从任何方式组成的信息集合中,查找特定用户在特定时间和条件下所

7、需信息的方法与过程。完整的信息检索含义还包括信息的存储(storage)。,相关概念与术语,检全率:检准率:,检出相关信息资源量系统相关信息资源总量,100%,检全率=,检出相关信息资源量 检出信息资源总数,100%,检准率=,要求描述控制词汇控制句法控制,控制与规范,对信息组织的要求:检全率与检准率、检索速度、系统易用性、检索的成本效益。描述控制:检索系统不直接将信息资源本身作为组织和处理的对象,而是以描述记录作为代用品进行操作。描述项目控制 描述文字控制 描述级别控制 描述格式控制,词汇控制,同义控制:使一个概念只用一个语词表达,克服一义多词。规范词,用代参照。如:自行车 代 脚踏车 单车

8、词义控制:使词义明确,一个词语只表示一个概念 克服一词多义。如:疲劳(生理);疲劳(物理)词间关系控制:语义相关系统 等同、等级、相关 主题法和分类法各有控制方法,句法控制,根据组词造句的规则,对检索语词的组合方式作出规定。例:金属材料锻造金属材料锻造句法控制实现方法 1.确定引用次序(组配次序)如:物质-种类-部分-成分-性质-过程-操作-施动者 2.使用辅助符号:关系符号、联系符号、职能符号、逻辑组配符号。()+-:*3.轮排,规范控制的依据,逻辑知识:概念内涵及外延、概念之间的关系。同一、包含、交叉、并列、反对、矛盾相容关系和不相容关系:,相容,不相容,A B,A B,A B,A B,A

9、 B,A,B,C,同一关系 包含关系 交叉关系,并列关系 反对关系 矛盾关系,规范控制的依据,知识分类:科学分类体系 学科分类体系 事物分类体系 行业分类体系,著录,概念:是指根据文献信息组织和检索的需要,对文献资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。(=文献著录或书目著录)作用:其结果是获得描述记录,即一个文献资源的基本数据;并将此作为文献实体的代替物组织目录、索引、数据库、搜索引擎等检索系统,供用户识别、定位、检索、选择文献。著录基本原则:以文献的物理实体为基础,客观著录,如实反映以达到文献著录的统一。,著录,描述记录:信息描述形成的结果-卡片式的文献描述结果称为“

10、款目”-机读目录中的文献描述结果称为“记录”-网络资源管理中的信息描述结果称为“元数据”。*在现代信息资源组织中,各种类型信息资源的描述记录目前统称为元数据。,傅守灿G250.8 图书馆自动化基础教程/傅守灿,陈文广编著.北 008 京:北京大学出版社,1996 16开;20元 高等院校教材 ISBN7301032102.图.傅 陈.图书馆自动化教材.G250.7,款目,rdf:RDFxmlns:rdf=http:/www.w3.org/TR/2000/CR-rdf-schema-20000327xmlns:dc=http:/purl.org/DC/documents/rec-dces-199

11、90702.htmxmlns:dcq=http:/www.loc.gov/marc/dcqualif.htmxmlns:ebmq=http/hc.lib.keio.ac.jp/yukiko/ebm/qualifier.htmxmlns:ac=http:/purl.org/dc/agent/1.0/xmlns:mesh=http:/nlm.nih.gov/mesh/MBrowser.htmxmlns:ebmc,OCLC协作联机资源编目系统(Online Computer Library Center)(CORC)中元数据的显示界面(Cooperative Online Resource Cata

12、log),元数据,著录的规范,文献著录标准-国际标准书目著录(ISBD系列):70年代-英美编目条例(AACR2):78年-文献著录总则:83年 各个分则:普通图书著录规则 连续出版物 非书资料 地图资料 档案 文后参考文献,国际标准书目著录国际图联ISBD=International Standard Bibliographic Description ISBD(G)总则 ISBD(CM)地图测绘资料 ISBD(S)连续出版物 ISBD(NBM)非书资料 ISBD(M)专著 ISBD(A)古籍 ISBD(PM)印刷乐谱 ISBD(CP)组成部分 ISBD(CF)计算机文档,元数据描述标准(p

13、29)-都柏林核心集(Dublin Core,简称DC)-文本编码倡议(Text Encoded Initiative,简称TEI)-政府信息定位服务(Government Information Locator Service,简称GILS)-,开始著录,信息源著录项目描述的符号和标识格式详略级次描述工作程序主要著录项目的描述方法检索点与规范档,文献信息描述的信息源,信息源(Sources of information):进行信息资源描述时描述信息的来源和出处。-图书信息源:主要信息源:书名页;版权页 次要信息源:参考规范文档、工具书-期刊信息源:封2、封3-网络信息源:头标部分,各类型文献

14、信息资源的主要信息源(参考北京大学出版社相关教材)著录各种文献信息资源时,优先选用的书目资料燎源。,文献信息资源描述项目,也叫著录项目基本描述项目(Areas):用以揭示信息内容和特征的记录事项。书目著录的主要组成部分,它包含某一类型或一组各种类型的书目数据。每一书目记录由若干著录项目组成。子项目(Elements):构成著录项目的一个组成部分。每一著录项目可分成若干子项目。设置在基本项目之下,对基本项目的内容进行限定,以规范该项目的描述。,基本描述项目,文献著录总则:9个项目-题名与责任者项;-版本项;-文献特殊细节项;-出版发行项;-载体形态项;-丛编项;-附注项;-文献标准编号及有关记载

15、项;-提要项;-标识项。为必备项目符号,基本描述项目,都柏林核心集:15个项目-题名(Title)-作者或创作者(Author or Creator)-主题和关键词(Subject and Keywords)-描述(Description)-出版者(Publisher)-其它参与者(Other Contributor)-日期(Date)-资源类型(Resource Type)-格式(Format)-资源标识(Resource Identifier)-来源(Source)-语言(Language)-关联(Relation)-覆盖范围(Coverage)-权限管理,描述子项目,如文献著录总则,题目

16、和责任者项的子项目为:-正题名-并列题名-副题名及说明题名-文献类型标识-第一责任者-其他责任者,中国机读目录(CNMARC)描述项目,中国机读目录描述项目,普通图书各个著录项目的规定信息源(参考北京大学出版社相关教材)指为款目的各个著录项目和子项提供著录信息的出处。,描述的符号和标识,标识符:分隔描述项目的专用辅助符号,用来识别各著录项 目和子项目。标识符位置:规定的标识符标注在著录项目以及子项目之前,或将其括起。标识符作用:标识其后或被括起的项目;识别不同项目的含义;便于计算机处理。,描述的符号和标识,标识类型 传统文献款目:(p3536)项目标识符(前置符):包括.=:/;,+/内容标识

17、符:包括()?网络信息元数据:表达该字段内容的文字标识。如:题名的标识就是“题名”,描述格式,描述格式:描述记录内各个描述项目的记录次序和表述方式。分为著录正文和提要两大部分元数据格式:都柏林核心集,标目(Heading)第一段落:题名与责任说明项;版本项;资料专用项;出 版发 行项。第二段落:载体形态项;丛编项。第三段落:附注项 第四段落:标准号(或代用号)和获得方式项。第五段落:提要项 标识项(Tracing),著录正文,款目(Entry)格式结构,标目 题名、著者或其他个人或团体责任者、主题标题 题名与责任说明项.版本项.出 版发 行(等)项。载体形态项.(丛编项)附注项 标准号(或代用

18、号)和获得方式项。提要项 标识项,中文款目著录格式(段落式),索书号 Call number,分类号,正题名 并列题名:其它题名信息/第一责任说 明;其它责任说明.版本说明/与本版有关的责 任说明.出 版地:出版者,出版年.页数或卷(册)数:插图说明;尺寸 附件说明.(丛编正题名,ISSN;丛编编号).附注 ISBN号(装订):价格.题名检索点.责任者检索点.主题标目.分类号,中文款目通用款目一般格式,医学信息学Medical Informatics/f(荷)贝梅尔(J.H.Van Bemmel),(美)穆森(M.A.Musen)编;包含飞,郑学侃译.-上海:上海科学技术出版社,2002.2

19、598页;27cm 本书包括医学信息学基本理论,方法、应用、评估方法、发展 方向及其限制。数据存储、分析和处理、数据、知识传输和交换、各种传输格式标准和编码术语库等。ISBN 7-5323-6317-1:¥68.00.医.贝 穆包 郑.医学 信息学.R05,描述详略级次,文献著录详略级次(文献著录总则)p37 简要级次:主要项目(题目责任者、版本、出版发行地、载体形态)基本级次:主要项目+部分选择项目 详细级次:主要项目+全部选择项目网络资源组织:未设置,推荐项目,描述工作程序,原始编目与复制编目工作程序:查重描述标引复核并输入系统,主要著录项目的描述方法,也叫著录法题名与责任者项版本项文献特

20、殊细节项出版、发行项载体形态项,丛编项附注项标准编号与获得方式项提要项 标识项,例 1 侠女奇缘 又名 儿女英雄传 著录为:侠女奇缘,又名,儿女英雄传,题名与责任者项,例3 原题:自己的园地 雨天的书 周作人著 著录为:自己的园地;雨天的书/周作人著,正题名(包括交替题名、合订题名),1.交替题名:正题名的一部分,突出或解释题名主要部分。(原题中:或;又;一名;原名;or),2.合订题名:著作汇编,无总题名。(三个以内),例2 Twelfth night Or What you will为:Twelfth night,or,What you wil,三个以上:取前三,用,并在附注项说明。,并列

21、题名:用另一种语言文字表示的正题名。符号=,题名与责任者项,例4 原题:Megatrends Ten New Directions Transforming Our Lives 大趋势 改变我们生活的十个新方向 著录为:大趋势:改变我们生活的十个新方向=Megatrends:Ten New Directions Transforming Our Lives,副题名及说明题名 符号:解释正题名的文字或表达文献的内容范围、时间范围、著作体裁、编辑方式等。,题名与责任者项,例5 原题:清明前后 五幕话剧 著录为:清明前后:五幕话剧,例6 原题:ECL集成电路 原理与设计 著录为:ECL集成电路:原理

22、与设计,责任说明:名称+责任方式 相同责任方式:,三个以上:等 et al.中文清代以前(包括清代):(元)责任者 中文外国:(国别)责任者,题名与责任者项,一般文献标识:表示某一文献所属的文献类型的术语。著录在正题名之后。普通图书省略 其他:走遍美国 录象制品,版本项 版本说明+与本版有关的责任说明,中文原题 版本著录形式:第2版 2版 1999版 1999版 修订版 修订版 新1版 新1版 增订版 增订版 删节版 删节版 改写版 改写版 第2 增订版 第2 增订版,西文原题 版本著录形式:Second edition 2th ed.1999 edition 1999 ed.Revised

23、edition Revised edition New edition New edition Enlarged edition Enlarged edition Expurgated edition Expurgated edition Adapted edition Adapted edition Second edition revised and enlarged Second edition revised and enlarged,例:中国书史简编/刘国钧著.1982年版/郑如斯订补.北京:书目,文献特殊细节项,为某些特殊类型文献特征的著录设置的项目。主要用于记录个别重要文献特征。

24、如:连续出版物卷、期、起讫,地图比例尺,投影法等,出版、发行项 出版地或发行地、出版者或发行者、出版日期或发行日期以及 印刷地、印刷者、印刷日期。,例7:Oxford University Press 1999 Kuala Lumpur Oxford Hong Kong 著录为:Kuala Lumpur;Hong Kong:Oxford Univ.Pr.,1999,出版地或发行地:-有多个出版、发行地时,一般只著录第一个或版式显著的出版地、发行地(出版地属于编目机构所在的国家,后续的出版、发行地可照录)。-同名异地或不知名的出版、发行地,需在地名后附国名或省名、州名等,以资区别。例:Cambr

25、idge,Eng-无法查考时,著录 出版地不详 S.L.(Sine Loco),出版者或发行者-两个出版者时,用;号。例:广州:花城出版社;香港:三联书店香港分店,1983-西文:published by publisher 一般不著录 published for by distributed by 照录-知名的出版机构:著录简称。,出版日期或发行日期-阿拉伯数字著录。-跨年度出版的文献(丛书、多卷书)著录起讫年。例:Harmondsworth:Penguin,1949(1963 printing),出版、发行项,载体形态项 描述文献的物质外形特征。包括:文献数量与单位:其他形态细节;尺寸+附

26、件,文献数量与单位:页数或卷(册)数。例:136页 660 p.4册(1317页),其他形态细节:图表、插图、色彩、照片等。例:235页:图;19 311p.Ill.;23,附件:(也可著录在附注项)与文献内容有关,而又分离于文献主体之外的附带材料。例:280p.:ill.;21+1 answer book 534页:折图;25+1袋附图,我国中文简装图书的开本与尺寸对照表:印张规格 图书高度 880毫米1230毫米 16开 30 787毫米1092毫米 16开 25 850毫米1168毫米 大32开 20 787毫米1092毫米 32开 19 787毫米960毫米 小32开 19,尺寸:以厘

27、米为单位著录文献封面的高度。计算时逢小数进一。,丛编项:丛书或多卷书分散著录时设置。著录国际标准连续出版物号ISSN.例:.(获诺贝尔文学奖作家丛书,ISSN 8891-1108;第二辑),附注项:补充描述项目。进一步说明文献的性质、特征、用途及范围。使用附注导语:根据 封面题名为:本馆有:译自 题名取自 子目:,标准编号与获得方式项 标准编号(附加说明):获得方式 国际标准书号(International Standard Book Number,ISBN)国际标准连续出版物号(International Standard Serial Book Number,ISSN)国际标准书号结构:I

28、SBN 0 87287 2203 ISBN 7 302 046506 10位数字组成:组号:国家、地区、语言或其他组织集团代号 出版者号:位数视出版者文献出版量的多寡而定。书序号:特定的图书编号。校验号:中国标准书号:国际标准书号+图书分类 种次号,校验号 0 8 7 2 8 7 2 2 03 加权 10 9 8 7 6 5 4 3 2 0+72+56+14+48+35+8+6+0=239 23911=12余8 11-8=3 计算机校验号,附加说明:包括装帧、简短的修饰语。例:ISBN 0 87287 2203(精装):¥68.00元 ISBN 0 8389 33467(casebound):

29、107.64,提要项 标识项,标准编号与获得方式项,获得方式:获得文献的途径、发行范围。获得方式为销售时,记录文献的定价。例:ISBN 0 87287 2203(精装):赠阅,检索点与规范档,检索点=标目 在信息描述各种内容中,供检索使用的数据。如题名、责任者、分类号、主题词等。作用:决定排检次序;决定款目性质,用以组织相应检索工具。(题名、责任者、分类、主题),检索点的设置,卡片目录检索系统:在通用款目基础上,设置标目。一条款目只有一个标目。可形成题名、责任者、分类、主题目录。书本式目录:只编制一条款目,按一种标目排列,其余检索途径通过索引提供。机读目录:隐含在机读记录中,通过字段指示符提供

30、可检索字段。特点:检索点的范围宽,各种输入的描述数据都可以 作为检索依据,要根据需要设定。,*在条件允许的范围内,应尽可能多地提供有价值的检索点。,通用款目,图书馆自动化基础教程 图书馆自动化基础教程/傅守灿,陈文广编著.北 京:北京大学出版社,1996 16开;20元 高等院校教材 ISBN7301032102.图.傅 陈.图书馆自动化教材.G250.7,傅守灿 图书馆自动化基础教程/傅守灿,陈文广编著.北 京:北京大学出版社,1996 16开;20元 高等院校教材图书馆自动化基础教程 ISBN7301032102.图.傅 陈.图书馆自动化教材.G250.7,陈文广 图书馆自动化基础教程/傅

31、守灿,陈文广编著.北 京:北京大学出版社,1996 16开;20元 高等院校教材 ISBN7301032102.图.傅 陈.图书馆自动化教材.G250.7,图书馆自动化教材 图书馆自动化基础教程/傅守灿,陈文广编著.北 京:北京大学出版社,1996 16开;20元 高等院校教材 ISBN7301032102.图.傅 陈.图书馆自动化教材.G250.7,G250.7 图书馆自动化基础教程/傅守灿,陈文广编著.北 京:北京大学出版社,1996 16开;20元 高等院校教材 ISBN7301032102.图.傅 陈.图书馆自动化教材.G250.7,规范文档,规范档:是由名称记录和主题记录组成的文献标目集合。对记录的检索点(标目)进行规范控制、跟踪、维护的工具。名称规范档/主题规范档-名称规范档:为题名、人名、团体规定统一 名称-主题规范档:叙词表,规范文档的作用,有利于以统一的方式加以记录。有利于以规范、通用的形式加以记录。提高标引和检索的质量。有助于实现国际书目共享。,规范控制的方法,建立三种款目规范款目:对使用的规范标目亦即同一标目及其有关参照的完整记录。(构成规范文档的主体)参照款目:引导用户从非正规标目查检对应的规范标目,或从一规范标目查检另一相关的规范标目的款目。说明款目:关于规范文档编制规范的说明,包括标目的选择方法、组织原则、目录使用方法,THE END,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号