《情报科学的基本定律.ppt》由会员分享,可在线阅读,更多相关《情报科学的基本定律.ppt(52页珍藏版)》请在三一办公上搜索。
1、情报科学理论第3章 情报科学的基本定律,21世纪信息管理丛书,3.1 布拉德福定律 3.2 洛特卡定律 3.3 齐夫定律 3.4 文献增长律 3.5 文献老化律 3.6 情报科学其他相关定律,第3章 情报科学的基本定律,3.1 布拉德福定律,布拉德福文献分散定律的产生并不是偶然的,而有着一定的客观背景。作为客观化的信息产品(论文)与其载体 期刊有一种集中与分散的关系。布拉德福认为,虽然科学有不同学科之分,但它是一个整体,具有同一性。科学技术的每一个学科都或多或少、或远或近地与其他任何一个学科相关联,因而有一个学科的文献出现在另一个学科的期刊之中的现象,所以文献呈现集中与分散两种趋势。布拉德福还
2、认为,总是会有若干期刊的内容与某个学科更近一些,而总是会有数量更多的期刊的内容离该学科更远些。专门面向这个学科的核心期刊即大量包含该学科论文的那一少部分期刊,在刊载该学科的论文中,载文率一般来说高于别的期刊。布拉德福就是根据科学具有统一性的原则,从定性上对布拉德福定律进行了描绘。,3.1.1 布拉德福定律产生的背景,1布拉德福定律的区域描述“布拉德福分散定律”(简称布拉德福定律):“如果将科学期刊按其刊载某个学科主题的论文数量以递减顺序排列起来就可以在所有这些期刊中区分出载文率最高的“核心”部分和包含着与核心部分同等数量论文的随后几个区,这时核心区和后继区(称为相关区、边沿区)中所含的期刊数成
3、1:a:a2的关系。(a1,称为布拉德福系数,a约等于5)。布拉德福定律是在对期刊文献的统计基础上得出的规律。,3.1.2 布拉德福定律的基本内容,3.1 布拉德福定律,布拉德福定律的图像描述 如果以期刊按载文量递减排列时的顺序号n的对数(lg n)为横坐标,以相应的文献累积数R(n)为纵坐标进行图像描述,我们可以绘制出布拉德福分散曲线。图3-1 布拉德福分散曲线,3.1.2 布拉德福定律的基本内容,3.1 布拉德福定律,A,o,n,C,3.1 布拉德福定律,布拉德福曲线是对文献分散现象直观的、对象化的基本描述,构成布拉德福分布理论的现象学研究的核心与基础。显然,布拉德福定律的区域描述和图像描
4、述是矛盾的。区域描述是从实际统计的具体数据出发,取近似值而概略地归纳出来的,这完全是一种近似的经验方法。图像描述所依据的是区域描述的结论完全同样的统计数据,只是图像描述将统计的期刊数据取对数,并利用了三个区中论文数量相等这一个近似条件得到的结论。因此,从数学观点来看,图像描述是没有任何错误的;从实际应用情况来看,图像描述也非常接近于反映文献的实际分布情况,甚至其近似程度比区域描述更为准确。于是,我们必须认识到,区域描述与图像描述共同组成了布拉德福定律的基本内容。研究布拉德福定律不能不注意到这一基本方面。同时不应只从数学上的差别去强调两个结果矛盾的一面,也不应从定律的区域表述去否定图像描述的方法
5、和结论,而应该从都能近似地与统计数据相吻合这一点去强调其有效性和实用性。,3.1.2 布拉德福定律的基本内容,布鲁克斯回避了图形描述,首次用数学公式描述了布拉德福定律。令 m1、m2、m3 为核心区、相关区、边沿区中的论文数量,p1、p2、p3 为对应区的杂志数量,r1、r2、r3 为各区中每种杂志的平均论文数量,则有:r1=m1/p1,r2=m2/p2,r3=m3/p3显然,p1r2r3划分区域使得:r1p1=r2p2=r3p3=m1于是:p2/p1=r1/r2=a1 p3/p2=r2/r3=a2式中:a1、a2都是大于1的常数,根据布拉德福假设,令a1=a2=a可得到:p2=a1p1=ap
6、1 p3=a2p2=ap2=a2p1于是有:p1:p2:p3=1:a:a2(31)布拉德福认为,式(31)与前面的区域描述形式是一致的。,3.1.3 布拉德福定律的数学解释,3.1 布拉德福定律,3.1 布拉德福定律,布拉德福定律提出后,不少学者试图从理论上加以验证和修正,力图使其更具有实用价值。BC维克里(1948)较早研究了布拉德福定律,不仅充分肯定了布拉德福的研究,而且指出了其论证过程中的矛盾之处,同时还创造性地提出了自己的修正和补充。证明了布拉德福定律的分区数目不一定是3,而可以是任意数。维克里的研究成果既使布拉德福文献分布的图段和定律在结构上得到了统一,在形式上趋于完整,又丰富了布拉
7、德福定律的内容。,3.1.4 布拉德福定律的维克里推论,3.1 布拉德福定律,1布拉德福定律研究中注意的两个问题按什么样的期刊中的什么样的论文数量进行等级排列的问题;布拉德福分布图中论文数量随期刊等级的变化关系问题。2布拉德福定律研究中的几点注释()数学上互相矛盾的布拉德福定律的区域描述与图像描述是该定律的整个内容。不能仅从布拉德福定律的区域描述否定图像描述的结论,也不能从数学上否定区域描述的近似正确性。()维克里对布拉德福定律的修正进一步证明,图像描述法是经验形式的区域近似法的发展和深化,图像描述法是文献分散规律的研究由纯粹经验的方法抽象理论高度发展的一种形式。()期刊论文既高度集中又高度分
8、散,即区域近似法和图像描述法的趋于统一的条件。一般情况下,在理论上二者有较大的差别。()在布拉德福的研究中,将期刊等级排列的依据应是每种期刊一年内(或取三年的平均数)所刊载的论文数量的平均总数。,3.1.5 布拉德福定律研究中注意的问题及注释,3.1 布拉德福定律,1布拉德福定律的应用步骤 应用布拉德福定律,主要是应用它的等级排列方法和分析方法,所以它的定律虽然是以期刊论文在期刊中的分散情况为基础展开的,但却可以派生出许多不同的应用。无论布拉德福定律的应用类型如何,基本上都要经过三大步骤:进行大量的有关文献资料的统计;等级排列统计数据;分析统计数据的相互关系(分析统计方法又分为布拉德福区域分析
9、法和布拉德福图像分析法)。分析统计数据相互关系的方法主要有两种:一种是区域分析法;一种是图像分析法.,3.1.6 布拉德福定律的应用,3.1 布拉德福定律,2布拉德福定律的应用范围 随着对布拉德福定律研究的不断深入,其应用的范围也不断扩大,布拉德福定律的应用主要有:()考察专著出版情况:考察专著出版情况是通过分析各个出版社的关于某一学科或专业的专著的出版情况,掌握专著的基本分布,了解这个学科的“核心出版社”。()考察某学科核心期刊:考察某学科的核心期刊是对与该学科相关的期刊登载相关论文的篇数进行统计的基础上,确定一部分期刊为“核心期刊”的方法,它使读者能在少量的期刊中获得大量的相关论文。()用
10、于情报检索。,3.1.6 布拉德福定律的应用,3.1 布拉德福定律,3布拉德福定律应用的具体事例 随着对布拉德福定律研究的不断深入,其应用的范围也不断扩大,布拉德福定律的应用主要有:(1)确定核心期刊(2)考查专著的分布、确定核心出版社(3)动态馆藏的维护(4)用于检索工具书完整性的确立,3.1.6 布拉德福定律的应用,3.2 洛特卡定律,3.2.1 洛特卡定律的基本内容,3.2 洛特卡定律,3.2.1 洛特卡定律的基本内容,3.2 洛特卡定律,3.2.1 洛特卡定律的基本内容,3.2 洛特卡定律,3.2.1 洛特卡定律的基本内容,3.2 洛特卡定律,3.2.1 洛特卡定律的基本内容,3.2
11、洛特卡定律,洛特卡选择美国化学文摘和德国奥尔巴赫物理学史一览表为数据源研究科技工作的论著分布。按照平方反比分布,所有撰写一篇论文的著者的比例刚刚超过60。例如:在物理学史一览表数据中,共有1325位作者,写一篇论文的位784人,占总数的59.20。在化学文摘数据中,姓氏以A开头的作者共1542人,写一篇论文的为890人,占57.70;以B开头的作者共5348人,写一篇论文的为3101人,占57.89,二者合计平均后占作者总数的57.90。洛特卡定律也可表述为:“撰写两篇论文的作者数量大约是撰写一篇论文作者数量的 1/4(即1/22),撰写三篇论文的作者数量大约是撰写一篇论文作者数量的 1/9(
12、即1/32),撰写n篇论文的作者数量大约是撰写一篇论文作者数量的1/n2,而所有撰写一篇论文的作者占所有作者数量的60”。通常称其为洛特卡定律的文字表述。,3.2.1 洛特卡定律的基本内容,3.2 洛特卡定律,洛特卡最早将科学活动视为人类的生产活动来研究,并创造性地首次提出了“科学生产率”的概念。所谓“科学生产率”是指科学家(科研人员)在科学上所表现出来的能力和工作效果。通常用其生产的科学文献的数量来衡量,这与“劳动生产率”的概念相类似,又有着区别。在经济领域里,劳动生产率是指劳动者的生产效果或能力,通常是用劳动者在单位劳动时间内所生产的产品数量计算或是用单位产品所消耗的劳动量来衡量的;而洛特
13、卡提出的“科学生产率”的概念却与之不同,它是针对科研人员的科学论文著作的生产量而言的,这是由科学生产的特殊性所决定的。显然,科学生产率概念具有一定的科学性和合理性,在此基础上提出了自己的定律。其目的和基本内容是:揭示作者与文献数量之间的关系,描述科学生产率分布的规律。,3.2.2 洛特卡定律与“科学生产率”,3.2 洛特卡定律,洛特卡处理合作者的方法是仅取“第一作者”为统计对象。在文献计量学中这种计量方法常被称为划一计数法,这种方法显然不能真正反映科学生产率分布的实际情况。洛特卡碰到的另一个问题是,洛特卡仅选取了化学和物理两学科第一作者的数据来处理,就得出了所谓“倒数平方定律”,因此我们完全有
14、理由问:()是否对任何学科都存在着倒数规律?()若对前面问题的回答是肯定的,那么“平方”是否永远成立?,3.2.3 洛特卡定律存在的有关问题,3.2 洛特卡定律,在情报科学和图书馆方面,可以用它来预测著者数量和文献数量,便于进行情报、文献的科学管理,便于掌握文献的增长趋势,便于对情报科学的理论进行研究。在科学学方面,可以用它来研究科学家的活动规律,研究人才的著述特征,为科学学的理论研究和应用研究增加了一个新的手段。在预测科学方面,洛特卡定律展现了学科文献的增长规律,便于掌握文献的交流规律。,3.2.4 洛特卡定律存在的应用,3.3 齐夫定律,在对“最小努力原则”的研究中,齐夫认为,每一个人在日
15、常生活中都必定要在他所处的环境中进行一定程度的运动,他把这种运动视为走某种道路。然而,人们在自己的环境里所走的道路并非都是他的全部活动。对于一个处于相对静止状态的人来讲,他要完成新陈代谢,就要有不断的物质和能的运动,并进行输入、循环、输出等一系列的过程。这个物质和能的运动也是在一定的道路中进行的。我们可以认为,组成人体的各个物质器官,正以不同的进度在不同的道路上穿行。而在整个宏观的宇宙世界中,人的系统又是以一个整体在这个宇宙世界中以不同的速度,取不同的途径运动着。,3.3.1 齐夫与最小努力原则,3.3 齐夫定律,3.3.2 齐夫定律的基本内容,3.3 齐夫定律,3.3.2 齐夫定律的基本内容
16、,3.3 齐夫定律,3.3.2 齐夫定律的基本内容,3.3 齐夫定律,3.3.2 齐夫定律的基本内容,3.3 齐夫定律,1齐夫定律在标引理论和词表编制理论中的应用2齐夫定律在情报检索中的应用,3.3.3 齐夫定律的应用,3.4 文献增长律,社会经济和科学技术的迅猛发展,“迅猛”是对科技发展的定性描述,我们也需要对科技发展进行定性的描述。对人类科研活动的数量研究首先要确定定量的对象,一般将其称为科学指标,我们将利用科学指标来表示科技发展的状况。可以充当科学指标的计算对象很多,可以归为如下四类:()人员与机构的数量()科研成果的数量()科研过程以及成果记录载体的数量()科研资金投入的数量,3.4.
17、1 文献增长律产生背景,3.4 文献增长律,在以上四类指标中,以文献指标使用得最为频繁,经验证明,其衡量效果明显优于其它三者。其原因大致有:绝大部分的科研活动及其成果都是以文献方式来记录和储存的。与人员、机构、资金和成果相比,各类科技文献的数量巨大,且易于收集。与人员、机构和资金相比,科技文献较易于统计分析,从而对各类科研过程进行有选择的定量研究。,3.4.1 文献增长律产生背景,3.4 文献增长律,3.4.2 文献增长律的基本内容,3.4 文献增长律,3.4.2 文献增长律的基本内容,3.4 文献增长律,3.4.2 文献增长律的基本内容,3.4 文献增长律,3.4.2 文献增长律的基本内容,
18、3.4 文献增长律,3.4.2 文献增长律的基本内容,3.4 文献增长律,1文献的普赖斯增长曲线 如图3-4所示,3.4.3 文献增长律曲线,3.4 文献增长律,2文献的逻辑增长曲线,3.4.3 文献增长律曲线,3.4 文献增长律,2文献的逻辑增长曲线,3.4.3 文献增长律曲线,O,F(t),3.4 文献增长律,3.4.4 文献增长律的应用,1文献增长律在情报预测中的应用,2文献增长律在科学史和科学学研究中的应用,3.5 文献老化律,一般来讲,旧的文献会逐步让位于新的文献。普赖斯根据科技文献逐年被引用的统计数据曾认为,一篇文献的使用平均寿命仅为10年。由于上述原因引起科技文献随时间推移而使用
19、频次逐步减少的现象被称为文献老化(或逐渐过时律)。“老化”是一个过程,是一个动态的概念,即给定的文献集合在不同的时期将有不同的使用价值,将文献老化等同于废弃不用是不正确的,二者在含意上有区别。文献的老化必定会导致其被使用数量随着时间的推移而减少,但文献使用量随着时间推移的减少却并不一定仅是由老化这一因素造成的。严格地讲,文献的老化过程应指使用价值逐渐减少的阶段(表现为使用次数的逐渐减少)而不是文献诞生之后被使用的全部过程。老化一般是针对某一类文献群体而言的,除特别声明外,不是指某一篇或少量具体的文献的老化。,3.5.1 文献老化及其产生原因,3.5 文献老化律,造成文献老化的原因有很多,下面例
20、举其中重要的四种原因:文献中的情报被后来的研究证明是错误的。文献中的情报是正确的,但被载有新的,更全面内容的文献所代替,原有文献的内容已进入了更广泛的交流领域。文献中的情报是正确的,但研究者的兴趣发生了转移。随着科研工作的发展,一个个的难题被突破,使得科学工作者研究方向不断转移,因而对文献的使用也必然会发生相应的变化。文献情报是正确的,且被后人所普遍接受,一般人们就不会再去专门查询那些原始文献。,3.5.1 文献老化及其产生原因,3.5 文献老化律,文献信息的老化一般指这样四种情形:文献中所含信息仍然有用,但现在已被包含在其他更新的论著中;文献中的信息仍旧有用,但现在正处在一个人们对其兴趣下降
21、的学科;文献中的信息仍旧有用,但为后来的著作所超越;信息不再有用。,3.5.2 文献老化律的基本内容,3.5 文献老化律,文献信息老化受许多因素的影响,归纳起来主要有如下几点:()文献增长()学科差异()学科发展阶段的差异()信息环境和用户需求,3.5.3 影响文献老化律的因素,3.5 文献老化律,(1)文献剔旧(2)指导阅读(3)研究学科发展规律,3.5.4 文献老化律的应用,3.6 情报科学其他相关定律,1.文献耦合规律 文献耦合是指文献通过参考文献进行的耦合。具体地讲,就是如果两篇论文同时具有同样的一片或几篇参考文献,或者说它们共同引用了一篇或多篇论文、则这两篇论文之间的关系,称“文献耦
22、合”。耦合的强度取决于共参考文献(被引文献)的数量。2.各种类型的文献耦合(1)文献耦合(2)学科耦合(3)著者耦合(4)期刊耦合,3.6.1 文献耦合规律,3.6 情报科学其他相关定律,1.文献同引规律 所谓文献同引是指两篇文献被别的文献同时引用,并以引用它们的文献数量作为测度,称为同引频率。2.文献同引与文献耦合的区别(1)同引反映的是两篇(或两篇以上)被引文献(即参考文献)之间的关系,而文献耦合反映的是引证文献(即来源文献)之间的关系。(2)文献同引反映的是文献之间变化的和暂时的关系,文献耦合反映的则是文献之间固定的和长久的关系,它们分别是动态和静态的结构模型。(3)文献同引是展望性的,
23、文献耦合则是回溯性的。,3.6.2 文献同引规律,3.6 情报科学其他相关定律,3.各种类型的文献同引 在文献计量学中,若能把“同引”的概念更加广泛化,进一步研究各种类型同引的结构关系,无疑将会使引证分析在研究对象和研究方法上更加趋于完美,同时对科学学、未来学的研究也将提供更广阔前程。(1)论文被同引(2)著者被同引(3)学科被同引(4)期刊被同引,3.6.2 文献同引规律,3.6 情报科学其他相关定律,自引是指具有相对稳定性和文献生产连续性的科学主体,在其后期产出文献中引用自身前期产出文献的文献引用形式。它包括以下几个要点:(1)自引是一种文献引证形式;(2)自引的“行为”主体必须具有文献生
24、产功能,如作者的著述、期刊的论文刊载、学科的文献产生等。换言之,自引主体同时也是文献生产的主体;(3)能够成为自引主体的科学主体必须具有相对稳定性和文献生长连续性;(4)自引的实质是科学主体的后期产出文献引用其自身的前期产出文献。,3.6.3 文献自引规律,3.6 情报科学其他相关定律,1.各种类型的文献自引(1)作者自引。指某一作者在其所著文献中,引用他本人以前所著(含合著)文献的自引现象。(2)机构自引。指某一机构作者的文献引用本机构作者(不管是否同一作者)文献的自引现象。(3)期刊自引。指某一期刊在其刊载文献中,引用该刊以前所刊载的文献的自引现象。(4)学科自引。指某一学科或技术领域的文
25、献引用本领域文献的自引现象。,3.6.3 文献自引规律,3.6 情报科学其他相关定律,(5)语种自引。指某一语种的文献引用本语种文献的自引现象。(6)地区自引。指某一地区出版的文献引用本地区出版文献的自引现象。(7)时期自引。指某一时期所发表的文献,被同期出版文献所引用的自引现象。,3.6.3 文献自引规律,3.6 情报科学其他相关定律,2.文献自引的分析 为了更好的理解文献自引,我们先来介绍几个概念:,3.6.3 文献自引规律,3.6 情报科学其他相关定律,被自引率代表某主体对其自身的影响力大小。被自引率高,则自影响力大;被自引率低则自影响力小。(1)作者自引的分析 作者自引分析的主要内容有
26、两个:作者学术地位的评价和作者自引原因(态度)的分析。地位评价主要依据被自引率,作者自引的原因如下:自引率高,被自引率高 自引率高,被自引率低 自引率低,被自引率高 自引率低,被自引率低,3.6.3 文献自引规律,3.6 情报科学其他相关定律,(2)期刊自引的分析 主要是评价期刊质量及其在本学科领域的地位。期刊自引率可用以分析期刊的报导方向,用稿标准和选材范围是否稳定,从而评价期刊的质量。如果期刊自引率高,表明该刊的用稿有连续性,前后衔接较好,逐渐形成了自己的学术风格和独到的特点,并把这一特色保持着。如果其被自引率也高,那就意味着该刊所载论文反映的专业面较窄,对口杂志较少。(3)学科自引的分析 对学科自引可进行如下的分析:分析某学科的相对独立性和吸收能力分析某学科的地位和渗透性,3.6.3 文献自引规律,