《布拉德福定律解析ppt课件.ppt》由会员分享,可在线阅读,更多相关《布拉德福定律解析ppt课件.ppt(59页珍藏版)》请在三一办公上搜索。
1、实验:专业期刊集中与分散现象研究,实验要求:根据集中与分散定律分析学科交叉渗透。实验目的:通过观察初步掌握集中分散现象的普遍性,为应用定律确定核心期刊打下基础。实验步骤:1、选择10种情报学专业期刊(包括核心和非核心)2、统计论文关键词分析实际涉及其他专业3、分析此期刊还可作为哪些专业核心期刊4、分析学科之间交叉渗透性确定学科近疏(300字左右),集中与分散规律实验参考表格,第五章 科学信息的集中与分散规律,张雪艳,教学要求掌握文献分散规律研究中的相关概念。熟悉Bradford定律的文字描述及其数推导。掌握Vickery对Bradford定律的修正。掌握Brookes公式及其参数。掌握Brad
2、ford定律应用中的基本技术和方法。主要内容Bradford定律的产生。Bradford定律的区域、图象和数学描述。Bradford定律的几个重要推论及其分析。Bradford定律的应用技术和方法。,第一节 布拉德福定律的形成背景,一、几个基本概念相关文献 ( relevant literrature )凡属同一个学科、专业或特定主题的文献。非相关文献(unrelated literature)文献分布规律文献在一定时期内空间上分布的总趋势。布拉德福定律(文献数量/期刊数量)洛特卡定律(文献数量/著者数量)齐夫定律等(文献中词频/等级序号),第一节 布拉德福定律的产生,二、布氏定律的创始人布拉
3、德福 SC布拉德福(Samuel Clement Bradford,1878一1948)是世界著名的文献学家和化学家。 创立了布拉德福文献分散定律,是文献计量学的主要奠基人。布拉德福是一位多产作家 ,主要有:理论科学与应用科学著作的分类、分类原理、科技目录的组织、图书馆编目等 他还发表过许多论文,较著名的有:国际十进分类法的起源、目的、结构及其使用、文献工作五十年、科学技术的全部文就工作、专门学科的情报源,等等,三、布拉德福定律的产生背景,文献分散是普遍的客观现象 科学统一性原则 文献统计研究是布氏定律产生的基础 布拉德福认为,总是会有若干期刊,它们的内容与某个学科更近些;而总会有数量更多的期
4、刊,它们的内容离这个学科更远些;专门面向这个学科的核心期刊,亦即大量包含这个学科内容的最少数的那一部分期他论述这个学科的论文,数量一定要多于论述有关学科的论文,四、布拉德福定律的产生琼斯和布拉德福的研究琼斯(E.L. Jones):最新应用地球物理学目录(Applied Geophysics,1928-1931),季刊,4年润滑作用目录季刊(Lubrication,1931.6-1933),2.5年布拉德福:Bradford S.C. Sources of Information on Specific SubjectsJ. Engineering,1934.Bradford S.C. Doc
5、umentationM. London:Crosby Lockwood, 1948.,观察结果:,文献的分散各学科专业文献除了密集地登载于本学科的专业期刊,即“核心期刊”(core periodicals)外,还登载于大量本专业的边缘期刊(borderline periodicals),即“相关期刊”,以及更一般化的其它学科的期刊(gerneral periodicals)上。由于后二者期刊的分散,难以查找特定专业的论文,因此往往导致专业文献的漏摘、漏标,使得大量论文“流失”。,核心期刊效应二次文献在摘录某一专业论文的时候,往往注重学科影响较大的“核心”类期刊,而忽视了非核心类的相关期刊,造成
6、大量论文的重复摘录。对此,布拉德福提出了一个带有规律性的假设,即: 任何学科的绝大多数专业文献都集中于少数的本专业的期刊内,但同时也散布于其它的相关期刊中。布拉德福的上述研究结论对于探讨文献分散规律是致关重要的。后经布拉德福的同事,琼斯(E.luncast Jones)的继续研究得以深入。,核心期刊效应具有广泛性二次文献(文摘、提录、索引)的核心期刊效应1967年,UNESCO的一篇文章指出:“从物理学和化学领域的重要文摘杂志中发现了一条规律,它们所列出的或编成文摘的75%的论文仅来自它们所收摘的全部期刊的10%”流通量的核心期刊效应1969年,美高夫曼(W.Goffman)等人通过统计分析证
7、实,按期刊流通量数据的分布近似服从布拉德福文献分散规律,存在核心期刊效应。被引量的核心期刊效应1971年,加菲尔德(Garfield)在统计了2000种期刊中的100万篇参考文献后发现,24%的被引频高的文章出自25种期刊,50%的出自152种期刊,75%出自767种期刊,而其余的被引文章则散布在数量大得多的期刊中。证明了被引文章在期刊上的分布也有一个较为集中的核心区与广为分散的相关区。,有许多研究表明,由上述因素派生的其他因素如:被摘率、影响因子、即时被引率等也都具有核心效应。核心期刊(CoreJournals):“某学科(或专业,或专题)的核心期刊,是指该学科所涉及的期刊中,刊载论文较多的
8、(信息量较大的),论文学术水平较高的,并能反映本学科最新研究成果及本学科前沿研究状况和发展趋势的,较受该学科读者重视的期刊。” 中文核心期刊要目总览基本标准:“载文量多”、“收录量大”和“被引次数多”。,第二节 布拉德福定律的内容,一、布拉德福定律的区域划分和文字描述数据统计 按每种期刊刊载相关论文数量的大小递减排列,即“降序排列”(见B项)。,布拉德福数据,区域划分 将观察数据在递减排列的基础上,按如下原则划分为三个区。使各区域中期刊对应的论文数量大致相等。,Bradfords Law of Scattering,9 sources 429 articles,59 sources 499 a
9、rticles,258 sources 404 articles,核心区,相关区,边缘区,文字描述 “If scientific journals are arranged in order of decreasing productivity of articles on a given subject, they may be divided into a nucleus of periodicals more particularly devoted to the subject, and several groups or zones containing the same numbe
10、r of articles as the nucleus, where the number of periodicals in the nucleus and succeeding zones will be as 1:a:a2.”,如果将科学期刊按其登载某个学科的论文数量的大小,以递减顺序排列,那么可以把期刊分为专门面向这个学科的核心区和包含着与核心区同等数量论文的几个区。这时,核心区与相继各区的期刊数量成 1:a:a2的关系。 式中 a 为布氏系数。根据布氏数据,a5,二、图像描述及数学推导图像描述,布拉德福相关论文分布曲线,A应用地球物理学B润滑学,论文累积数,logn,A,B,150
11、0,1200,900,600,300,20 40 60 80 100,2022/12/15,第五章 布拉德福定律,20,两种表示法是等价的吗?,比较:假设一定时间内(通常为一年)共有N种期刊刊载了某学科的论文(简称为“相关论文”)K篇,将这N种期刊按照所载“相关论文”的数量降序排列,然后,将该序列划分为三个区,使得每个区所包含的”相关论文“的数量相等(即“K/3篇”),则:区域法:各区的期刊数量满足等比关系; n1:n2:n3=1:a:a2 (a1)图像法:前面各区的期刊累积数量满足等比关系。 :=1:b:b2 (b1),其中, =n1; =n1+n2; =n1+n2+n3,结论:“区域表示法
12、”和“图像表示法”之间,存在着无法统一的矛盾。,2022/12/15,第五章 布拉德福定律,21,两种表示法哪个更准确?,“区域派”F.F.Leimkuhler、 W.Goffman、“图像派”B.C. Brookes、M.G.Kendall、,2022/12/15,第五章 布拉德福定律,22,文献为什么“离散”?,科学统一性原则:每一个科学学科都或多或少,或远或近地与其他任何一个学科相关联。因此,属于某学科的文献,不仅仅会出现在这个学科的专业期刊上,而且也时时可能出现在其他学科的期刊上。,文献为什么“集中”?,成功产生成功的原则(the success-breeds-success prin
13、ciple):一种期刊的文献量越大、质量越高的期刊,作者就越愿意将自己的文章刊登在这些期刊上,形成了一种“堆加效应” 。,“文献分布的集中与离散规律”,第三节 布拉德福定律的修正和发展,一、维克利推论 英国文献学者维克利(B.C.Vickery)对布拉德福定律研究的两项重要突破:推论1. 严格讲,布拉德福曲线的“PB”段并非一直线。 推论2. 三个区域的划分并非是唯一的,区域数量可扩展。,二、布鲁克斯公式及其参数分析(一)布鲁克斯公式 1968年和1969年,英国著名文献学家布鲁克斯(B.C.Brookes)分别在文献工作(Journal of Documentation)和自然(Nature
14、)上公开发表文章(Bradfords law and bibliography of science, Nature, 1969(224):953-956),先后针对布拉德福文献分散曲线给出了相对应的数学模型,对布氏图形法的发展做出了突出的贡献。,1968年布鲁克斯提出的公式中,只对布拉德福曲线采用唯一的数学模型进行表示,即: R(n)=klnn,1969年,布鲁克斯提出采用“分段”的方法,对布氏曲线采用不同的数学模型进行描述的设想,并建立了相应的数学模型,即: R(n)=n (1nc) R(n)=kln(n/s) (cnN),A应用地球物理学B润滑学,论文累积量R(n),lnn,A,B,15
15、00,1200,900,600,300,20 40 60 80 100,R(n)=n (1nc),R(n)=kln(n/s) (cnN),s,布鲁克斯的数学公式,ant (1nc)R(n)= Klg(n/s) (cnN)R(n)-对应Nde 相关论文的累计数n为期刊等级排列的序号a为第一级期刊中相关论文量R(1)C-核心区的期刊种数,即由曲线过度到直线交点对象的n值N为期刊排列的期刊总数t为参数,与核心区的期刊数量相关,大小等于曲线的曲率K为系数,等于分散曲线中直线部分的斜率S为参数,等于图象直线部分向横坐标延伸并与其相交点的n值,(二)Brookes公式的几何性质1. 对 R(n)=klnn
16、 模型的分析(1968)对于模型R(n)=klnn 设 lnn=x 则 R(n)=kx当 x=0 R(n)=0 即 lnn=x=0 此时,n=1 即: R(1)=0结论错误:在按论文数量等级降序排列组织数据中,等级序号为 1 的期刊发表的相关主题论文数量为零!这个结果与数据分布实际是不相符合的。,布拉德福数据,2. 对 R(n)=kln(n/s) 模型的分析(1969)对于模型R(n)=kln(n/s) 设 lnn=x 则 R(n)=klnn-klns=kx-klns当 x=0 即 lnn=x=0 此时,n=1 R(1)=-klns式中,k0,s0 当s1,R(1)0显然, R(1)0 和R(
17、1)=0 的结果与数据分布实际是不相符合的,因此必须对布氏曲线采用不同的数学模型分段描述。,(三)Brookes公式的参数分析1. 可以证明:在 N 足够大时, kN N期刊总量,即在等级降序排列中最末一级期刊的等级序号。,将 kN 代入模型:R(n)=kln(n/s) (cnN)中,则可得到以下重要结果:,布拉德福数据,1 158 1164 1 159 1165168 1 325 1331 R(N-1) 1 326 1332 R(N),2. 参数 s 的意义布氏分散曲线中“直线”部分的反向延长线在横轴上的交点为 lns。可通过作图获得。布鲁克斯认为,s 值的大小可用于衡量被调查文献所属学科(
18、专业)的范围。一般情况下,s 值的大小随专业范围的扩大而相应增大。不同学科,其 s 值亦不同。 s学科范围,在R(n)=Kln(n/s)中,令R(n)=0 则 lnn=lns (在横轴上的交点),lns,R(1)=,学科范围和相应的 s 值,3. 参数 的几何意义对于曲线部分即,曲线部分交于纵轴的焦点为 为等级序号为1的论文数量R(1)的值。,lns,R(1)=,三 布拉德福定律的解释,(一)、布拉德福定律的形成机理学科因素学科的分化、交叉与渗透相同主题论文在不同学科期刊中的分布。社会因素老子/马太效应(Matthews Effect)成功产生成功,累积优势分布。最省力法则(Principle
19、 of Least Effort)核心信息源的自我选择,文献的堆积效应。,格鲁斯指出“布拉德福曲线在进入直线部分后,并非无休止地直伸下去,后来总要弯曲下垂,因而使得布拉德福定律的图形变为明显的三个部分:上升的曲线部分,直线部分和弯曲的下垂部分。,Groos droop,(二)、布拉德福定律的适用条件学科(专业或主题)的范围应该界定清楚。对所研究学科文献的时间期限的选择应该恰当。即“载文量”的确定和计算应取一定时期该学科文献载文总量的均值(一般以“年”为单位),而非每种期刊的平均载文量。对所研究的期刊论文的统计应该尽量充分。可以采用具有权威性,且覆盖面相对较广的二次文献做为数据的来源。,第四节
20、布拉德福定律的应用,一、布拉德福定律在文献收藏和管理中的应用1. 核心期刊的确定 思考:以上按期刊载文数量的绝对值来组织数据,将位于 C 以前的期刊均视为核心期刊,而其后的期刊不论其实际质量如何均被排斥在核心期刊之外,这样是否合理?,结论:,核心区的大小可以根据需要划定。核心区应遵循包含较少数量的期刊、对应较大评价量的原则。当需要较完整收藏和较高文献保障率的时候,可以选择较大的评价量(如80%),当需要少量最精粹的出版物的时候,可选择较少的评价量(如30%)。,2. 优化期刊采购方案,f=50%、70%、 90%s=3, N=600$30/刊/年所需经费?,3. 考察专著的分布,确定核心出版社
21、,2,16,核心出版社,二、布拉德福定律在情报检索中的应用计算拟检索的某学科或专业论文及其相应期刊的数量 根据检索要求,估算被检期刊的最小数量 检出效率的计算 参数值 s 与论文检出效率(a2)的关系 期刊检出效率(a1)与论文检出效率(a2)之间的关系,1.计算拟检索的某学科或专业论文及其相应期刊的数量,获取原始数据等级降序组织数据图形分布观察选取“直线”上两点联立方程求解(s、N),R(n1),R(n2),2.根据检索要求,估算被检期刊的最小数量,令 f 为论文的检出要求(检出率),则,例:如果 f=50%,N=320,s=2,根据上式计算得知,被检期刊数量至少应达到25种才能满足50%的
22、论文覆盖率(查全率)。,3.期刊检出效率(a1 )和论文检出效率(a2)的计算,期刊检出率(a1)论文检出率(a2),4.参数值s与论文检出效率(a2)的关系,由 a2= f(s) 求导即随着参数s 值,论文检出效率a2 。,5.期刊检出效率(a1)与论文检出效率(a2)之间的关系,将期刊检出效率公式 a1=n/N 代入论文检出效率公式,可推导: 此时,若已知要求检索论文的检出效率(a2 ),以及期刊的平均载文量(),利用上式很容易计算出能够满足论文检出效率的期刊检出效率(a1 )的值。,三、在其他领域中的应用核心资源分布的多学科研究,核心资源分布的社会学理论老子学说(Laozis theor
23、y)马太效应(Matthew effect)卢梭定律(Rousseans law),本书是1755年卢梭应法国科学院的征文而写的论文,文中提出了私有制的出现是人类不平等的起源这一光辉思想。恩格斯对此书评价很高,认为它是十八世纪中辩证法的杰作。,三、在其他领域中的应用核心资源分布的多学科研究,核心资源分布的经济学理论帕雷托法则与二八律(Paretos Law & 80/20 rule)洛伦茨曲线与基尼系数(Lorenz curve & Gini coefficient)赫佛因德指数(Herfindahl index),帕雷托法则与二八律(Paretos Law & 80/20 rule),这个法
24、则最初是意大利经济学家维弗雷多帕雷托在1906年对意大利20%的人口拥有80%的财产的观察而得出的,后来管理学思想家约瑟夫朱兰和其他人把它概括为帕雷托法则(尽管该法则应该称为朱兰猜想)。帕雷托法则,又称为帕雷托猜想,也称为80/20法则,即:在众多现象中,80%的结果取决于20%的原因。,帕雷托法则与二八律(Paretos Law & 80/20 rule),更奇怪的是:若我们在这掌握了80%财富的20%去作统计,便会发现当中大约45%的人口(20% 20%)竟然掌握了社会差不多65%(80% 80%)的财富。这一猜想说明绝大部分的产量或结果取决于一小部分的投入和劳动。在商业活动中,80%的销
25、量来自与20%的客户。这种猜想能够帮助管理者制定商业决策,很大程度上是正确的,尽管此猜想需要进一步的证实。,洛伦茨曲线与基尼系数(Lorenz curve & Gini coefficient),洛伦茨曲线:用来显示收人或财富不平等的程度的几何图形。基尼系数(Gini coefficient)是根据洛伦茨曲线提出的判断分配平等程度的指标。,赫佛因德指数(Herfindahl index),赫佛因德指数(HI) 最初由A赫希曼提出,1950年由哥伦比亚大学的赫佛因德在他的博士论文钢铁业的集中中进一步阐述。由于它兼有绝对集中和相对集中度指标的优点,同时能避免两者缺点的特点,因而日益被人们所重视。用于衡量市场结构分布的量度指标。数值越低,集中度越低;数值越高,集中度越高。,2022/12/15,第五章 布拉德福定律,59,本章重点,布拉德福定律的文字描述布鲁克斯公式及个参数含义布拉德福定律的理论基础布拉德福定律的主要应用领域局限性分析,