[互联网]信息计量分析技术与方法.ppt

上传人:sccc 文档编号:4602440 上传时间:2023-04-30 格式:PPT 页数:97 大小:3.57MB
返回 下载 相关 举报
[互联网]信息计量分析技术与方法.ppt_第1页
第1页 / 共97页
[互联网]信息计量分析技术与方法.ppt_第2页
第2页 / 共97页
[互联网]信息计量分析技术与方法.ppt_第3页
第3页 / 共97页
[互联网]信息计量分析技术与方法.ppt_第4页
第4页 / 共97页
[互联网]信息计量分析技术与方法.ppt_第5页
第5页 / 共97页
点击查看更多>>
资源描述

《[互联网]信息计量分析技术与方法.ppt》由会员分享,可在线阅读,更多相关《[互联网]信息计量分析技术与方法.ppt(97页珍藏版)》请在三一办公上搜索。

1、化柏林010-中国科学技术信息研究所,信息计量分析技术与方法,化柏林,1/60,信息计量分析技术与方法,1,2,3,信息计量分析与情报,计量分析流程与技术,计量分析类论文撰写,4,计量分析软件与系统,快速增长的背后?,千人计划等政策措施,计划的千人从何而来?,网络搜索与计量分析,化柏林,问:情报究竟为何物?答:情况之报告,情报:情况之报告,化柏林,有哪些情况?如何获取这些情况:Input如何分析这些情况:Process如何报送这些情况:Output,情报:情况之报告,化柏林,从空间上讲分为本方情况和他方情况:对于国家情报机构:就对应着国内情况与国外情况;对于省级情报机构:还有本省与他省的区分对

2、于企业情报机构:还有竞争对手的情况,情况之报告:空间维度,化柏林,针对某一个决策者关注的决策问题,一、了解国内的发展现状及其存在的问题,二、对国外主要发达国家的相应政策、措施等进行调研(主要是资料的收集整理与综合分析),三、在比较国内外差距的基础上提出建议。,研究报告三段论,情况之报告:时间维度,从时间上讲分为过去的情况,现在的情况和未来的情况。历史研究,如研究对象的发展历程、经验教训等。现状研究,如研究对象的当前水平、最新动态、基本差距、基础数据等。未来研究,如研究对象的发展趋势、发展战略等。,化柏林,化柏林,获取与分析的方法,科学计量分析,科学计量试图通过定量方法寻找科学活动的内在规律和准

3、规律,并为更有效率地开展科研提供指导。计量分析一般选取过去一段时间(如十年、二十年、五十年)内某类信息(如期刊论文题录信息、学位论文题录信息、专利题录信息、著作题录信息、项目题录信息)进行统计分析,从而分析在过去的这段时间内某一科学活动的基本情况与规律。,化柏林,评价型计量分析,评价型计量分析以引文分析为典型,通过文献之间的引用关系对论文、作者、机构和期刊等进行评价,小规模分析是选取一种或几种期刊的某一段时间内的全部论文进行分析,中国科技信息研究所 化柏林,统计信息源,文献题录信息、专利信息、访问日志信息、调查问卷信息,大量的信息中存在哪些规律,如何看待与使用这些规律,是体现信息分析能力的标志

4、之一。如何针对成千上万条信息进行统计分析,迅速找出核心作者、主要机构、区域分布、最新热点、趋势变化等重要信息,并在一周内快速形成一份研究报告或学术论文,既是情况之报告的重要内容,也是科研选题的重要一环。,中国科技信息研究所 化柏林,化柏林,学科主题演化是指以词语为表征的学科主题在时间维度上的发展变化过程,与空间变化相比,学科主题的时间演化体现的是学科主题的新陈代谢过程,体现了某一学科的发展态势和未来走向,是研究学科发展规律的重要内容。,主题演化分析,化柏林,情报采集系统,不仅是竞争情报系统的一个重要组成部分,也是其他情报分析系统的一个重要组成部分。情报采集通过实时地自动运行,可以在运行时不断地

5、观察信息源的变化和更新,把新的或更新过的信息采集下来,并进行分类、标引等分析。,情报采集系统,中国科技信息研究所 化柏林,情报采集系统过程,采集过程,中国科技信息研究所 化柏林,情报采集系统范围,竞争对手网站,行业协会网站,政府机关网站,新闻媒体网站,中国科技信息研究所 化柏林,页面解析主要根据词表对网页信息进行过滤。过滤包括两个层面:粗浅过滤与精细过滤。粗浅过滤指过滤掉不相关网页,细过滤过滤掉网页中不相关内容,相当于段落级的信息抽取对采集的信息进行分类、标引与重组。不同类别的信息放在不同的表中,并以不同的目录呈现。,情报采集系统,中国科技信息研究所 化柏林,国内常见的软件有北京拓尔思(TRS

6、)公司的雷达软件北京万方数据公司的iRMS等。,情报采集系统,化柏林,话题识别与跟踪(Topic Detection and Tracking)主要是通过对新闻报道中的一个事件或一系列事件采用多个侧面的分析与观察来定位出具有同一全局事件话题的多个新闻报道所包含的主要信息。,话题识别与跟踪,化柏林,话题识别与跟踪包括热点问题发现与话题跟踪两个方面。前者强调话题的新颖性与被关注度,后者强调事件的发展变化、结果以及社会影响。新颖性包括新词的检测,新的术语等方面进行确定,被关注度包括点击、评论、转载等指标进行测度。话题识别与跟踪的高级阶段还可以对话题进行情感计算、褒贬计算。,话题识别与跟踪,化柏林,科

7、技热点监测是以科技信息、数据分析为基础,以数据挖掘(Data Mining)、信息抽取(Information Extraction)、知识发现(Knowledge Discovery)、数据可视化技术(Data Visualization)等信息科学前沿技术为手段,综合集成各方面专家的战略性智力,对科学技术活动关注的重点进行动态监视、观测、检查、分析及评估的方法23。,科技热点监测,化柏林,通过分析研究热点的生命周期模型(如Gompertz曲线、Logistic曲线等)来预测某一主题的发展趋势,通过时间序列分析、趋势外推法、系统动力学、复合随机过程理论等理论或方法对事物未来发展的轨迹进行描绘

8、。通过引用Backcasting等方法可以对未来的场景进行预测。,发展趋势分析,化柏林,技术预测研究领域最主要的代表是乔治亚理工学院的Alan Porter带领的技术政策与评估中心所做的工作。该组织在20世纪90年代初就联合其他公词、组织开发技术机会分析(TOA)软件,采用文本挖掘方法,对大型科技文献数据库的主题词进行时间序列分析、聚类分析等各种自动分析,以发现科研的热点领域和前沿领域,监测科技活动、预测技术发展、评估新兴技术所蕴含的机会。,发展趋势分析,化柏林,如果仅利用词频分析、共词分析很难预测出尚未出现的研究,因此需要更复杂的逻辑分析,需要句子的推理,需要对学科全文献集合的综合分析。这就

9、要求从更大的文献集合角度出发,对所有的文献按照对学科领域的贡献或主题功能进行分类,从中发现整个学科或研究领域中哪些方面的研究尚未出现或未得到重视,从而探测出未知的研究方向,从而预测新的研究热点。,技术预测预见,化柏林,空白点分析法就是一种新的尝试,对未来预期实现的创新成果轮廓的一种揭示,它能引导人们如何思索未知事物。探索人员与研发人员从知识库中调出已知的有关知识容量,与锁定目标所需的知识容量进行对比,就会发现具有探索或研发性质的内容或特定参数,这些内容与参数就是空白点。,技术预测预见,化柏林,都涉及到词频统计都需要计量分析技术,以上系统的共性,化柏林,37/60,信息计量分析与情报,信息计量分

10、析与情报,2,1,3,计量分析流程与技术,计量分析类论文撰写,4,计量分析系统,美国THOMSON REUTERS的web of science万方数据的科技创新辅助决策支持系统STADS中国知网(清华同方)的中国学术期刊评价统计分析平台,化柏林,web of science,化柏林,数据:SCI、ISTP等文献信息网址:http:/检索-分析检索结果-分析,共词分析,化柏林,化柏林,共词分析,化柏林,Scopus,中国科技信息研究所 化柏林,提供商:Elsevier网址:http:/,中国学术期刊评价统计分析平台,化柏林,提供商:清华同方网址:http:/,化柏林,科技创新辅助决策支持系统S

11、TADS,化柏林,提供商:万方数据网址:http:/,共词分析,化柏林,播放功能演示,上述软件系统优点,化柏林,数据量大,产品成熟,分析系统,使用方便,快速有效,上述软件系统缺点,化柏林,数据封闭,过程隐藏,结果固定,使用付费,参考文献管理软件,化柏林,BiblioscapeEndNoteRefVizQuoSaNoteExpress,专利分析软件,化柏林,Thomson Data Analyzer(TDA)是美国Thomson公司开发的专利分析工具,是Derwent Analytics的第二代产品。通过该软件可以对专利数据进行深度挖掘并展开可视化分析。TDA具有自动化程度高、界面友好、直观的特

12、点,提供一种轻松的方法从Derwent世界专利索引和专利引文数据库中的原始数据中挖掘出有用信息,为洞察技术发展趋势、掌握竞争对手的专利发展情况、找出多产的专利发明人及其供职的公司、发现行业近年新出现的技术、确定研究战略和发展方向等方面提供有价值的依据。,专利分析软件,化柏林,Aureka数据范围:美国专利、欧洲专利、日本专利等;系统功能:根据词频绘制技术地图(例如地形图)根据引用关系绘制引文树图报告生成工具,专利分析软件,化柏林,大为PatentEX专利信息创新平台 专利战略分析软件。exCITEr 1.24 试用版 美国专利分析软件,可绘制专利引用关系图,可以系统分析一个专利的前后相关引用专

13、利的情况。注册费99美元。PatentLab-II 1.45f 免费的专利分析软件,主要针对美国专利进行分析,给出二维、三维的直观分析图表。BizInt Smart Charts for Patents 3.3.17 Demo 专利分析工具,通过分析STN,Questel*Orbit,Dialog,MicroPatent or Delphion 等商业专利数据库,生成专利分析报告。可免费试用一段时间。价格2500美元 PatTools 1.6 专利综合工具 IPscore 2.11 专利知识产权价值评估软件,专利分析软件,化柏林,信息可视化软件,化柏林,Pajek是一个特别为处理大数据集而设计

14、的网络分析和可视化程序。Pajek可以同时处理多个网络,也可以处理二模网络和时间事件网络(时间事件网络包括了某一网络随时间的流逝而发生的网络的发展或进化)。Pajek提供了纵向网络分析的工具。如果要对网络演化进行统计分析,需要使用StOCNET软件的SIENA模块。Pajek提供了多种数据输入方式,例如,可以从网络文件(扩展名NET)中引入ASCII格式的网络数据。Ucinet是目前最流行的社会网分析软件,Ucinet网络分析集成软件,其中包括一维与二维数据分析的NetDraw,还有正在发展应用的三维展示分析软件Mage等,同时集成了Pajek用于大型网络分析的Free应用软件程序,信息可视化

15、系统,中国科技信息研究所 化柏林,CiteSpace制造者:chaomei chen(陈超美)网址:http:/cluster.cis.drexel.edu/cchen/citespace/,化柏林,信息计量分析与情报,信息计量分析与情报,3,1,2,计量分析流程与技术,计量分析类论文撰写,4,计量分析软件与系统,计量分析流程,化柏林,数据预处理过程,化柏林,数据预处理的过程,通过转换把它变成二维表格的形式;滤掉通知类非正式文献;根据标记符拆分作者、关键词、分类号等字段;析取多项目字段,从机构字段中提取作者单位、城市名、邮编等,从期刊字段中析取期刊名、年、卷期号、起止页码等信息。,化柏林,格式

16、转换,化柏林,二维表格行为记录列为字段,网页数据详细记录单列存储,行列转换,数据清洗:过滤与筛选,化柏林,数据的过滤与筛选,第一种情况是过滤掉重复记录;第二种情况是过滤掉通知类文献;第三种情况是过滤掉不符合检索条件的记录。,化柏林,数据拆分,化柏林,同质多值:如作者、机构、关键词、分类号异质多值:如机构信息、年卷期、页码等,数据拆分,化柏林,数据拆分,化柏林,包昌火;谢新洲;,包昌火,谢新洲,资源整合;数字图书馆;数字资源;网络爬虫,资源整合,数字图书馆,数字资源,网络爬虫,数据拆分,化柏林,武汉大学信息管理学院,武汉 430072,武汉大学信息管理学院,武汉,430072,统计分类:按对象,

17、化柏林,期刊论文,作者统计,机构统计,地区统计,期刊统计,主题统计,引文统计,基金统计,分类统计,统计分类:内容统计分析,化柏林,统计分类:按结果分,化柏林,科技热点监测,化柏林,热点监测服务,Google趋势http:/,化柏林,热点监测服务,化柏林,百度指数,化柏林,热点监测服务,化柏林,用绝对量统计的问题,化柏林,前沿热点监测的几种方法,化柏林,基础词频,前沿热点,年度增长量,年度增长率,相对增长率,增长高峰期,低变高监测,化柏林,信息计量分析与情报,信息计量分析与情报,4,1,2,计量分析类论文撰写,计量分析流程与技术,3,计量分析软件与系统,思维方式的差异,计量分析与热点监测,中国科

18、技信息研究所 化柏林,检索条件:TI=论文 and(TI=计量分析 or TI=统计)检索结果:2272条,关于竞争情报的计量分析类论文,中国科技信息研究所 化柏林,关于竞争情报的计量分析类论文,中国科技信息研究所 化柏林,计量分析应用研究,化柏林,计量论文,分析评价型,预测分析型,指标验证型,情况报告型,对比分析型,资源获取型,分析评价型计量分析,评价型计量分析以引文分析为典型,通过文献之间的引用关系对论文、作者、机构和期刊等进行评价,小规模分析是选取一种或几种期刊的某一段时间内的全部论文进行分析。,化柏林,分析评价型计量分析,化柏林,预测分析型论文,预测型计量分析基于某种经验或历史数据,运

19、用特定的方法或模型对某件事物的发展趋势与前景进行预测.,化柏林,预测分析型论文,化柏林,资源获取型论文,通过计量分析获取某些数据或某类数据,化柏林,资源获取型论文,化柏林,指标验证型论文,提出指标或体系,运用数据进行验证.,化柏林,指标验证型论文,提出指标或体系,运用数据进行验证.,化柏林,对比分析型,以国家之间的对比分析为主.,化柏林,对比分析型,以国家之间的对比分析为主.,化柏林,情况报告型论文,情况报告以主题计量为主,选取某一时间段期刊论文进行关键词统计分析、高产作者、高产机构、区域分布、国内外对比分析等,如对知识管理、网络信息计量学等的统计分析,主题计量分析突出使用关键词或主题词,主要

20、运用简单统计和关联统计技术,目前此类文章占计量分析文章的主流。这样的分析数据量大都在几百篇到几千篇,数据量较小,统计计算较容易,计算时可以有适当的人工干预,化柏林,主题型计量类论文结构,化柏林,年代统计,作者统计分析,期刊统计分析,作者机构,地区分布,分类号统计,基金统计,引文统计,概念解析,数据来源,研究方法,概念解析,化柏林,数据来源,化柏林,数据来源,检索方式,检索结果,数据清洗,年代统计,化柏林,作者统计分析,化柏林,期刊统计,化柏林,核心期刊,学科分布,期刊数量,机构统计,化柏林,重要机构,机构类型,机构合作,计量分析论文的创新,数据来源,异源数据:万方与同方的集成SCI与EI数据的集成PubMed与MedLine的集成异构数据期刊论文、学位论文、会议论文、专利、图书、项目信息、会议信息多语数据中文、英文、日文、法文、德文、俄文、阿拉伯文等多语数据,研究方法,提出新指标使用多重指标体系对指标进行加权,结果解析,规律的总结验证先前的错误并进行修正异常点发现新关系的发现,中国科技信息研究所 化柏林,谢谢大家!,肯请宝贵意见,欢迎踊跃探讨!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 教育教学 > 成人教育


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号