事实和数值型数据库.ppt

上传人:牧羊曲112 文档编号:5684169 上传时间:2023-08-09 格式:PPT 页数:48 大小:568KB
返回 下载 相关 举报
事实和数值型数据库.ppt_第1页
第1页 / 共48页
事实和数值型数据库.ppt_第2页
第2页 / 共48页
事实和数值型数据库.ppt_第3页
第3页 / 共48页
事实和数值型数据库.ppt_第4页
第4页 / 共48页
事实和数值型数据库.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《事实和数值型数据库.ppt》由会员分享,可在线阅读,更多相关《事实和数值型数据库.ppt(48页珍藏版)》请在三一办公上搜索。

1、国内外常用信息检索工具与检索服务系统介绍,赵玉冬信息咨询部,国内外常用信息检索工具与检索服务系统介绍,机读数据库检索服务系统 1.书目数据库检索系统 2.全文数据库检索系统 3.数值数据库检索系统 4.图象数据库检索系统联机检索服务系统 1.综合性联机检索服务系统 2.专业性联机检索服务系统网络搜索引擎服务系统 1.独立搜索引擎 2.元搜索引擎,一、机读数据库检索服务系统 1.书目数据库检索系统,书目数据库检索系统概念:指存储某些或某一个领域的二次文献(如文摘、题录等)书目数据的一类数据库,属于参考数据库的一种。特点:历史悠久,20世纪60年代末开始发展,是机读数据库先驱。数据量大,连续性与累

2、计性强。使用上无限制,开放性比较好。记录结构简单固定,标准化程度高。,机读数据库检索服务系统 1.书目数据库检索系统,美国工程索引数据库(Engineering Index,简称EI)创刊于1884年,历史悠久,是工程领域现有盛誉的一部综合性检索工具。由位于美国新泽西的“工程信息公司”(Engineering Information,Inc.)出版。自20世纪60年代末以来,在其手工检索工具书的基础上,陆续增加了Ei的磁带版、光盘版和网络版(Ei Compendex Web)。1998年,美国工程信息公司在清华大学图书馆建立了Ei中国镜像服务站,2002年底又开通了Ei China网站。,机读

3、数据库检索服务系统 1.书目数据库检索系统,EI数据库治疗囊括了世界范围内工程领域的众多分支学科,如:土木工程、能源、环境、地理和生物工程,电气、电子和控制工程、机械、自动化、核能和航空工程,计算机、人工智能和工业机器人,化学,矿业、金属和燃料工程等。数据来源主要是2600种期刊,、技术报告、会议论文和会议录,22为会议文献。该数据库对检索全世界范围内工程与技术文献、跟踪与评价技术新成果非常有用。系统提供的检索方式有多种,相应的检索功能也非常完备。,机读数据库检索服务系统 1.书目数据库检索系统,美国科学信息服务社的英文索引系列 数据库(SCI/SSCI/A&HCI)科学引文索引(SCI)由美

4、国ISI(Institute of Scientific Information)公司出版和提供服务,目前所收录数据的最早回溯年为1945年。SCI是科学技术领域的综合性检索工具,是了解全世界科技期刊出版信息的最重要的检索工具。选材来源于世界上40多个国家和地区的3000多种期刊、l800余种会议录和专题文集,以及大量的专利文献和丛书、图书等。SCI所涵盖学科超过100个,所收资料每年以60万条新记录及900万条以上引文记录的速度增长。,机读数据库检索服务系统 1.书目数据库检索系统,社会科学引文索引(SSCI),SocialScience Citation Index由美国ISI(Insti

5、tute of Scientific Information)公司出版和提供服务,目前所收录数据的最早回溯年为1956年。SSCI收录全球1800多种主要的社会科学期刊论文,同时也收录Science Citation Index Expanded所收录的期刊当中涉及社会科学研究的论文有些论文同时被SCI和SSCI收录(如心理学,环境等),涉及50多个领域。,机读数据库检索服务系统 1.书目数据库检索系统,艺术与人文科学引文索引(A&HCI),Arts&Humanities Citation Index由美国ISI(Institute of Scientific Information)公司出版

6、和提供服务,目前所收录数据的最早回溯年为1975年A&HCI完整地收录了25个学科的1136种期刊,还包括ISI各个数据库中有关艺术与人文科学方面的的内容。该数据库每年增加10万条新记录。,机读数据库检索服务系统 1.书目数据库检索系统,英国科学文摘数据库(INSPEC)美国政府报告数据库(NTIS)美国生物学文摘数据库(BIOSIS Previews)美国化学文摘数据库(Chemical Abstracts,简称CA)英国德温特专利数据库(DI),机读数据库检索服务系统 2.全文数据库检索系统,全文数据库检索系统概念:指存储文献全文或其中主要部分的一种数据库。,机读数据库检索服务系统 2.全

7、文数据库检索系统,特点:自足性、直接性,可以直接检索出原始文献并获取全文信息。详尽性,理论上可以查到原文任何信息。收录求“全”,过“杂”,降低了数据库的学术水平。资源消耗性,需要占用大量存储空间,一年增加数据量几百个G.检索方法:除一般检索方法之外,增加全文检索和引文检索。检索语言以自然语言应用较多。标引:全文自动抽词标引,后处理能力强。文件格式:多采用PDF文件和文本文件两种格式。,机读数据库检索服务系统 2.全文数据库检索系统,IEEE/IEE Electronic Library(IEL)数据库提供1988年以来美国电气电子工程师学会和英国电气工程师学会出版的12,000多种IEEE 和

8、 IEE 的出版物包括期刊、会议录和标准的全文信息。,机读数据库检索服务系统 2.全文数据库检索系统,荷兰Elsevier Science公司德期刊全文数据库清华同方公司的全文数据库 万方数据公司的全文数据库产品(数字化期刊群)UMI公司的ARL(Academic Research Library),荷兰Kluwer公司的Kluwer Online等。,机读数据库检索服务系统 3.数值数据库检索系统,数值数据库检索系统概念:专门提供以数值方式表示的数据(或包括其统计处理表示法)的一类数据库。存储各类数值,如科学技术数据、社会资源数据、商业经济、地理环境数据 等。存储运算公式、图谱、表格 等。,

9、机读数据库检索服务系统 3.数值数据库检索系统,特点:高度专门化,具有明确学科特性。一般不对外公开,使用范围受限制。在使用方法和检索方式上彼此不兼容通常还兼备数据运算、数据分析、图形处理、报表生成等特殊功能。,机读数据库检索服务系统 3.数值数据库检索系统,英文文科事实型数据库Gale 集团是全球最大、最权威的参考文献出版商之一。Gale集团以其精确、权威的参考信息(reference)及全文期刊、报纸的智能集成闻名全球;Gale集团创建及维护了600余个在线、纸本及缩微大型数据库。Gale以人文社会学科参考文献见长。,机读数据库检索服务系统 3.数值数据库检索系统,英文理科事实型数据库 IS

10、I Chemistry是美国科技信息所(ISI)推出的一个事实型的化学数据库 包括Current Chemical Reactions(CCR)和Index Chemicus(IC)收录世界领先期刊和国际专利中的化学数据、化学反应和化合物信息。,机读数据库检索服务系统 3.数值数据库检索系统,中文事实型数据库中国资讯行是香港专门收集、处理及传播中国商业信息的资讯企业,其数据库(中文)建于1995年。该数据库较为适合经济、工商管理、财经、金融、法律、政治等专业使用,尤其是其包含有各类报告、统计数据、法律法规、动态信息等内容,数据库内容包含了大量事实性数据、报告、政策法规,弥补了期刊和会议论文数据

11、库的不足。,机读数据库检索服务系统 3.数值数据库检索系统,万方数据库系统分为科技信息子系统、商务信息子系统和数字化期刊子系统三部分以理工类文献为特色;涵盖工程、信息科技、电脑、中医药和环境科学等40个与科学技术有关的范畴还提供很多实用生活方面的信息,如院校信息、医药信息、交通旅游信息、商品和通讯信息等,机读数据库检索服务系统 3.数值数据库检索系统,网上其它事实数据库搜索引擎http:/com/reference彼得森林指南http:/www.Chinese 4.图像数据库检索系统,目前属于信息检索的前沿领域,成熟而实用的图像检索服务系统目前还不多见。,机读数据库检索服务系统 4.图像数据库

12、检索系统,示范或试验系统:IBM公司的QBIC http:/哥伦比亚大学的Webseek http:/Virage公司的Virage http:/波士顿大学的Image Rover,二、联机检索服务系统,1.综合性联机检索系统DIALOG系统First Search系统2.专业性联机检索系统生物医学(Biomedical)科学技术(Sci-Tech)法律法规(Legal&Legislative)新闻与商业(News and Business),联机检索服务系统 1.综合性联机检索系统,DIALOG系统始建于1963-1964年间。是世界上规模最大的联机服务系统。目前拥有600多个联机数据库。数

13、据库种类齐全,包括书目、全文、数值、图像、事实等类型。内容涉及自然科学、工程技术、商业、经济、新闻、社会科学、人文科学等数十个学科领域。检索功能丰富多彩,除联机检索外,还有光盘检索、原文订购、电子邮件、通讯软件、商界链接、全文检索、多文档检索、电子商务解决方案、用户培训等形式。,联机检索服务系统 1.综合性联机检索系统,First Search系统联机计算机中心图书馆(OCLC)1990初创立世界上使用量最大的联机系统,世界范围内有OCLC近2万个成员图书馆使用。八十多个主题范围。信息量大、更新及时、费用低廉。检索结果包括文摘,馆藏地,可获取全文。,联机检索服务系统 2.专业性联机检索系统,生

14、物医学(Biomedical)MEDLARS系统:美国国家医学图书馆创建PaperChase系统、HealthGate系统科学技术(Sci-Tech)STN系统、CIS系统法律法规(Legal&Legislative)LEXIS系统:美国米德公司 WESTLAW系统:美国西方出版公司新闻与商业(News and Business)NEXIS系统:美国米德公司 DJNRS系统:道琼斯公司,三、网络搜索引擎服务系统,概念 搜索引擎:是指WWW环境中能够进行网络信息的搜集、组织、并能提供查询服务的一种信息服务系统。,网络搜索引擎服务系统,搜索引擎的原理 主要是通过网络搜索软件或多种人工方式将WWW站

15、点上大量网站的页面信息搜集、传输到本地,经过加工处理建成索引数据库或目录指南,从而能够对用户提出的各种查询请求做出响应,并提供用户所需要的信息,即:抓取网页建立索引数据库搜索排序。,网络搜索引擎服务系统,搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页,建立索引数据库。搜索引擎也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。,网络搜索引擎服务系统,分类(一)1.独立搜索引擎Google(http:/)Alta Vista(http:/)数字设备公司1995年建设NorthernLight(http:/www.NorthernL研究型搜索引擎)除包含网页,还包含2500万篇

16、文献。,网络搜索引擎服务系统,独立搜索引擎Yahoo!(目录浏览型)Excite(概念检索)新浪(关键词检索、分类检索)搜狐(分类查询)网易(关键词、分类目录)百度北大天网(中英文搜索引擎)悠游。,网络搜索引擎服务系统,2.元搜索引擎Metacrawler:美国Washington大学开发Dogpile:隶属于InfoSpace公司Profusion:美国Kansas大学开发SavvySearch、Ask Jeeves万纬搜索:上海万纬公司,第一个中文并行元搜索引擎。,网络搜索引擎服务系统,分类(二)关键词搜索引擎:著名搜索引擎Alta Vista最初即是关键词搜索引擎,国内的搜索引擎如百度、

17、天网,也属于此类。主题分类指南(directory search engine):Yahoo元搜索引擎(meta-search engine):基于搜索引擎的搜索引擎,著名的元搜索引擎如Metacrawler,网络搜索引擎服务系统 1.独立搜索引擎搜索引擎,独立搜索引擎特点:数据采集搜集WWW站点等资源,存入搜 索引擎临时数据库中。数据分析或标引对搜集到的网页进行分析,提取查有价值的检索或查询内容,对关键词进行权值计算。数据组织形成规范的索引数据库或便于浏览的层次型分类目录结构。数据检索帮助用户用一定的方式检索索引数据库或浏览目录结构,获取符合用户需要的WWW信息。信息挖掘提取用户相关信息,来

18、提高检索服务质量。,网络搜索引擎服务系统 1.独立搜索引擎搜索引Google,Google第二代搜索引擎最优秀的代表。于1998年创建。Stanford大学两位博士生。目前是世界上最大的综合型搜索引擎。搜索约30亿张网页,包括35个国家和地区的语言的资源。已占有全球搜索市场的80%。Google 在中国的搜索市场的市场份额也已突破30%,并且增长速度迅猛,在中文搜索市场有举足轻重的作用。,网络搜索引擎服务系统 1.独立搜索引擎搜索引Google,Scholar 学术搜索引擎Books 搜索图书News 搜索新闻Labs google新建、成熟的项目搜索,网络搜索引擎服务系统 1.独立搜索引擎搜

19、索引Google特色,Google特色支持布尔逻辑:+、-,OR;不支持通配符,如“*”、“?”如:“神州”和“神州”“飞船”高级搜索:site、link、intitle、allintitle、inurl、allinurl。如:查相关链接:Link www lib pku edu cn;限定标题:intitle 周迅 写真;其它查询:天气(或TQ)北京;股票(GP),邮编(YB),货币转换,数学公式转换,中英文翻译(FY),日历,图片,单词可以限定在“简体中文网页”里查询等。,网络搜索引擎服务系统 1.独立搜索引擎搜索引Google特色,查找文件格式 如:“英语四级”filetype:pdf;

20、“报表”filetype:doc or filetype:ppt智能化的“手气不错”功能,提供可能最符合要求的网站,直接转到所查内容的网站。如:限定网址,“英语试题”site“网页快照”功能,能从Google服务器里直接取出缓存的网页。对中文的支持比较好。,网络搜索引擎服务系统1.独立搜索引擎搜索引擎Alta Vista,网络搜索引擎服务系统1.独立搜索引擎搜索引擎Yahoo主页,网络搜索引擎服务系统1.独立搜索引擎搜索引擎Yahoo分类目录,网络搜索引擎服务系统1.独立搜索引擎搜索引擎Yahoo检索界面,网络搜索引擎服务系统 2.元搜索引擎搜索引擎,概念:是在独立搜索引擎的基础之上建立起来的

21、、再一个统一查询界面就可以同时或分时查询多个搜索引擎的WWW站点。是一类新型的网络信息查询系统。分类:并行元搜索引擎 串行元搜索引擎,网络搜索引擎服务系统 2.元搜索引擎搜索引擎,技术优势完全不需要考虑网页索引数据库的建立和维护,可集中精力与财力于查询请求的分发和查询结果的处理。有效屏蔽了各个成员引擎的接口、位置等细节,使用户避免了在多个搜索引擎之间的切换及查询请求的重复输入。同时链接多个独立搜索引擎,可方便检索多个索引数据库,提高检索效率。使检索工具具有一定的可扩展性,每个用户可以按照自己的习惯和需求定制具有个人风格的Web查询工具。,网络搜索引擎服务系统 2.元搜索引擎搜索引MetaCra

22、wler,网络搜索引擎服务系统 2.元搜索引擎搜索引MetaCrawler,网络搜索引擎服务系统 3.其它搜索引擎,其它搜索引擎Usenet Search Engine(新闻论坛搜索引擎)http:/YellowPage Search EngineWhitePage Search Engine 学术搜索引擎,网络搜索引擎服务系统总结,每种搜索引擎都有不同的特点,只有选择合适的搜索工具才能得到最佳的结果。任何一个搜索引擎的收录范围都非常有限,尽量选用多个不同的搜索引擎,扩大查询范围,提高查询率。搜索引擎一般采用自动搜索软件收集网络资源,无法对信息的质量和可靠性做出正确判断,需要用户进行选择、判断。随着Web查询技术的发展,新的搜索引擎必将不断涌现,已有搜索引擎的功能也会不断改善,在优胜劣汰中进步。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号