Five搜索引擎及国际联机检索.ppt

上传人:小飞机 文档编号:6505636 上传时间:2023-11-07 格式:PPT 页数:56 大小:516.50KB
返回 下载 相关 举报
Five搜索引擎及国际联机检索.ppt_第1页
第1页 / 共56页
Five搜索引擎及国际联机检索.ppt_第2页
第2页 / 共56页
Five搜索引擎及国际联机检索.ppt_第3页
第3页 / 共56页
Five搜索引擎及国际联机检索.ppt_第4页
第4页 / 共56页
Five搜索引擎及国际联机检索.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《Five搜索引擎及国际联机检索.ppt》由会员分享,可在线阅读,更多相关《Five搜索引擎及国际联机检索.ppt(56页珍藏版)》请在三一办公上搜索。

1、第五章 搜索引擎及国际联机检索,主要内容,5.1 搜索引擎5.2 国际联机检索,5.1 搜索引擎,1、网络信息资源检索概述2、基于搜素引擎的网络信息检索3、常用的搜索引擎介绍4、使用搜索引擎的相关问题及发展趋势,5.1 搜索引擎,1、网络信息资源检索概述(1)网络信息检索特点1)交互式作业方式2)用户透明3)信息检索空间的拓宽4)友好的用户界面操作方便,5.1 搜索引擎,1、网络信息资源检索概述(2)网络信息检索的进入方式从方法上来看,用户访问WWW系统,搜索和利用网络信息资源的方法有两种:1)已知URL地址的查找方法2)未知URL地址的查找方法,5.1 搜索引擎,1、网络信息资源检索概述(3

2、)网络信息检索工具的类型1)按检索机制划分分类目录检索工具搜索引擎型检索工具混合型检索工具,5.1 搜索引擎,1、网络信息资源检索概述(3)网络信息检索工具的类型2)按检索内容划分综合型检索工具专题型检索工具特殊型检索工具,5.1 搜索引擎,1、网络信息资源检索概述(3)网络信息检索工具的类型3)按包含检索工具数量划分单独型检索工具:拥有独立的网络资源采集标引机制和相应的数据库。多元型检索工具:是一种能够利用多个检索工具进行网络信息查询的检索工具,它通过一个统一用户界面帮助用户在多个检索工具中选择和利用合适的检索工具来实现检索操作。,5.1 搜索引擎,1、网络信息资源检索概述(3)网络信息检索

3、工具的类型4)按检索资源类型划分万维网检索工具:主要检索万维网站点上的资源。非万维网检索工具:主要检索特殊类型的信息资源,如:检索FTP文件的Archie、FileZ和T等。,5.1 搜索引擎,2、基于搜素引擎的网络信息检索(1)搜索引擎概述1)搜索引擎的基本类型按分类检索:Yahoo、Infoseek、Galaxy、GNN等。按检索词检索:Webcrawler、Lycos、Alta Vista、excite、Open-Text,5.1 搜索引擎,2、基于搜素引擎的网络信息检索(1)搜索引擎概述2)搜索引擎的工作原理搜索引擎一般主要由搜索软件、索引软件和检索软件三部分组成。信息的采集和存储信息

4、索引的建立检索界面的建立搜索结果的相关性处理,5.1 搜索引擎,2、基于搜素引擎的网络信息检索(2)搜索引擎的技术分析1)搜索引擎的Robot技术分析2)搜索引擎的索引技术分析3)搜索引擎的接口技术分析,5.1 搜索引擎,3、常用的搜索引擎介绍(1)常用的单个搜索引1)Alta vista-http:/Excite-http:/Lycos-http:/,5.1 搜索引擎,3、常用的搜索引擎介绍(1)常用的单个搜索引1)Alta vista-http:/Excite-http:/Lycos-http:/,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述 可以在不降低系统效率的前提下

5、,把多个 搜索引擎的检索结果综合起来,从中选取与用户查询相关度较大的,排除掉重复的和相关度较低的检索结果,并将检索结果以统一的界面呈现给用户。,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述1)基本体系结构(1)用户接口部分:指用户的浏览器和多元搜索引擎系统交互的界面,任务是接收用户的查询要求,生成适用于不同独立搜索引擎的特定请求。(2)查询代理部分:指多元搜索引擎和相应的单元搜索引擎的交互,以获得用户需要的查询结果。其中,包括查询、网页分析、汇总输出并调整。,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述2)工作原理 多元搜索引擎实际上是一种网络查询接口工具。

6、用户向多元搜索引擎发出检索请求,它将该请求整理为相应的检索指令发往多个单搜索引擎。给单搜索引擎执行检索指令后将检索结果传送给多元搜索引擎,经过整理后再传送给用户。,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述3)主要功能搜索引擎的选择功能较强的多元搜索引擎一般能采用并行和串行处理相结合的方式检索指令的转换检索结果的转换查询操作大多仅支持简单的布尔逻辑运算查询界面逐渐致力于满足用户进行查询操作的个人特制化要求。,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述4)多元搜索引擎的类型按照工作方式可以分为两大类:并行处理串行处理,5.1 搜索引擎,3、常用的搜索引擎介

7、绍(2)多元搜索引擎概述5)多元搜索引擎的优势由于没有网页索引数据库的建立和维护,多元搜索引擎可以集中更多的精力和财力完善检索要求的分发和检索结果的技术处理。同时链接多个独立的搜索引擎,并充分使用数据库,因而避免在多个系统之间的切换及重复输入查询要求,特别是一些采用并行处理方式的多元搜索引擎,查询的速度也会更快。使用多元搜索引擎可以省却各个独立搜索引擎在检索语法、指令差异,可由系统为用户统一处理检索的规则、语法和指令。多元搜索引擎可以很方便地配置客户端,用户可以按照自己的习惯配置成具有个人风格的WEB查询工具。,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述6)多元搜索引擎的评

8、价与选择是否允许用户浏览并选择要调用的独立搜索引擎。是否覆盖多种区资源类型,是否可提供主题范畴的目录服务。是否支持逻辑匹配检索、短语检索、自然语言检索等高级检索特性,是否能够实现检索请求的“本地化”转换。是否提供了足够多的检索选项和功能设置。是否提供多种检索结果输出格式,检索结果的信息描述是否全面等。,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述7)多元搜索引擎的局限性检索性能的局限性。调用搜索引擎的局限性。是否支持逻辑匹配检索、短语检索、自然语言检索等高级检索特性,是否能够实现检索请求的“本地化”转换。是否提供了足够多的检索选项和功能设置。是否提供多种检索结果输出格式,检索

9、结果的信息描述是否全面等。,5.1 搜索引擎,3、常用的搜索引擎介绍(3)常用多元搜索引擎介绍1)Mamma()1996年面世,自称为“搜索引擎之母”的并行元搜索引擎,可同时调用7个最常用的独立搜索引擎,并且可查询网上商店、新闻、股票指数、图像和声音文件等资源。其特点是检索界面友好,检索选项丰富,主要包括:可控制调用的独立搜索引擎、选择使用短语检索功能、设定检索时间、设定每页可显示记录数等。另外,Mamma支持常用检索语法在不同搜索引擎中的转换,还提供了专门检索页面文件标题的特殊检索服务,以及通过Email传输检索结果的特色功能。检索结果以相关性排序,内容包括网页名称、URL、文摘、源搜索引擎

10、,Mamma主页,5.1 搜索引擎,3、常用的搜索引擎介绍(3)常用多元搜索引擎介绍2)ASK Jeeves 3)Search,ASK主页,Search主页,5.1 搜索引擎,3、常用的搜索引擎介绍(3)常用多元搜索引擎介绍4)MetaCrawler 1995年由华盛顿大学推出,1997年被InfoSpace购买。支持调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服务。其检索特性非常丰富,包括常规检索、高级检索、定制检索、国家或地区的资源检索等检索服务模式。,MetaCrawler主页,5.1 搜索引擎,3、常用的搜索引擎介绍(3)常用多元搜索引擎介绍5)Profusion 6)Byt

11、eSearch,其他著名元搜索引擎,Ithaki(http:/)支持包括中文在内的14种语言检索Ixquick(http:/)可搜索网站、MP3、新闻、图象等多种网络资源InfoGrid(http:/)提供与主要搜索网站的直接连结和目录检索,具有强大的元搜索和新闻搜索功能 SavvySearch(http:/savvy.cs.colostate.edu:2000/)支持二十种语言(不包括中文),可调用全部或任意几个搜索引擎,可选择每个搜索引擎返回结果的数目,可进行目录检索,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势(1)使用搜索引擎的相关问题1)使用搜索引擎的主要要点2)使用搜索引

12、擎的主要事项3)搜索引擎的检索策略4)搜索引擎的检索技巧,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势(2)使用搜索引擎的发展趋势1)搜索引擎技术的最新研究在使用智能代理技术跟踪用户检索行为。采用人工智能技术,不断地分析用户的检索行为。采用集中式体系结构和分布式体系结构,以提高系统性能。使用交叉语言信息检索,让用户能在母语检索词的背景下,能检索到所有语言的检索结果。,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势(2)使用搜索引擎的发展趋势2)搜索引擎的最新技术发展内容提高了搜索引擎对用户检索提问的理解提高了对检索结果的处理能力,5.1 搜索引擎,4、使用搜索引擎的相关问题及

13、发展趋势(2)使用搜索引擎的发展趋势3)搜索引擎的研究发展方向智能化搜索个性化搜索结构化搜索垂直化专业领域搜索本土化的搜索,5.2 国际联机检索,1、联机检索系统2、国际联机检索:Dialog联机检索系统3、国际联机检索:OCLC的FirstSearch联机检索系统,5.2 国际联机检索,1)联机检索,就是人们将终端设备通过通信网络与计算机检索系统相联,采用人机对话方式,从主机中查找所需信息的过程.2)联机检索的主要步骤 与主机系统联机,并输入用户号和密码。使用选库指令进入数据库。输入检索式,开始进行检索。打印检索出来的记录内容。关机,结束检索。,5.2 国际联机检索,1、联机检索系统(1)联

14、机检索系统的结构包括检索终端、通信网络和联机检索中心三个部分。(2)国际联机系统国际联机检索中数据库系统在国外的,检索结果可提供国外文献信息。四大国际联机检索系统:DIALOG、ORBIT、ESA-IRS、DATA-STAR,5.2 国际联机检索,2、国际联机检索:Dialog联机检索系统 美国DIALOG是目前世界上最强大的国际联机检索系统,所拥有的近600个联机数据库都是质量很高、权威的数据库。DIALOG现有60亿页文字信息和300万个图像象文件共9万亿字节的文字信息量,是目前万维网上信息量的50倍。其内容涉及40多个语种和占世界发行总量的60%的6万多种期刊。DIALOG数据库信息量大

15、,检索方式灵活,适用于做比较全面的文献调研检索。如:科研课题开题立项时进行文献回溯检索、课题中期跟踪检索和课题结题时的查新检索等。,5.2 国际联机检索,2、国际联机检索:Dialog联机检索系统 DIALOG学科覆盖面广,几乎涉及全部学科范围,包括综合性科学、自然科学、应用科学和工艺学、社会科学和人文科学、时事报道和商业经济等。其数据来源于各种不同的图书、报纸、杂志期刊、技术报告、会议论文、专著、专利、标准、报表、目录、手册等上的信息。其数据形式包括:文献型文献的题录和文摘;数值型统计表、商业财政数据等;名录字典型手册、指南、名录等;全文型论文、报告、新闻报道的全文等。,5.2 国际联机检索

16、,2、国际联机检索:Dialog联机检索系统 DIALOG的近600个数据库中有许多极具代表性的和常用的数据库,著名的数据库如INSPEC、MEDLINE、MATHSCI、BA、NTIS等都加入到DIALOG系统中;还有著名的几大检索数据库,如SCI、EI、ISTP、SSCI、AHCI(艺术与人文科学引文索引)等也都可从DIALOG系统中检索;再有世界著名的DERWENT专利数据库以及美国专利、欧洲专利、日本专利等数据库也都可在DIALOG中查询。DIALOG更有一些全文数据库,如IAC的计算机全文库、纽约时报和华盛顿邮报等的全文库等。,5.2 国际联机检索,二DIALOG系统的Interne

17、t Web界面的检索方法1利用eb直接上网检索。其eb网址为http:/这种方式检索费用最低,仅在主要是运行和调用数据一刹那计算Internet费用,缺点是如果用户 需要将所有检索过程存盘,就要一屏一屏的存盘,否则随着检索指令的变化,一及时存盘,数据容易丢失。2.特别为专业人员推出的Web界面。其网址为http:/这是最新推出界面。速度快,检索过程每一屏幕均保留不丢失数据,便于存盘,界面是专 业人员熟悉的界面,能很快的从旧检索方式转入适应新的Web界面。,5.2 国际联机检索,3.非专业检索人员Web界面。其网址为http:/DialogSelect作为在Internet上的傻爪界面主要针对最

18、终用户,而非专业人员。对于初 学者、最终信息用户和不愿学习Dialog检索指令的人可使用其傻瓜界面。4.数据库兰页网址:http:/你可以按数据库名称、文档号、主题浏览兰页。数据库兰页提供有每一种数据库的收 录范 围,可供检索的字段、打印格式、记录样式及收费情况等。,5.2 国际联机检索,2、国际联机检索:Dialog联机检索系统使用说明1)检索方式DIALOG国际联机检索系统的使用方法不像面向最终用户的数据库那么简单,它具有一套完整而功能强大的指令系统以保障检索的快速性及检索结果的查全率和查准率。这些检索指令和检索技巧需经过培训才能掌握,加之DIALOG用户号在同一时间内只能提供给一个用户使

19、用,不能多用户共享,因此,读者使用DIALOG国际联机系统必须与图书馆联系,由用户将检索课题提交给图书馆的情报检索人员,并由专业人员来进行检索,否则会有耗时、耗费、甚至检索不到结果的可能。,5.2 国际联机检索,2、国际联机检索:Dialog联机检索系统2)收费方式本馆是DIALOG的授权用户。DIALOG系统的服务是收费服务,其费用主要包括:(1)每年的会费;(2)数据库的使用费(按时间)和记录的显示费(按数量)。不同的数据库有不同的收费标准。鉴于DIALOG系统的检索是按次收费,且费用较高,而且检索方式较为复杂,为使读者更充分地利用该项资源开展教学科研工作,但又不造成资源的浪费,现决定参考

20、兄弟院校的做法,在校内读者进行DIALOG检索时,按DIALOG系统实际发生的全部费用的30%收取“DIALOG数据库使用及检索服务费”,而校外读者则收取全部检索费用的100%。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统OCLC简介 OCLC全名为 Online Computer Library Center(联机计算机图书馆中心),是世界上最大的提供网络文献信息服务和研究的机构,它创建于1967年,总部在美国俄亥俄州都伯林。OCLC是一个面向图书馆、非盈利性质、成员关系的组织,以推动更多的人检索世界范围内的信息、实现资源共享并减少信息的费用为主要目

21、的。OCLC主要提供以计算机为基础的联合编目、参考咨询、资源共享和保存服务。据最新统计,使用OCLC产品和服务的用户已达86个国家和地区的45,000个图书馆和教育科研机构。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统FirstSearch系统简介 FirstSearch联机信息检索服务是OCLC从1992年开始推出的一个新产品,此后,发展迅速,深受欢迎。1999年8月,OCLC完成了新版的FirstSearch(当时,称为New FirstSearch)。新版 FirstSearch以Web为基础,采用了当前信息通讯领域的高新技术,提供给用户一个便捷

22、、友好、世界范围的参考资源。目前通过该系统可检索70多个数据库,其中有30多个库可检索到全文,总计包括11,600多种期刊的联机全文和4,500多种期刊的联机电子映象,达1000多万篇全文文章。这些数据库涉及广泛的主题范畴,覆盖了各个领域和学科。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统 新FirstSearch实现了和OCLC 的联机电子出版物数据库ECO的完全整合,增强了联合编目数据库WorldCat的馆藏信息,实现了各库间的联机全文共享。通过一个简单适用的界面,FirstSearch可完成:对OCLC ILL(馆际互借)的无缝访问;数千种印刷型

23、和电子期刊的全文文章的跨数据库的联机显示;帮助使用者选择合适的数据库;灵活的检索功能;在记录表中显示用户所在图书馆的馆藏标识等。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统 FirstSearch的主要特色(1)易于获取联机全文(与ECO整合;标识全文库;各库间全文共享;限制检索全文;用户馆文献标识;联机的馆际互借)。(2)强大的检索手段(选库;多种检索界面及检索式;检索限制;结果屏幕的标识;扩展、限制、主题词和作者的再检索等)。(3)灵活多样的检索索引(索引随数据库变化、数量多、形式多样)。(4)专门配置了Web界面的管理模块(管理帐号,进行系统和数

24、据库参数的设置)(5)包含馆藏信息,目前该系统共收集了8亿多个馆藏地点。(6)信息量大,更新快,覆盖了广泛的主题范畴。(7)面向最终用户。收费低,按检索次数或年订购收费,而不是按机时收费。(8)服务时间长。周一至周六,24小时服务。周日,服务20小时(北京时间下午37点维机)。(9)多语种界面,包括简体中文界面。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统FirstSearch应用环境 用一台安装有基于Web的浏览器(IE或Netscape均可),且以各种方式联入Internet或OCLC指定的其他远程通讯网的工作站或微机就可进行检索。地点不限。OCL

25、C建议的浏览器和软件:(1)4.0或以上版本的IE或Netscape 浏览器,且支持JavaScript语言。(2)浏览电子出版物时需安装:Adobe Acrobat Reader3.0或更高级软件(浏览 PDF格式的电子映象文章)。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统FirstSearch检索网址 帐号方式:http:/IP方式:http:/FSIP 注:由于OCLC已付费,CERNET用户可像检索国内网站一样,不必付通讯费。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统FirstSearch检索付费的

26、方式 用户可采用两种付费方式检索FirstSearch的数据库:(1)按检索的次数 使用此方式的用户需预先向OCLC购买包含一定次数的帐号,在检索时,每提交一个检索式,得到结果记录数多少不限,计为一次。随后,用户可浏览结果记录的简表,查看详细记录、文摘和馆藏,都算在这一次检索内。,OCLC规定,用户一次最少购买500次检索,价格如下:,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统 使用此方式的用户可检索约50个数据库,其中有30多个可检索到全文,但显示一篇全文计为5次检索。另有10多个数据库只能用以下的年订购方式检索。,5.2 国际联机检索,3、国际联机

27、检索:OCLC的FirstSearch联机检索系统(2)年订购方式 如用户对FirstSearch某个或一组数据库的应用量很多,可采用年订购方式。用此方式检索前,用户需付给OCLC一年的费用,就可在订购期内不计次数地检索所订购的数据库。每个数据库的价格不等,且随“并发用户数”的多少而变。以上无论采用那种方式,需预先与OCLC亚太部欧阳先生()联系,商定购买价格,索取订购单。订购单和订购费到OCLC后,即可获得帐号。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统为方便国内用户付费,可与清华OCLC服务中心联系(联系人:李旭,电话:01062782574,Email:),由清华图书馆垫付美元,用户按比率(仅包括汇率和手续费)付人民币给清华图书馆即可。使用OCLC的帐号检索时,可采用IP方式控制,也可使用帐号方式(每次登录需填写授权号和密码)。,FirstSearch数据库简介 当前利用FirstSearch可以检索到75个数据库(按次检索50个左右),这些数据库绝大多数由一些美国的国家机构、联合会、研究院、图书馆和大公司等单位提供。数据库的记录中有文献信息、馆藏信息、索引、名录、文摘和全文资料等内容。资料的类型包括书籍、连续出版物、报纸、杂志、胶片、计算机软件、音频资料、视频资料、乐谱等。数据库被分成15个主题范畴,它们是:,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号