第九章搜索引擎的使用1.ppt

上传人:sccc 文档编号:4968024 上传时间:2023-05-26 格式:PPT 页数:36 大小:824.54KB
返回 下载 相关 举报
第九章搜索引擎的使用1.ppt_第1页
第1页 / 共36页
第九章搜索引擎的使用1.ppt_第2页
第2页 / 共36页
第九章搜索引擎的使用1.ppt_第3页
第3页 / 共36页
第九章搜索引擎的使用1.ppt_第4页
第4页 / 共36页
第九章搜索引擎的使用1.ppt_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《第九章搜索引擎的使用1.ppt》由会员分享,可在线阅读,更多相关《第九章搜索引擎的使用1.ppt(36页珍藏版)》请在三一办公上搜索。

1、搜索引擎的使用,搜索引擎及其检索,一、搜索引擎的概念二、搜索引擎的构成及工作原理三、搜索引擎的功能四、搜索引擎的发展历史五、搜索引擎的分类六、搜索引擎的检索步骤,搜索引擎Search EngineInternet网络信息检索工具,一、搜索引擎的概念 Search Engine,搜索引擎是用来对网络信息资源管理和检索的一系列软件,是一种在Internet上查找信息的工具。,搜索引擎是一种用于帮助Internet用户查询信息的搜索工具,是Internet网络上的信息检索系统,它以一定的策略在Internet中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的

2、目的。,一、搜索引擎的概念 Search Engine,用户系统,用户接口,搜索器,索引器,检索器,WWW信息资源,FTP信息资源,Telent信息资源,Ghopher信息资源,WAIS信息资源,用户服务组信息资源,搜索引擎,网络,网络,二、搜索引擎的构成及工作原理,搜索引擎:搜索器、索引器、检索器、用户接口,二、搜索引擎的构成及工作原理,用户检索策略,搜索引擎用户接口,搜索引擎本地的摘要信息数据库,各万维网站点资源,访问,详细信息反馈,摘要信息反馈,各记录链接,信息资源搜集,三、搜索引擎的功能,搜索引擎有两个主要的功能:1、收集网络信息资源,对其进行 索引并建立数据库。2、提供网络的信息导航

3、与检索服 务(主要的功能)。,搜索引擎的基本检索功能,1、布尔逻辑检索 逻辑与(与、and、AND、)A and B AB 逻辑或(或、or、OR、|)A or B A;B;AB;逻辑非(非、not、NOT、!)A not B AAB,三、搜索引擎的功能,搜索引擎的基本检索功能,2、完全字符串检索 采用双引号“”代表字符串 精确查找“知识经济”知识经济,三、搜索引擎的功能,搜索引擎的基本检索功能,3、截词检索(*)前方一致检索 扩大检索范围 nutri*nutria+nutrient+nutrilitei+nutriment+nutrition,三、搜索引擎的功能,搜索引擎的基本检索功能,4、

4、括号的使用括号的作用和数字中的括号相似,可用来使括在其中的操作符先起作用。例如:(知识or信息)and经济,在实际查询时,真正的关键字是“知识经济”或“信息经济”。,三、搜索引擎的功能,搜索引擎的基本检索功能,5、位置检索 目前只有Alta Vista能提供 邻近位置运算near运算。,三、搜索引擎的功能,搜索引擎的基本检索功能,6、+、-检索+:放在检索词前,表示该检索词在检索结果中必须出现,且“+”号与关键字之间 不能有空格。-:放在检索词前,表示该检索词在检索结果中不能出现。几乎所有的搜索引擎都支持这种功能。例如:+网络,表示搜索出的文档一定出现“网络”这个关键字。,三、搜索引擎的功能,

5、搜索引擎的基本检索功能,7、逗号的使用逗号的作用类似于OR,也是寻找那些至少包含一个指定关键字的文档。与其不同的是,查询所得的文档中包含关键字越多,文档排列的位置越靠前。例如:查询关键字是数字,图书馆,网络,在查询时,同时包含这三个关键字的文档将出现在前面。,三、搜索引擎的功能,搜索引擎的基本检索功能,8、空格的使用空格的作用类似于AND,查找所得的文档中包含所有关键字。例如:查询计算机网络,可查出所有包含“计算机”和“网络”关键字的文档。,三、搜索引擎的功能,搜索引擎的高级检索功能,1、自然语言检索支持字、词、句子检索几乎所有的搜索引擎都支持该功能如:知识经济的支柱产业 How has WT

6、O developed?,三、搜索引擎的功能,搜索引擎的高级检索功能,2、模糊检索当输入一个检索词时,搜索引擎会把与该检索词相关的词一并反馈,列出供用户选择。相关性检索如:在雅虎中国查找“搜索引擎”一词时,模糊检索会把“搜索引擎”、“搜寻引擎”、“引擎”等相关的检索词一并列出。,三、搜索引擎的功能,搜索引擎的高级检索功能,3、概念检索 用某一检索词进行检索时,能同时对该词同样或类似概念的同义词和近义词进行检索,以达到扩大检索范围,提高查全率的目的。,三、搜索引擎的功能,搜索引擎的高级检索功能,4、区分大小写检索大多数搜索引擎在查询中要区分大小写小写匹配大小写字符大写只匹配大写字符,三、搜索引擎

7、的功能,搜索引擎的高级检索功能,5、管道(|)检索 用管道符(|)连接两个或者多个检索词,如 apple|disease,先对前一个检索词进行检索,再在其检索结果的基础上对后一个检索词进行检索,依次类推,以达到逐步缩小检索范围提高查准率的目的。,三、搜索引擎的功能,四、搜索引擎发展历史,自1994年搜索引擎问世以来,它的发展已经经历了三个时期.第一代搜索引擎出现于1994年,它在技术上基本沿用较为成熟的IR(information retrieval)、网络、数据库等技术.,大约在1996年出现了第二代搜索引擎系统,它大多采用分布式方案(多个微型计算机协同工作)来提高数据规模、响应速度和用户数

8、量。自1998年到现在,一般称这一时期的搜索引擎为第三代搜索引擎。第三代搜索引擎除继续增大索引数据库的规模,还加强了对检索结果相关度的评价.,五、搜索引擎的分类:,搜索引擎通常由信息收集和信息检索两部分组成。它可以根据 信息组织方式 语种 搜索范围 的不同,将搜索引擎分类。,按信息组织方式分类,搜索 引擎可分为 目录式(网站级)搜索引擎 全文(网页级)搜索引擎,分类目录型搜索引擎 它是基于人工建立的搜索索引,提供一种可供检索和查询的等级式主题目录。信息收集时,利用大量人力浏览INTERNET页面,以超文本链接方式将不同学科、专业、行业和区域的信息按照分类或主题的方式组织起来,形成分类目录式的树

9、状结构。这类引擎提供了一份由人工按类别编排的网站目录,下面排列着属于这一类别的网站的站名和网址链接,再记录一些摘要信息。目前国外的YAHOO,国内搜狐、新浪、常青藤等都用这种搜索方式。,全文搜索引擎 它提供对关键词、主题词、或自然语言的查询。用户在搜索框中输入检索词或检索表达式,搜索引擎会自动排查相关词,并按相关词的相关程度的高低排序加以链接。用户查到的是与你输入的关键词相关的一个个网页的地址和一小段文字。如GOOGLE、百度就是这类搜索引擎,搜索引擎按语种可分为单语种搜索引擎和多语种搜索引擎。,单语种搜索引擎,是指搜索时只能用一种语言查询的搜索引擎,如英文“HOTBOT”、中文“搜狐”。,多

10、语种搜索引擎,是指那些可以用多种语言查询的搜索引擎,如“Altavista”,该网站可以用25种语言进行查询。中文、日文等均在其中。,按搜索范围搜索引擎可分为独立搜索引擎和多元搜索引擎。独立搜索引擎:独立搜索引擎的网站只代表一个独立搜索引擎,检索只在本引擎的数据库内进行,由这个数据库反馈出相应的查询信息,或者是相链接的站点指向。各个独立的搜索引擎都会有自己的查询特色。,多元搜索引擎:多元搜索引擎又称为集合式搜索引擎。它是将多个搜索引擎集成在一起,提供一个统一的检索界面。,六、搜索引擎的主要作用及工作过程,搜索引擎是上的一个网站,它的主要任务是在上主动搜索服务器信息并将其自动索引,其索引内容存储

11、于可供查询的大型数据库中。对于各种搜索引擎,它们的工作过程基本一样,包括以下三个方面:,第一步,派出“网页搜索程序”在网上搜寻所有信息,并将它们带回搜索引擎。每个搜索引擎都派出绰号为“蜘蛛()”或“机器人()”的网页搜索软件在各网址中爬行,访问网络中公开区域的每一个站点并记录其网址,从而创建出一个详尽的网络目录。各搜索引擎工作的最初步骤大致都是如此。,第二步,将信息进行分类整理,建立搜索引擎数据库。在进行信息分类整理阶段,不同的系统会在搜索结果的数量和质量上产生明显的不同。有的系统是把“网页搜索软件”发往每一个站点,记录下每一页的所有文本内容;其他系统则首先分析数据库中的地址,以判别哪些站点最受欢迎(一般都是通过测定该站点的链接数量),然后再用软件记录这些站点的信息。记录的信息包括从标题到整个站点所有文本内容及经过算法处理后的摘要。当然,最重要的是数据库的内容必须经常更新、重建,以保持与信息世界的同步发展。,第三步,通过服务器端软件,为用户提供浏览器界面下的信息查询。每个搜索引擎都提供了一个良好的界面,并具有帮助功能。用户只要把想要查找的关键字或短语输入查询栏中,并按“”按钮(或其他类似的按钮)。搜索引擎就会根据用户输入的提问,在索引中查找相应的词语,并进行必要的逻辑运算,最后给出查询的命中结果(均为超文本链形式)。用户只需通过搜索引擎提供的链接,马上就可以访问到相关信息。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号