第三章 网络信息检索.ppt

上传人:文库蛋蛋多 文档编号:2910024 上传时间:2023-03-03 格式:PPT 页数:58 大小:1.65MB
返回 下载 相关 举报
第三章 网络信息检索.ppt_第1页
第1页 / 共58页
第三章 网络信息检索.ppt_第2页
第2页 / 共58页
第三章 网络信息检索.ppt_第3页
第3页 / 共58页
第三章 网络信息检索.ppt_第4页
第4页 / 共58页
第三章 网络信息检索.ppt_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《第三章 网络信息检索.ppt》由会员分享,可在线阅读,更多相关《第三章 网络信息检索.ppt(58页珍藏版)》请在三一办公上搜索。

1、第三章 网络信息检索,第一节 网络信息检索工具与方法 第二节 搜索引擎及其检索,第一节 网络信息检索工具与方法,一、网络信息检索的特点二、网络信息检索工具三、网络信息检索的方法,一、网络信息检索的特点,1、存取范围覆盖Internet上所有资源2、传统检索方法与全新检索技术相结合3、用户界面友好且操作方便4、具备良好的导航和编辑功能5、用户透明度,二、网络信息检索工具,网络信息检索工具按照不同标准可以划分不同类型:1、按照网络信息资源类型划分:WWW检索工具、非WWW检索工具2、按照检索机制划分:关键词检索工具、分类目录检索工具、混合型检索工具3、按照包含检索工具数量划分:单一型检索工具、多元

2、型检索工具4、按照检索内容划分:综合型检索工具、专题型检索工具、特殊型检索工具,二、网络信息检索工具,查Usenet新闻组资源的WAIS查FTP资源的Archie查Gopher资源的Veronica查Telent资源的Hytelent查WWW资源Search Engine(搜索引擎)其中Search Engine 应用最为普及,主要搜索引擎的建立时间及网址,建立年月 搜索引擎的名称及网址1994年4月WebCrawlerhttp:/1994年5月Lycoshttp:/,1994年底Yahoo!http:/1995年初Infoseekhttp:/1995年10月AltaVistahttp:/,第

3、二节 搜索引擎及其检索一、搜索引擎的构成及工作原理,用户检索策略,搜索引擎用户接口,搜索引擎本地的摘要信息数据库,各万维网站点资源,访问,详细信息反馈,摘要信息反馈,各记录链接,信息资源搜集,二、搜索引擎的功能,搜索引擎有两个主要的功能:1、收集网络信息资源,对其进行 索引并建立数据库。2、提供网络的信息导航与检索服 务(主要的功能)。,搜索引擎的基本检索功能,1、布尔逻辑检索 逻辑与(与、and、AND、)A and B AB 逻辑或(或、or、OR、|)A or B A;B;AB;逻辑非(非、not、NOT、!)A not B AAB,2、完全字符串检索 采用双引号“”代表字符串 精确查找

4、“知识经济”知识经济,3、截词检索(*)前方一致检索 扩大检索范围 nutri*nutria+nutrient+nutrilitei+nutriment+nutrition,4、字段限制检索限定检索词在检索结果中出现的位置,用来控制检索结果的相关性。如:URL限制(url:)主机名限制(host:)标题限制(title:),5、位置检索 目前只有Alta Vista能提供 邻近位置运算near运算。,6、+、-检索+:放在检索词前,表示该检索词在检索结 果中必须出现。-:放在检索词前,表示该检索词在检索结 果中不能出现。几乎所有的搜索引擎都支持这种功能。如:+computer+virusCIH

5、,搜索引擎的高级检索功能,1、自然语言检索支持字、词、句子检索几乎所有的搜索引擎都支持该功能如:知识经济的支柱产业 How has WTO developed?,2、模糊检索当输入一个检索词时,搜索引擎会把与该检索词相关的词一并反馈,列出供用户选择。相关性检索如:在雅虎中国查找“搜索引擎”一词时,模糊检索会把“搜索引擎”、“搜寻引擎”、“引擎”等相关的检索词一并列出。,3、概念检索 用某一检索词进行检索时,能同时对该词同样或类似概念的同义词和近义词进行检索,以达到扩大检索范围,提高查全率的目的。如:Excite,4、区分大小写检索大多数搜索引擎在查询中要区分大小写小写匹配大小写字符大写只匹配大

6、写字符,5、管道(|)检索 用管道符(|)连接两个或者多个检索词,如 apple|disease,先对前一个检索词进行检索,再在其检索结果的基础上对后一个检索词进行检索,依次类推,以达到逐步缩小检索范围提高查准率的目的。,6、相关信息反馈检索 提供与检索结果类似的检索结果。如:雅虎中国的“相关网站、相关网页、相关新闻”。Lycos的“More Like This”Excite的“Search for more documents like this one”,7、范围限制检索在某一范围内检索指定的检索词。分类范围、时间范围、地域范围、信息来源、检索词位置、语种范围、特殊范围,三、搜索引擎的分类

7、,1、根据信息检索方式分类:分类搜索引擎、关键词搜索引擎、混合搜索引擎2、根据信息覆盖范围及适用用户群分类:综合性搜索引擎、专用性搜索引擎 3、根据搜索范围分类:独立搜索引擎、集成搜索引擎,四、搜索引擎常见的查询方式,按照搜索引擎提供的分类目录逐级查询,用户一般不需要输入检索词,而是按照查询系统提供的几种分类项目,选择类别进行查询,这种方式也叫分类检索。用布尔逻辑组配方式查询,这种方式也叫定制搜索。(多个关键词),五、搜索引擎检索的步骤,1、输入URL地址,登陆到搜索引擎 的主页。2、输入检索提问式或点击分类目录,进行实时的交互式的信息检索。3、搜索引擎输出HTML文件,并且翻 译HTML,显

8、示检索结果。,六、搜索引擎的选择技巧,查全率、查准率更新速度、死链接易用性、稳定性搜索速度高级搜索的支持能力,七、常用搜索引擎简介,1、主要中文搜索引擎2、主要英文搜索引擎3、各具特色的专用搜索引擎,主要中文搜索引擎,百度是世界上规模最大的中文搜索引擎,拥有全球最大的中文网页库,每天处理来自一百多个国家的超过一亿人次的搜索请求。,百度高级搜索,主要中文搜索引擎,一搜()是雅虎公司基于全球领先的YST(Yahoo Search Technology)技术,在中国推出的搜索门户。一搜具有简洁专业、海量、客观精准、国际化、稳定高速等特点,是值得依赖的专业搜索门户。,主要中文搜索引擎,主要中文搜索引擎

9、,一搜高级搜索,主要中文搜索引擎,雅虎中国,主要中文搜索引擎,雅虎中国高级搜索,主要中文搜索引擎,新浪,主要中文搜索引擎,搜狐,主要中文搜索引擎,网易,主要中文搜索引擎,主要中文搜索引擎,263搜索,主要英文搜索引擎,Alta Vista:http:/,主要英文搜索引擎,Excite:http:/,主要英文搜索引擎,Hotbot:http:/,主要英文搜索引擎,Hotbot:http:/,主要英文搜索引擎,Lycos:http:/,Google搜索引擎和百度搜索引擎,Google搜索引擎百度搜索引擎,2.1 Google搜索引擎网址:http:/Google是一个全自动搜索引擎,它是利用计算机

10、程序直接在网页中抓取相关字串。“Google”一词来源于“googol”(仍然是英文),是10的100次方,表示是一个非常巨大的数字的概念。正如其名,Google是一个功能强大、使用方便的搜索引擎。,与其他搜索引擎相比Google的优点:1)对于用户所输入的关键字,Google 会最大程度的寻求语义匹配。例如想查找有关某人的网页,但输入“同音不同字的名”,Google 也能找到你想要得信息。或者,在查询框中输入作者的名字,所有文章与网页都会被检索,连那个网页有转载都会显示出来。此外,Google 还包含有汉字的相关性,例如对中文简体网站,找出对应的繁体网站,甚至是日文网站。2)Google还提

11、供网页快照(Cached)功能。Google将检索的网页都做了一番“快照”,然后存放在自己的服务器上,当被搜索的内容站点当前不存在时,用户可以用网页快照功能。,Google检索须知,当检索结果过多,需进一步缩小时,可选择“缩小搜索”或在“结果中搜索”。只要输入更多的关键词即可,或在不需要的关键词前“-”号。注意“-”后应留一空格。Google 不支持OR检索,也不区分英文大小写,所有字母均当小写处理。在专用词语上加双引号可以进行精确查询,这在查找某个产品或专用术语时特别有用。,“-+=,”等也作为短语连接符。例如,尽管Micro-computer,不加引号,仍作为专用词语处理。Google 会

12、忽略http和com 等字样,以及数字和单字,因为他们出现过频繁,因此无助于检索,还会减低速度。Google的“手气不错”功能将自动连接到Google推荐的网页,无需再查其他结果,快速方便,Google检索示例,2.2 百度搜索引擎,网址:http:/,百度搜索引擎特点,1)中国人自己开发研制的,适合中文网站搜索2)“网页的相关检索功能”例如输入“手机”,在检索的上方还会出现“手机的价格”、“手机铃声”等与“手机”相关的词,此时再点一下“手机铃声”,则会检索出“手机铃声”的结果3)在百度的检索结果中,用户可以选“重新查询”;也可选“在结果中再查”则将在第一次的结果中在按新输入的词查询,这相当于AND,结果会更精确些;选在“结果中去除”则将在第一次的结果中“减去”新输入的词查询,相当于NOT。,4)百度支持多关键词查询。关键词之间可用空格、逗号、+以及&符号,他们都代表AND,而竖线符号“|”代表OR,“-”仍然为NOT。在输入关键词前加“t:”将搜索网站标题(title),加“u:”则搜索网站地址URLs。,百度搜索示例,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号