《网络搜索引擎googl.ppt》由会员分享,可在线阅读,更多相关《网络搜索引擎googl.ppt(19页珍藏版)》请在三一办公上搜索。
1、2007.11.21,hohai university,第七讲:网络搜索引擎,信 息 检 索,Contents,搜索引擎的基本概念和原理,常用的几种中、英文搜索引擎,搜索引擎检索实例,一、搜索引擎的基本概念和原理,概念 搜索引擎(Search Engine)是指通过网络搜索软件或网站登陆等方式,将互联网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询作出响应,提供用户所需的信息。组成 WWW服务器,搜索程序(如spider、robot),索引数据库(包括成千上万甚至上亿个网页),检索程序(用来处理用户的检索请求),一、搜索引擎的基本概念和原理,Internet搜索引
2、擎就像信息海洋中的导航员,能帮助人们快速找到所需的信息。然而随着各种信息的巨量增长,人们使用搜索引擎也遇到了许多困难,相同的搜索词在不同的搜索引擎中得出不同的结果,在质量和数量上都有所不同。产生这种现象是因为不同的搜索引擎采集信息的方法、标引的内容以及检索功能是有所区别的,下面详细介绍一下几种搜索引擎。,二、中、英文搜索引擎,中、外文搜索引擎介绍百 度 http:/天网搜索 http:/谷歌中文 http:/雅 虎 http:/AltaVista http:/,二、中、英文搜索引擎,Google简介Google是数学名词Googol的谐音,表示一个 1 后面跟着100 个零或10的100次方。
3、由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明。目前被公认为万维网上最大的搜索引擎,它提供了简单易用的免费服务,使用户能够访问一个包含超过 80 亿个网址的索引。Google 使用PageRank技术检查整个网络链接结构,并确定哪些网页重要性最高。然后进行超文本匹配分析,以确定哪些网页与正在执行的特定搜索相关。,Google 搜索引擎,1、基本搜索技术:(1)布尔逻辑:逻辑”与”:AND、+或空格,如:墨攻+鸡犬不宁。逻辑”或”:OR,|如:墨攻|鸡犬不宁。逻辑”非”:-如:张艺谋 大红灯笼高高挂。(注:-前面有空格,后面没有空格)(2)短语搜索:“be
4、ijing university of technology”(3)英文字母大小写与通配符的用法:大小写不敏感,通配符目前只可以用*来替代单个字符 LOGO,Google 搜索引擎,(4)忽略高频字符以及强制搜索 Google对一些网络上出现频率极高的英文单词,如“the”、“com”、“www”等,以及一些符号如“、”、“.”等作忽略处理。如果必须要使用某一常见字词才能获得需要的结果,您可以在该字词前面放一个“+”号,从而将其包含在查询字词中。如:搜索 www 的历史internet,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“历史”和“internet”。这显然不符合要求
5、。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号(注:在“+”号前留一空格)。如:搜索+www+的历史internet。另一个强制搜索的方法是把上述的关键字用英文双引号引起来。如:搜索“www的历史”internet。,Google 搜索引擎,2、命令型搜索技术:(1)制定网域。要在某个特定的站点中进行搜索,可以在Google搜索框中输入“site”。例如要查找人民网上的新闻,可以输入:“新闻”。输入“金庸 古龙”搜索包含“金庸”和“古龙”的中文新浪网站页面。注:site后的冒号为英文字符,而且冒号后不能有空格,网站域名不能有“http:/”和www前缀,也不能有任何“
6、/”的目录后缀;网站频道则只局限于“频道名.域名”方式。而不能是“域名/频道名”方式。,Google 搜索引擎,Google 搜索引擎,(2)搜索的关键字包含在URL链接中“inurl:”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。如:查找微软网站上关于Windows2000的安全课题资料。“inurl:security windows2000 site:”“allinurl”语法返回的网页链接中包含所有作用的关键字,这个查询的关键字只集中于网页的链接字符串。(3)按链接搜索:Link后面加上冒号“:”查询所有指向该网址的网页 如:,(4)搜索的关键字包含在
7、网页标题或正文中 Intitle标题搜索 如:intitle:休斯顿火箭队 Intext正文检索 如:intext:像素600万(5)搜索特定类型的文件“filetype:”格式:filetype:pdf OR filetype:doc 如:搜索关于电子商务(ECOMMERCE)的PDF文档 ecommerce filetype:pdf(6)查看字或词组的定义“define:”,3、智能性搜索技术(1)错别字纠正(2)手气不错:按下“手气不错”按钮将自动进入Google 查询到的第一个网页。(3)类似网页(4)网页快照(5)天气查询(6)邮编区号(7)手机号码归属地(8)股票查询,Google
8、 搜索引擎,4、综合性搜索技术(1)在线计算器(2)中英文字典:“翻译”,“fy”和“FY”任选其一,格式为:fy 检索词(3)拼音转换,Google 搜索引擎,5、Google特色功能(1)学术论文搜索 进入Ggoogle scholar页面后和使用Google一样键入你要搜索的关键词或文章名后,Google scholar会列出与之相关的结果。而且,它还列出了该文献的引用情况以及,该文献在网络上的版本,点击版本可以查到通过维普和万方两个途径获得文献的全文。第一步:打开http:/;第二步:将文献名输入到检索框中,点击“搜索”,这时候你会看到有关的信息,而且如果该文献在网上有收录的话,还会告诉你在哪个库有收录;第三步:如果你运气好一点的话,直接点击该标题还可以直接就得到原文。如:在GoogleScholar中文献“数字图书馆研究”的检索结果,(2)图书搜索(3)地图服务(4)大学搜索(5)翻译,Google 搜索引擎,Google检索方式,Google提供了基本搜索、高级搜索和目录式搜索。1、基本搜索2、高级搜索3、目录式搜索,Google 搜索引擎,举例,某三年级小学生,想查一些关于时间的名人名言 他的查询词是“小学三年级关于时间的名人名言”。,时间名言,intitle:时间名言,主讲人:朱末霞电 话:85191970E-地 点:图书馆信息服务部312室,