《走近搜索引擎.ppt》由会员分享,可在线阅读,更多相关《走近搜索引擎.ppt(29页珍藏版)》请在三一办公上搜索。
1、走近搜索引擎,搜索引擎的发展史,搜索引擎的祖先,是1990年由蒙特利尔大学学生Alan Emtage发明的Archie。最早现代意义上的搜索引擎Lycos出现于1994年7月同年4月,斯坦福大学的两名博士生和美籍华人杨致远共同创办了超级目录索引Yahoo 从此搜索引擎进入了高速发展时期,在1998年著名搜索引擎Google 诞生了。,搜索引擎是用户查找网站的第一途径数据来源自CNNIC发布的中国互联网络发展状况统计报 告,搜索引擎的现状,全球每天约有近4亿次搜索请求,其中中国超过5000万次68.3%网民使用搜索引擎,仅次于电子邮件 84.6%网民是通过搜索引擎发现新的网站,排名第一41%网民
2、是通过搜索引擎进入在线购物平台,搜索引擎的分类,目录型搜索引擎关键词型搜索引擎混合型搜索引擎,中外搜索引擎简介,国外英文目录索引 Yahoo 最著名的目录索引,搜索引擎开山鼻祖之一。D 由义务编辑维护的目录索引。Ask Jeeves 著名的自然语言搜索引擎A 有其自身特色的目录索引。国外英文搜索引擎 Google 是目前搜索界的领军人物。Fast/AllTheWeb 总部位于挪威的搜索引擎后起之秀AltaVista 曾经的搜索引擎巨人,目前仍是最好的搜索引擎之一。Overture 最著名的搜索引擎广告商Lycos 发源于西班牙的搜索引擎国内三大门户网站,Google简介,Google 是从第一
3、代搜索引擎中脱颖而出的第二代搜索引擎的代表。1998 年,两位斯坦福大学的博士生创立了Google,它的使命就是要为用户提供网上最好的查询服务,促进全球信息的交流。Google 开发出了世界上最大的搜索引擎,,Google的页面随着节庆而改变的图标,Google高级技巧,第一次搜索实践为了方便讲解,我们假定你是个搜索新手,想要了解一下搜索引擎的来龙去脉和搜索技巧。在搜索框内输入一个关键字“搜索引擎”,选中“搜索中文(简体)网页”选项,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。,“搜索引擎”一词的检索结果,Google高级技巧,第二步:增加关键词,缩小范围示例:搜索所
4、有包含关键词“搜索引擎”和“历史”的中文网页搜索:输入:搜索引擎 历史,Google高级技巧,第三步、排除某些特定信息Google用减号“-”表示逻辑“非”操作。“A B”表示搜索包含A但没有B的网页。示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页搜索:“搜索引擎 历史-文化-中国历史-世界历史”,Google高级技巧,第四步:从搜索结果中更新检索策略点开se-的这个名为“搜索引擎发展历史”的网页,我们发现,搜索引擎的历史,是与互联网早期的文件检索工具“Archie”息息相关的。此外,搜索引擎似乎有个核心程序,叫“蜘蛛”,使搜索引擎深入人心的是“Y
5、ahoo”。了解了这些信息,我们就可以进一步的让搜索结果符合要求了。示例:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关键字中的任何一个或者多个:“Archie”、“蜘蛛”、“Yahoo”。、检索式:“搜索引擎 历史 archie OR 蜘蛛 OR yahoo-文化”,Google的语法,搜索引擎最基本的语法“与”“非”和“或”,这三种搜索语法Google分别用“”(空格)、“-”和“OR”表示。顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法,即:目标信息一定含有的关键字(用“”连起来),目标信息不能含有的关键字(用“-”去掉),目标
6、信息可能含有的关键字(用“OR”连起来)。,通配符问题,Google对通配符支持有限。它目前只支持“*”,不支持?号。比如,“以*治国”,表示搜索第一个为“以”,末两个为“治国”的四字或四字以上的短语,中间的“*”可以为任何字符。关键字的字母大小写Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。搜索整个短语或者句子Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。,搜索引擎忽略的字符,Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及
7、一些符号如“*”、“.”等,作忽略处理。示例:搜索关于www起源的一些历史资料。如果我们用检索式“www的历史 internet”进行搜索,则得到的结果冠盖实际上只是搜索了“历史”和“internet”两个关键词的结果,而“www的”却被忽略了。,强制搜索,如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。比如:搜索关于www起源的一些历史资料搜索:则我们可以用下面的检索式进行搜索:+www+的历史 internet另一个强制搜索的方法是把上述的关键字用英文双引号引起来。例如上面的例子可以构造成如下的检索式:www的历史 internet注意:大部分常用英文符号(如问号,
8、句号,逗号等)无法成为搜索关键字,加强制也不行。,对搜索的网站进行限制,“site”表示搜索结果局限于某个具体网站或者网站频道,如site:表示只搜索新浪网、site:.com表示只搜索商业机构网站,site:表示只搜索中国的商业机构网站。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。示例一:搜索中文教育科研网站()上关于搜索引擎技巧的页面。检索式:“搜索引擎 技巧 site:”注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http:/”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道
9、名.域名”方式,而不能是“域名/频道名”方式。,在某一类文件中查找信息-filetype:语法,“filetype:”是个非常强大实用的一个搜索语法。它能实现对某些二进制文档的搜索。如:.xls、.ppt、.doc,.swf、.pdf文档等共13种类型。例如:关键词 filetype:pdf,Google的其他杰出功能,网页快照集成化的工具条 单词英文解释 网页翻译 单词纠错与错别字更正繁简转换 搜索结果过滤 计算器,实例:,搜索小功能,天气查询股票查询邮编区号人名号码,百度,国内最大商业化全文搜索引擎,Yahoo,北大天网中英文搜索引擎1997年由北大网络实验室研制开发的国家“九五”重点科技攻关项目,如何提高检索的效率,首选关键词细化搜索条件精确匹配搜索特殊搜索命令附加搜索功能,知识搜索,渊源模式:问答优势前景,知识搜索,百度“知道”,新浪”爱问“,雅虎”知识堂“,