《网络搜索资料技巧探讨.ppt》由会员分享,可在线阅读,更多相关《网络搜索资料技巧探讨.ppt(58页珍藏版)》请在三一办公上搜索。
1、网络搜索资料技巧探讨以Google、Baidu为例,图书馆信息咨询部2014年5月22日,2023年9月4日,1,主要内容,Google搜索引擎Baidu搜索引擎其他搜索引擎,2023年9月4日,2,Google搜索引擎,Google的简要介绍Google的检索规则Google的检索运算符Google的语法结构Google的学术搜索Google的图书搜索,2023年9月4日,3,Google的简要介绍,Google的创立 Google是由2位斯坦福大学的博士生Larry Page和 Sergey Brin在1998年创立的。,Larry Page,Sergey Brin,2023年9月4日,4
2、,Google的简要介绍,Google的释义 Google 是由英文单词“googol”变化而来。Google的特点 作为目前世界上最大的搜索引擎,Google支持多达132种语言,包括简体中文和繁体中文;Google目录中收录了80亿多个网址。,2023年9月4日,5,Google的简要介绍,2023年9月4日,6,Google的检索规则,And规则:在Google的检索规则中,最基本的一条是默认And规则,即当你输入多个检索词之后,Google默认为要检索所有的包含所有检索词的网页,它们之间为And连接。如:“篮球 NBA”,2023年9月4日,7,Google的检索规则,排除常用词规则:
3、在Google的检索规则中,有些常用词如“的”、“the”或者“of”等这些词是不被当作检索词的,而被忽略掉。如:NBA的球队,2023年9月4日,8,Google的检索规则,不区分大小写规则:Google对于检索词中的大小写是完全不做区分的,这个规则的设置是为了改善检索结果,因为利用这样一个规则,就可以检索到包含该词的所有网页,避免了因为大小写不规范而造成的在查全率上的损失。如:LARRYPAGE,2023年9月4日,9,Google的检索规则,排除标点符号规则:Google并不认为标点符号具有与文字一样的重要地位,因此Google会忽略检索之间绝大多数的标点符号。但是对于单引号和连字符而言
4、,它们是不被省略的。如:你好吗?我很好,2023年9月4日,10,Google的检索规则,检索词的词序和邻近规则:在Google中,检索词的排序方式对于整个检索式具有重要的影响,它将首先匹配按照检索式给出的次序进行搜索。同时它也将优先匹配检索词相互邻接的网页。如:“足球 世界”与“世界 足球”,2023年9月4日,11,Google的检索运算符,双引号“”双引号界定多个检索词,可以查到各个单词按相同顺序在一起出现的网页。如:chronic hepatitis 与”chronic hepatitis”,2023年9月4日,12,Google的检索运算符,通配符*:在检索时,如果只知道某字句的一部
5、分,可以通过通配符来进行检索。在Google中,使用星号作为通配符运算符,表示匹配用它代表的任何词。如:I*never saw the sunshine,2023年9月4日,13,Google的检索运算符,“OR”、“+”、“-”、“”。在检索式中运算符OR必须以大写的形式出现,否则会把它看成是普通的检索词。OR运算符告诉Google查找包含其中任何一个词的网页。运算符“+”表示包含运算符后面的词。运算符“-”表示不包含该运算符后面的词。运算符“”让Google检索该词及其同义词。,2023年9月4日,14,Google的检索运算符,2023年9月4日,15,Google的检索运算符,2023
6、年9月4日,16,Google的检索运算符,2023年9月4日,17,Google的语法结构,使用Google所提供的特殊的语法结构,能够帮助用户缩小检索范围,更有效地找到所需要的内容。在一般情况下,Google将整个网页进行收录和索引,通过专门的语法结构,可以让用户搜索网页的某些特定部分或者特定信息。,2023年9月4日,18,Google的语法结构,Intitle:将搜索范围限制在网页的标题内。即检索词仅匹配(在网页标题中)字词出现在检索结果的网页的链接内和打开网页后浏览器的标题栏内。,2023年9月4日,19,Google的语法结构,Intext:只在网页的正文中检索关键词,即忽略超链接
7、文本、URL以及题目等。,2023年9月4日,20,Google的语法结构,Inanchor:在页面的链接锚点进行搜索,即在一个链接的描述文本内进行检索。,2023年9月4日,21,Google的语法结构,Site:将检索局限在特定网站或者网域内,即将搜索限制在某个特定站点或者顶级域名内。,2023年9月4日,22,Google的语法结构,Inurl:将搜索结果限制在URL或者网站页面上,他可以查询网站的子目录。一般通过这个语法,我们可以查找某些特定的内容页,如帮助页,也可以查找特定的文件,如音乐或者视频文件。,2023年9月4日,23,Google的语法结构,Link:检索所有链接到某个特定
8、URL的页面列表。例如,搜索所有链向新浪的链接,其结果如下:,2023年9月4日,24,Google的语法结构,Cache:帮助用户查找Google的网页快照。网页快照的作用是帮助我们查找某些原链接处不存在,或者更换了内容的网页。对于我们查找过去的一些页面是很有帮助的。例如,用“cache:”返回的结果如下:,2023年9月4日,25,Google的语法结构,Filetype:检索特定类型的文件,即搜索后缀或者文件的扩展名。在我们寻找特定格式的内容的时候,这项语法是必不可少的。例如,仅搜索关于“旅游管理”的pdf文件,结果如下:,2023年9月4日,26,Google的语法结构,Define:
9、对检索关键词显示网上的定义。该词的定义不一定来自于词典,而更多的是源于网上的定义,如:维基百科等。例如,搜索网上关于RSS的定义,其结果如下:,2023年9月4日,27,Google的语法结构,Daterange:查找在一定的日期或者一定的日期范围内,Google索引的网页(该语法只关注被Google收录的时间,而不关注网页创建的时间)Related:检索与某特定网页类似的网页。这在搜寻相关内容或者具有类似功能的网页的时候,非常有帮助。,2023年9月4日,28,Google的语法结构,Info:检索有关特定网页的信息,获得关于该URL更多信息的页面列表,包括指向该网页的网页快照、类似网页、链
10、接到该URL的所有网页的列表、该URL相关的页面列表以及含有该URL的页面。例如,搜索关于新浪的信息,其结果如下:,2023年9月4日,29,AND,双引号,OR,减号-,filetype,daterange,“intitle”、“intext”、“inURL”“inancher”,和上述的字词位置相配合使用,同时可以选择特定网域进行检索,related,link,2023年9月4日,30,Google的学术搜索,2023年9月4日,31,Google图书搜索,2023年9月4日,32,Google更多产品,2023年9月4日,33,Baidu搜索引擎,百度是中国互联网用户最常用的搜索引擎,每
11、天完成上亿次搜索;也是全球最大的中文搜索引擎,可查询数十亿中文网页。主要内容 1、搜索内容 2、高级搜索语法 3、常用搜索技巧,2023年9月4日,34,搜索内容,2023年9月4日,35,高级搜索语法,把搜索范围限定在特定站点中site 有时候,您如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。,2023年9月4日,36,高级搜索语法,把搜索范围限定在网页标题中intitle把搜索范围限定在url链接中inurl精确匹配双引号去除含有特定关键词的网页减号书名号 有两层特殊功能,一是书名号会出现在
12、搜索结果中;二是被书名号扩起来的内容,不会被拆分。书名号在某些情况下特别有效果。,2023年9月4日,37,把搜索范围限定在网页标题中intitle,2023年9月4日,38,大学 intitle:教育改革,把搜索范围限定在url链接中inurl,2023年9月4日,39,网络搜索 inurl:jiqiao,精确匹配双引号”“”,2023年9月4日,40,网络搜索技巧,去除含有特定关键词的网页减号,2023年9月4日,41,“网络搜索技巧”-百度,书名号,2023年9月4日,42,书名号,2023年9月4日,43,Baidu常用搜索技巧,选择适当的查询词-准确的表述百度会严格按照您提交的查询词
13、去搜索,因此,查询词表述准确是获得良好搜索结果的必要前提。一类常见的表述不准确情况是,脑袋里想着一回事,搜索框里输入的是另一回事。一种不准确的表述就是在查询中出现错别字查询词的主题关联与简练 目前的搜索引擎并不能很好的处理自然语言。因此,在提交搜索请求时,您最好把自己的想法,提炼成简单的,而且与希望找到的信息内容主题关联的查询词。还是用实际例子说明。某三年级小学生,想查一些关于时间的名人名言,他的查询词是“小学三年级关于时间的名人名言”。最好的查询词,应该是“时间名言”。,2023年9月4日,44,Baidu常用搜索技巧-软件下载,日常工作和娱乐需要用到大量的软件,很多软件属于共享或者自由性质
14、,可以在网上免费下载到。1.直接找下载页面 这是最直接的方式。软件名称,加上“下载”这个特征词,通常可以很快找到下载点。例:“网际快车 下载”2.在著名的软件下载站找软件 由于网站质量参差不齐,下载速度也快慢不一。如果我们积累了一些好用的下载站(如天空网,华军网,电脑之家等),就可以用site语法把搜索范围局限在这些网站内,以提高搜索效率。例:“网际快车 site:”小提示:一旦搜索范围局限在专业下载站中,“下载”这个特征词就不必在查询词中出现了。,2023年9月4日,45,Baidu常用搜索技巧-找专业报告,很多情况下,我们需要有权威性的,信息量大的专业报告或者论文。巧妙利用filetype
15、:这个语法对搜索对象做限制。,2023年9月4日,46,百度产品,2023年9月4日,47,其他搜索引擎,Yahoo搜狗中搜有道SOSO全能搜,2023年9月4日,48,网络搜索资料技巧小结,1.关键词组合 如搜索“上海世博会”搜索“上海世博会宾馆价格”.用“-(减号)”去除不需要的内容 搜索天龙八部游戏而不是金庸小说,关键词为“天龙八部-金庸”检索式(关键词):天龙八部 检索式(关键词):天龙八部-金庸,2023年9月4日,49,网络搜索资料技巧小结,3.搜索结果至少包含多个关键字中的任意一个 例如:想找到内容必须含有“搜索引擎”,也可以包括“语义网”或者英文的语义网单词“Semantic
16、Web”。检索式:搜索引擎 语义网 OR Semantic Web比对:搜索引擎 语义网 Semantic Web,2023年9月4日,50,网络搜索资料技巧小结,4.搜索短语和句子(用英文双引号限定)搜索知识管理的英文单词“Knowledge Management”,搜索引擎默认为两个词(Knowledge+Management)的组合。检索式:”Knowledge Management”比对:Knowledge Management搜索“未知生,焉知死?”出自何处?,2023年9月4日,51,网络搜索资料技巧小结,5.在指定网站和相关领域网站搜索(了解相关领域网站顶级域名,请自己检索结果)
17、例:搜索网易网站上关于“快乐男声”的信息 检索式:快乐男声 site:搜索教育网类网站上关于“工学交替”方面的信息 检索式:工学交替 site:,2023年9月4日,52,网络搜索资料技巧小结,6.搜索某一类文件 Word、Excel、PPt、PDF等类型文件(关于各类型文件的扩展名请自己检索完成)。例:搜索有关“资产负债表”方面的Excel文件 检索式:资产负债表 filetype:xls 搜索“儿童节”方面的动画片 检索式:儿童节 filetype:swf,2023年9月4日,53,网络搜索资料技巧小结,7.把搜索范围限定在网页标题中intitle 网页标题通常是对网页内容提纲挈领式的归纳
18、。例:找范冰冰的写真 检索式:写真 intitle:范冰冰 8.目录检索 如果你不想搜索广泛的网页,而是想寻找某些专题网站,可以访问一些导航网站。谷歌265:http:/例:了解商业贸易类专题网站 http:/,2023年9月4日,54,网络搜索资料技巧小结,9.点击搜索结果前先思考,尽量用网页快照打开 一次成功的搜索由两个部分组成:正确的搜索关键词,有用的搜索结果。在你点击任何一条搜索结果之前,快速地分析一下你的搜索结果的标题、网址、摘要,会有助于你选出更准确的结果,帮你节省大量的时间。如果可能,尽量用“网页快照”打开相关页面,速度又快又能准确定位你的关键词。要提高评估信息和知识的能力。,2
19、023年9月4日,55,网络信息资源评价参考指标,站点由权威的机构或个人维护;站占的URL包含了“edu、ac、gov、org”网站顶级域名;作者是该主题领域中公认的权威人士;作者的教育经历和工作经验与文献主题相关;作者属于与文献领域相关的某个权威的学术机构或政府部门;网页有明确的主题和主要的学科范围;网页发布的目的与内容相关;网页发布的日期和最后更新的日期比较新;网页被权威作者和站点引用和链接;,2023年9月4日,56,网络信息资源评价参考指标,网页内容被加入了同行评价(Peer Reviewed)系统;网页内容中的数据与其他信息源提供的数据一致;网页内容提供可信的统计数据来支持结论;网页中不包括明显的错误和遗漏;网页内容客观地陈述了有争议性的观点;站点的组织者对文献的主题不存在商业的兴趣;网页在文本和图片中不存在种族偏见;图形、功能按钮和各种链接与内容描述是相关和符合的;对网页内的链接加以注释或评价。,2023年9月4日,57,谢谢!,2023年9月4日,58,