《Internet基础知识与搜索引擎.ppt》由会员分享,可在线阅读,更多相关《Internet基础知识与搜索引擎.ppt(34页珍藏版)》请在三一办公上搜索。
1、Internet网络资源检索,本章重点,Internet基本知识搜索引擎开放存取的概念学科门户的概念及代表性网站,第一节 Internet基础知识,1 因特网的概念,是由许多不同类型、规模的计算机网络组成的全球性计算机互联网。是庞大的信息和服务基地。面向公众的社会化组织。,2 因特网的发展史,2.1 Internet的起源和发展ARPANET的诞生;NSFNET(National Science Foundation Network)的出现;取代ARPANET现代Internet的产生因特网II计划:新一代因特网计划(NGI计划)NSF(The National Science Foundat
2、ion,国家科学基金会)的VBNS(Very High Bandwidth Network Service,超高带宽网络服务)。Internet2(一个由大学、协会、公司和政府机构共同努力建设的网络)。IPng(下一代因特网协议,又名IPv6)。,2 因特网的发展史,2.2 我国的因特网1986年1993年小范围的E-MAIL服务1994进入全功能服务阶段我国四大互联网:中国科学技术网(CSTNET)中国公用计算机互联网(CHINANET)中国教育和科研计算机网(CERNET)中国金桥信息网(CHINAGBN),3 Internet的基本概念,3.1 TCP/IP协议Transmision C
3、ontrol Protocol/Internet Protocol 传输控制协议/交互网络协议 作用:是保证各种不同类型的计算机网络实现相互通信一套规则或协议地位:是因特网的基础和核心。,3 Internet的基本概念,3.2 IP地址IP地址概念:Internet上的众多计算机和住处资源必须通过名字和地址来进行识别,接入Internet的计算机或节点被赋予一个唯一的数字作为地址。由用小数点隔开的四组数字组成特点:具有唯一性形式:四组小于256的十进制表示。如202.115.182.3表示图书馆的一台主机,3 Internet的基本概念,3.2 域名域名:1984年起采用字符型的IP地址,即域
4、名(DN)Internet中每台计算机的域名结构为主机名、机构名、网络名、最高域名组成。lib.sicau.edu.Cn主机名 机构名 网络名 最高域名,3 Internet的基本概念,3.3 URL也称网址,是信息在网上的地址,用来定位和检索WWW上的文档。由三部分组成,例如http:/web服务器域名 文件路径及文件名,4 Internet提供的信息和服务,4.1 WWW信息服务4.2 Telnet(远程登录)usenet(新闻组)4.3 FTP(文件传输协议)4.4 电子邮件(E-MAIL)4.5 网络新闻服务4.6 Gopher信息服务4.7 博客与RSS,第二节 网络检索工具,1 网
5、络检索工具的组成,数据采集子系统数据组织子系统用户检索子系统,2 网络检索工具的类型,按检索机制划分:检索型、目录型、混合型按检索内容划分:综合型、专题型、特殊型按包含的检索工具数量划分:单独型、集合型按检索资源类型划分:万维网检索工具和非万维网检索工具,第三节 常用搜索引擎及专业网站,搜索引擎的概念,广义:指一种基于Internet上的查询系统,包括信息存取、信息管理、信息检索。狭义:指一种为搜索Internet上的网页而设计的检索软件。,1 中文搜索引擎,1 Google中文版2 百度3 搜狐4 雅虎,1 Google,简介:Google()是一个搜索引擎,由两个斯坦福大学博士生Larry
6、 Page与Sergey Brin于1998年 9月发明,Google Inc.于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,GOOGLE已经获得30多项业界大奖。,1 Google,GOOGLE的成功得益于其强大的功能和独到的特点:GOOGLE支持多达132种语言,包括简体中文和繁体中文;GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;GOOGLE速度极快,据说有10000多台服务器,200多条T3级宽带;GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜
7、索结果;GOOGLE的搜索结果摘录查询网页的含有关键字的内容,而不仅仅是网站简介;GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站;GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。,1 Google:语法,intitle:将搜索词限定在网页标题中Allintitle:将所有的搜索词限定在网页标题中Site:限定搜索范围的域名Inurl:搜索网页上包含的URLIntext:只在中进行搜索Link:可得到所有包含某个指定URL的页面列表.Filetype:搜索特定类型的文件Define:搜索概念的定义。Inanchor:搜索连接中包含锚点标记 Ralate
8、d:搜索和指定页面相关的页面Phonebook:搜索电话号码,Google:检索技巧(一),*的使用不支持截词,但在搜索时可使用通配符*,而且包含*的词句必须用”引起来,这在搜索诗词时特别有效,如”床前明*”如果想得到Google索引页面的总数,可以搜索*,Google:检索技巧(二),逻辑算符的使用:逻辑与检索无需加and,两词间的空格默认and检索;逻辑或必须使用大写的 OR,或者|,使用时要与关键词之间留有空格逻辑非用-,但减号前必须留一空格,不能使用not。,Google:检索技巧(三),“”的使用和通配符*配合使用短语或词组检索用“”,会强制匹配“”中的所有字词。对于一些高频词,go
9、ogle会自动忽略,如果必须要检索这些词,可加上“”强制检索。,Google:检索技巧(四),近义词检索:在单词前加符号可以搜索同义词,如,management,结果当中除了有包含management的页面,还有包含manage,administrator等的页面。,Google:检索技巧(五),智能搜索:Google有一定的人工智能,可以识别一些简单的短语如whenwas Einstein born?或einstein birthday有时候Google懂得一些自然语言,比如搜索关键词goog,weather new york,ny,new york ny或war of the worlds
10、,此时Google会在搜索结果前显示出一个被业内称为“onebox”的结果,Google:检索技巧(六),数字搜索:Google可以指定数字范围搜索。搜索2001.2005相当于搜索含有2001、2002直到2005的任意一个数的网页股票报价:只要输入一个或多个NYSE,NASDAQ,AMEX或共有基金的股票行情自动收录机的代码,也可以输入在股市开户的公司名字。如果Google识别出你查询的是股票或者共有基金,它回复的链接会直接连到高质量的金融信息提供者提供的股票和共有基金信息。,Google:检索技巧(七),其它:对大小写不敏感拼音汉字自动转换:能提供自动功能转换并能提供相应提示。如,搜索“
11、sang wu tong”,google会自动提示,“您是不是要找:商务通”。,Google:检索技巧(八),一些特殊的入口(数字图书搜索)(虚拟地球仪软件)(博客搜索)(专利搜索),2 英文搜索引擎,Medsite(http:/)AltaVistaExcite,3、常用农业生物网站,美国国家农业图书馆(NAL)联合国粮农组织(FAO)欧洲农业网欧洲生物信息研究所(EBI)美国国家生物技术信息中心(NCBI)PSD数据库中国农业信息网中国农业科技信息网生物谷丁香园,第四节 开放存取信息资源的利用,开放存取的概念:,布达佩斯开放获取计划:对文献的“开放存取”不应该存在不同的政策和权限,用户可以通
12、过Internet免费阅读、下载、复制、传播、打印和检索作品,实现对作品全文的链接,为作品建立索引,将作品作为数据传递给相应软件,或者进行任何其他出于合法目的的使用。,第五节 学科信息门户网站资源利用,学科信息门户,概念(SIG):一种专业性网站,为研究人员、教师和研究生提供高质量的、经过筛选的定期更新的学科信息目录和入口。图书馆员和学科专家对互联网上同一个学科有关的资料(期刊、图书室、数据库和软件等)进行系统的整理和规范加工,形成可供用户检索和浏览的目录数据库,为科研和教学提供权威可靠的网络信息导航服务。代表性的门户网站:中国科学院国家科学图书馆学科门户网站()国家科技图书文献中心热点门户(),