《信息检索课件第3章.ppt》由会员分享,可在线阅读,更多相关《信息检索课件第3章.ppt(41页珍藏版)》请在三一办公上搜索。
1、2013,图书馆参考咨询部 2013.7,LOGO,文献信息检索,2013,22,第三章网络信息检索基础知识,2013,目录,3.1网络信息检索原理3.2搜索引擎原理和概况,2013,因特网基础因特网的主要服务Web通用检索工具,3.1网络信息检索原理,2013,因特网基础,1因特网的概念是由许多不同类型、规模的计算机网络组成的全球性计算机互联网。是庞大的信息和服务基地。面向公众的社会化组织。,2013,因特网基础,2因特网的发展史(1)国际因特网的发展1969年ARPANET;美国国防部高级研究计划局(ARPA)1986年NSFNET(National Science Foundation
2、Network);取代RPANET因特网II计划;新一代因特网计划(NGI计划),2013,下一代互联网 NGI更大:采用IPv6协议,使下一代互联网具有非常巨大的地址空间,网络规模将更大,接入网络的终端种类和数量更多,网络应用更广泛更快:100M字节秒以上的端到端高性能通信更安全:可进行网络对象识别、身份认证和访问授权,具有数据加密和完整性,实现一个可信任的网络更及时:提供组播服务,进行服务质量控制,可开发大规模实时交互应用更方便:无处不在的移动和无线通信应用更可管理:有序的管理、有效的运营、及时的维护更有效:可创造重大社会效益和经济效益,因特网基础,2013,因特网基础,3 我国的因特网1
3、987年9月20日 钱天白发出我国第一封电子邮件1990年10月 钱天白注册登记我国顶级域名CN1994年4月20日 中国实现与互联网的全功能连接,被国际上正式承认为有互联网的国家1996年1月 中国互联网全国骨干网建成并正式开通,开始提供服务1998年3月 信息产业部成立,中国Internet之父,2013,三大阶段19871993年,研究试验阶段。中国一些科研部门和高等院校开始研究Internet技术,并开展了科研课题和科技合作工作,但这个阶段的网络应用仅限于小范围内的电子邮件服务。,因特网基础,2013,1994年1996年,起步阶段。1994年4月,中关村地区教育与科研示范网络工程进入
4、Internet,从此中国被国际上正式承认为有Internet的国家。之后,Chinanet、CERnet、CSTnet、Chinagbnet等多个Internet网络项目在全国范围相继启动,Internet开始进入公众生活,并在中国得到了迅速的发展。至1996年底,中国Internet用户数已达20万,利用Internet开展的业务与应用逐步增多。,因特网基础,2013,1997年今,是Internet在我国最为快速发展的阶段。国内Internet用户数97年以后基本保持每半年翻一番的增长速度。2010年7月15日,中国互联网络信息中心(CNNIC)在京发布了第26次中国互联网络发展状况统计
5、报告(以下简称报告)。报告数据显示,截至2010年6月,我国网民规模已达4.2亿,互联网普及率进一步提升,达到31.8%。我国手机网民半年内新增4334万,达到 2.77亿人,增幅为18.6%。手机上网已成为我国互联网用户的新增长点。,因特网基础,2013,手机网民成为拉动中国总体网民规模攀升的主要动力。报告显示,截至2010年6月底,手机网民用户达到2.77亿,在整体网民中的占比攀升至 65.9%,相比2009年底增加了4334万人,增幅达18.6%,其中,大约有4914万的网民只使用手机上网,占网民总数的11.7%。移动互联网展现出了巨大的发展潜力。,因特网基础,2013,商务应用快速发展
6、 网络安全仍为最大制约因素2010年上半年,我国网民的互联网应用表现出商务化程度迅速提高、娱乐化倾向继续保持、沟通和信息工具价值加深的特点,其中,商务类应用表现尤其突出。截至2010年6月底,网络购物、网上支付和网上银行的使用率分别为 33.8%、30.5%和29.1%,用户规模分别达到1.42亿、1.28亿、1.22亿,半年用户规模增幅分别为31.4%,36.2%和 29.9%,增速在各类网络应用中排名前三。2010年上半年,有59.2%的网民在使用互联网过程中遇到过病毒或木马攻击;30.9%的网民账号或密码被盗过;电子商务网站访问者中89.2%的人担心假冒网站,其中,86.9%的人表示如果
7、无法获得该网站进一步的确认信息,将会选择退出交易。,因特网基础,2013,网络视频用户止跌回升 3G推动网络文学用户增长2010年上半年,网络视频用户规模达到2.65亿,使用率从2009年末的 62.6%上升到63.2%。虽然增幅不大,但却结束了去年用户下滑的局面,使用率开始缓慢上升。2010年上半年,网络视频新增用户2500万,增幅达 10.4%。报告认为,随着国家三网融合政策的部署和实施,中国网络视频也将迎来新的发展机遇:视频传输速率的提高,接入渠道的增多,将使网络视频获得更广泛的用户支持,成为大众视频消费的重要方式,快速提升了网络视频的媒体价值和商业价值。,因特网基础,2013,90后网
8、民网络娱乐应用最突出 90后网民目前在6-19岁之间,独特的年龄段决定了这一群体网络应用范围较窄,应用主要集中在网络娱乐类应用上。90后网民在网络游戏和网络文学应用上使用率最高,其中,有80%的90后网民都玩网络游戏,高出80后10个百分点,更高出70后近20个百分点。而在其他应用上相对较低。,因特网基础,2013,80后网民是商务和交流应用的中坚力量 随着80后的成长,这一群体逐步成为各行各业的重要组成群体,在网络应用上也表现的最为活跃。80后网民在商务交易和交流沟通的大部分应用中使用率都最高,其中,网购比例为37.4%,网上银行使用率35%,即时通信使用率80.4%。80后网民成为网络商务
9、和交流应用的中坚力量。,因特网基础,2013,70后网民互联网使用工具性最明显 70后网民目前处于30-39岁年龄段,这部分网民对互联网使用的互联网的工具价值较娱乐和沟通价值更强。70后网民网络新闻使用最普及,使用率为88%;使用网络炒股的比例高达22.1%,远远高出其他群体。旅游预订也有10.3%的用户,其在商务类应用上也具有较强的使用潜力。,因特网基础,2013,上海信息交互网(SHIX),1996年12月,上海就率先开通了国内首个地区性互联网交换中心上海信息交互网,实现了上海本地家信息网络之间的信息共享,改变了以往国内信息到境外交换的做法。2000年9月上海宽带信息交互中心基本框架构成。
10、加快上海本地和周边地区信息网络之间的互访速度,提高信息网络的服务质量。,2013,中国互联网普及状况,2013,我国四大骨干网,中国科技网(CSTNET):网络通信服务,信息资源服务,超级计算服务和域名注册服务。中国公用计算机互联网(CHINANET):面向社会公开开放的、服务于社会公众的大规模的网络基础设施和信息资源的集合,保证大范围的国内用户之间的高质量的互通,进而保证国内用户与国际Internet的高质量互通。中国教育和科研计算机网(CERNET):为教育、科研和国际学术交流服务的非盈利性网络。中国金桥信息网(CHINAGBNET):覆盖全国,与国内其他专用网络相联接,并与30几个省市自
11、治区,500个中心城市,12000个大型企业,100个重要企业集团相联接的国家公用经济信息通信网。,2013,4因特网的互联原理(1)通信的保证机制TCP/IP协议传输控制协议/交互网络协议(Transmision Control Protocol/Internet Protocol)是保证各种不同类型的计算机网络实现相互通信一套规则或协议是因特网的基础和核心,因特网基础,2013,(2)地址的标识技术IP地址唯一性分为动态和固定两种 动态的:由Internet服务提供商(Internet Service Provider,ISP)提供。固定的:由网管中心提供。形式:四组小于256的十进制表示
12、。如:表示北京邮电大学图书馆 技术部的一台主机。,因特网基础,2013,1984年起采用字符型的IP地址,即域名(DN)域名的地址格式为:主机名 机构名 网络类型 最高域名,因特网基础,2013,常用网络类型代码:com 商业机构 mil 军事部门 edu 教育机构 net 网管组织 gov 政府部门 org 非营利组织 int 国际组织,因特网基础,2013,(3)运作的基本模式:客户机/服务器系统(Client/Server System),服务器:是提供资源的程序和计算机客户机:是使用资源的程序和计算机,因特网基础,2013,电子邮件环球网,因特网的主要服务,2013,1.电子邮件(El
13、ectronicMail)(1)遵循简单邮件传输协议SMTP,采用客户 机/服务器模式。(2)传送信息类型:传送文字,图像,声音(3)传送信件的速度:即时,因特网的主要服务,2013,电子邮件地址组成:用户名主机名.机构名.机构类型.国家代码 图书馆电子邮件地址:,2013,2.环球网(World Wide Web)概念:是通过超文本(Hypertext)方式来进行信息查询的网络工具。1990年诞生于瑞士全欧原子物理研究室。,因特网的主要服务,2013,信息传递方式:,基于超文本传输协议(Hypertext Transfer Protocol)采用超文本和多媒体技术通过关键字在超文本,超媒体信
14、息间建立起网状链接类似于人类联想思维结构,2013,统一资源定位器(URL):也称网址,是信息在网上的地址,用来定位和检索WWW上的文档。由三部分组成,例如http:/=article&do=detail&tid=2507 web服务器域名 文件路径及文件名,2013,Web浏览器的使用:,基本功能:Location(地址)Bookmarks(收藏夹)Toolbar(工具条),2013,Web通用检索工具,1.WWW检索工具的含义及类型广义一种基于环球网()的信息查询系统。包括信息存储、信息管理和信息检索。狭义一种为搜索环球网(WWW)上的网页而设计的检索软件。,2013,按检索功能分:,主题
15、指南/目录(Subject Guides or Directory)按某种分类规则建成,由人工干预,保证了查准率,但查全率较低。如Yahoo!检索引擎(Search Engines)通过Robot、Spider等自动跟踪标引软件搜寻网络资源。它不需要人工干涉,查全率较高,但查准率较低。如AltaVista、Google、Baidu,2013,2013,2013,按检索内容分:,通用检索工具 是综合性的信息检索系统,它往往基于检索词去匹配相关的内容。时常也会因检出内容太泛而无法一一过目。如Yahoo!、Google、AltaVista等。专业检索工具 是专业信息机构根据专业需求,将Internet上资源进行筛选整理、重新组织而形成专业信息检索系统,专业针对性较强。如Medical World Search、Medical Matrix等。,2013,2013,2013,2.工作原理定期运行搜索软件,收集信息。利用索引软件进行自动标引,建立数据库。在Web上建立检索界面,由用户输入检索式。通过检索软件进行检索,给出结果。,Web通用检索工具,2013,问题与思考,你最常使用的网络服务有哪些?它们还有何处可以改进?列出你常用的搜索引擎并分析它们的不同。搜索引擎日常使用中,你有那些好的做法?,请在下周课前完成作业,课堂上提交,文件命名:学号+姓名,