《斯坦福大学集成数字图书馆.pptx》由会员分享,可在线阅读,更多相关《斯坦福大学集成数字图书馆.pptx(38页珍藏版)》请在三一办公上搜索。
1、美国数字图书馆首倡计划,斯坦福大学集成数字图书馆,背景,美国将其数字图书馆研究及建设纳入其国家信息基础建设(NII)重要的组成部分。90年代初,NSFDARPANASA都在独立地进行计算机和通讯方面的基础研究,并把数字图书馆看成为新兴的有潜力的内涵广泛的研究领域。它们组成了一些非正式的工作组,不定期会面,并在在1993年秋天有了他们的第一份宣言:数字图书馆研究,DLI的推出就是这些非正式交流和讨论的结果。1993年底,NSFDARPANASA公布了DLI的招标书,对DLI的目标、特色和申请要求等进行了阐述。随后共收到73份研究计划资助申请,从中最终有六份被选中。DLI于1994年九月正式启动,
2、为期四年,共投入2400万美元。每个研究项目每年约为100万美元。,目标,DLI的研究目标在于“极大地推进对以数字形式收藏、存储和组织信息的方法的研究,并使得信息能通过通讯网络友好地进行搜寻(searching)、检索(retrieval)和加工”。,成员,在DLI的研究中,很强调包含研究人员、应用开发人员和用户在内的合作的重要性,它所资助的六个研究项目都是由美国的一个大学主要负责,但参加项目的人员构成来自四个方面:,数字图书馆的用户(如特定的研究团体和信息使用者)商业公司,从而使得数字图书馆系统商业化(如出版商、软件商、股票交易所、设备制造商和通讯公司)公共或私营信息库(如图书馆、数据库、政
3、府或私营信息服务)相关的计算机和其它科学技术研究团体(如学术性团体、超级计算机中心和商业化的试验室),研究领域,信息的获得 电子信息的分类和组织 大量数据、影象和文本信息的查询、筛选和摘要的先进软件的研究 大量影像的快速浏览的可视化和交互技术 对网络协议和标准的研究,从而确保数字图书馆对网络容量、带宽和线路分配的要求 对网络信息资源利用方法、途径的简化 与数字图书馆有关的个人和群体的行为、社会和经济问题的研究,研究项目,加州大学伯克利分校环境电子图书馆:可升级的、智能化和分布式电子图书馆的原型 加州大学圣巴巴拉分校亚历山大项目:图象和空间参考信息综合服务的分布式数字图书馆的初步探索 卡内基梅隆
4、大学(Carnegie Mellon University)信息媒体:集成声音、图象和语言理解技术创建和探索数字视频图书馆 伊利诺大学厄尔巴那分校构建互联空间:为大学工程学科建立数字图书馆的基本架构 密歇根大学:智能信息搜索 斯坦福大学斯坦福综合电子图书馆,下面主要介绍斯坦福大学集成数字图书馆 重点研究信息共享,通讯模式,用户界面和信息查找服务。即建立一个综合性的虚拟图书馆,提供用户对网络信息惊醒统一存取。http:/dbpubs.stanford.edu:8091/diglib/,项目目的,设计和实施数字图书馆中由于信息资源的合作、开发、传播、共享和管理而需要的基础设施和服务。,项目计划,信
5、息检索,斯坦福数字图书馆PalmPilot(手持电脑)基础设施:提供容错、事件日志、内存管理,并通过通信基础设施为 发展迅速的个人数字助理(PDA)在数字图书馆中的应用提供帮助。,超强浏览。超强浏览允许巴掌大小的计算机浏览互联网小如PalmPilot的屏幕,带宽如同便宜的无线电链接要求完全重新考虑用户界面对信息库(例如互联网)的浏览。这个项目开发了浏览的新方法,它使用了多个我们研发的能使浏览方便快捷的支持设施。其中一个是导航使用户的湖览速度可以提高45,另一个提供动态的网站查询和自动根据主题词词条完成查询。另外一项技术是帮助用户在他们的小设备上分析单个网页。这个技术提供语法和结构性的网页摘要以
6、及逐步揭示网页内容的渐进机制。,SDLIP(SimpleDigitalLibraryInteroperability):简单的数字图书馆共用协议。简单的数字图书馆共用协议是一个集中多个不同的信息资源库的协议。它是由斯坦福大学、加州伯克利分校、加州圣巴普拉、圣地亚哥超级计算机中心和加利福尼亚数字图书馆项目联合开发的。用户通过SDLIP协议来请求查询资源库查询的结果同步返回,或是文件可利用的话由服务器直接传送给用户。这样就可以构建基于HITP或CORBA的传输。事实上,任何一个查询服务都可以同时通过这两种传输方式来执行。,问题翻译器。帮助用户查找支持不同查询语言的各类信息服务。这种方法允许用户自始
7、至终使用统一的语言编制布尔逻辑查询,井把它们按照句法和功能转化成本来的形式。,价值过滤(Value filter)。价值过滤解决了搜索引擎超载以及搜索不到多媒体网页上的要素的问题。它是根据“文件价值”而不仅仅是根据“查询,文本”的相似性来搜索和过滤文件的。它通过有价值的信息来提高用户与信息之间的互动。,网页库(Webbase)。网贝库项目探索太量的同页怎样能被高效地收集、存贮、检索和开发利用。斯坦福大学建立了巧妙的智能搜索器(Smart Crawlers)并建立了可存贮网上获取网页的存贮系统。网页库是研究人员建立的独特的入网索引工具。研究人员能够以非常高的速率通过系统为特征分析程序提供相应的网
8、页,针对这些计算机化了的网页特征,网页库就会建立专门的索引,这些索引随后将被用来查询。,网页聚合(web clustering)。在同页相关的一种与雅虎或是开放目录相似的方式,把网页编组分入有关各类。然而,这两个目录没有使用任何自动化技术,而是完全由人来编辑、维护。对于整个网来说,手工技术是不可升级的,尽管在网络(http:wwwinktomi comwebmap)上有一万亿个网页(雅虎和开放目录在他们各自的体系内各有不到200亿个urls地址)。由于网页的庞大规模和超链接的性质传统的IR方法在网络的上下文链接中是不恰当的。斯坦福大学最近开发了允许在高维度空间中进行相似性查询的技术,特别是如同
9、精确度要求被提升了一样,即使有了更新的技术信息资源的需求也会很大。在网页聚类和其他揭示网页内容的操作方面,高度计算机化的资源将是非常有价值的财产。这些资源将允许我们探索和评估更多可利用的聚类选择,如同我们开发最有效的技术。,信息管理,信息管理项目致力解决现实中信息管理的一些问题,包括:长期信息组织、分布式环境中的信息付费、版权侵权管理等。,档案式存贮。数字国书馆存贮库由相互独立但又相互合作的站点组成。每个站点管理着一些数字化资源,并对其他站点(已被定义了的)提供服务。,与叁考书目相关的服务(InterBib)。InterBib是用来维护书目信息的工具。作为统一标准的、可查询的书目仓库,它能以许
10、多不同的格式进行读写,PDA图片浏览器。随着个人数字助理(PDAs)的计算能力和存贮容量的增长,图片浏览器作为这些设备的可行和重要的应用而出现了,斯坦福大学研发了两种浏览器来支持PDAs中大量图片的收集。一种浏览器使用了一种传统的、文件夹式的布局:使用用户手动创建的组织结构或是系统自动生成的结构。另一种浏览器使用了基于垂直、可放大的时间轴的新颖接口。这个时间轴浏览器不要求用户组织它们的图片,反而是单纯依靠系统自动生成的结构。系统创建了一个用户图片的等级结构,它是基于用户图片的申请时间来聚类辨认可能相关的图片子集。在用户实验中,根据每位用户的图片收集来比较用户通过浏览器查找和浏览的结果;图片收集
11、规模在5003 000之间。结果表明,时间轴测览器与传统浏览器在执行查找和浏览工作方面至少是同样有效的,而传统浏览器要求用户手工组织它们的图片。,信息共享(Sharing information),信息共享工具包括:文件解释、用户界面和为视觉障碍者提供音像录入。,Diet ORB。Diet ORB是高度缩小了的CORBA的掌上设备。斯坦福大学为个人数字助理的掌上电脑开发了一种CORBA ORB。ORB目前只允许利用个人数字助理来进行全方位的服务。,数字钱包。数字钱包的研究工作集中于实现电子支付场所的互通。简单的数字钱包结构包括:支付、交换、充值和其它操作。数字钱包是一个允许用户使用金融设施(如信用卡、数字货币)来进行电子支付的一个软件的组成部分,它省略了执行用以支付的付款协议的细节。,移动安全(M0bile Security)。图书馆的移动接人增加了经挤基础设施的复杂性。为了达到移动接入的目的,用户的数字式证件可以由几台机器共享(家用电脑、笔记本和个人数字助理)相应地,所有机器在图书馆的相互作用中必须保持其一致性。例如,已在家用电脑上花费了的数字货币不应该再在笔记本上又花费一次.,Projects,Documents,People,Testbed,