《网络信息资源个性化服务及成功案例.ppt》由会员分享,可在线阅读,更多相关《网络信息资源个性化服务及成功案例.ppt(81页珍藏版)》请在三一办公上搜索。
1、网络信息资源的个性化服务及成功案例,目录,1.1网络信息资源开展个性化服务的必要性,2006.122010.6中国网站规模变化,个性化服务,1.2 网络信息资源个性化服务定义,个性化信息服务 就是基于信息用户的信息使用行为、习惯、偏好和特点,向用户提供满足其各种个性化需求的一种服务.,个性化信息:是反映个性化特征的一切信息,同时还包括个体特定的信息需求组合。,1.2 网络信息资源个性化服务的特点,主动性,用户提出现有的需求提供用户所需要的信息研究用户个性、习惯、知识结构、信息需求预测和搜集用户可能感兴趣的信息提供信息、激活用户的潜在信息需求,1.2 网络信息资源个性化服务的特点,服务方式的针对
2、性服务内容的针对性,针对性,1.2 网络信息资源个性化服务的特点,互动性,互动性,最大程度地了解用户对信息的明确需求与潜在需求、当前需求与长远需求个性化信息服务适应动态变化的个性需求,1.2 网络信息资源个性化服务的特点,针对性,高效性,用户满意是个性化信息服务的出发点和归宿点,面向用户的个性化信息服务提高了信息需求的满足度,速度更快、容量更大。查全率和查准率得到很大的提高,个性化信息服务对网络信息资源进行自动化处理,使用户的需求能够得到高效、准确、及时的反馈。,2 网络信息资源个性化服务方式,分类定制是指信息用户可以按照自己的目的和需求,在某一特定系统功能服务形式中,自己设定信息的资源类型、
3、表现形式、选择特定的系统服务功能等。通过分类定制,用户每次登录网站时,只要键入自己的用户名和密码,服务器根据用户信息数据库将查询结果主动推送给信息用户,并利用动态网页生成用户定制的动态页面。RSS订阅,2 网络信息资源个性化服务方式,智能代理技术很好的解决了用户无法贴切、完全地表达出自己的爱好、兴趣和需求的问题。它是一种能够完成委托任务的智能计算机系统,能模仿人的行为执行一定的任务,不需要或很少需要用户的干预和指导。智能化代理通过跟踪用户在信息空间中的活动,自动捕捉用户的兴趣、爱好,主动搜索可能引起用户兴趣的信息并提供给用户。,2 网络信息资源个性化服务方式,协调过滤服务主要是把用户的偏好与其
4、他用户的偏好进行比较,建立偏好群体的描述,然后假定这个特定用户与这个同偏好群体的需求相同,对其需求内容进行推荐。,2 网络信息资源个性化服务方式,垂直门户是和综合性及水平门户相对应的概念,它通过汇聚网上某一特定专题信息资源,并对其进行挖掘和加工,以满足用户基于专业的深入的信息需求。,系统帮助用户修改检索提问式,如当用户输入一个检索词,系统就会将检索词与内部词表中相关词进行比较,并在界面上显示各种与该词有逻辑关联性的词组,以供用户选择。通过帮助用户选择更接近自己检索目标的检索词来提高信息查询效率。,2 网络信息资源个性化服务方式,信息呼叫中心主要利用电话、传真等方式来服务客户,处理简单的呼叫流程
5、。信息呼叫中心引入客户关系管理,建立客户数据库,对信息进行分析、处理、采集和挖掘,使呼叫中心可以得到每个客户的详细信息,由此为客户提供一对一的个性化服务。,2 网络信息资源个性化服务方式,3 网络信息资源个性化服务实现过程,1.用户描述文件的表达与更新,2.资源描述文件的表达,3.个性化推荐,4.个性化服务体系结构,3.1用户描述文件的表达与更新,收集用户描述文件前应考虑问题:有没有现成的标准?收集什么数据?收集的数据用于什么目的?如何收集数据?根据什么信息源来收集?收集的数据如何组织?用户信息能否自适应地更新?,调查显示80%的用户愿意向Web站点提供自己的姓名、性别、年龄、教育背景和兴趣,
6、但大多数用户不愿意提供私有、敏感的信息,比如个人收入和信用卡号等28%的用户愿意Web站点向其他Web站点共享自己的信息,3.1用户描述文件的表达与更新,可以表示为用户浏览模式或访问模式,可以表示为加权矢量模型、类型层次结构模型、加权语义网模型、书签和目录结构等,3.1用户描述文件的表达与更新,用户注册基本信息,系统隐式收集用户信息,用户描述文件一,系统自适应修改(显示跟踪、隐式跟踪),用户修改,用户描述文件,3.1用户描述文件的表达与更新,系统可以要求用户反馈自己对推荐资源的喜好程度。一般情况下,这种做法很难收到实效,因为很少有用户向系统主动表达自己的喜好。行为跟踪.用户行为可以表现为查询、
7、浏览页面和文章、标记书签、反馈信息、点击鼠标、拖动滚动条、前进、后退等等。文献的研究表明,用户查询、访问页面、标记书签能有效揭示用户的兴趣.日志挖掘,利用Web日志可以获得页面的点击次数、页面停留时间和页面访问顺序等信息。通过分析Web日志可以获得相关页面、相似用户群体和用户访问模式等信息,3.1用户描述文件的表达与更新,将用维变量构建数据立方体(URL、资源类型、大小、时间),首先清除日志中无关的信息,将有效数据存放到数据库中,进行在线分析处理,通过对数据立方体的切块和切片,分析用户在不同域的分布情况,分析用户对资源的使用情况等等.,利用各种数据挖掘方法来预测、分类和发现有意义的关系,3.2
8、资源文件的表达,基于内容的方法是从资源本身抽取信息来表示资源,使用最广泛的方法是用加权关键词矢量.对文档来说,关键的问题是特征选取,特征选取要达到两个目标:一是选取最好的词;二是选取的词最少.要抽取特征词条,需要对文档进行词的切分,在切分的同时,利用停用词列表(stop word)从文档特征集中除去停用词,在完成词切分后,接着除去文档集中出现次数过少和过多的词.经过这些处理后,特征数目一般还很大,还需对特征进行进一步的选取,以降低特征的维数.在完成文档特征的选取后,还得计算每个特征的权值,使用最广泛的是TFIDF方法,对某一特征,TF(term frequency)表示该特征在文档中出现的次数
9、,IDF(inverse document frequency)表示log(所有文档数/包含该特征的文档数).矢量模型的代价是比较大的,有时为了加快处理速度,可以只考虑TF一项,3.2资源文件的表达,基于分类的方法是利用类别来表示资源,对文档资源进行分类有利于将文档推荐给对该类文档感兴趣的用户.文本分类方法有多种,比如:朴素贝叶斯(Nae-Bayes),k最近邻方法(KNN)和支持向量机(SVM)等。资源的类别可以预先定义,也可以利用聚类技术自动产生。许多研究表明:聚类的精度非常依赖于文档的数量,而且由自动聚类产生的类型可能对用户来说是毫无意义的,因此可以先使用手工选定的类型来分类文档,在没有
10、对应的候选类型或需要进一步划分某类型时,才使用聚类产生的类型。,3.3 个性化推荐,规则可以由用户定制,也可以利用基于关联规则的挖掘技术来发现,利用规则来推荐信息依赖于规则的质量和数量,基于规则的技术其缺点是随着规则的数量增多,系统将变得越来越难以管理.一个规则本质上是一个If-Then语句。为了利用规则来推荐资源,用户描述文件和资源描述文件需用相同的关键词集合来进行描述.,基于内容过滤的技术是通过比较资源与用户描述文件来推荐资源,它的关键问题是相似度计算,对于矢量空间模型来说,通常采用的方法是余弦度量。如果用户的描述文件没有正确描述用户的兴趣和行为,那么该方法推荐的数据可能和用户真正的兴趣根
11、本不相关。优点:是简单、有效缺点:难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。,3.3 个性化推荐,3.3 个性化推荐,3.4 个性化服务体系结构,基于服务器端,优点是可以避免用户描述文件的传输,除了支持基于内容的过滤,还可以支持协作过滤缺点是用户描述文件不能在不同的Web应用之间共享Syskill,Letizia,GroupLens,基于客户端,优点是用户描述文件可以在不同的应用之间共享缺点是只能进行基于内容的过滤,基于代理服务器端,优点是不仅可以支持基于内容的过滤和协作过滤,还支持用户描述文件在不同Web应用之间的共享缺点是可能需要传
12、输用户描述文件.,3.4 个性化服务体系结构,案例一 个性化服务系统 ILOG,案例二 个性化服务系统 Personal WebWatcher,案例三 个性化服务系统 GroupLens,案例四,第一,信息量大,需要对海量信息进行搜索、存储和智能管理。文字信息,从1948年以来新华社播发的所有中文电讯稿3000余万篇,每天新增各种精选稿件10000多篇。200多万张图片涉及国内外政治、经济、文化、体育、教育及风土人情等,而且每日增加1600多张。国内外多个领域,集新闻性与艺术性于一体的图表近万张,每天递增最新的国内国际图表新闻10多张。音、视频信息近万小时。第二,信息形式多,需要提供统一、跨媒
13、体检索。不但包括文字、图片、图表和视频等多种形式的信息资源,而且涵盖了中文、英文、法文、西文、俄文等10多种语言信息资源。第三,服务人群多,需提供个性化服务。新华社多媒体数据库搜索引擎不仅面向内部用户,还面向许多类型外部用户,例如为媒体用户提供大量丰富、前沿、精彩的各类新闻,作为编写稿件的权威参考等。,新华社多媒体数据库特点:,案例五:QQ空间的RSS订阅,方式一:直接输入订阅网址,方式二:通过推荐订阅,方式四:通过好友推荐,方式三:通过热文排行,案例五:QQ空间的RSS订阅,案例六:,Page 45,数字图书馆个性化信息服务,数字图书馆拥有海量的信息,而用户要在如此海量的信息中挖掘出有用的或
14、自己感兴趣的资料非常困难。因此,用户获得信息的主要障碍已转变为选择上的障碍。这种用户需求的转变催生了个性化信息服务的提出。,Page 46,国内外数字图书馆个性化信息服务现状,Page 47,1 数字图书馆个性化信息服务,1.1个性化内容定制服务,个性化内容定制服务主要指用户根据自己的需求和目的,向某一特定的系统提交自己的检索界面、偏好资源、系统服务等信息。它通过获取用户个性化信息,为用户提供更为准确满意的信息服务,因而成为了数字图书馆个性化信息服务的最主要方式。,Page 48,1.1.1 个性化内容定制服务范例,Page 49,1.1.2 个性化内容定制服务范例(深圳图书馆),深圳图书馆的
15、ILAS系统,Page 50,1.2 个性化信息推送服务,推送技术通过自动传送信息给用户,来减少用于网络上搜索的时间。它根据用户的兴趣来搜索、过滤信息,并将其定期推给用户,帮助用户高效率地发掘有价值的信息。,Page 51,1.2.1 最新资料快报,通过推送技术开展最新资料快报服务,也就是信息服务机构在动态收集用户信息行为或用户定制基础上,建立用户信息需求模型,及时将符合用户兴趣的最新资料推送给用户。,Page 52,1.2.1 最新资料快报(UnCover数据库),Page 53,1.2.2 信息定题,信息定题服务是利用网络推送技术,信息服务机构可为特约信息需求用户群体长期或定期推送定向式、
16、跟踪式的专题信息服务。,Page 54,1.2.3 智能化推荐,智能化推荐服务不仅能根据用户的特征提供具有针对性的信息,还能通过对用户专业特征、研究兴趣的智能分析而主动向用户推荐其可能需要的信息。,Page 55,1.2.3 智能化推荐范例(中国人民大学图书馆),Page 56,1.2.4 个性化信息推送服务的方式,Page 57,1.3 个性化信息咨询服务,个性化信息咨询是一种以人力资源为媒介、以因特网为基础而提供的信息服务。咨询的方式可通过提供多层次的咨询服务接口,实现用户与虚拟咨询员的在线或离线讨论。,Page 58,1.3.1 个性化信息咨询服务范例(联合参考咨询网),Page 59,
17、1.3.1 个性化信息咨询服务范例(联合参考咨询网),Page 60,1.3.1 个性化信息咨询服务范例(联合参考咨询网),Page 61,1.3.2 个性化信息咨询服务范例(网上联合知识导航站),Page 62,1.3.3 个性化信息咨询服务范例(Ask a Librarian),Page 63,1.4 学科服务,学科馆员是指图书馆设专人与某一个院系或学科专业作为对口单位建立联系,在院系、学科专业与图书馆之间架起一座桥梁,相互沟通,为用户主动地有针对性地收集、提供文献信息服务。,学科导航站是利用数据库系统结合超文本技术,对因特网上与某一学科相关的国内外科研状况、电子出版物、学术机构组织、学者
18、个人站点、网络数据库、专利标准、科技成果以及专业搜索引擎等信息资源节点加以集中、分类、整理,按照方便用户利用的原则,以主题树的形式揭示资源的分布情况,同时提供关键词检索途径。,Page 64,1.4 学科服务范例(清华大学图书馆),Page 65,1.4 学科服务范例(清华大学图书馆),Page 66,2 经典案例(中国科学院国家科学图书馆),Page 67,2 经典案例(中国科学院国家科学图书馆),中国科学院国家图书馆个性化信息服务项目,Page 68,2.1 问图书馆员,Page 69,2.1 问图书馆员,Page 70,2.2 论文收引检索及评价,国科图为用户在申报院士、国家自然科学基金
19、、职称评定等方面提供机构或个人的论文收录引用检索服务。除查询SCI、EI、ISTP三大检索数据库外,还可查询 INSPEC(SA)、CA、MEDLINE、BP(BA)、MATHSCI、GEOREF等国际著名检索数据库。根据检索结果,为用户提供客观、准确、权威的论文收录引用检索证明。,Page 71,2.3 定题、专题信息服务,Page 72,2.4 科技查新,Page 73,2.5 我的图书馆,Page 74,2.6 网络信息资源导航,Page 75,2.6 网络信息资源导航,Page 76,2.6 网络信息资源导航,Page 77,2.6 网络信息资源导航,Page 78,2.6 网络信息资源导航,Page 79,2.7 学科馆员服务,Page 80,2.8 科技新闻聚合服务,谢 谢 大 家!,