《网上信息搜索》PPT课件.ppt

上传人:牧羊曲112 文档编号:5569105 上传时间:2023-07-29 格式:PPT 页数:75 大小:9.16MB
返回 下载 相关 举报
《网上信息搜索》PPT课件.ppt_第1页
第1页 / 共75页
《网上信息搜索》PPT课件.ppt_第2页
第2页 / 共75页
《网上信息搜索》PPT课件.ppt_第3页
第3页 / 共75页
《网上信息搜索》PPT课件.ppt_第4页
第4页 / 共75页
《网上信息搜索》PPT课件.ppt_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《《网上信息搜索》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《网上信息搜索》PPT课件.ppt(75页珍藏版)》请在三一办公上搜索。

1、多媒体文化基础网上信息搜索,清华大学 计算机科学与技术系,2023/7/29,多媒体文化基础,2,第9章 网上信息搜索,9.1 信息搜索工具9.2 信息搜索方法9.3 网页评估方法9.4 网页搜索方法9.5 图像搜索方法9.6 影视搜索方法9.7 音乐搜索方法9.8 多媒体搜索引擎,2023/7/29,多媒体文化基础,3,概要,网上信息是网上文件所含内容的描述网上信息(web-based information)网上信息搜索是查找多媒体文件信息的过程文字搜索(text search1)搜索文字文件的信息图像搜索(image search)搜索图像文件的信息声音搜索(audio search)搜

2、索声音文件的信息视像搜索(video search)搜索影视文件的信息信息搜索的必备知识搜索工具有哪些搜索工具的特性搜索信息的方法搜索工具的使用,2023/7/29,多媒体文化基础,4,9.1 信息搜索工具(1),两种类型的搜索信息方法主题搜索(subject search)主题是用简明的术语或短语描述信息资源的标题主题搜索是搜索编辑人员(如图书管理员)赋予信息资源的标题,搜索范围限定到描述信息资源的术语或短语关键字搜索(keyword search)关键字是用于概括信息资源核心内容的字词关键字词可出现在标题、摘要和正文的任何地方关键字搜索是搜索包含关键字的信息资源,2023/7/29,多媒体

3、文化基础,5,9.1 信息搜索工具(2),四种类型的信息搜索工具(information search tool)网页目录主题搜索工具网页目录像书前面的目录,列出每一篇、每一章、每一节的标题和相应的页码网页索引关键字搜索工具网页索引像英文书后面的索引1,列出书中所有关键词和每个关键字所在的所有页码专题数据库基本属于关键字搜索工具网页搜索门户主题搜索和关键字搜索相结合的搜索工具,2023/7/29,多媒体文化基础,6,9.1 信息搜索工具(3),1.网页索引索引(index)是由关键字和关联数据组成的列表,说明信息及其存储位置网页索引(Web index)是万维网上的网页或网站信息的列表如果把万

4、维网看成是一本“超大型的书”,那么网页索引就是这本书后面的“索引”网页索引放在“索引数据库”里网页索引包含“所有”网页的关键字和每个关键字所在的“所有”网页地址和简短说明按照网页索引提供的信息,可找到包含这个关键字的所有网页,2023/7/29,多媒体文化基础,7,9.1 信息搜索工具(4),网页索引用搜索引擎创建 搜索引擎的工作原理搜索引擎(search engine)是由网爬虫、索引器、数据库、查询和网页排名等部件组成的程序,2023/7/29,多媒体文化基础,8,9.1 信息搜索工具(5),搜索网页:使用 网爬虫(crawlers)/网蜘蛛(spiders)不停地在网上搜索网页,并将搜索

5、到网页暂时存放到网页库创建索引:通过索引器(indexer)分析网页、抽出词汇、创建索引,并将索引存入索引数据库,以备用户查询接收查询:当用户查询时,把查询请求告诉查询引擎(query engine),将查询结果返回给用户搜索引擎可分成两种类型 独立搜索引擎(individual search engine),简称为搜索引擎,拥有自己的网页索引数据库,如Google、必应和百度元搜索引擎(meta search engine),没有自己的网页索引数据库,2023/7/29,多媒体文化基础,9,9.1 信息搜索工具(6),网页索引的性能 查全率(recall)搜索引擎返回的匹配文档数量占所有相匹

6、配文档总量的比例。例如,总共有100个相匹配的文档,搜索引擎只返回其中的80个文档,则其查全率是80查准率(precision)搜索引擎列出的文档与查询内容相匹配的程度。列出的匹配文档越多,说明查准率越高。例如,搜索引擎列出80个文档,若其中有20个文档包含搜索字词,则其查准率为25查询速度查询速度的衡量比较困难,2023/7/29,多媒体文化基础,10,9.1 信息搜索工具(7),网页索引的特点网页索引是查找网页的最好工具,尤其是查找包含关键字(keyword)、短语(phrase)和引述(quote)的网页网页索引是用搜索引擎创建的,能较及时地对新创建和更新的网页做索引给用户返回的查询结果

7、中,通常有与查询请求不相关或相关性很小的网页虽然创建网页索引的原理相同,但各个公司开发的搜索引擎的性能不同,包括搜索速度、搜索范围、搜索算法和排名算法,呈现给用户的结果也就不同。虽然差别不是很大,但比较明显,2023/7/29,多媒体文化基础,11,9.1 信息搜索工具(8),2.网页目录(Web directory)网页目录主要是由编辑人员按主题人工创建的网页分类目录,不是用网上机器人自动生成的网页分类目录,也称主题目录(subject directory)编辑人员按照某些准则,对网站进行审核,确定是否要编入到目录,并按主题对网页进行分类,然后输入到数据库,以供用户使用主题目录是网页搜索工具

8、,但不是网页索引工具主题目录是图书馆中早已有之的图书资料管理方法如把万维网看成是 一本超大型图书,网页目录就是这本书前面的目录网页目录的编排和布局则不一定像书目录那样千篇一律,2023/7/29,多媒体文化基础,12,9.1 信息搜索工具(9),网页目录的结构 网页目录通常采用分层结构层次越高的主题,覆盖的网页范围越大层次越低的主题,覆盖的网页范围越小最低层的主题就是具体的网页信息,包括网页名称、说明和网址网页目录在网页上呈现的形式基本上都是二维的有的主题(主目录)在窗口的左侧,列表(子目录)在窗口右侧有的主题(主目录)在窗口上部,列表(子目录)在窗口的下部有的主题放在按钮上,而列表(子目录)

9、在下拉菜单上,2023/7/29,多媒体文化基础,13,9.1 信息搜索工具(10),网页目录示例(2010年2月)(http:/),2023/7/29,多媒体文化基础,14,9.1 信息搜索工具(11),网页目录的特点可更有针对性地快速获取某个主题的概貌需要高水平的编辑人员、选编网页时不抱成见信息质量比较高,与查询请求的相关性比较大网页目录结构很清晰,浏览很方便呈现给用户的网页数目比搜索引擎提供的少浏览网页目录时,需要多次点击连接对象才能找到具体的网页信息网页目录更新周期长,而网页地址变动快,2023/7/29,多媒体文化基础,15,9.1 信息搜索工具(12),3.专题数据库 1.数据库是

10、什么数据库(database)由数据库管理系统(DBMS)创建和管理的数据集合,可快速和准确地搜索和获取所需的信息DBMS是数据库和用户之间的接口软件,用于组织、创建、存储、修改、查询、搜索、分类、备份、格式和打印数据库中的数据,维护数据的安全和数据的完整性数据库中的数据以记录(record)形式组织每一个记录包含若干个域(field),每个域都有自己的名称和数据类型1优点是便于搜索、排序、重新组合或其他操作,2023/7/29,多媒体文化基础,16,9.1 信息搜索工具(13),数据库中的记录组成示例,2023/7/29,多媒体文化基础,17,9.1 信息搜索工具(14),2.专题数据库(s

11、pecialized database)也称专业数据库,垂直门户vortal(vertical portal的简写)针对某个题目收集的资料库由各行各业的专家、教授、研究人员、政府机构、商业团体创建,他们对某个特定题目有专门的知识和深入的研究提供的信息和资料极具权威性专题数据库类型公共数据库(public database):包含公共资料,由政府机构和非营利组织管理和维护,通常出现在Web上私有数据库(proprietary database)/商业数据库(business database):包含公共数据库中没有的专业资料,由公司管理和维护,通常需要账户或授权的IP地址才能登录和使用,2023

12、/7/29,多媒体文化基础,18,9.1 信息搜索工具(15),3.专题数据库示例ScienceDirecthttp:/世界著名的学术期刊出版商荷兰Elsevier公司出版的全文数据库收录1995年以来Elsevier出版的1600多种电子期刊,原文以html和pdf格式存储该数据库涵盖20多个学科,包括数学、物理学、化学、天文学、医学、生物化学、生命科学、计算机科学、环境科学、材料科学、社会科学、工程和技术、能源和动力等 既可搜索又可浏览,打印也很方便,2023/7/29,多媒体文化基础,19,9.1 信息搜索工具(16),Web of Science数据库,Web of Science的用

13、户界面(2010-01-26),2023/7/29,多媒体文化基础,20,9.1 信息搜索工具(17),5.网页搜索门户 网页门户(Web portal)企业创建和维护的按主题分类的网页目录向用户提供的服务包括新闻、天气预报、电子邮件、讨论组、在线购物、娱乐站点和与其他站点的链接门户网站(Web portal(s)site)支持“网页门户”的网站它将各种应用系统、数据资源集成到服务机上国内的门户网站:新浪、网易、搜狐、腾讯QQ、Tom、凤凰网、新华网、阿里巴巴、中华网和中国网络电视台等Web网站1都应属于“门户网站”,有大有小,2023/7/29,多媒体文化基础,21,9.1 信息搜索工具(1

14、8),网页搜索门户(Web search portal)网页门户和网页索引相结合的信息搜索工具,如Google Directory http:/MSNhttp:/,http:/Yahoo!Searchhttp:/,Gigablasthttp:/,2023/7/29,多媒体文化基础,22,9.2 信息搜索方法,成功的信息搜索需要两个方面的努力,一个是提高搜索工具的性能,另一个是提高使用搜索工具的技能在提高搜索工具性能方面,科学技术人员已经做了非常出色的工作,而且还在孜孜不倦地继续努力在提高使用搜索工具的水平方面,除了要理解搜索工具的知识外,还要靠自己在实践中不断地摸索、总结和提高,2023/7/

15、29,多媒体文化基础,23,9.2 信息搜索方法(1),信息搜索过程 信息搜索过程可归纳为五个步骤:充分准备、明智决策、细心构思、用好工具和反复查询,信息搜索的概念,2023/7/29,多媒体文化基础,24,9.2 信息搜索方法(2),1.充分准备:信息描述语句描述语句:用关键字词描述要搜索的信息搜索范围:可添加时间、地点或其他条件,使描述语句更接近你的查询意图 2.明智决策:用什么搜索工具浏览主题概貌宜先用网页目录查找特定信息宜先用网页索引查找专业信息宜先用专题数据库,如中国国家图书馆()北京大学图书馆()清华大学图书馆(),2023/7/29,多媒体文化基础,25,9.2 信息搜索方法(3

16、),3.精心构思:查询语句查询语句是由描述性短语由运算符/操作符/标识符和操作对象组成查询语句是表达查询请求/查询条件的方法如选择网页目录(即主题搜索),无需构思查询语句如选择关键字搜索,则需构思查询语句,2023/7/29,多媒体文化基础,26,9.2 信息搜索方法(4),4.巧用域名:限定搜索范围在只用一二个关键字搜索信息时,返回给用户的信息可能远远多于想要的信息限定搜索范围的选项限定域(limit field),其名称叫“域名(field name)”。常见域名,语言域:限定使用的语言,如中文,英文,日文文件格式域:限定文件类型,如.doc,.pdf,.ppt,.xls时间域:限定日期,

17、如年限,时间段网域:限定网站的域名,如.com,.edu,.gov限定出版类型,如图书,期刊,文章摘要不同搜索工具支持的限定域的数目和类型相差较大,2023/7/29,多媒体文化基础,27,9.2 信息搜索方法(5),5.反复推敲:精练查询结果一次搜索就获得满意的查询结果往往做不到查找信息需要用户不断调整查询策略和查询语句,通过多次查询以改善查询结果返回信息太多可用前面介绍的方法,调整查询请求后再搜索返回信息太少可重新选择搜索术语,如选择与关键字词同义的字词,调整查询请求后再搜索,2023/7/29,多媒体文化基础,28,9.2 信息搜索方法(6),搜索引擎数学(search engine m

18、ath)构造查询语句的数学目的是精炼和控制查询语句,以改进搜索结果主要是布尔逻辑查询语句中的字词用运算符连接,连接方法直接输入:在搜索工具的搜索框中,输入搜索字词的同时输入运算符 使用对话框:在搜索工具的对话框中,让用户选择选项,无需直接输入运算符网页索引工具(如Google、必应和百度)对以上两种方法都支持,但笔者感觉使用Google最方便,效果最好,其次是必应,2023/7/29,多媒体文化基础,29,9.2 信息搜索方法(7),1.使用运算符构造查询语句运算符给多个对象施加运算的符号或字符两种运算符布尔运算符:AND(与)、OR(或)、NOT(非)、NEAR(相近)和ADJ(相邻)。算术

19、运算符:加号(+)和减号(-)大多数搜索引擎都使用,2023/7/29,多媒体文化基础,30,布尔运算符和算术运算符的含义及使用示例,9.2 信息搜索方法(8),2023/7/29,多媒体文化基础,31,9.2 信息搜索方法(9),2.使用引号标识特定短语使用双引号标识特定短语是非常有效的方法【例1】在Google的搜索框中,分别输入带双引号的“少壮不努力老大徒伤悲”和不带双引号的少壮不努力老大徒伤悲,查询结果差别很大【例2】在必应搜索框中,分别输入带英文双引号“multimedia literacy”和不带双引号的multimedia literacy,查询结果差别很大3.使用圆括号构造复杂

20、查询语句当两个搜索字词(如W和X)用运算符连接而又想把W和X当作一组看待时,可用圆括号表示【例】如想搜索包含W不包含X,但同时包含Y的网页,查询语句可为(W-X)+Y。读者可分别在Google、必应和百度的搜索框中键入(猫-老鼠)游戏,比较查询结果,2023/7/29,多媒体文化基础,32,9.2 信息搜索方法(10),4.注意关键字的次序把最重要的关键字放在查询条件前面【例】使用Google分别查询“猫和老鼠”与“老鼠和猫”的网页,将得到不同的查询结果 5.使用通配符构造查询语句在查询语句中可使用通配符。通配符有两个问号(?):表示任何其他单个字符星号(*):表示一个或多个字符【例1】查询扫

21、除?盲将返回包含“扫除科盲”和“扫除网盲”的网页信息【例2】查询扫除*盲将返回包含“扫除科盲”、“扫除电脑盲”和“扫除理财盲”的网页信息,2023/7/29,多媒体文化基础,33,9.2 信息搜索方法(11),信息搜索概念图 概念(concept)从事物或事件中抽象出来加以概括得到的一般性想法概念图(concept map)用图形方法表达想法的方法,它包含一个核心思想、若干个相关想法以及它们之间的关系信息搜索概念图(concept map for information searching)用图形方式表达搜索信息的方法,在查找信息过程中,可帮助我们做决策和构思查询语句注意事项不要在第一次查询时

22、就用复杂的查询语句,而是要用最重要的概念或关键字词构造的比较简单的查询语句,根据第一次查询结果,逐渐调整查询策略和查询语句,2023/7/29,多媒体文化基础,34,9.2 信息搜索方法(12),信息搜索概念图,2023/7/29,多媒体文化基础,35,9.3 网页评估方法(1),评估的重要性传统出版物的特点传统出版物包括报纸、杂志和图书等来源比较可靠,质量相对较高。经过反复审查、多次校对后才允许印刷和发行,而且都有名有姓、图书编号(ISBN)、责任编辑、责任校对、出版社、通信地址等至于造假和抄袭等问题,则另当别论网页的创建和传播特点谁都可以写网页,谁都可以发表文章,你看到的网页往往是无名无姓

23、,无年月日,没有出处,其内容是真是假、来源是否可靠、信息是否有用等都是要考虑的问题在利用所获内容之前,搞清楚这些问题非常有必要,而且目前主要还得要靠自己去把握,2023/7/29,多媒体文化基础,36,9.3 网页评估方法(2),网页评估方法 网页评估需要综合分析至少五个方面的信息1.查看网页来源根据网页所在网站的域名,分析网站所属国家或地区,网站类型,目的是查看网站的信誉度网页来源可在浏览器的地址栏(URL)中看到。例如http:/:属美国,商业类,微软在中国的网站http:/:属中国,教育类,教育网站http:/:属美国,教育类,麻省理工学院网站http:/:属美国,政府类,白宫网站网站版

24、权和介绍对分析来源及其可靠性也很重要回答的问题:该网站的信誉度如何?需要该网站提供的内容吗?,2023/7/29,多媒体文化基础,37,9.3 网页评估方法(3),2.查看网页作者查看网页作者可辅助评估网页的真实性网页作者应是负责任的个人、公司、政府机构或其他组织负责任的作者和较有名的网站,通常可找到网页作者的署名,包括所在单位联系方式:电话、地址、电子邮箱(mail to)网页最后修改日期回答的问题:作者对此主题有专门研究吗?,2023/7/29,多媒体文化基础,38,9.3 网页评估方法(4),3.查看网页内容衡量准则因人而异网页内容各种各样,每个人的文化背景和经历不同,对网页内容的看法自

25、然就有差别要尽力做到不抱成见每个人都有偏见,自然倾向于接受支持自己观点的信息,这是常人的特性。如抱偏见阅读网页,就容易上当受骗回答的问题:网页上的论述言之有理吗?信息是客观的还是主观的?信息是片面的还是全面的?,2023/7/29,多媒体文化基础,39,9.3 网页评估方法(5),4.查看类似网页对于同样一件事情、同样一个问题,往往有很多类似的网页许多类似网页的作者是同行,他们的网页可能发表在相同的普通顶级域名(如edu)的网站上同行内的能人很多,多看几个这种作者的网页,对网页内容的理解和评估会更全面,理解更深入,看法更准确“外行”作者的见解可能更客观,对网页内容的评估也很有帮助 回答的问题:

26、还有哪些网页值得参考?,2023/7/29,多媒体文化基础,40,9.3 网页评估方法(6),5.查看网页变动对原理性、基本知识和基本事实的介绍,通常经得起时间考验,网页变动也不大。例如,许多大学的辅助教学网站,几年前创建的网页保留到现在如研究课题的时效性很强,就要查看网页发表的时间,网页修改的时间,利用这些信息可辅助网页的评估。许多网页都没有提供这种信息,但在主页底部的版权信息中,往往有“Copyright 20?”,利用这些信息也可推断网页的创建日期和修改日期回答的问题:网页是什么时候写的?网页内容最近有无变动?参考或引用是否合适?,2023/7/29,多媒体文化基础,41,9.4 网页搜

27、索方法,网页搜索使用网页搜索工具查找包含所需信息的网页的过程网页搜索工具指网页目录、网页索引和网页搜索门户网页目录的操作相对容易,而网页索引的操作相对复杂,2023/7/29,多媒体文化基础,42,9.4 网页搜索方法(1),部分常见网页搜索引擎 1.国内常见网页搜索工具百度(http:/)必应(http:/)谷歌(http:/)搜狗(http:/)搜狐(http:/)网易()新浪(http:/),2023/7/29,多媒体文化基础,43,9.4 网页搜索方法(2),2.国外常见网页搜索工具AOL(),支持中文Ask Jeeves(/),支持中文Duck Duck Go(/)Google(/)

28、,在英文浏览器中使用,支持中文Lycos()Open Directory Project(ODP)(http:/)Yahoo(/),2023/7/29,多媒体文化基础,44,9.4 网页搜索方法(3),一般操作 1.养成阅读帮助文件的习惯网页索引工具都有一些自己定义的使用规则,“帮助”文件是了解使用规则最直接的“老师”。不少用户忽视帮助文件,自认为搜索工具用得很好一般操作示例,2023/7/29,多媒体文化基础,45,9.4 网页搜索方法(4),高级搜索 查找“我国教育域名下计算机文化课程的ppt文件”,2023/7/29,多媒体文化基础,46,9.5 图像搜索方法,图像搜索图像搜索通过图像搜

29、索工具查找所需图像文件的过程图像搜索工具主要是指图像目录和图像索引搜索图像与搜索网页类似目前搜索图像主要是通过描述图像文件的关键字通过描述图像的可视特性来搜索图像的技术还不太成熟,可作为搜索图像的辅助手段,2023/7/29,多媒体文化基础,47,9.5 图像搜索方法(1),图像目录 图像目录是以人工为主创建的图像主题分类目录网站导航或网页搜索门户几乎都有“图片1”、“图片浏览”或“壁纸图片”等图片目录许多图像目录工具还有“搜索”或“检索”功能,但通常局限于搜索当前目录下的图片典型的图片目录都是用分层结构来组织图片,一层表示一个主题,层次越低,主题覆盖的范围越窄,2023/7/29,多媒体文化

30、基础,48,9.5 图像搜索方法(2),百度的图片目录,2023/7/29,多媒体文化基础,49,9.5 图像搜索方法(3),Google的图像目录,2023/7/29,多媒体文化基础,50,9.5 图像搜索方法(4),专题图像数据库 针对某个主题专门收集的图像集合,也称专业图像数据库。例如全球著名的医学图像库The online encyclopedia of medical image,从2010元旦开始成为SpringerImages2图像库的一部分华盛顿州立大学的兽医和动物图像数据库Image Data Base,College of Veterinary Medicine,Washi

31、ngton State University使用关键字查找时,找到的图像在这个图像数据库中,无需访问其他网站,2023/7/29,多媒体文化基础,51,9.5 图像搜索方法(5),医学图像百科全书()专题图像数据库示例(2010年1月27日),2023/7/29,多媒体文化基础,52,9.5 图像搜索方法(6),兽医和动物图像数据库(http:/)专题图像数据库示例(2010年1月27日),2023/7/29,多媒体文化基础,53,9.5 图像搜索方法(7),图像索引方法 1.使用文字编辑图像索引使用描述图像的文字编辑图像索引的学术名称叫做“基于文字的(text-based)图像索引”,其核心

32、思想是用描述图片的文字来编辑图像索引由于网页上的图片通常有图片名称,在图片周围有文字说明,在其相应的HTML文档中,有图片文件的名称、图像存储格式和网址等信息,根据这些信息就可用文字对图片进行标注,如图片的名称、网址和大小,这就是图像文件信息的索引,2023/7/29,多媒体文化基础,54,9.5 图像搜索方法(8),2023/7/29,多媒体文化基础,55,9.5 图像搜索方法(9),2.使用可视特性做索引使用可视特性做图像索引的学术名称叫做“基于内容的图像索引(content-based image indexing)”/根据图像内容编索引可视特性/图像内容指图像的颜色、纹理、形状、对象间

33、的空间关系的统计数据让计算机替我们描述图像内容和自动编索引,需要开发自动识别图像内容的算法基于内容的图像检索(content-based image retrieval,CBIR)实现CBIR的系统叫做“基于内容的图像搜索引擎(content-based image search engine)”,2023/7/29,多媒体文化基础,56,9.5 图像搜索方法(10),图像索引工具 1.部分图像索引工具图像索引工具很多。例如,Google和必应的图像索引对中英文都支持得很好,雅虎、百度和搜狗等搜索引擎都有图像索引的功能Picsearch:Picsearch公司开发的图像搜索引擎,提供图像、影视

34、和音乐搜索服务,2005年首次推出,支持中文 TinEye:Ide Inc公司开发的图像搜索引擎,这个搜索引擎是“逆向图像搜索(TinEye Reverse Image Search Engine1)”。2008年5月开始为用户提供图像搜索服务。搜索图像时不是输入关键字,而是上载图像,目的是查找与上载图像类似的或被修改过的图像,2023/7/29,多媒体文化基础,57,9.5 图像搜索方法(11),Picsearch图像索引界面(,)图像索引工具示例(2010年1月27日),2023/7/29,多媒体文化基础,58,9.5 图像搜索方法(12),(b)TinEye图像索引界面(http:/,2

35、023/7/29,多媒体文化基础,59,9.5 图像搜索方法(13),2.图像索引工具的操作搜索图像的操作与搜索网页的操作类似在使用图像索引工具之前先看帮助文件,因不同图像索引工具支持的搜索引擎数学和限定搜索范围的域名不同,Google图片搜索工具的用法(2010年1月27日),2023/7/29,多媒体文化基础,60,9.5 图像搜索方法(14),查询“兔子”图片必应图片搜索工具的用法(2010年1月27日),2023/7/29,多媒体文化基础,61,9.5 图像搜索方法(15),有关兔子的介绍必应图片搜索工具的用法(2010年1月27日),2023/7/29,多媒体文化基础,62,9.6

36、影视搜索方法(1),影视目录(video directory)1以人工为主创建的主题分类目录影视目录下的文件主要是电影、连续剧和电视节目等网站导航的主页都有“视频”、“影视”或“电视”选项网上影视的目录结构网站导航影视影视网站影视目录影视节目,其中的“网站导航”为影视节目的根目录影视目录通常也有“搜索”功能,但只是搜索网站内部的影视节目搜索影视节目使用关键字词,如影视节目的名称、演员或其他关键字词,2023/7/29,多媒体文化基础,63,9.6 影视搜索方法(2),网站导航-影视(视频)-影视网站目录示例(http:/,2023/7/29,多媒体文化基础,64,9.6 影视搜索方法(3),影

37、视的索引方法 影视索引是影视搜索引擎(vide search engine)创建的索引影视搜索引擎是专门在网上收集影视文件并对其编索引的系统创建影视索引的方法有两种使用文字使用影视的视听特性,2023/7/29,多媒体文化基础,65,9.6 影视搜索方法(4),1.使用文字编辑影视索引影视索引使用文字使用文字编辑影视索引的学术名称,其核心思想是用描述影视文件的文字编辑影视索引影视节目通常都有比较详细的文字说明,包括影视名称、内容简介和演员列表,这些内容都会出现在其相应的HTML文档中。根据这些信息就可用文字对影视进行标注,如节目名称和网址,这样就得到影视节目的索引用描述影视的文字编索引是对整部

38、影视节目的,对其内部镜头1的描述需用影视的视听特性,2023/7/29,多媒体文化基础,66,9.6 影视搜索方法(5),2.使用视听特性做影视索引可视特性影视由连续图像构成,具有空间和时间的可视特性空间可视特性体现在图像的颜色、纹理和形状时间可视特性体现在图像随时间发生的变化【例】球场上的运动员在不停跑动,新闻联播中播音员的嘴和表情在不断变化,电视连续剧中的背景变化比较缓慢可听特性影视或录像通常有对话、解说、音乐和背景等声音,这是听觉系统可感知的信息让配音参与影视索引的基本想法是把声音转换成文字(speech to text),并让文字与播放的画面相对应,2023/7/29,多媒体文化基础,

39、67,9.6 影视搜索方法(6),影视索引工具 著名影视索引工具不计其数Google()MSN()百度(http:/)Yahoo!()1blinkx2:综合性影视搜索工具被认为目前世界上最大和最先进的影视搜索工具,2023/7/29,多媒体文化基础,68,9.6 影视搜索方法(7),blinkx用户界面()(2010年1月27日),2023/7/29,多媒体文化基础,69,9.7 音乐搜索方法(1),音乐搜索通过音乐搜索工具查找所需音乐文件的过程音乐搜索工具音乐目录和音乐索引浏览音乐目录就像浏览网页目录那样容易,搜索音乐与搜索网页没有差别,2023/7/29,多媒体文化基础,70,9.7 音乐

40、搜索方法(2),音乐目录(audio/audio directory)1以人工为主创建的按主题分类的目录网站导航的主页或网页搜索门户都有“音乐”或MP3命名的目录音乐节目的目录结构网站导航/音乐/音乐网站/音乐目录/音乐节目,其中的“网站导航”是音乐节目的根目录,2023/7/29,多媒体文化基础,71,9.7 音乐搜索方法(3),音乐索引(audio/music index)使用文字的索引,文字来自两个方面对音乐文件的说明,这是主要的文字信息通过声音-文字转换软件,从音乐内提取的文字信息,这是辅助的索引信息音乐搜索引擎(audio search engine)搜索和索引音乐的软件,也称音乐搜

41、索工具(audio/music search tool)音乐搜索工具【例】Google、百度、必应、雅虎使用方法与搜索网页相同,目前使用关键字搜索,2023/7/29,多媒体文化基础,72,9.8 多媒体搜索引擎(1),多媒体搜索引擎(multimedia search)多媒体搜索搜索文字、图像、影视和音乐等文件信息的过程多媒体搜索引擎(multimedia search engine)收集、分析和索引多媒体文件、存储索引并为用户提供信息服务的系统。多媒体索引(multimedia index)多媒体搜索引擎生成的索引主要以文字为主,以视听特性为辅用户获得的查询结果是文字、图像、影视和音乐等文

42、件的描述信息和文件所在的网址,2023/7/29,多媒体文化基础,73,9.8 多媒体搜索引擎(2),多媒体搜索引擎示例 Google,必应,百度,blinkxPlayAudioVideo Munax公司开发,公司成立于2007年,总部在瑞典首都斯德哥尔摩PlayAudioVideo自认为是“The Worlds first Multimedia search engine”世界上第一个多媒体搜索引擎使用关键字查询,同时返回包括声音、影视和图像文件的信息,2023/7/29,多媒体文化基础,74,9.8 多媒体搜索引擎(3),PlayAudioVideo的用户界面(2009-07-26)(http:/),多媒体文化基础,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号