第5章 数字媒资的编目与检索ppt课件.ppt

上传人:牧羊曲112 文档编号:1428555 上传时间:2022-11-23 格式:PPT 页数:84 大小:5.99MB
返回 下载 相关 举报
第5章 数字媒资的编目与检索ppt课件.ppt_第1页
第1页 / 共84页
第5章 数字媒资的编目与检索ppt课件.ppt_第2页
第2页 / 共84页
第5章 数字媒资的编目与检索ppt课件.ppt_第3页
第3页 / 共84页
第5章 数字媒资的编目与检索ppt课件.ppt_第4页
第4页 / 共84页
第5章 数字媒资的编目与检索ppt课件.ppt_第5页
第5页 / 共84页
点击查看更多>>
资源描述

《第5章 数字媒资的编目与检索ppt课件.ppt》由会员分享,可在线阅读,更多相关《第5章 数字媒资的编目与检索ppt课件.ppt(84页珍藏版)》请在三一办公上搜索。

1、第5章 数媒资产的编目与检索,刘士军,数字媒体资产管理,2,本章内容,5.1 数字媒体资产的编目技术5.2 数字媒体资产的检索技术,数字媒体资产管理,3,1.编目技术,所谓编目就是对信息资源的形式及内容特征进行分析、选择和记录,然后再将这些描述信息按照一定的规则有序化地组织起来数字媒体资产的编目是对音、视频对象整理和提炼的过程,将其中有价值的画面和资料的相关信息整理成为独立的文件,便于检索和再利用编目是数字媒体资产应用的基础和关键,各类音、视频节目和素材资料的入库必须经过科学严格的编目,否则对于海量存储系统来说,其后果可能是永远也找不到该资料,数字媒体资产管理,4,传统的卡片目录,S 种植优良

2、新品种/李登春等主编.北京32 气象出版社,1992.084015 298页;7-5029-0961-3 (平) 5.50元.92303030-31(2) ,数字媒体资产管理,5,国际联机检索,Dialog OpenAccess美国DIALOG系统是世界上最早和最大的专业情报检索系统,也是我国科技界广泛使 用的系统。该公司自1972年起,开始为用户提供服务工作系统拥有600多个数据库。其数据库类型主要有四种:即文献型、数值型、名录字典型、全文型。涉及多个语种,收录的信息涉及的专业范围广泛CALIS联合目录中国高等教育文献保障系统(China Academic Library & Informa

3、tion System,简称CALIS联机合作编目始于2000年3月,数字媒体资产管理,6,CALIS联合编目系统例子,数字媒体资产管理,7,数字媒体资产管理,8,编目标准,目前一般类资料编目中可借鉴的标准主要有UNIMARC标准和CNMARC标准MARC就是机读目录,即Machine-Readable Catalogue,称机器可读目录,是计算机编目的产品UNIMARC ( Universal Machine-Readablee Catalogue,通用机读目录)于1976年在USMARC的基础上由国际图书馆联合会制定,目的是能够适应不同文种和文献类型间数据交换的需要CNMARC我国依据UN

4、IMARC制定的中国机读目录格式,主要用于国内图书情报部门和其他国家书目机构之间的信息交换与检索,数字媒体资产管理,9,机读目录MARC编目,MARC编目是通过编制目录来控制文献的存在状况及存在特征,对文献信息进行整序和控制,以达到利用馆藏资源、交流书目和资源共享的目的MARC编目是使文献有序化,包括对文献信息的著录、标引和组织。它是图书馆的基础工作,是图书馆读者服务工作得以顺利开展的根本保证MARC数据就是元数据。是详细的、严谨的、专业性要求高的一种元数据,数字媒体资产管理,10,MARC编目的历史,1965年美国国会图书馆首先研制;1966年9月生产出试验性磁带MARCI式;1967年试制

5、出MARCII式;1969年正式向该国图书馆订购馆发行MARCII式英文图书磁带;1971年成为美国国家标准;1973年其格式成为国际标准(ISO2709),数字媒体资产管理,11,UNIMARC,国际机读目录,1972年由IFLA推出。随后产生了英国 UKMARC;日本 JMARC;中国 CNMARC,数字媒体资产管理,12,CNMARC中国机读目录通讯格式,1979年,北京图书馆、北京大学图书馆、清华大学图书馆、中国科学院图书馆等共同引进并研究了美国国会图书馆的MARC磁带,成立了北京地区机读目录研制协作组,于1992年出版1995年正式成为文化行业标准,数字媒体资产管理,13,Z39.5

6、0信息检索协议,信息检索协议ANSI/NISO Z39.50ISO 23950MARC数据的交换和共享通过Z39.50协议实现Z39.50 维护管理机构 美国国会图书馆 http:/lcweb.loc.gov/z3950/agency/,数字媒体资产管理,14,Z39.50原理,Z39.50的服务和机制11种机制与相应服务、服务类型、启动方式Z39.50 是客户机、服务器模式但称之为源端( Origin)与目的端 (Target),数字媒体资产管理,15,我国广播电视音像资料编目规范,音频媒体资料有其自身的特殊属性,广电总局于2004年10月13日发布了广播电影电视行业标准广播电视音像资料编目

7、规范第一部分:电视资料(GY/T 202. 1 -2004)该标准提出的编目项目对广播电视节目采编、制作、存储、交换、播出、接收等各个环信息的规范化收集整理起到指导作用,同时方便海量的音像、文字和图片息资料的再利用我国编目规范中使用的元数据标准为都柏林核心( Doulin Core,DC)元数据集,数字媒体资产管理,16,我国广播电视音像资料编目规范,国家广电总局的编目规范规定,视音频资料的元数据总体上分为四个层次,从上到下分别为节目层、片段层、场景层和镜头层各层次分别包含相应的元素类,在元素类下面是各层对象的具体编目元数据项对视音频资料编目时,应从节目层开始著录,片断层、场景层、镜头层著录可

8、以根据实际需要灵活选择,视音频资料元数据的层次、结构,数字媒体资产管理,17,与编目相关的术语和定义,著录、标引著录、标引是指对视音频资料的内容和形式特征进行分析、归纳和记录的过程著录项著录项是用以揭示视音频资料内容和形式特征的记录项目元数据元数据是用于描述数据的数据,指对视音频资料的描述信息素材素材是指具有使用价值的、可用于制作节目的视音频资料,数字媒体资产管理,18,与编目相关的术语和定义,节目节目是指具有独立主题意义的、已经制作完成的完整的视音频资料片段片段是节目或素材中一段连续的视音频资料,由个以上相互关联的场景构成场景场景是指节目或素材中背景或场景不变的一段连续视音频部分,由时间或空

9、间上相关的一个或多个镜头组成镜头镜头指同一摄像机一次摄录的连续画面,数字媒体资产管理,19,编目系统的业务流程,通过一次编目完成从导人的数据或者EDL表中提取相关信息。二次编目对一次编目后的信息进行加工、处理,对素材进行分类、增加主题词、详细说明等;正常编目工作完成之后,提供对已编目资料进行多次编目的功能,丰富并完善编目的信息,数字媒体资产管理,20,编目系统的描述,编目系统的基本原则高效性原则易用性原则开放性原则高可靠性原则,数字媒体资产管理,21,编目系统的描述,编目系统应具备的功能(1)编目系统要符合编目标准,建立节目、片段、场景、镜头具有层次关系的视音频元数据结构(2)编目系统要能够浏

10、览低码流的视音频数据对象,同时可以方便快速地浏览和帧精度定位(3)编目系统要能够对关键帧进行浏览和编辑,并可以实现自动或手动进行节目或节目片段的关键帧分析和提取(4)编目系统可以采用各种灵活的字段结构以及编目输入界面,能够灵活方便的处理各种复杂编目元数据,如受控词处理、重复字段处理、绑定关系处理、分类树处理等,数字媒体资产管理,22,编目系统的描述,编目系统应具备的功能(5)编目系统应支持工作流程的管理、运行和配置,能够实现多结点、多用户的协调流水线方式的编目生产,以提高编目效率(6)在整个编目流水线上,应具备审核机制,并可以对任何未能通过审核的编目元数据建立返工机制(7)编目管理要能够配置各

11、种编目参数,包括流程的配置,同时能够提供对不同流程的编目功能定义以及功能权限的限制(8)编目管理要能够方便地对整个或单个的编目流程进行数据统计和分析,对编目流程、在编条目进行工作量统计计算,以便于管理人员进行工作量统计和流程管理。,数字媒体资产管理,23,编目系统的描述,编目工作站编目工作站的客户端软件,主要用于生成对编目数据库的初级新闻资料编目文件进行详细编目处理,建立稿件关联,并将生成的编目数据上载到编目数据库服务器中,由它完成数据入库的工作,数字媒体资产管理,24,编目系统的描述,编目数据库服务器编目数据库服务器主要用于创建和维护编目数据库和用户身份数据库建立一个结构严谨、数据完整的编目

12、据库对媒体资产管理的后期运行非常重要通常系统构建编目数据库结构时应采用分层结构,采用挑选编目标准字段子集,并过字段映射的方式建立自己的编目数据库结构,数字媒体资产管理,25,编目工作方式,媒资系统数据编目必须同时支持自动和手动两种方式自动方式主要用于基本编目数据的提取。如关键帧的提取可在采集时,利用软件画面比较技术,实时或后台自动提取切换镜头转换帧,见图所示,数字媒体资产管理,26,编目工作方式,媒资系统数据编目必须同时支持自动和手动两种方式还可以通过422协议,读取磁带上的U bit或IC芯片信息,实时或后台捕获画面获取转换帧自动编目的另一个应用是自动继承业务系统中产生的元数据,如素材的压缩

13、格式、时码、人员信息等此外,编目系统还要支持通过浏览高或低码流数据,手动选取关键帧,或按时间间隔生成序列关键帧编目的内容有些是非常简单的物理特征,而有些则需要编目人员具有高度的专业知识才能完成标引;用户可以根据自身的需要进行多层次编目引入编目签章和审核签章的概念,用于控制编目流程与编目质量,数字媒体资产管理,27,2.数字媒体资产的检索技术,检索是系统的窗口,是数字资产再利用的关键,随着数字媒体资产内容的日益益积累,如何在海量视音频资料中快速检索出所需要的内容就显得至关重要传统的基于文本信息(即关键词)的检索方法是建构于关系型数据库基础之上的,是结构化的方法,因为其述能力有限、主观性强、手工标

14、注等原因,已经不能满足海量数字媒体资产检索的需求目前基于内容的视频分析和检索技术成为应用的热点,数字媒体资产管理,28,检索系统的流程,通过浏览器直接进入检索页面输入检索条件或节目信息,查询浏览库存节目数据检索命中结果可立即浏览低码率视音频信息,并可察看关键帧信息满足需要的节目可提交下载申请,或设置入点、出点信息后提交该片段下载申请,数字媒体资产管理,29,检索系统的数据流程,(1)发出检索指令(2)传递给应用服务器解析(3)查询数据库检索(4)传递回WEB服务器(5)WEB服务器传递给用户,(6)查看流媒体数据指令给应用服务器(7)URL文件定位给流媒体服务器(8)从媒资在线存储区找到媒体文

15、件(9)通过RTP/UDP将流媒体文件数据传递给用户端,数字媒体资产管理,30,检索系统的功能要求,1快速整合检索能力2支持混合检索并提供友好的查询界面3向用户提供多种用途的检索服务适应网络化、智能化和个性化的检索方式是视音频内容检索实现的目标,数字媒体资产管理,31,检索方式,1客户端检索软件与WEB检索方式采用检索客户端软件的优势在于部分软件功能较易实现,对于诸如访问权限、检索计费的处理较为容易;检索界面的专用性很强等对于网络规模较大,甚至是广域网环境,则通常需要采用WEB检索方式,以降低客户端检索软件的安装和维护成本另外,可以在存储管理系统中引入电子商务的理念,同时加入检索计费、会员管理

16、、超市下载、远程编辑等,为以后系统的扩展打下良好的基础,数字媒体资产管理,32,检索方式,2先控词检索方式检索系统通常采用自然语言、先控语言以及后控词表等几种方式进行检索控制所谓“先控”是指在输入标引阶段就对自然语言语词先行控制,包括:同义词、准同义词、同形异义、一词多义等,数字媒体资产管理,33,检索方式,先控方式相对自然语言具备以下优点:1)促使主题表达的一致性,能有效防止同一主题资料的分散2)减少主题表达的含糊和失真,能有效防止不同主题资料的混同3)有助于进行全面广泛的检索,能较好的满足扩检、缩检和改变检索范围的要求4)减轻检索者设想同一检索课题所有相关检索词的负担,大大加快检输出速度但

17、也存在下列缺陷1)先控方式专指度普遍不足2)编目标引负担较重,资料加工处理速度慢、费用高3)先控语言过于专业,易用性较差4)词表、类表的编制及维护难度很大,费用较高5)对新生事物、新概念反应迟钝,控制滞后,甚至“失控”6)检索系统将自然语言语词转换成词表或类表中的规范词难度较大,数字媒体资产管理,34,检索方式,3自然语言检索方式自然语言是人们日常用于交流的语言,其“不受控制”的特点产生以下优点:1)表达文献主题和情报需要可以达到完全专指2)是人们熟悉的、习惯的语言,易用性好3)不依附于词表数据库,具有良好的兼容性且标引成果可以共享4)文献编目标引负担较轻,输入速度快且费用较低5)自然语言可以

18、方便、及时地反映新概念、新术语和新事物,不会滞后或失控目前的媒体资产管理系统大多采用自然语言的编目检索方式,但是也存在一些自身难以克服的缺陷:1)全面检索某一主题难度较大2)难免产生检索噪音,影响检准率3)扩检、缩检和改变检索范围较困难4)检索者负担较重,检索输出速度慢、效率低,数字媒体资产管理,35,自然语言检索方式,由百度技术支持的ChinaRen“孙悟空”搜索引擎将帮助您如愿以偿,使网站对您的信息查寻要求有问必答。智能化的“孙悟空”搜索引擎具有独特的解析软件,用户即使输入一个问句搜索引擎也能够清晰地分析出问话里的关键词,而查找到相应的能够回答问题的网站。因此,使用“孙悟空”搜索引擎在Ch

19、inaRen网站上搜索时,您可以用自己习惯的语言提出问题,如“谁的个人主页最酷?”,“未来十年什么行业最热门?”,“哪里的手机价钱最便宜?”,搜索引擎前端的智能分析系统将自动对您问题中的关键词进行检索,然后搜索到您需要的内容。,数字媒体资产管理,36,检索方式,4后控词表检索方式“后控”是指在系统输入阶段不进行控制,而在系统输出阶段进行一定的控制,它把“控制”不放在标引阶段,而放在检索阶段。后控检索一般过后控词表来实现,是利用先控语言的原理和方法编制语言的自然语言的检索用控制词表主要是对自然语言中大量存在的等同关系、等级关系和部分的相关关系进行控制和揭示,通过这些措施达到对自然语言检索中各种不

20、利因素的事后控制后控词表与自然语言检索系统的结合,在很大程度上弥补了纯自然语言检索系统由于自然语言的“不受控制”而产生缺陷,大大提高了自然语言检索系统的性能和效率控词表综合了自然语言与先控语言的优点,“后控”检索方式无疑是数字资产存储管理系统的应用方向,数字媒体资产管理,37,基于内容的检索,基于内容的检索是指根据多媒体对象的语义、特征进行检索,如图像中颜色、纹理、形状,视频中的镜头、场景、镜头的运动,声音中的音调、响度、音色等它需要从媒体数据中提取指定的特征,然后再根据这些特征从媒体数据库中检索出具有相似特征的图像或者视频内容特点:(1)是一种近似匹配(2)适于从媒体内容中提取信息线索(3)

21、适于对大型多媒体数据库的快速检索,数字媒体资产管理,38,基于内容的检索类型,基于内容的图像检索基于内容的视频检索基于内容的音频检索基于内容的图形检索基于内容的文本检索,数字媒体资产管理,39,基于内容的图像检索技术,主要依据图像的颜色、纹理、形状特征,以及图像中子图像的特征进行检索。其中有:颜色查询,使用户查到与用户所选择的颜色相似;纹理查询,使用户查到含有相似纹理的图像;形状查询,用户选择某一形状或勾勒一幅草图,利用形状特征或匹配主要边界进行检索;图像对象查询,对像中所包含的静态子对象进行查询。查询条件可综合利用颜色、纹理、形状特征,逻辑特征和客观属性等,数字媒体资产管理,40,基于文本的

22、图像检索技术 TBIR,从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。目前还在广泛使用,一张照片,配以文字说明照片拍摄的时间、地点、事件的主要内容等,数字媒体资产管理,41,图 新华社图片稿件,基于文本的图像检索技术TBIR,数字媒体资产管理,42,存在的问题:,在基于文本的图像检索系统中,需要先对所有的图像进行关键字标注,然后才能使用全文检索技术对图像进行搜索。这种方法存在两个方面的问题:一是这种方法需要较多的人

23、工参与,而且随着图像数目的增加,这种方法很难实现;二是由于图像所包含的信息量庞大,不同的人对于同一张图像的理解也不相同,这就导致对图像的标注没有一个统一的标准,因而检索的结果不能很好地符合用户的需求,数字媒体资产管理,43,图 不同的人关心不同的内容,基于文本的图像检索技术,数字媒体资产管理,44,基于内容的图像检索CBIR,到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)技术。属于图像分析的一个研究领域CBIR属于基于内容检索(Content-bas

24、ed Retrieval ,简称CBR)的一种,CBR中还包括对动态视频、音频等其它形式多媒体信息的检索技术,数字媒体资产管理,45,图像检索原理,在检索原理上,无论是基于文本的图像检索还是基于内容的图像检索,主要包括三方面:1、对用户需求的分析和转化,形成可以检索索引数据库的提问;2、收集和加工图像资源,提取特征,分析并进行标引,建立图像的索引数据库;3、根据相似度算法,计算用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作为结果,按照相似度降序的方式输出,数字媒体资产管理,46,基于内容的图像检索,查询条件本身就是一个图像,或者是对于图像内容的描述建立索引的方式是通过提取底层特

25、征,然后通过计算比较这些特征和查询条件之间的距离,来决定两个图片的相似程度1、提取特征值:利用一些数学规则(公式),把图像进行一个量化的描述,按照色彩、形状、图案、纹理等不同要求,把一张图片转化为一组数字,称其为特征值。由于是采用的同样的规则,所以每一张图片都能提取出一组特征值,数字媒体资产管理,47,基于内容的图像检索,2、特征值的比对:由于采用的规则是相同的,如果两张图片是一样的,提取的特征值也会相同,这样就可以把两张图片的内容比较转化为两组特征值的数字比较,也就是用数字量的比较代替了模拟量的比较;如果两张图片是相似的,提取的特征值也是相近的;反过来讲,如果两张图片相差很大,其特征值也会有

26、很大的差距;3、结合语义分析:相同特征值的图片不一定就是相同的内容,结合图片的语义进行分析判断,数字媒体资产管理,48,基于内容的图像检索,图像的低层特征值提取对于图像的低层特征,主要采用的是图像的颜色、纹理及其形状等特征颜色特征,颜色特征和图像的大小、方向无关,而且对图像的背景颜色不敏感,因此颜色特征被广泛应用于图像检索。颜色特征中包括颜色直方图、颜色相关图、颜色矩等,颜色特征颜色布局示例,数字媒体资产管理,49,基于内容的图像检索,图像的低层特征值提取纹理特征,纹理特征代表了物体的视觉模式,它包含了物体表面的组织结构以及与周围环境之间的关系。常用的方法有相关矩阵法,粗糙度、对比度等纹理表示

27、方法,以及小波变换等,纹理特征,数字媒体资产管理,50,基于内容的图像检索,图像的低层特征值提取形状特征这些低层的特征将通过各种方法抽取出来,并形成一组特征向量,建立相关索引并存储到数据库中,形状特征则包括两种,一种是基于边界的形状特征,另外一种则是基于区域的形状特征。最常用的表示方法有傅利叶变换和不变矩等,灯管 杯子基于边缘的形状表示 基于区域的形状表示,数字媒体资产管理,51,冰箱,图冰箱与洗衣机的后视图对比,洗衣机,基于内容的图像检索,单独使用低层特征值的弊端单纯使用图像的底层特征值,容易产生混淆,因为不同的图像也会有近似的特征组合,例如:一个冰箱和一个洗衣机从正面看二者有较大的区别,但

28、从后面看其后视图时,二者的差距很小,相似度较高,无法有效区分,数字媒体资产管理,52,基于内容的图像检索,建立语义特征必要性由于低层的特征并不直接代表图像的语义信息,还需要抽取图像的语义特征可行性采用了相关文字信息来表征图像的语义特征,比如:分类号、产品名称、设计人、通讯地址等效果通过使用文字信息,使不同类别、不同名称之间的图像有了明显的区分,避免了混淆,提高了检索精度举例上面的图,两个方框,加上产品名称后,冰箱和洗衣机就不会混淆了,数字媒体资产管理,53,基于内容的图像检索,示例,数字媒体资产管理,54,基于内容的图像检索,通过设置检索输出门限值,可以控制检索结果的输出数量检索结果的显示需要

29、考虑显示效率和显示效果的矛盾,数字媒体资产管理,55,基于内容的图像检索,基于内容的图像检索技术的特点1.属于模糊查询,检索结果不是唯一的基于内容的图像检索与文字检索的一个主要区别是,基于内容的检索都是属于模糊查询,一般不会给出单一的检索结果,输出的是一个结果排序集合,按照图像的相似程度,从最像到最不像最后需由人来判断最终的结果是否满足检索需要,是人机结合的典范;由计算机来做大量简单烦琐的工作,由人做分析工作,数字媒体资产管理,56,基于内容的图像检索,基于内容的图像检索技术的特点2.检索结果是逐渐逼近在检索过程中不断修订检索条件,可以逐步达到最终的检索结果;通过调整特征参数组合,可以得到不同

30、的检索结果3.计算工作量大每次查询都需要根据临时提交的特征标准,对全部特征值进行匹配运算;数据计算时对计算机的要求高,查询时间相对长一些,数字媒体资产管理,57,Google Goggles,Goggles可以把拍下的相片送到Google数据库比对,使用者得到搜寻结果如果相片里的主体是风景可以得到相关的旅游信息与搜寻结果如果相片里的主体是书籍可以得到相关的比价、评价与搜寻结果如果相片里的主体是图画可以得到相关的作者、介绍与搜寻结果如果相片里的主体有条形码可以直接通过该条形码找到该产品相关信息如果相片里的主体是名片可以把名片里面的联络人、电话与地址自动建立到通讯簿里,数字媒体资产管理,58,Go

31、ogle Goggles,LOGO,数字媒体资产管理,59,Google Goggles,条形码,数字媒体资产管理,60,Google Goggles,书籍,数字媒体资产管理,61,Google Goggles,名片,数字媒体资产管理,62,Google Goggles,解数独,数字媒体资产管理,63,基于内容的视频检索,基于内容的视频检索是当前多媒体数据库发展的一个重要方向,它通过对非结构化的视频数据进行结构化分析和处理,采用视频分割技术,将连续的视频流划分为具有特定语义的视频片段镜头,作为检索的基本单元,在此基础上进行代表帧的提取和动态特征的提取,形成描述镜头的特征索引依据镜头组织和特征索

32、引,采用视频聚类等方法研究镜头之间的关系,把内容相近的镜头组合起来,逐步缩小检索范围,直至查询到所需的视频数据其中,视频分割、代表帧和动态特征提取是基于内容的视频检索的关键检术,数字媒体资产管理,64,基于内容的视频检索技术,视频可用场景、镜头、帧来描述帧是一幅静态的图像,是组成视频的最小单位镜头是由一系列帧组成的一段视频,它描绘同一场景,表示的是一个摄像机的移动操作、一个事件或连续的动作。一个镜头由一个或多个关键帧表示场景包含有多个镜头,针对同一批对象,拍摄的角度不同,表达的含义不同,数字媒体资产管理,65,基于内容的视频检索技术,基于关键帧的检索,是对代表视频镜头的关键帧进行检索。关键帧是

33、一幅幅图像,可以采用与图像检索相似的方法。一旦检索到目标关键帧,用户可以播放观看它代表的视频片段基于运动的检索,是基于镜头和视频对象的时间特征来检索,是视频检索的进一步要求。可以查询摄像机的移动操作和场景移动,以及运动方向和运动幅度等特征来检索运动的主体对象,数字媒体资产管理,66,基于内容的视频检索,数字媒体资产管理,67,基于内容的视频检索,镜头分割镜头表示运动目标的半自动分割背景图象的拼接运动分析视频浏览与检索,数字媒体资产管理,68,基于内容的视频检索,视频镜头检测镜头是摄像机在一次连续操作期间拍摄所得的视频帧序列;一个镜头内所有图象描述的应当是比较一致的内容,可以把镜头作为基本索引单

34、元,数字媒体资产管理,69,基于内容的视频检索,镜头切换类型两类镜头切换:1. 突变:两镜头直接衔接2. 渐变:两镜头间通过特技操作平滑过渡,包括渐隐,淡入,淡出,扫换等,数字媒体资产管理,70,突变,渐变,镜头切换例子,数字媒体资产管理,71,镜头检测的基本原理,基本假定: 一个镜头内的相邻帧间有较强的连续性和相似性,内容不会有大的变化选择合适的帧间差别测度和合适的阈值,当相邻帧图象间的差别大于阈值时,就认为出现了镜头切换对帧间差别测度的要求:对镜头切换敏感对镜头内图象的变化不敏感,数字媒体资产管理,72,镜头检测的主要方法,基于像素差的方法;基于统计量的方法;基于图象特征的方法;基于灰度或

35、彩色直方图的方法;区域块法;时空流法;压缩域中的方法;,数字媒体资产管理,73,颜色直方图,常用测度:颜色直方图镜头内图象变化的原因:运动,光照,小噪声 颜色直方图对目标运动和小噪声不敏感,因此得到广泛应用颜色直方图对光照变化非常敏感,简单的光强变化就会引起直方图的突变,数字媒体资产管理,74,颜色比值直方图,相邻象素颜色的比值在光照变化时是不变的颜色比值直方图的差可以作为帧间差别测度,普通颜色直方图,颜色比值直方图,数字媒体资产管理,75,渐变检测,渐变检测更困难,因为是平滑过渡,发生切换时相邻帧间仍保持了连续性双阈值技术:低阈值检测可能的起始帧,后续帧与此起始帧比较,高阈值检测渐变结束帧,

36、数字媒体资产管理,76,动态阈值技术,镜头切换是视频的一个局部过程,不应采用单一的全局阈值 动态自适应的阈值选择 1. 对当前帧,选择之前的一个时间窗口2. 计算这个窗口中帧间差值的均值 和方差3. 设定双阈值中,低阈值为 , 高阈值为,数字媒体资产管理,77,动态阈值技术,数字媒体资产管理,78,基于内容的视频检索技术,基于内容的视频检索流程基本过程是提取用户输入的影像特征信息,在影像特征库中查询与之相匹配的特征信息,从而得到索引结果,数字媒体资产管理,79,基于内容的视频检索技术,关键步骤(1)人机交互界面(2)特征提取(3)自动分类(4)相似性检索,数字媒体资产管理,80,基于内容的音频

37、检索,声音查询利用声学的和主观的特性进行查询。声音的一些感知特性,如音调、响度、音色等,与音频信号的测量属性非常接近,在音频数据库中记录这些特征,并利用这些特征进行示例和指定特征值查询音频的类型波形声音语音音乐语音检索音乐检索结构化音乐的检索基于样本的音乐检索,数字媒体资产管理,81,基于内容的图形检索,图形查询基于空间的约束关系进行查询。包括:点查询,查找某坐标处的目标;线查询,查找线状目标两侧的目标;区域查询,查找某区域内的图形目标;关联查询,利用两个或多个图形对象之间的空间和拓扑关系来查询。空间约束关系可以是方向、邻接、包含等,数字媒体资产管理,82,基于内容的文本检索,文本查询以往文本

38、资料的检索是利用关键词,采用传统的数据库技术来实现管理和检索。然而,由于关键词标引工作量大,而且标引同用户的检索概念可能不一致,导致查准率和查全率低。因此,需采用直接对文本进行任意词和字的检索。根据实现方法的不同,其检索分为串搜索、串匹配和全文检索,以字和词以及它们的逻辑组合为条件进行查询,数字媒体资产管理,83,基于内容的文本检索,跨语言信息检索跨语言信息检索是指用户以一种语言提问,检索出另一种语言或多种语言描述的相关信息。计算机信息检索技术机器翻译技术跨语言信息检索的实现方法提问式翻译法基于词典的方法基于语料库的方法混合方法文献翻译法提问式-文献翻译法中间翻译法不翻译法提问词构造法专有名词音译法,数字媒体资产管理,84,本章小结,(1)从编目标准、与编目相关的术语和定义、编目系统的业务流程、编目系统的描述、编目工作方式等几个方面分析了媒体资产管理系统中编目的技术要点(2)阐述了数字媒体资产的检索技术,包括检索系统的流程、检索系统的功能要求、检索方式、基于内容的视频检索技术等,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号