电视视频字幕文字提取应用方法分析.doc

上传人:laozhun 文档编号:2392008 上传时间:2023-02-17 格式:DOC 页数:2 大小:15.50KB
返回 下载 相关 举报
电视视频字幕文字提取应用方法分析.doc_第1页
第1页 / 共2页
电视视频字幕文字提取应用方法分析.doc_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《电视视频字幕文字提取应用方法分析.doc》由会员分享,可在线阅读,更多相关《电视视频字幕文字提取应用方法分析.doc(2页珍藏版)》请在三一办公上搜索。

1、电视视频字幕文字提取应用方法分析 摘要 随着网络的发展,电视的智能化、数字化也不断的提高,快速、便捷地为人们提供大量的信息。在提供各类媒体信息的同时,也出现了电视视频内容安全等问题。为了及时给人们提供准确、原汁原味的信息,我们采取一种提取电视视频字幕文字的方法,使电视内容在播放过程中,不会发生任何变化,让人们放心的观看自己喜欢的节目。 关键词 电视视频;文字;提取方法 1根据角点检测原理的字幕文字提取方法 角点是图像边界上曲率很高的点,是图像纹理的一个重要特征。图像信息里含有很多的角点,在使用原图进行计算的前提下,角点计算不但可以够保留原有信息而且还可以提高计算的效率。本方法就是利用角点这个纹

2、理特征来进行文字区域的检测。根据图像边缘的方法要对图像边缘进行编码,图像的分割和边缘提取决定了这种角点检测效果的好与坏,由于该操作方法操作难度和计算量都比较大,所以检测效果不是太令人满意。 通过计算点的曲率及梯度来检测角点的方法叫做图像灰度。Harris角点检测算法是通过微积分的运算方法和自相关矩阵的方法来进行角点的检测,进一步提高文字的提取效率。为了抑制噪声的产生,Harris检测算法是把高斯函数作为检测窗口,平滑滤波是对图像的第一步处理,图像中角点检测是对图像的进一步处理,本文提出了一种视频字幕检测算法其依据是角点检测。 在视频图像中,背景留下的一些角点也可能被看成是文字区域的角点。为了提

3、高文字区域检测的准确率,降低提取结果中的噪声,应先将角点分布图中孤立的角点滤除。因为大量的角点存在于视频图像中的文字区域,所以从角点分布图中来看,角点分布密度很大的情况就是文字区域,而在视频图像中的某些背景区域虽然也含有不够密集的角点,但是文字区域构成的最小外接矩阵特征与背景区域角点构成的最小外接矩阵特征相差较大。可以利用这些对角点分布图进行过滤,检测找出文字区域。本文总结了根据启发式规则和角点分布密度的文字区域检测、根据角点聚类的文字区域检测以及根据角点匹配的文字区域检测这三种文字区域检测的方法。 2插值放大和混合阈值二值化方法 对切割出来的文字区域先进行灰度变换,然后再插值放大、二值化。先

4、将图片的大小和分辨率都进行插值放大,以满足OCR软件对输入的图像质量的较高要求,然后进行二值化。插值方法是一种图像放大增强的手段可以提高图像放大和灰度化之后的文字图片中文字和背景的对比度,提高二值化的效果。图像增强技术可以归纳为两大类即空间域法和频率域法。把原始图像的灰度直方图从比较集中的某个灰度区间变成全部灰度范围内的均匀分布的方法叫做直方图均衡增强,本文就用运该方法对灰度化后的文字图像进行增强。在处理实际情况时,一般先对原始图像的灰度情况进行统计分析,并计算出原始直方图分布,然后利用某个函数将图像的某个灰度值进行转换,使原始图像成为均匀的积累直方图分布。 待添加的隐藏文字内容1对于背景简单

5、的文字图片,用全局阈值二值化方法提取文字的效果较好,而对于背景复杂的文字图片则使用局部阂值的二值化方法较好。如果只使用其中的一种方法,不能发挥其优点,文字的提取效率也会相应的降低,噪声也不能得到很好的控制,图像的细节也不能完整的保存,只有把两种方法结合起来使用,效果更加显著。对于背景简单的文字图像,应该在使用二值化方法之前对文字灰度图像进行增强,这样能提高二值化识别的正确率,取得更好的二值化效果。对于背景复杂的文字图像,首先应选取一个全局阈值把图像分割成几个小图,因为全局阈值二值化方法在整个图像的二值化过程中只使用一个阈值,此阈值的产生与整幅图像的灰度分布有密切的关系。当图像中前景较背景灰度值

6、差距大时,应该使用全局二值化方法。平均灰度法、OTSU法、迭代最优算法是常用的全局二值化方法。采用二值化方法计算全局阈值时效果更好。 全局阈值二值化和局部二值方法在提取文字后都会混入一定的噪声,即使很小的噪声也会对OCR的识别结果造成一定的影响,其后果是输出内容和原内容相差很大,所以要利用一定的方法把噪声去除。要想消除噪声,只能在形态特征上对文字笔画连通域和非文字像素构成的连通域加以区分,因为二值化后文字图像中的噪声与文字像素值相同。为了做出正确的判断,避免文字和图像相互混淆,我们应采取这样一种方法:首先求出每个矩形的连通域,找出每个矩形的宽度、高度、左上角坐标以及右下角坐标。再找出所有外接矩形高度、宽度值、左上角坐标值以及右下角坐标值出现频率最高的值,这四个数值可以在一定程度上代表文字区域。噪声可能对文字图像边界相连的连通域造成错误的判断,所以应根据文字区域的四个元素选定一个矩形框,然后把该矩形框涂上不同于文字的颜色并把文字框住。 3结论 随着社会的发展,人们生活水平的提高,电视节目已成为人们生活中必不可少的一部分。电视节目的多样化以及内容的质量都会对成年和孩子们的思想和行为有重要的影响。为了给人们播放新鲜、积极向上的各类节目,丰富人们的生活,虽然我们采取了一系列的方法,但是还不能把所有的节目内容进行监控,所以我们要不断地研究更先进的操控方法。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号