《信息熵在图像处理特别是图像分割和图像配准中的应用——信息与计算科学毕业论文.doc》由会员分享,可在线阅读,更多相关《信息熵在图像处理特别是图像分割和图像配准中的应用——信息与计算科学毕业论文.doc(40页珍藏版)》请在三一办公上搜索。
1、摘要信息论是人们在长期通信实践活动中,由通信技术与概率论、随机过程、数理统计等学科相结合而逐步发展起来的一门新兴交叉学科。而熵是信息论中事件出现概率的不确定性的量度,能有效反映事件包含的信息。随着科学技术,特别是信息技术的迅猛发展,信息理论在通信领域中发挥了越来越重要的作用,由于信息理论解决问题的思路和方法独特、新颖和有效,信息论已渗透到其他科学领域。随着计算机技术和数学理论的不断发展,人工智能、神经网络、遗传算法、模糊理论的不断完善,信息理论的应用越来越广泛。在图像处理研究中,信息熵也越来越受到关注。为了寻找快速有效的图像处理方法,信息理论越来越多地渗透到图像处理技术中。本文通过进一步探讨概
2、论率中熵的概念,分析其在图像处理中的应用,通过概念的分析理解,详细讨论其在图像处理的各个方面:如图像分割、图像配准、人脸识别,特征检测等的应用。 本文介绍了信息熵在图像处理中的应用,总结了一些基于熵的基本概念,互信息的定义。并给出了信息熵在图像处理特别是图像分割和图像配准中的应用,最后实现了信息熵在图像配准中的方法。关键词:信息熵,互信息,图像分割,图像配准Abstract Information theory is a new interdisciplinary subject developed in people long-term communication practice, com
3、bining with communication technology, theory of probability, stochastic processes, and mathematical statistics. Entropy is a measure of the uncertainty the probability of the occurrence of the event in the information theory, it can effectively reflect the information event contains. With the develo
4、pment of science and technology, especially the rapid development of information technology, information theory has played a more and more important role in the communication field, because the ideas and methods to solve the problem of information theory is unique, novel and effective, information t
5、heory has penetrated into other areas of science. With the development of computer technology and mathematical theory, continuous improvement of artificial intelligence, neural network, genetic algorithm, fuzzy theory, there are more and more extensive applications of information theory. In the rese
6、arch of image processing, the information entropy has attracted more and more attention. In order to find the fast and effective image processing method, information theory is used more and more frequently in the image processing technology. In this paper, through the further discussion on concept o
7、f entropy, analyzes its application in image processing, such as image segmentation, image registration, face recognition, feature detection etc.This paper introduces the application of information entropy in image processing, summarizes some basic concepts based on the definition of entropy, mutual
8、 information. And the information entropy of image processing especially for image segmentation and image registration. Finally realize the information entropy in image registration.Keywords: Information entropy, Mutual information, Image segmentation,Image registration目 录摘 要.1ABSTRACT2目 录31 引言51.1
9、信息熵的概念51.2 信息熵的基本性质及证明61.2.1 单峰性61.2.2 对称性71.2.3 渐化性71.2.4 展开性71.2.5 确定性82 基于熵的互信息理论92.1 互信息的概述92.2 互信息的定义92.3 熵与互信息的关系93 信息熵在图像分割中的应用113.1 图像分割的基本概念11 3.1.1 图像分割的研究现状113.1.2 图像分割的方法113.2 基于改进粒子群优化的模糊熵煤尘图像分割123.2.1 基本粒子群算法123.2.2 改进粒子群优化算法133.2.3 Morlet变异133.2.4改建粒子群优化的图像分割方法143.2.5 实验结果及分析163.3 一种新
10、信息熵的定义及其在图像分割中的应用193.3.1香农熵的概念及性质193.3.2一种信息熵的定义及证明193.3.3信息熵计算复杂性分析213.3.4二维信息熵阈值法223.3.5二维信息熵阈值法的复杂性分析24 3.3.6 结论及分析254 信息熵在图像配准中的应用274.1 图像配准的基本概述274.2 基于互信息的图像配准274.3 Powell算法284.4 变换28 4.4.1 平移变换29 4.4.2 旋转变换304.5 基于互信息的图像配准的设计与实现31 4.5.1总体设计思路和图像配准实现 31 4.5.2直方图33 4.5.3 联合直方图33 4.5.4灰度级差值技术34
11、4.4.5 优化搜索办法级结论355 结 语37致 谢38参考文献391 引言1.1. 信息熵的概念1948年,美国科学家香农(CEShannon)发表了一篇著名的论文通信的数学理论。他从研究通信系统传输的实质出发,对信息做了科学的定义,并进行了定性和定量的描述。他指出,信息是事物运动状态或存在方式的不确定性的描述。其通信系统的模型如下所示: 信 源编 码信 道信号解 码信 宿干 扰噪 声 图1.1 信息的传播信息的基本作用就是消除人们对事物的不确定性。信息熵是信息论中用于度量信息量的一个概念。假定是随机变量的集合,表示其概率密度,计算此随机变量的信息熵的公式是:表示一对随机变量的联合密度函数
12、,他们的联合熵可以表示为:信息熵描述的是信源的不确定性,是信源中所有目标的平均信息量。信息量是信息论的中心概念,将熵作为一个随机事件的不确定性或信息量的量度,它奠定了现代信息论的科学理论基础,如果一条信息是由个字符连成的字符串组成,并且每个字符有种可能,那么这条信息就有种不同的排列情况,那么可以用度量信息量,但这时的信息量随着消息的长度按指数增加,为了使信息量的度量值按线性增加,Hartley给出了取对数的信息量的定义: (1.1)由上式可以看出,信息量随着消息的可能性组合增多而增多,如果消息只有一种可能性时即事件为必然事件时,那么消息中包含的信息量为零。因此可以看出,可能收到的不同消息越多,
13、对收到哪条消息的不确定性就越大;相反,收到只有一种可能性的消息,不确定性为零,Hartley对消息的度量实际是对不确定性的度量。Hartley度量方法的不足之处是他所定义信息量是假定所有符号发生的概率相同,但实际情况各符号并不一定都等概发生,为此,Shannon用概率加权来衡量消息出现的可能性,对Hartley的度量方法做出改进。设某一随机过程中有k种可能的情况,每种情况发生的概率分别是,Shannon给出了熵的如下定义: (1.2) 当所有可能的事件均以相等的概率发生时,上式就成了Hartley定 义的熵,并且这时熵取得最大值,即 (1.3)所以,Hartley熵是,Shannon熵的特殊情
14、形,而Shannon更具有一般性。Shannon熵包含三种含义:第一种含义是度量信息量,事件发生概率与获得的信息量成反比,即概率越大,信息量越少,又由式(1.3)知,概率越大,信息量越少,熵越小,所以可用熵的大小来度量信息量,熵越大,信息量越大;第二是度量事件概率分布的分散度,概率集中分布时熵值小,分散性越强,熵越大;三含义是度量事件发生的不确定性,概率越大,事件的不确定性越小,熵越小。利用上面第三个含义,可以用Shannon熵,来度量图像包含的信息量,图像灰度值的概率分布是每灰度值出现的次数除以图像中所有灰度值出现的总次数,此时图像的信息量可依据这个概率分布来计算,一幅图像中不同的灰度值较少
15、,各灰度值出现的概率较高,则对应的灰度值较低,意味着这幅图像含有的信息量很少。反之,如果一幅图像中含有很多不同的灰度值,且各灰度值发生的概率又基本一致,则它的熵值会很高,那么这幅图像包含的信息量很大。1.2信息熵的基本性质及证明1.2.1单峰性信息熵的单峰性可表述为:先考察由、两个事件构成的概率系统,其产生的概率分别为和则该系统的信息通过求极限 不难证明:(1) 当时,这是一种产生的概率为0,产生的概率为1 的确定系统。(2) 当时这是一种产生的概率为1,产生的概率为0 的确定系统。(3) 对函数可以通过求导数的方式寻找其极值点。该函数的一阶导数为令则有,求得为该函数的驻点。因为二阶导数 当时
16、,恒小于0 , 所以当时函数有极大值。这说明当、两事件产生的概率相同时,具有最大值,这是一种不确定性最大的不确定系统。(4) 若概率系统中有个事件,当每一事件产生的概率相同(均为)时,则系统的信息熵具有最大值。该结论可以通过以下的讨论来证明:具有个事件的概率系统其信息熵可表示为,这是在约束条件下的极值问题。应用因子法,设:将对事件的概率求一阶偏导数,并令使用约束条件确定值,可求得(常数)。同理有(常数),即当时,有极大值。1.2.2 对称性信息熵的对称性可表述为:设某一概率系统中n 个事件的概率分布为 当对事件位置的顺序进行任意置换后,得到新的概率分布为,并有以下关系成立: 它表示概率系统中事
17、件的顺序虽不同,但概率系统的熵H 是不变的,即概率系统的熵与事件的顺序无关。1.2.3 渐化性信息熵的渐化性可表述为:设概率为的事件可分解为概率分别为和的两个事件,则有:1.2.4 展开性信息熵的展开性可表述为:设某一概率系统的概率分布为则系统的信息熵具有展开性质: 在此基础上,进一步展开有: 根据上述展开性不难证明。1.2.5 确定性信息熵的确定性可表述为:设信息系统中,任一事件产生的概率为1,则其他事件产生的概率为0。这是一种确定的系统,对于这样的系统有: 根据很容易证明上述性质。2 基于熵的互信息理论2.1 互信息的概述互信息(Mutual Information)来自于信息论,是信息论
18、中的一个基本概念,是两个随机变量统计相关性的测度。当两幅图像达到最佳配准,它们对应像素的灰度互信息应达到最大。该测度不需要对不同成像模式下图像灰度间的关系作任何假设,也不需要对图像进行分割或任何预处理,具有自动化程度高的特点。因此,最近几年将互信息作为图像配准过程的相似性测度,利用最大互信息法进行图像配准成为了图像处理领域的研究热点。互信息是基于概率统计论提出的,具有统计特性,它被多数研究者公认为是一个很好的图像配准准则,许多图像配准算法的研究均是在互信息的基础上加以改进的。互信息作为医学图像配准的一个相似性测度,多模态医学图像的配准很实用,其配准原理是两幅基于共同人体解剖结构的图像在配准时具
19、有最大的互信息值。2.2 互信息定义定义1:随机变量和之间的互信息定义为:或定义互信息为:可以证明二者是相等的,即=。因此,和是随机变量和之间相互提供的信息。另一种定义:也可以采用直接定义与之间的互信息为:=可直接导出及2.3 熵与互信息的关系(1) 独立:,有(2) 确定:,则.从而,互信息是随机变量之间相互依存度的度量信息。互信息是信息论中的一个基本概念,通常用于描述两个系统间的相关性,或者是一个系统中所包含的另一个系统信息的多少,是两个随机变量和之间统计相关性的量度,或是一个变量包含另一个变量的信息量的量度。它可以用熵和来描述以及联合熵, (2.1)其中和分别是系统和的熵,是,的联合熵,
20、表示一直系统时的条件熵和一直系统时的条件熵。上述各种熵可分别表示为: (2.2) (2.3) (2.4) (2.5) (2.6)其中, 和分别是系统和系统完全独立时的边缘概率密度,是系统和的联合概率分布,是已知系统时的条件概率分布,是已知系统时的条件概率分布,如果联合概率分布密度满足,则随机变量和相互独立;如果和满足某映射关系使,则随机变量和最大相关。在通信系统中,信源和信宿是相互联系的,因此,收到的条件下,对信源具有一定的了解,但仍然对有不确定度,即条件熵,但总小于绝对熵。对信源的了解程度(确定度)为得到结论:差值度量了确定度。同样,在确值信源发送X的条件下,差值度量了对的了解程度。3 信息
21、熵在图像分割中的应用3.1 图像分割的基本概念图像分割是图像处理和分析的关键步骤,也是一种基本的计算机视觉技术。当今信息熵主要应用在图像分割技术中。为了识别和分析目标,图像分割把图像分各具特性的区域。这些特性可以是灰度、颜色、纹理等,目标可以对应单个区域,也可以对应多个区域。基于熵的图像分割方法,尽可能减少了图像信息的损失,因此可用于复杂背景,而且这种方法有很多。随着计算机技术和数学理论的不断发展,人工智能、神经网络、遗传算法、模糊理论的不断完善,以及处理的图像越来越复杂,单一的方法已不能满足人们的需求,因此,研究多方法的结合是这一领域的趋势。3.1.1 图像分割的研究现状图像分割是图像处理中
22、的一项关键技术,也是一经典难题,自20世纪70年代起一直受到人们的高度重视,至今已提出了上千种分割算法。但发展至今仍没有找出一个通用的分割理论,现提出的分割算法大都是针对具体问题的,并没有一种适合所有图像的通用分割算法。另外,也还没有制定出判断分割算法好坏和选择适用分割算法的标准,这给图像分割技术的应用带来许多实际问题。3.1.2图像分割的方法(1) 基于阈值的分割这是一种最常用的区域分割技术,阈值是用于区分不同目标的灰度值。如果图像只有目标和背景两大类,那么只需选取一个阈值称为单阈值分割。这种方法是将图像中每个像素的灰度值和阈值比较,灰度值大于阈值的像素为一类,灰度值小于阈值的像素为另一类。
23、如果图像中有多个目标,就需要选取多个阈值将各个目标分开,这种方法称为多阈值分割。为区分目标还需要对多个区域进行标记。阈值又可分为全局阈值,局部阈值和动态阈值,阈值分割的结果依赖于阈值的选取,确定阈值是阈值分割的关键,阈值分割实质上就是按照某个标准求出最佳阈值的过程。常用的全局阈值选取方法有利用图像灰度直方图的峰谷法,最小误差法,最大类间方差法,最大熵自动阈值法以及其他一些方法。(2) 基于区域的分割基于区域的分割技术有两种基本形式:区域生长和分裂合并。前者是从单像素出发,逐渐合并以形成所需的分割结果。后者是从整个图像出发,逐渐分裂或合并以形成所需要的分割结果。与阈值方法不同,这类方法不但考虑了
24、像素的相似性,还考虑了空间上的邻接性,因此可以有效地消除孤立噪声的干扰,具有很强的鲁棒性。而且,无论是分裂还是合并,都能将分割深入达到像素级。(3) 基于边缘的分割基于边界的分割方法是利用不同区域间像素灰度不连续的特点检测出区域间的边缘,从而实现图像分割。边界的像素灰度值变化往往比较剧烈。首先检测图像中的边缘点,在按一定策略连接成轮廓,从而构成分割区域。边缘检测技术可以按照处理的顺序分为串行边缘检测及并行边缘检测。在穿性边缘检测中,当前像素点是否属于欲检测的边缘取决于先前像素的验证结果;而在并行边缘检测技术中,一个像素点是否属于欲检测的边缘,取决于当前正在检测的像素点以及该像素点的一些相邻像素
25、点,这样该模型可以同时用于检测图像中的所有像素点。3.2 基于改进粒子群优化的模糊熵煤尘图像分割对煤尘图像进行有效的分割是煤尘浓度测量的重要研究内容之一,在煤尘图像分析和识别中具有重要意义。阈值法是最常用的图像分割方法,其关键是阈值的选取,用图像灰度模糊熵来确定分割阈值是一种有效的阈值确定方法。图像灰度模糊熵中模糊参数的寻优实际上是一个优化问题。解决优化问题的方法通常有穷举法、遗传算法、蚁群算法、粒子群算法等,其中Kennedy 和Eberhart提出的粒子群优化算法(PSO) 因其优越性而成为研究的热点。普通粒子群优化算法存在易陷入局部最优以及过早收敛的缺点, 使得该算法难以得到理想的优化效
26、果。近年来出现了不少改进的PSO 算法,改进算法主要有对惯性因子的改进,以及引入遗传算法中的交叉、变异或进化思想对部分粒子进行相应的操作。Li等人提出的高斯变异粒子群(GMPSO) 算法取得了不错的分割效果,但该算法的分割精度还有待进一步提高。用一种综合Morlet 变异和惯性因子自适应的改进粒子群优化算法,让该算法和模糊熵结合应用于图像分割,利用改进粒子群优化(IPSO) 算法来搜索,使模糊熵最大时的参数值得到模糊参数的最优组合,进而确定图像的分割阈值。实验结果表明,该算法取得了令人满意的分割结果,算法运算时间较小,能满足对煤尘浓度实时精确测量的要求。 3.2.1 基本粒子群算法粒子群优化(
27、PSO) 算法是一种进化计算技术,最早由Kenney 和Eberhart 于1995 年提出的。源于对鸟群捕食行为研究的PSO 算法同遗传算法类似,是一种基于迭代的优化工具。在PSO 算法中,每个个体称为粒子,所有的粒子都有一个由被优化的函数决定的适应值,每个粒子还有一个速度决定他们飞翔的方向和距离,然后粒子就追随当前的最优粒子在解空间搜索。假定粒子规模为搜索空间为维,则第个粒子的位置表示为,第个粒子的速度表示为,每个粒子具有最好适应值的位置称为个体最好位置,记为,整个种群中的最好适应值位置称为全局最好位置,记为。 在找到这两个最优值时,每个粒子根据如下公式来更新自己的速度和位置: (3.1)
28、 (3.2)其中:表示第个粒子;表示粒子的第维;表示第次迭代;为加速常数,通常在间取值;为均匀分布在(0, 1) 上的随机数;为惯性因子。3.2.2 改进粒子群优化算法普通粒子群优化算法存在易陷入局部最优以及过早收敛的缺点,使得该算法难以得到理想的优化效果。近年来出现了不少改进的PSO 算法,改进算法主要有对惯性因子的改进,以及引入遗传算法中的交叉、变异或进化思想对部分粒子进行相应的操作。本文针对惯性因子的改进提出了惯性因子自适应算法,同时引入了Morlet 变异操作,克服了普通粒子群优化算法存在易陷入局部最优以及过早收敛的缺点。惯性因子自适应粒子群算法,当粒子群中大多数粒子在连续的迭代中未找
29、到最优值前停止更新时,就会出现过早收敛的现像。当惯性因子较小或固定时也会出现这种现像,从式(3.1) 可以看出, 当较小并且 和很小时,也很小,即相应的粒子失去搜索能力。这种情况通常会出现在当粒子本身是全局最优时即和等于零时的迭代早期阶段,这样在以后的迭代中粒子就失去了多样性。为了解决该问题,一般将设为: (3.3)其中:表示总迭代次数,和分别表示最大和最小惯性因子。本文对上述方法作了改进,根据粒子距离全局最优值之间的距离对进行调节,即 (3.4)其中:为当前粒子距离全局最优值之间的欧几里得距离,即(4)为最大距离。这样对进行调节能保证粒子在偏离全局最优时,粒子和全局最优值之间的吸引力将保证粒
30、子不会偏离最优值太远,从而避免出现过早收敛的现像。3.2.3 Morlet 变异为了克服过早收敛,还有一种方法就是引入遗传算法中的变异操作,即当用基本PSO 算法对粒子的位置和速度进行更新后,再对部分粒子进行变异操作,使得粒子种群呈现多样性。 一般可用均匀变异或非均匀变异来进行变异操作,Natsuki引入了高斯变异操作,有: (3.5)其中:为高斯变异后的位置;为的高斯分布,Natsuki 指出可以对粒子以一定概率进行高斯变异,也可以当粒子的位置停止更新时进行高斯变异。本文中的Morlet变异能对粒子起到微调的作用,每个粒子变异的概率为的大小根据粒子群的维数决定。Morlet 变异的方程式如下
31、: (3.6)其中:为变异后的,和分别为的最大最小值,的计算公式如下: (3.7)其中: (3.8)这里: 为上式单调递增方程的形状参数,为的上限值,为当前迭代次数, 为最大迭代次数。3.2.4 改进粒子群优化的模糊熵图像分割算法图像的最大模糊熵:根据模糊理论,图像可看成是一个模糊事件。根据模糊熵理论,若分割阈值将原始图像的像素分成黑和亮两个模糊集,则这两个集合的隶属函数和模糊熵分别为: (3.9) (3.10) (3.11) (3.12)其中:参数满足 这里为中元素的个数。模糊事件的总模糊熵: (3.13)由熵理论可知,为了实现目标与背景的最佳分割,模糊事件的模糊熵应为最大,即得到使总模糊熵
32、达到最大值时对应,并据此确定最优阈值 (3.14)改进粒子群优化的模糊熵图像分割算法:根据最大模糊熵原理,基于最大模糊熵的图像分割算法其本质是在图像的整个灰度空间上搜索一组参数使图像的总模糊熵取最大值的优化问题。并且将改进粒子群优化(IPSO) 算法用于搜索一组最优参数,提高了算法的分割性能。算法的基本步骤如下:Step 1: 初始化。初始化粒子群的位置矩阵和速度矩阵,设定粒子群规模和维数(由于需寻优2 个参数,),设定 (3.15) (3.16) (3.17) (3.18)其中:为均匀分布在(0, 1) 上的随机数;为的最大值;和分别为的最大、最小值,一般取,这里和 分别为图像的最大、最小灰
33、度。Step 2: 选择式(3.13) 作为粒子群算法的适应度函数,计算粒子群中每个粒子的适应值, 并根据适应值选择每个粒子的当前最好位置Pi 和粒子群的全局最好位置。Step 3: 根据式(3.3) 计算权重因子, 再根据式(3.1) 和(3.2) 更新粒子的速度和位置。Step 4: 根据式(3.6) 以一定概率对部分粒子进行Morlet 变异。Step 5: 若达到最大迭代次数,则算法结束;否则,转Step 2。Step 6: 求出全局最优解对应的参数组合,计算分割阈值对图像进行分割。3.2.5 实验结果及分析利用本文算法对不同类型图像进行分割实验,并与其他算法的结果进行对比。实验中粒子
34、群算法相关参数选择如下:粒子群规模,维数,最大迭代次,普通PSO 算法中的惯性因子,学习因子.Morlet变异参数为:随即抽取50% 的粒子进行变异操作, 即变异概率实验中采用的图像分别为Lena,Boat,共3幅真实煤尘图像,它们代表几种不同类型的图像。 (a) Lena 图像 (b) Boat 图像(c) 煤尘图像1 (d) 煤尘图像2(e) 煤尘图像3图3.1 实验图像直方图它们的灰度直方图,Lena 图像呈多峰模式;Boat 图像为明显的双峰; 3 幅煤尘图像为单峰模式。利用本文(IPSO) 算法和基本PSO 算法, (GMPSO) 算法对3 种不同类型的图像进行了分割效果比较实验,实
35、验效果如图3.2 所示。图3.2 中,为原始图像;为基本PSO 算法的分割结果;为(GMPSO) 算法的分割结果;为本文算法的分割结果, 由图3.2 的分割结果可以看出,本文算法的分割效果优于其他两种算法,特别是在对具有单峰特性的第3 幅煤尘图像,本文算法的优势非常明显。 (a1) (b1) (c1) (d1) (a2) (b2) (c2) (d2) (a3) (b3) (c3) (d3) (a4) (b4) (c4) (d4)图3.2 实验结果比较图表3.1 列出了不同算法的分割阈值、运算时间以及广泛使用的无差异测量。无差异测量定义为 (3.19)其中:为阈值数量,为j 阶分割区域,为像素的
36、灰度值,为j 阶分割区域灰度平均值,为图像总的像素点,和为图像的最大最小灰度值。,越接近于1 说明分割效果越好。由表1 可以看出,本文提出的IPSO 分割算法在阈值和分割性能指标上具有明显的优势,同时运算时间也相应增加,但运算时间最大也在之内,完全能满足实时精确分割的要求,为煤尘浓度的实时精确测量打下了坚实的基础。表3.1 本文算法与其他算法进行图像分割性能比较图像算法阈值时间/sUMLenaPSOGMPSOIPSO134.6105130.8517121.74960.0750.0780.1940.97640.97730.9787BoatPSOGMPSOIPSO160.0200156.81551
37、44.62090.0780.0940.1090.95770.96470.9752Coal dust 1PSOGMPSOIPSO110.4098108.3135102.50000.0980.1250.2350.96700.97820.9989Coal dust 2PSOGMPSOIPSO117.8226115.0620111.90500.1010.1320.2340.96800.97840.9989Coal dust 3PSOGMPSOIPSO114.0127111.02351106.01740.110.0.1250.2420.96620.97830.9984针对基本粒子群算法存在易陷入局部最优
38、以及过早收敛的问题,提出了一种基于改进粒子群优化的模糊熵图像分割算法,用惯性因子自适应粒子群来搜索使模糊熵最大时的参数值,并对部分粒子进行Morlet 变异操作,得到模糊数的最优组合,进而确定图像的分割阈值。实验结果充分地表明,该算法对不同类型的图像均能取得较好的分割结果,且计算量较小,稍加改进即可在DSP 等硬件上实现,因此能满足对煤尘浓度实时测量的要求。3.3 一种新信息熵定义及其在图像分割中的应用3.3.1 香农熵的概念及性质离散概率分布,其中,满足条件 且。香农在1948年提出了描述信息不确定性程度大小的量(简称为香农熵) ,。它具有如下的典型性质:(1) 对于任意离散概率分布,则有
39、(2) 对于任意离散概率分布,则(3) 对于任意离散概率分布 ,则 (4) 对于两个独立事件离散概率分则满足。3.3.2 一种信息熵的定义及证明从香农熵的表达式来看,因其含有对数运算导致计算所需时间较大,不利于基于香农熵的图像分割方法在实时场合的使用。为了定义没有对数运算的新息熵,这里首先引入Tsallis熵定义: (3.20)当式(3.20)中的时,可以得到: (3.21)这里对Tsallis 熵进行如下的修改: (3.22)修改后的Tsallis 熵具有如下的性质:(1) (2) (3.23)然而(3.21)中有可能为零,需将(3.22)进一步修改为如下形式: (3.24)针对(3.24)
40、式,它具有如下的性质:(1) (2) (3.25)为了定义非对数型信息熵,这里引入下面的定理。定理1:若是信息熵,那么函数也是信息熵。证明:因指数函数是单调函数,且信息是有界函数,那么复合函数也单调有界函数。对于离散概率分布,使得信息熵得到最小值,同样也使得复合函数取最小值。对于离散概率分布 ,使得信息熵得到最大值,同样也使得复合函数取到最大值。总上所述,复合函数满足信息熵最基本的性质。因此,它是一种信息熵。证毕。根据本文修改的Tsallis 熵公式(3.25) 和定理1,我们可以构造如下新的信息熵为: (3.26)该新的信息熵中仅有加法和乘法运算,其计算量很显然比香农熵Tsallis 熵要少
41、很多。为了方便,将新信息熵表达式(3.26)简称为乘积型熵。它也具有如下典型性质:(1) 对于任意离散概率分布 ,则有;(2) 若任意离散概率分布的乘积型熵,当且仅当 (3) 对于任意离散概率分布的乘积型熵,当且仅当(4) 对于两个独立事件离散概率分布则有这表明,新信息熵是非可加性信息熵。可加性信息熵仅有香农熵和Renyi熵,其它诸如Tsallis熵、Kapur熵、Taneja熵等众多信息熵都属于非可加性信息熵范畴。下面给出乘积型熵性质的证明。其具体过程如下:证明:(1) 因又因且,所以有:成立。又因算术平均和几何平均之间满足不等关系式,若那么 ,因此,成立。综上所述,不等式是正确的。又利用极
42、限表达式,就有成立。(2) 若任意离散概率分布则其相应乘积型熵是很显然的。这里主要是证明任意离散概率分布的乘积型熵,则该概率分布为的成立。因,就有成立。又因且。 则由可以得到。又因则必有且 中必然有 个取值为0。仅1 个取值为1 的结论。 (3) 若任意离散概率分布,则其相应乘积型熵 是很显然的。这里主要是证明任意离散概率分布的乘积型熵 则该概率分布为时成立。因,可以得到:成立,也即有 。定义目标函数在约束条件且 下取得最小值为零的必要条件是其原因在于目标函数是变量 在定义域上的凸函数,以及目标函数对变量 的二阶偏导数构成的Hessian 矩阵是正的。因此,由必然得到成立。3.3.3 信息熵计算复杂性分析在现有的微型计算机中,其CPU 的算术运算单元( ALU) 有加法器和乘法器,需将减法运算变成加法运算,以及除法运算变成乘法运算来执行。假设计算机每执行加法或减法运算一次需要时间秒,执行乘法或除法运算一次需要时