图象信息隐藏与水印算法数字水印基础教程.ppt

上传人:小飞机 文档编号:4898086 上传时间:2023-05-22 格式:PPT 页数:129 大小:2.60MB
返回 下载 相关 举报
图象信息隐藏与水印算法数字水印基础教程.ppt_第1页
第1页 / 共129页
图象信息隐藏与水印算法数字水印基础教程.ppt_第2页
第2页 / 共129页
图象信息隐藏与水印算法数字水印基础教程.ppt_第3页
第3页 / 共129页
图象信息隐藏与水印算法数字水印基础教程.ppt_第4页
第4页 / 共129页
图象信息隐藏与水印算法数字水印基础教程.ppt_第5页
第5页 / 共129页
点击查看更多>>
资源描述

《图象信息隐藏与水印算法数字水印基础教程.ppt》由会员分享,可在线阅读,更多相关《图象信息隐藏与水印算法数字水印基础教程.ppt(129页珍藏版)》请在三一办公上搜索。

1、5、信息隐藏(数字水印)算法,信息隐藏算法的分类,根据载体分类图像、语音、视频、数据、文本中的信息隐藏根据隐藏算法分类文件格式法时域替换算法变换域算法扩频算法统计方法变形方法载体生成方法,5.1 图像信息隐藏(数字水印)算法,图像水印的分类,普通图像水印图像鲁棒性水印图像脆弱性水印,1普通图像水印,在鲁棒性和脆弱性等方面没有特别要求,主要强调隐蔽性(不可见性)介绍一些有代表性的普通图像数字水印,有助于开拓思路,2图像鲁棒性水印,能够抵抗各种信号处理、攻击如:压缩、滤波、加噪、剪切、增删、拼接、合并、放大缩小、打印扫描、几何变形、等等,3图像脆弱性水印,在保证多媒体信息一定感知质量的前提下,将数

2、字、序列号、文字、图像标志等做为数字水印嵌入到多媒体数据中,当多媒体内容受到怀疑时,可将该水印提取出来用于多媒体内容的真伪识别,并且指出篡改的位置,甚至攻击类型等又称为易碎水印,图像载体发生变化,水印则受到破坏分为完全脆弱性和半脆弱性,普通图像水印,根据隐藏算法分类,文件格式法时域替换算法变换域算法扩频算法统计方法,1 文件格式信息隐藏,在图像文件格式中隐藏信息(BMP,GIF,TIF)在HTML文件中隐藏信息,在图像文件中隐藏信息,图像文件都有一定的存贮格式文件头主要描述图像文件的格式、文件大小、数据起始偏移地址、图像数据大小等关键信息利用图像文件的这种特性,可以在图像文件中隐藏秘密数据,B

3、MP文件格式,由Microsoft公司推出的位图文件格式由三个部分组成:位图文件头、位图信息和位图阵列信息位图文件头由14个字节组成;位图信息由位图信息头和调色板组成,其中位图信息头由40个字节组成,而调色板的大小取决于色彩数。位图信息头中就包含了图像的宽度、高度和位图大小等信息位图阵列信息按行的顺序依次记录图像的每一个象素的图像数据,BMP格式,秘密信息嵌入文件末尾:DataStash、Cloak等掩密软件,调色板,BMP图像文件,秘密数据必须保存到位图文件的两个有效数据结构之间这些有效数据结构至少包括位图图像的结尾以及文件头数据与图像数据之间等位置存放在文件尾部可以减少修改文件头的数据量,

4、仅需修改文件头中文件长度域的值即可如果将秘密数据放在文件头与图像数据之间,则至少需要修改文件头中文件长度、数据起始偏移地址这两个域的值,例,特点,Lena图像文件增加的字节数正好等于Office文档的字节数文件头中文件长度域的值增加的幅度也刚好等于Office文档的字节数 使用Windows的画板程序可以将伪装后的Lena图像文件正常打开将图像另存为一个新文档后发现,所隐藏的Office文档数据完全丢失,GIF文件格式,分为文件头和文件体两部分文件头包括文件标志、图像水平分辨率、垂直分辨率、彩色表、图像宽度、图像高度、图像偏移量、编码的初始值等关于图像的参数,1。秘密信息嵌入 文件注释块2。秘

5、密信息嵌入文件末尾DataStash等掩密软件,TIF文件格式,分为四个部分:文件头、参数指针表、参数数据表和图像数据 文件头长度为8B,包含字节顺序、标记号和指向第一个参数指针表的偏移量参数指针表占12B,它包含了描述图像的压缩种类、长度、彩色数以及扫描密度等参数,在参数指针表中列出了参数的偏移指针实际参数数据放在参数数据表中,其中比较常见的是16色或者256色的调色板最后一部分是图像数据,它们按照参数表中描述的形式按行排列,在HTML文件中隐藏信息,HTML文件是文本文件,在浏览器端仅能显示ASCII码中的可见字符。利用这一特点,可以在HTML的标记之间插入隐藏的数据比如,如果要隐藏的二进

6、制比特值为1,在选定的HTML标记后插入ASCII码值为9的字符;如果要隐藏的二进制比特值为0,则在选定的HTML标记后插入ASCII码值为32的字符,例,隐藏信息前的HTML文件的部分文本,例,隐藏信息后的HTML文件的相应文本深颜色部分为隐藏的数据。尽管在代码文本上可以明显的看出二者之间的差异,但在浏览器端则显示不出任何差异,例,在HTML文件中隐藏了秘密数据的载体文件的部分数据,例,例,HTML文件中隐藏的秘密数据,结论,用文件格式法,可以在文件中隐藏任意多的数据其隐藏结果不会对载体本身的外观造成任何损坏 文件的拷贝不会对隐藏的信息造成破坏 文件存取工具在保存文档时可能会造成隐藏数据的丢

7、失 隐藏的信息较容易被发现 为了确保隐藏内容的机密性,需要首先进行加密处理,然后再隐藏,2 时域替换技术,任何多媒体信息,在数字化时,都会产生物理随机噪声,而人的感观系统对这些随机噪声是不敏感的替换技术就是利用这个原理,试图用秘密信息比特替换掉随机噪声,以达到隐藏秘密信息的目的,时域替换技术,图像的位平面概念,图41,图像象素的灰度表示,图像各个位平面的作用,原始图像(8bit 灰度BMP图像),图像各个位平面的作用(1),去掉第一个位平面的Lena图像和第一个位平面,图像各个位平面的作用(2),去掉第12个位平面的Lena图像和第12个位平面,图像各个位平面的作用(3),去掉第13个位平面的

8、Lena图像和第13个位平面,图像各个位平面的作用(4),去掉第14个位平面的Lena图像和第14个位平面,图像各个位平面的作用(5),去掉第15个位平面的Lena图像和第15个位平面,图像各个位平面的作用(6),去掉第16个位平面的Lena图像和第16个位平面,图像各个位平面的作用(7),去掉第17个位平面的Lena图像(即第八个位平面)和第17个位平面,彩色图像,蓝色通道,绿色通道位平面(16),所用符号,Ci:载体对象的取样值 L(c):载体的长度L(m):秘密信息的长度Si:伪装对象的取样值K:伪装密钥,1。流载体的LSB方法,嵌入:选择一个载体元素的子集,其中共有 个元素,用以隐藏秘

9、密信息的 个比特。然后在这个子集上执行替换操作,把 的最低比特用 来替换 提取:找到嵌入信息的伪装元素的子集,从这些伪装对象中抽出它们的最低比特位,排列之后组成秘密信息,如何选择隐藏位置子集?,顺序选取缺点:已嵌和未嵌部分数据特征不同随机间隔法用伪装密钥k作为伪随机数发生器的种子,生成一个伪随机序列,嵌入位置为,2。伪随机置换,能够得到载体的所有元素,就可以从整个载体考虑,把秘密信息比特随机地分散在整个载体中嵌入:用种子密钥产生一个伪随机索引序列,将第k个秘密消息比特隐藏在索引为 的载体元素的最低比特位中,伪随机置换,提取:用同样的种子密钥产生同样的伪随机索引序列,从这些位置最低比特位中提取信

10、息 应避免的问题产生的索引值可能产生碰撞用一个集合记录所有已使用过的载体索引值,当再次出现同样的索引值时,则放弃这个索引值,再选择下一个元素 提取时同样处理,LSB顺序嵌入,LSB随机嵌入,替换,特点:修改量很小,视觉效果好,与图像内容无关,LSB方法的特点,简单,易实现,容量大安全性不高,不能抵抗叠加噪声、有损压缩等破坏,3。利用奇偶校验位的方法,把载体划分成几个不相重叠的区域,在一个载体区域中存储一比特信息嵌入:选择 个不重叠区域,计算出每一区域的所有最低比特的奇偶性,并选择一个载体元素的最低比特位存放这个区域的奇偶校验位。嵌入信息时,在对应区域的奇偶校验位上嵌入信息比特,如果奇偶校验位与

11、 不匹配,则将该区域中所有元素的最低比特位进行翻转,使得奇偶校验位与 相同,利用奇偶校验位的方法,提取:用同样的方法划分载体区域,计算出奇偶校验位,构成秘密信息,4。基于调色板的图像,基于调色板的图像调色板数据:定义了N种颜色索引对(i,ci)图象数据:代表每一个象素的调色板索引颜色向量代表R、G、B三个分量的值,如果是灰度图像,则三个分量取值相同使用调色板格式,可以降低图像存储的大小,基于调色板图像的隐藏方法,修改调色板颜色向量的LSB对彩色图像如果三种颜色同时修改,有可能引起颜色偏差修改图像数据(索引)的LSB索引值不代表颜色,相邻的索引值其代表的颜色可能相差很远可以先将颜色按某种规则排序

12、,使得相邻颜色比较接近,这时索引值所代表的颜色是相近的,基于调色板图像的隐藏方法,利用调色板中颜色顺序的不同组合隐藏信息改变调色板顺序会破坏隐藏信息,基于调色板图像的隐藏方法,Hide&Seek将调色板中各颜色分量进行划分,生成一个特殊的调色板,然后提取128个基色并经过细微的修改后扩展到256个颜色,产生可互相替换的相近颜色,嵌入时根据嵌入数据进行相应的替换产生相近颜色对,5。基于量化编码的信息隐藏,在差分编码中隐藏信息嵌入计算邻近采样的差值,对差值进行量化,得到 查量化隐藏表,如果 与要编码的秘密信息比特相同,则差分信号不变;如果 与秘密信息比特不相同,则由最接近的 替换,使得查表所对应的

13、比特与秘密信息比特相同,基于量化编码的信息隐藏,提取接收者拥有同样的伪装密钥表,它根据伪装对象的相邻数据的差分信号,对应密钥表,可以得到每一个差分值所对应的秘密信息比特,6。Patchwork算法,水印嵌入位置的选择(时空域)选择视觉不敏感区域(如纹理区域等)Patchwork算法:根据密钥随机选择n个象素对,更改它们的亮度值 提取时,计算,(a1,b1)(a2,b2)(a3,b3)(an,bn)Aa1,.,anBb1,.,an,A,B,7。二值图像中的信息隐藏,二值图像:由黑白象素的分布构成图像例如:传真、文字识别等通常方法:利用图像区域中黑色象素的个数对秘密信息进行编码,二值图像中的信息隐

14、藏(方法1),嵌入把一个二值图像分成 个矩形图像区域,如果其中黑色象素的个数大于一半,则表示嵌入0;如果白色象素的个数大于一半,则表示嵌入1当需要嵌入的比特与所选区域的黑白象素的比例不一致时,为了达到希望的象素关系,则需要修改一些象素的颜色修改应遵循一定的规则,原则是不引起感观察觉修改应在黑白区域的边缘进行,二值图像中的信息隐藏,需注意的细节应考虑有一定的冗余度。确定有效区域确定两个阈值 和,以及一个健壮性参数。隐藏0时,该块的黑色象素的个数应属于;隐藏1时,该块的黑色象素的个数应属于 如果为了适应所嵌入的比特,目标块必须修改太多的象素,就把该块设为无效标识无效块:将无效块中的象素进行少量的修

15、改,使得其中黑色象素的百分比大于,或者小于,二值图像中的信息隐藏,提取判断每一个图像块黑色象素的百分比,如果大于,或者小于,则跳过这样的无效块如果在 或者 的范围内,则正确提取出秘密信息0或1,二值图像中的信息隐藏,应用工程图纸,地图等需注意的问题在边缘处修改(如何标识边缘?),二值图像中的信息隐藏(方法2),另一种方法:利用游程编码的方法例编码:,二值图像中的信息隐藏,嵌入:修改二值图像的游程长度如果秘密信息位是0,则修改该游程长度为偶数;如果为1,则修改游程长度为奇数;如果秘密信息的取值与游程长度的奇偶性相匹配,则不改变游程长度 提取根据游程长度的奇偶性提取出秘密信息,二值图像中的信息隐藏

16、(方法3),二值图像中的信息隐藏(其他方法),文字特征修改法计算每个笔画的平均宽度改变笔画粗细嵌入秘密信息文本行、文本字符移位法行间距移位字间距移位,小结,时间、空间域的最低比特位替换方法把信息隐藏在载体的最不重要部分容易被噪声掩盖,有损压缩后丢失能否隐藏在载体的最重要部分?,变换域技术,在载体的显著区域隐藏信息,比LSB方法能够更好地抵抗攻击,而且还保持了对人类感观的不可察觉性 常用的变换域方法离散余弦变换(DCT)离散小波变换(DWT)离散傅立叶变换(DFT)等,DCT域的信息隐藏,图像压缩标准(JPEG)的核心二维DCT变换在DCT域中的信息隐藏,可以有效地抵抗JPEG有损压缩,二维DC

17、T变换,图像分为88的象素块,进行二维DCT变换,得到88的DCT系数系数按照Zig-Zag次序排列,左上角为直流系数,其余为交流系数左上角部分为直流和低频,右下角部分为高频,中间区域为中频。中低频系数包含了图像的大部分能量,是对人的视觉最重要的部分,DCT变换域,88分块,DCT变换,ZigZag 扫描,DCT变换域,JPEG压缩中使用的量化值(亮度成分),DCT变换域,DCT系数的特点直流分量和低频系数值较大,代表了图像的大部分能量,对它们做修改会影响图像的视觉效果高频系数值很小,去掉它们基本不引起察觉最好的水印嵌入区域就是在中频部分,图像DCT变换,基本隐藏算法,以一定的方式挑选一些中频

18、系数,在这些中频系数中叠加秘密信息 所有中频系数固定位置的中频系数随机挑选中频系数选择最大的N个中频系数,算法一(嵌入),在选出的中频系数中叠加秘密信息:DCT系数:隐藏后的DCT系数:第 i 个秘密信息比特:可调参数,控制嵌入强度,算法一(提取),在约定的中频系数中提取信息:接收端收到图像的对应中频系数:提取出的隐藏信息需要原始图像,算法二(嵌入、提取),在选出的中频系数中叠加秘密信息在约定的中频系数中提取信息,算法三(嵌入、提取),在选出的中频系数中叠加秘密信息在约定的中频系数中提取信息,特点,方法一:每个系数上嵌入的强度相同嵌入强度一定时系数很大时,嵌入信息易受破坏系数很小时,对系数修改

19、大方法二、三:根据系数的大小,成比例地嵌入这三个算法的提取需要原始图像,算法四,不需要原始载体的信息隐藏方法:利用载体中两个特定数的相对大小来代表隐藏的信息 嵌入:载体图像分为88的块,做二维DCT变换,分别选择其中的两个位置,比如用 和 代表所选定的两个系数的坐标如果,代表隐藏1;如果相反,则交换两系数如果,代表隐藏0;如果相反,则交换两系数,算法四,提取接收者进行二维DCT变换,比较每一块中约定位置的DCT系数值,根据其相对大小,得到隐藏信息的比特串,从而恢复出秘密信息 特点:不需原始图像注意:如果选定位置的两个系数相差太大,则对图像影响较大增大差距,代表无效应选择相近的值(如中频系数),

20、算法五,算法四的扩展:利用DCT中频系数中的三个系数之间的相对关系来对秘密信息进行编码 嵌入:选择三个位置,嵌入1:令嵌入0:令如果数据不符,则修改这三个系数值,使得它们满足上述关系其中参数D的选择要考虑隐藏的健壮性和不可察觉性之间的平衡,D越大,隐藏算法对于图像处理就越健壮,但是对图像的改动就越大,越容易引起察觉,算法五,如果需要做的修改太大,则放弃该块,将其标识为“无效”“无效”:对这三个系数做小量的修改使得它们满足下面条件之一:或,算法五,提取对图像进行DCT变换,比较每一块相应三个位置的系数,从它们之间的关系,可以判断隐藏的是信息“1”、“0”还是“无效”块,这样就可以恢复秘密信息,算

21、法六量化方法,QIM量化索引调制(Quantization Index Modulation)根据要嵌入的信息,使用不同的量化器对图像进行量化,得到的图像就是含有嵌入信息的图像嵌入信息并没有直接“加”到图像中提取时不需原始图像,简化标量量化,均匀标量量化二进制编码调制嵌入:以D为量化步长对选定的系数进行量化D的偶数倍:m=0D的奇数倍:m=1,简化标量量化,提取对选定的系数,判断是D的偶数倍:m=0D的奇数倍:m=1,算法六量化方法,算法六量化方法,矢量量化示意图X:量化器1O:量化器2,算法六量化方法,m=1:信号被“X”量化器量化,即:信号值用离“X”最近的量化器值代替m=0:信号被“O”

22、量化器量化,即:信号值用离“O”最近的量化器值代替,算法六量化方法,提取设定一个门限系数值与量化器X的距离小于门限:m1系数值与量化器O的距离小于门限:m0,小波变换域的信息隐藏,二维小波分解一级小波分解后得到的四个部分:左上:低频近似部分右上:水平方向细节部分左下:垂直方向细节部分右下:对角线方向细节部分图像的主要能量集中在低频部分,小波分解,近似部分(LL),水平方向细节部分(HL),垂直方向细节部分(LH),对角线方向细节部分(HH),HH1,HL1,LH1,HH2,HL2,LH2,LL1,LL2,隐藏算法,适合于DCT域的修改系数方法量化方法 都可以用于小波变换域系数比较方法 不适合小

23、波变换域,傅氏变换域的信息隐藏,适合于DCT域的修改系数方法和系数比较方法和量化方法都可以借鉴应注意:傅氏变换的特点实信号的傅氏变换系数包含实部和虚部,隐藏信息时应考虑在实部、虚部还是幅度、相位中隐藏信息 实信号的傅氏变换系数是对称的,隐藏信息应保证不改变系数的对称性,这样才能保证逆傅氏变换后仍然得到实信号,小结,变换域隐藏的总体思想,就是将秘密信息隐藏在载体的最重要部位DCT变换、小波变换、傅氏变换等,都是能量守恒变换,在变换域中将能量集中,隐藏时将秘密信息与载体的视觉重要部分紧密联系在一起,其他隐藏技术,扩展频谱算法统计隐藏技术变形技术载体生成技术,扩展频谱技术,扩频通信:信号在大于所需的

24、带宽内进行传输,数据的带宽扩展是通过一个与数据独立的码字完成的,并且在接收端需要该码字的一个同步接收,以进行解扩和数据恢复 特点:占据频带很宽,每个频段上的能量很低即使几个频段的信号丢失,仍可以恢复信号利用相互正交的扩频码,可以在一个宽频带内同时传输很多路信号优势:拦截概率小,抗干扰能力强,信息隐藏中的扩频概念,将扩频通信的概念应用到隐蔽通信系统中隐蔽通信系统就是试图将秘密信息扩展在整个载体中,以达到不可察觉的目的,并且删除一小部分载体,也很难删除整个信息,理想的扩频信息隐藏模型,使用MN的灰度图像作为载体。假设通信双方A和B共同拥有一组(至少)L(m)个正交的、尺寸为MN的灰度图像,把他们作

25、为伪装密钥,满足 其中,扩频信息隐藏模型,隐藏A通过计算图像 的加权和,产生一个秘密图像,然后选择一个载体图像 C,要求 C 与 全部正交计算载体图像与与秘密图像的和,得到一个伪装对象,扩频信息隐藏模型,提取计算伪装图像在基础图像 上的投影得到秘密信息,问题,这是一个理想的扩频信息隐藏系统模型问题:既要满足正交性要求,又要求图像有含义,SSIS掩密算法(1),SSIS使用扩展频谱技术作为嵌入函数。对加密后的秘密信息进行高容量的纠错编码,以提高整个掩密系统的鲁棒性。将纠错编码后的秘密信息与伪随机序列进行调制。再用一个交织器进行交织以抵抗突发噪声。然后嵌入到载体图像中,最后对载体图像进行适当的量化

26、得到最后的掩密图像。,SSIS是将扩频通信的概念引入到掩密技术中,SSIS 掩密算法(2),嵌入框图,SSIS提取信息思想,将检测看作是有噪图像的恢复问题;首先对得到的图像进行估计(推荐使用维纳滤波方法);将估计误差认为是图像中的隐藏信息;再进行反调制和反交织及纠错解码后获得隐藏的信息。,SSIS掩密提取信息框图,提取框 图,统计隐藏技术,原理:对载体的某些统计特性进行明显的修改,表示嵌入信息“1”,若统计特性不变,则表示嵌入信息“0”接收者在不知道原始载体的情况下,根据统计特性的改变,提取信息,统计隐藏技术(例),载体为灰度图像,把图像分为L(m)个不重叠的载体块,其中包含的象素集合为 伪装

27、密钥:同样尺寸的伪随机二值图案并且S中1的个数与0的个数相等,统计隐藏技术(例),嵌入把图像块 按照S分成同样大小的两个集合 和,规则为:对应 为1的那些象素点放入集合,而对应 为0的那些象素点放入集合,统计隐藏技术(例),嵌入1对子集 的所有象素加上一个值k(k0),而 中的象素不变合并 和,形成加了标记的图象块嵌入0对子集 的所有象素减去一个值k(k0),而 中的象素不变合并 和,形成加了标记的图象块,统计隐藏技术(例),提取接收者利用伪装密钥S,可以重构集合 和 计算集合 和 的均值之差如果均值之差大于一个阈值,则认为在块中嵌入了比特“1”,如果均值之差小于阈值,则认为嵌入的为“0”。,

28、变形技术,原理:对载体进行某种修改,其修改方式与需要嵌入的秘密信息比特相关联,通过比较修改后的载体与原始载体的差别来提取隐藏信息对载体的修改应该是不易察觉的,变形技术的应用,在格式化文本中嵌入信息利用文本的排列或者文档的布局来隐藏信息 例如:可以调节行间距、字间距,以及在文本中加入适当的空格等,代表对信息的编码,变形技术的应用,嵌入:在行间距编码中,行的位置根据秘密信息位进行上移或下移为了检测时达到同步,需要保持一些行不变,如隔行不变提取可以使用质心检测法(质心定义为水平轴上一行的中心),计算移动行的质心与上下不动行质心之间的距离,变形技术的应用,可用于文档打印后的真伪鉴别可以抵抗打印扫描计算

29、行或列的质心不能抵抗文字重新输入,载体生成技术,前面介绍的所有信息隐藏方法,都是修改载体,将秘密信息嵌入载体生成技术:利用秘密信息,生成一个伪装对象,而生成的伪装对象是有意义的数字文件,不会引起怀疑,这样也达到了秘密信息传递的目的,载体生成技术的应用,由于信息传输量的爆炸性增长,人类不可能观察世界上所有的通信,这样的任务只能由自动监控系统完成信息监控系统:通过设置关键字来检查信息,也可以通过统计特性来分析消息的特性,通过监控系统的筛查后,再对可疑信息进行人工检查例如,对于明文传输的消息,用关键字的方法就可以筛选出某类消息;而对于加密的信息,可以从统计特性上区分加密文本和未加密文本,载体生成技术

30、的应用,Wayner提出了一种模拟函数的方法,它是通过更改加密文本中字母的统计特性,使得它与正常文本的统计特性相匹配,以此来躲过自动监控系统的检查,模拟函数的方法,英语字母拥有几个统计特性。例如,单字母、两字母组和三字母组的分布频率模拟函数能把一个消息(其字母的概率分布为A)转换成另一个消息(其字母的统计特性为B)首先对分布为A的文件x使用哈夫曼系统压缩,产生一个二进制串文件,这个二进制串又能看成是另一个文件y(其分布为B)经哈夫曼压缩系统后输出的结果文件y将用作伪装对象,并能通过对二进制串文件运用一个逆哈夫曼压缩函数进行重构,模拟函数的方法,采用模拟函数产生的文本,由于它是根据统计特性创建的

31、,完全忽略了语义成分,因此,它仅能欺骗利用统计特性分析文本的自动检测机器,如果让人来看,这个文本是完全没有正常含义的,载体生成技术的应用,为了使产生的伪装对象既能欺骗机器,又能欺骗人,就是说既有正常的英文统计特性,又有正常的语法含义,看起来是一篇正常的文章,提出了一种英语文本的自动生成技术:自由上下文语法(CFG),CFG,G=V是一个变量集是终止符号集SV是起始符号 是叉积。叉积可以看成是一个替代规则,它们把一个变量转化成包含结束符号或变量符号的字符串,自由上下文语法(例),=SAlice B,SBob B,SEve B,SI A,Aam working,Aam lazy,Aam tired,Bis C,Bcan cook,Creading,Csleeping,Cworking,自由上下文语法(例),=S0.5Alice B,S0.3Bob B,S0.1Eve B,S0.1I A,A0.3am working,A0.4am lazy,A0.3am tired,B0.5is C,B0.5can cook,C0.5reading,C0.1sleeping,C0.4working,哈夫曼编码,“Eve B”编码为110“I A”编码为111,“A am tired”编码为11,“I am tired”11111,“Eve is working”110010,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号