《碎纸片的拼接复原数学建模二等奖论文.doc》由会员分享,可在线阅读,更多相关《碎纸片的拼接复原数学建模二等奖论文.doc(40页珍藏版)》请在三一办公上搜索。
1、碎纸片的拼接复原摘要破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。但是人工完成效率很低,所以引入计算机复原,计算机虽然准确率不及人工高,但是可以大大减轻工作强度。本论文主要是对纸张形状为矩形切割规范并且纸张上的文字标准的碎纸片的拼接复原的研究。问题一:首先根据图片的灰度矩阵找出第一张(最左侧)图片,根据小差值优先匹配依次排出相邻图片。碎纸片复原后的顺序如附件一、二所示。问题二:首先根据图片的灰度矩阵最左侧n列灰度值求和最大,可找出第一列(最左侧)图片,共11张。根据 “行间”的位置特征作为凝聚点进行聚类分析,将所有图片分为11类,即11行。应用小差值优先匹配
2、将这每行的图片进行拼接,得到11个行图片,再次应用小差值优先匹配把这11个行图片拼接成完整的图片。碎纸片复原后的顺序如附件三、四所示。问题三:同问题二方法一致,找出第一列(最左侧)图片(正反两面共有22张图片),将这些“行间”的位置特征作为凝聚点进行聚类分析,所有的图片分为11“大行”,将这些图片配对的正反面进行上边缘“粘接”处理,按照小差值优先匹配将这每行的粘接形成的19图片(如图一所示)进行拼接,得到11个行图片之后,再次应用小差值优先匹配把这11个行图片拼接成完整的图片。碎纸片复原后的顺序如附件五所示。观察上述三个问题的处理方法可知,三个问题的解决办法主干思想完全相同,都是小差值优先匹配
3、解决,并且清晰简练。但是由于问题的逐渐深入和复杂程度的增加,仅靠这一个简单的方法并不能在实际中解决问题,于是增加约束条件减小搜索范围,如:找出“行间”位置,并作为凝聚点进行聚类分析,然后就可以很大程度上减小出错的概率。关键词:聚类分析、MATLAB R2012a、小差值优先匹配、灰度矩阵 1、问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。请讨论以下问题:(1). 对
4、于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达(见【结果表达格式说明】)。(2). 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果表达要求同上。(3). 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解
5、决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果,结果表达要求同上。2、问题分析分析本问题可知,第一问是解决此类问题的基本方法,第二问及第三问相比第一问逐渐变得复杂,但主要解决思路与第一问相同,只是在第一问的基础上需要应用其他方法缩小搜索范围,但主体方法并未改变。针对问题一:对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法。在MATLAB软件12中应用imread函数读取附件一及附件二中的图片,可以获得相应的灰度矩阵,从矩阵中可以清楚地看到图片中每个像素的灰度值。观察
6、图片边缘及灰度矩阵边缘可以得出:图片被切割后会在这张图片被切割两侧生成相似的两个列矩阵,可以猜测这两个列矩阵相似程度越高则这两张图片可以拼接复原的概率就越大。为表示两列矩阵的相似程度,对这两列矩阵进行对应行相减取绝对值最后求和,所求得的和越小两矩阵越相似即复原概率越大。最左边一张图片的最左侧全为空白,即最左侧矩阵所有行求和值最大,可以得到最左侧的图片,然后可以拼接出整张图片。针对问题二:对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法。方法一:应用第一问中的小差值优先匹配,求出所有图片边缘矩阵的对应行相减取绝对值最后求和,然后逐个比较,此时会发现由于图片小且图片中字数较少,灰度矩阵
7、所给出的信息就会比较少,并且应用小差值优先匹配所求和会有大量数值相差不是很大图片出现,出现过多的候选项,这会对判断哪张图片可以复原产生很大的影响,甚至会出现无法选择,因为部分图片是正好没有切割文字,此时计算机是无法判断哪张可以复原的,就需要对方法一进行补充提供更多的约束条件或是进行人工干预,所以得出了以下的方法二。方法二:此方法主体方法也是应用小差值优先匹配,针对上述出现过多的候选项情况,观察附件三及附件四中的图片会发现,虽然所给的图片小且文字数目少,但是观察可知这些图片全部大小一致但是“行间”(两行文字之间的空白处)所出现的位置是不同的,记录这几行的位置,将其余图片所生成的矩阵对比,若特殊的
8、几行出现在相同的位置,则可将这些图片分为一“大行”(这些图片的行间距出现的位置相同)。然后将“大行”内的图片应用第一问中的小差值优先匹配进行拼接,可将这些行拼出。紧接着人工干预将所得的行分为11行(如果所得到的行多余11行),最后将这是11行转置成11列,按照第一问的方法进行即可拼出完整的图片。针对问题三:该问题比第二问更复杂,但是更贴合于实际情况,即实用性很强。仔细观察附件5中的图片,可以观察到,每张图片的a面和b面,“行间”所处的位置是相同的。这样,可以“行间”所处的位置进行聚类,聚为11类,同第二问方法一样,先分行,然后再每行拼接出来,转置成列,应用小差值优先匹配将这11列拼接,即可得出
9、完整图片。但是行分完后,猜测每行有英语碎纸片,由于英文字母本身所能获得的信息量较少,且每行的图片过多,在按照第二种方法处理时,会出现过多接近值,甚至会出现错误排列, 再仔细观察及阅读题意可以得出,一行图片的正面确定且结果正确时,反面是自然形成的,这样就只用到了一面数据量,若此时将两张图片的正反面以上边缘相接展开,形成高度是原高两倍的行图片,这样就会同时应用到正反两面的边缘数据,提高筛选时的准确率。同理,在每一行都拼完后,在进行“大行”相拼的时候,可以将这个行的正反两面以右边缘相接展开,又会形成长度是原长两倍的行,也同时应用到正反两面的边缘数据提高筛选时的准确率。得到图形如一所示:a a(b)a
10、(b)a(b)a(b)bb(a)b(a)b(a)b(a)图一(正反面粘接)按照如上图片正反连接在一起后应用小差值优先匹配加以适当的人工干预,拼出完整行图片。这样可以确定11张行图片,将这11张图片转置成11个列图片,之后再次应用小差值优先匹配拼出完整图片。3、模型假设(1)假设所有复原图片中位于同一面的文字的行间距相同。(2)假设页面上的文字全部是统一字体且页面排版相同。(3)假设页面整洁干净无黑点等干扰项。(4)第一列文字距离纸张左边缘的距离大于两相邻文字间的距离。4、符号说明及名词定义符号说明:k: 第k张图片n: 图片具有n行I: 两张图片边缘拼接能力,值越小,越容易拼接。:第k张图片所
11、对应的灰度矩阵。; 矩阵的第i行第j列所对应的元素。名词定义:“行间”: 相邻两行文字之间固定存在的空白区域,即文字排版时所设计的隔开每行的空白区域。它与这行中是否存在文字无关。小差值优先匹配: 在n张图片中取出每张图片的最左和最右侧的两个列灰度矩阵,然后任一两张图片进行下列运算:第一张图片的最右侧矩阵与第二张图片的最左侧灰度矩阵对应行相减,取绝对值最后求和,这个值越小,表明这两张图片边缘灰度值越接近,即两张图片的边缘小差值优先匹配,拼接的概率越大。5、模型建立与求解5.1第一问模型建立与求解:对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法。在MATL
12、AB软件中应用imread函数1 2读取附件一中的19张图片,得到19个灰度矩阵。建立目标函数为:(1) 按算法如下:(1) 找出第一张图片: (2)因为一张完整纸张上的字体第一列都会距离页面最左端有一定的距离以方便阅读和美观,所有最左边的图片最左端会对应一列全白,即所生成的矩阵第一列全为255,此时对该矩阵所有行求和会得到最大值504900。应用以上结论,对所有图片的灰度矩阵第一列进行求和,所得值最大的即为最左边一张照片,即 。对所有图片的灰度矩阵第一列进行求最大值的结果为第008张图片为最左边一张图片。(2) 找出第k张照片: (3)观察图片边缘及灰度矩阵边缘可以得出:图片被切割后会在这张
13、图片被切割两侧生成两个相似的列矩阵,即这两个列矩阵相似程度越高则这两张图片可以拼接复原的概率就越大,这里将此方法命名为小差值优先匹配。为比较图片边缘相似程度,将所有图片的最左侧及最右侧矩阵取出,即和对这两列矩阵进行对应行相减取绝对值最后求和,所求得的和越小两矩阵越相似,即匹配概率越大,即(k=2)。3此时和最小的即为第2张图片。以此类推,应用程序1即可求出第3、4、519张图片。顺序如表格一所示:8141215310216145913181171706表格一(3)MATLAB拼接19张图片由程序2所求出图片顺序在MATLAB中用imtool函数4将图片按顺序合并。完整图片的排列顺序即完整图如附
14、件一所示。第一问中的英文图片按上述(1)(2)(3)操作即可得出合并后的图片。完整图片的排列顺序即完整图如表格二所示。表格二3627151811051913108121417164运行程序二即为按照上述步骤操作后得出的完整图片。5.2第二问模型建立与求解: 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。根据第一问模型改进后建立第二问目标函数为: (4)要解决这个问题,要将这些碎纸片首先按照一定特征聚类,缩小搜索范围,应用到的这种方法叫做聚类分析。5.2.1聚类分析5:聚类分析(cluster analysis)
15、是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。 聚类分析区别于分类分析(classification analysis) ,后者是有监督的学习。选取若干个样品作为凝聚点,计算每个样品和凝聚点的距离,进行初始分类,然后根据初始分类计算其重心,再进行第二次分类,一直到所有样品不再调整为止。动态聚类法计算简单,分类迅速,占用计算机内存少,特别是当样品数较大时,采用动态聚类法比较有利;但动态聚类法的分类结果与最初凝聚点的选择有关,有较大的不确定性。聚类过程如图二所示:选凝聚点初始分类分类是否合理最终分类修改分类图二本题中所应用到的聚类方法为:最短距离法,此论文中,为便于理解,将
16、最短距离理解为灰度值接近,即两边缘小差值优先匹配,记为小差值优先匹配。以下用表示样品与之间距离,用表示类与之间的距离。定义类与之间的距离为两类最近样品的距离,即 (4)设类与合并成一个新类记为,则任一类与的距离是: (5)最短距离法聚类的步骤如下:(1)定义样品之间距离,计算样品两两距离,得一距离阵记为,开始每个样品自成一类,显然这时。(2)找出的非对角线最小元素,设为,则将和合并成一个新类,记为,即。(3)给出计算新类与其它类的距离公式: (6)将中第p、q行及p、q列用上面公式并成一个新行新列,新行新列对应,所得到的矩阵记为。(4)对重复上述对的(2)、(3)两步得;如此下去,直到所有的元
17、素并成一类为止。如果某一步中非对角线最小的元素不止一个,则对应这些最小元素的类可以同时合并。最短距离法也可用于指标(变量)分类,分类时可以用距离,也可以用相似系数。但用相似系数时应找最大的元素并类,也就是把公式中的min换成max。按算法解决步骤如下:5.2.2对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,观察附件三中的图片,可以发现这些图片存在以下两个规律:(1)一些图片的整个左端有很大一部分空白,初步参测这几张图片为整张图片的第一列。将附件三中的209张图片用MATLAB用imread函数读出209个灰度矩阵,因为这些图片的整个左端有很大一部分空白,所以这几张图片前11列都
18、是灰度值255,对这11列所有的元素进行求和可得255*11*180=504900,然后对所有图片的前11列求和78,并筛选出数值为504900的所有图片, (7)并将这些图片作为第一列。筛选结果如下007、014、029、038、049、061、071、089、094、125、168(.bmp)这11张图片构成了完整图片的第一列。(2)这209图片全部大小一致但是行间距(两行文字之间的空白)所出现的位置是不同的,“行间”出现的位置不同且只有固定的几种。表现在灰度矩阵中就是整个同一行的图片会出现相同的某几行数值全为255,对这些矩阵进行行求和,利用MATLAB将值为19*255=4854的行记
19、为1 9,值小于4854的记为0,可以清晰的得出“行间”的位置,在此处记录两个完整的“行间”,利用这些位置特征将这209张图片分为11类,即11“大行”。MATLAB实现分“大行”过程:将附件3中求出的209图片,全部进行每行求和,并利用MATLAB将值为19*255=4854的行记为1,值小于4854的记为0,可以得出这209张图片的“行间”位置记录矩阵。将以上11张图片的“行间”位置作为参考,利用这些图片分成11行。由于图片较小从中能获取的数据量较少,所以再用小差值优先匹配后会的发现拼错的概率比较大,所以在此对模型进行改进,同上,找出图片最右侧一列,然后从右往左开始拼接,最后将这两列图片合
20、并选取各种准确的排列,如此,可以降低排列出错的概率。(3)对这11行中的19张图片,进行行方向上的拼接。应用上述聚类分析最短距离分析中提出的小差值优先匹配进行拼接,由于纸片较小可以获得的信息量非常少,尽管已经将范围缩小到19张,但是仍然会出现拼接错误出现如下图一所示情况:图一 然后,按照上述方法找出最右侧图片,从右往左拼接图片如图二所示图二观察可以看出图一图二均出现了四处拼接错误,但两张可以拼出完整的一行,即此时需要进行人工干预,干预方式:比较两张图片,排出正确的顺序。后面生成的图片中有少量会出现错误,干预方式及干预时间与上述图片相似,这里不再重复叙述(4)对折11张“行纸片”进行列方向上的拼
21、接。对这是一个行纸片转置又形成11个列纸片,再次应用小差值优先匹配,即可将这11列纸片拼接为完整的一张纸。完整图片的排列顺序即完整图如附件三所示。运行程序四即为按照上述步骤操作后得出的完整图片。(5)附件4中的英文纸片重复上述步骤(1)(2)(3(4),即可得出复原后的图片。完整图片的排列顺序即完整图如表格三和表格四所示。表格三495465143186257192178118190951122129289118814461197867699916296131796311616372617720523616810076621423041231471915017912086195261871838
22、148461612435811891221031301938816725891057414128315982199135127316020316913439315110711517694348418390471214212414477112149971361641275843125131821091971618411018766106150211731571812041391452964111201592180483775554420610104981721715972081381581266817545174013753569315370166321967115683132200178033
23、2021981513317020585152165276089146102154114401512071551401851081174101113194119123表格四19107501115419018400210418006410600414903220406503906714720114817019619809411316407810309108010102610000601702814608605110702904015818609802411715000505905809203003704612701919409314108812112610515511417618215102205
24、7202071165082159139001129063138153053038123120175085050160187097203031020041108116136073036207135015076043199045173079161179143208021007049061119033142168062169054192133118189162197112070084060014068174137195008047172156196023099122090185109132181095069167163166188111144206003130034013110025待添加的隐藏文字
25、内容3027178171042066205010157074145083134055018056035016009183152044081077128200131052125140193087089048072012177124000102115运行程序五即为按照上述步骤操作后得出的完整图片。(见附录)5.3第三问模型建立与求解:上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法根据前两问的模型改进优化后建立第三问目标函数: (8) (9) () (1
26、0)()(11)该问题比第二问更复杂,但是更贴合于实际情况,所以实用性很强。仔细观察附件5中的图片,可以观察到,每张图片的a面和b面,“行间”所处的位置是相同的,对每一张图片的a、b面读取灰度矩阵,对比可知“行间”出现的位置相同。即在不知正反面的情况下,可先将正反面分为同一行。按算法解决步骤如下:(1)找出最左侧一列的图片观察附件。所有最左边的图片最左端会对应一列全白,即所生成的矩阵通过灰度矩阵图可知最多前11列全为255,此时对该矩阵所有行求和会得到最大值504900。应用以上结论,对所有图片的灰度矩阵第一列进行求和,所得值最大的即为最左边一列照片 (2)所以在进行聚类分析的时候可以先将这些
27、“行间”相同的图片分为一“大行”。MATLAB实现分“大行”过程:将附件5中求出的518图片,全部进行灰度矩阵每行求和,并利用MATLAB将值为19*255=4854的行记为1,值小于4854的记为0,可以得出这508张图片的“行间”位置记录矩阵。将(1)中求出的最左侧的11个图片的“行间”位置作为凝聚点,聚类分析将所有的图片分成11“大行”,每行包含19X2=38张图片。这38张图片“行间”位置是相同的,并且这38张包括19张正反面。将每一张图片的正反面通过上边缘粘接就会形成一个二倍高的纸片,这样就会从边缘获取更多的信息量。(3)每一“大行”的拼接应用上述聚类分析最短距离分析中提出的小差值优
28、先匹配进行拼接,依次即可排出11个行图片。(4)行与行相连拼出完整图片应用方法同样是小差值优先匹配,即可以拼出完整的图片。正反面顺序如表格五、表格六所示表格五(正面)078a111a125b140b155b150b183a174a110b066b108b018a029b189a081a164a020b047b136a089b010a036b076a178b044b025a192b124a022b120a144b079b014b059b060a147b152b005b186a153b084b042a030b038b121b098b094a061a137a045b138b056a131a187a0
29、86a200a143a199a011a161b169a194a173a206a156b034b181a198a087b132a093b072a175b097b039a083b088a107b149a180b037a191b065a115a166a001a151a170a041b070a139a002b162a203a090b114b184a179a116a207b058b158b197b154a028a012b017a102a064a208b142b057b024b013b146b171a031b201b050b190a092a019a016a177a053a202b021a130b163b1
30、93a073a159b035b165a195b128b157b168b046b067b063a075a167b117a008a068a188b127b040b182a122b172b003a007a085a148a077b004b069b032b074a126a176b185b000a080a027b135a141b204a106b023a133b048b051a095b160a119b033a071a052b062b129a118a101b015a205b082a145b009a099b043b096a109b123b006b104b134b113b026a049a091b106a100a0
31、55a103b112b196a054a表格六(反面)136b047a020a164b081b189b029a018b108a066a110a174b183b150a155a140a125a111b078b005a152a147a060b059a014a079a144a120b022a124b192a025b044a178a076b036a010b089a143b200b086b187b131b056b138a045a137b061b094b098a121a038a030a042b084b153a186b083a039b097a175a072b093a132b087a198b181b034a15
32、6a206b173b194b169b161a011b199b090a203b162b002a139b070b041a170b151b001b166b115b065b191a037b180a149b107a088b013a024a057a142a208a064b102b017b012a028b154b197a158a058a207a116b179b184b114a035a159a073b193b163a130a021b202a053b177b016b019b092b190b050a201a031a171b146a172a122a182b040a127a188a068b008b117b167a07
33、5b063b067a046a168a157a128a195a165b106a204b141a135b027a080b000b185a176a126b074b032a069a004a077a148b085b007b003b009b145a082b205a015b101a118b129b062a052a071b033b119a160b095a051b048a133a023b054b196b112a103a055b100b106b091a049b026b113a134a104a006a123a109a096b043a099a运行程序六即为按照上述步骤操作后得出的完整图片模型总结:纵观以上三个问题,可
34、以发现,题目的复杂性越来越高,也越来越接近与现实生活中碰到的情况,即实用性增强,但是论文中解决三个问题所应用的主体方法小差值优先匹配没有改变。小差值优先匹配如图四:复原图11行左侧空白列大行第一列图片灰度矩阵“行间”聚类分析小差值优先匹配小差值优先匹配图四第一问问题直接应用上述模型进行求解,第二问和第三问稍微复杂需要先进行预处理,第二问中利用“行间”位置特征先进行聚类分出行,第三问同样分出行之后还要分出正反面。其余步骤均是按照小差值优先匹配来解决。可见模型的主体清晰有利于模型进化已解决更复杂的同类问题。6、 模型优缺点模型优点:(1) 模型主体部分简洁清晰,程序简洁干练。(2) 模型实用性较强
35、,易于向更复杂的现实情况推广。复杂问题只要根据实际情况增加聚类分析的凝聚点或者挖掘实际情况中所隐含的条件,在小差值优先匹配模型上增加约束条件就可以简化分类,提高排序正确率,所以模型易于推广。(3) 在“分行”的关键问题上抓住“行间”这个决定性的影响因素,使每张图片所处的行唯一确定,提高筛选的准确度。(4) 充分挖掘了题目中所提供的一切数据条件,如最左端和最右端都考虑,正反面同时考虑。模型缺点:(1) 模型在碎片边缘较短且数量较多的情况下,获得数据太少,其准确度下降,需要太多人工干预。(2) 模型不具有一般普遍性,它仅适用于边缘为直线的且纸片上文字书写规范的矩形碎片复原情况,对边缘为是特殊形状的
36、碎片或是文字书写不规范的纸片将不再适用。7、 模型改进及推广模型在对数据较少的图片拼接识别准确率不高,显然模型不能对两张图片是否相邻做出很好的判断,改进可从以下两反面进行:(1)从图片的最左端和最右端同时开始拼接,使拼接正确的图片尽可能多的出现在这行中。(2)仅使用一个来判断下一张图片,在图片较小数据量少的情况下容易误判,所以需要再增加约束条件,如同时考虑类平均法、离差平方和法(Ward法)等较复杂的算法,可提高准确性。8、参考文献1 沈恒范. 详解MATLAB数字图像处理.北京:电子工业出版社,20102 张德丰等. MATLAB数字图像处理.北京:机械工业出版社,20093 汪晓银.周保平
37、.数学建模与数学实验.北京:科学出版社,20124 蓝章礼 李益才 李艾星.数字图像处理与图像通信.北京:清华大学出版社,2009 5 zhx19870705,聚类分析2013年9月15日6 陈刚 于丹 吴迪.MATLAB基础与实例进阶.北京:清华大学出版社,20127 于万波.基于MATLAB的图像处理.北京:清华大学出版社,20118 蒋先刚.数字图像模式识别工程软件设计.北京:中国水利水电出版社,20089 赵书兰.MATLAB数字图像处理与分析实例教程.北京:化学工业出版社,2009附录8141215310216145913181171706附件1中碎片复原后的顺序及图片:附件2中碎片
38、复原后的顺序及图片:3627151811051913108121417164附件3中碎片复原后的顺序及图片:附件3行排序(只列了两行的图)第一行:第二行:复原后的顺序495465143186257192178118190951122129289118814461197867699916296131796311616372617720523616810076621423041231471915017912086195261871838148461612435811891221031301938816725891057414128315982199135127316020316913439315110711517694348418390471214212414477112149971361641275843125131821091971618411018766106150211731571812041391452964111201592180483775554420610104981721715972081381581266817545174013753569315370166321967115683132200178033