当前位置:
文档之家› 数学建模 碎纸片拼接优秀论文
数学建模 碎纸片拼接优秀论文
⎪
⎪
⎪
⎩ ������������������������ ≥ 0 ������ = 1, 2, . . . , 19 ������ = 2, . . . , 19 ������ ̸= ������
������ ̸= ������
首先找出������������������中数字0的位置(������, ������),则第������张为首张碎片,第������张为尾张碎片。再将 矩阵������������������ 导入������������������������������中,将11张碎纸片的首位从第������张到第������张按照最短距离逐个连接。
1. 问题一的分析:已有一份中文单面文件和一份英文单面文件,均被纵切为19条碎片,中 文文件的每张碎片中均有27行的汉字,英文文件的每张碎片中均有29行的字母。因为 图片由像素点组成,像素点可以转换成可运算的数据,我们的做题思路为:先将19张 碎纸片分别转化成0 ∼ 255的灰度值矩阵,再将其转化分别成数据的矩阵,利用首尾数 据拼接模型,将19个0-1矩阵的尾列数据逐个与其他矩阵的首列矩阵进行对比,取距离 最短的进行两两拼接。
������(11,792) ⎞
������������������
=
⎜ ⎜
...
...
...
...
...
⎟ ⎟
⎝
⎠
������(119)80,72 ������(129)80,72 · · · ������(11988)0,72 ������(11998)0,72
5.1.2 首尾数据拼接模型的建立
2
三、模型的假设
1. 每一张碎纸片的边缘均光滑。 2. 同一文件的碎纸片大小、形状相同。 3. 同一文件的行间距相同,段落间距相同。 4. 文件中仅有黑色文字,无污渍或其他内容。 5. 所有图片不需要进行去噪处理。
四、符号假设
符号
���������(���������������) ������(������������������) ������������������ ������������������ ������������������ ������������������ ������������������ ������������������ ������������������
意义 第k张碎片的������ × ������灰度值矩阵 第k张碎片的������ × ������ 0-1数据矩阵
所有碎纸片 碎纸片首列的������ × ������ 0-1的数据矩阵 碎纸片尾列的������ × ������ 0-1的数据矩阵
碎纸片的������ × ������距离矩阵 各行0-1数据之和的矩阵
|������180������,������ − ������180������−179,������ |
������=1 ������=1
进行行与行之间的三次拼接。其中需在一次聚类、二次拼接和三次拼接可能出错处进行 人工干预。根据人工干预次数得出中文文件拼接的准确率为90.99%,英文文件拼接的准确 率为67.46%。
2. 建立最短距离拼接模型:以������������������为决策变量,引入������������������判断是否通过该距离,建立旅行
商模型:
19 19
∑︁ ∑︁
������������������
������������������ ������������������
������=1 ������=1
19 19
������������,������ = ∑︁ ∑︁ |(���������(���,������������) − ���������(���,������������))|
������=1 ������=1
得到所有碎纸片之间的距离,将所有匹配度导入Lingo,利用旅行商模型取距离最短的碎 纸片进行两两拼接,并导出图像。得到中文文件的拼接顺序为:008、014、012、015、 003、010、002、016、001、004、005、009、013、018、011、007、017、000、006,英文文件的拼接顺序 为:003、006、002、007、015、018、011、000、005、001、009、013、010、008、012、014、017、016、004。
2. 将灰度值矩阵转化成0-1矩阵:通过
������(������������������)
=
⎧ ⎨
1,
������(������������������)
⎩ 0, ������������������������
≥ <
170 170
, ������ = 1, 2, · · · , 19
(1)
3. 得到碎纸片的首尾列矩阵:从������ = 1, 2, · · · , 19的������������������������中分别取出第一列,放入矩阵������������������,分
3
别取出第最后一列,放入矩阵������������������,其中������������������,������������������均为1980 × 19 的矩阵:
⎛ ������(11,1)
������(12,1) · · · ������������(11,19) ������(11,19) ⎞
������������������
=
⎜ ⎜
...
...
...
...
...
⎟ ⎟
⎝
⎠
������(119)80,1 ������(129)80,1 · · · ������(11988)0,1 ������119980,1
⎛ ������(11,7)2
������(12,7)2 · · · ������(11,782)
(2)
������=1 ������=1
得出矩阵������������,������ :
⎛
⎞
������1,1 · · · ������1,19
������������������
=
⎜ ⎜
...
...
⎝
...
⎟ ⎟
⎠
������19,1 · · · ������19,19
其中矩阵的对角线代表������ = ������时的对比,在实际拼接时不存在碎纸片的尾列与自身首 列拼接的情况,故人为将对角线取为极大值1000。
⎛ ������1(���,���1) · · · ������1(���,������)��� ⎞
���������(���������������)
=
⎜ ⎜
...
...
...
⎟ ⎟
⎝
⎠
, ������ = 1, 2, · · · , 19
���������(���������,)1 · · · ���������(���������,)������ 1980×72
������=1
计算第一列11张与剩余198 张的距离,取距离最短的碎纸片进行一次聚类,再找出11张碎
纸片同行碎纸片共同具有的的特征行,利用绝对差值比较模型和最短距离拼接模型对特
征行进行求解,进行同类碎纸片间的拼接,得到二次拼接的结果,最后建立三维矩阵最短
距离模型
11 1368
∑︁ ∑︁
������������������������ =
⎧ 19
⎪ ⎪ ⎪
∑︁ ������������������ = 1
������ = 1, 2, . . . , 19 ������ ̸= ������
⎪
⎪
⎪ ⎪
������=1
⎪
⎪
⎪ ⎪
19
⎪ ⎪ ⎪ ⎨
∑︁ ������������������ = 1
������ = 1, 2, . . . , 19 ������ ̸= ������
1. 建立首尾差值比较模型:将第������(������ = 1, 2, · · · , 19)张碎片尾列数据依次与第������(������ = 1, 2, · · · , 19)张 碎片首列数据进行比较,比较时采用模型:
19 19
∑︁ ∑︁
������������������ =
|(������������������ − ������������������ )|
关键词: 绝对差值比较;最短距离模型;聚类分析;特征行对比;三维矩阵。
1
一、问题的重述
破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重 要的应用。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当碎 片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发 碎纸片的自动拼接技术,以提高拼接复原效率。请讨论以下问题:
2. 问题二的分析:已有一份中文单面文件和一份英文单面文件,均为横切和纵切成11 × 19块的碎片,中文文件的每张碎片中均有2 ∼ 3行的汉字,英文文件的每张碎片中均 有2 ∼ 3行的字母,可见行数较少,准确率会降低。由于第一列的前多列具有全空白 的特征且后多列不空白的特征,我们的思路是:先从每个文件中找出首列所有碎纸片, 再以第一列为基准进行每行碎纸片的分组和拼接。对于中文文件,我们根据行与行之 间空白部分的位置进行一次聚类;对于英文文件,我们根据特征行的数据和位置进行 一次聚类,再利用首尾数据拼接模型进行二次拼接,最后在碎纸片和碎纸片的行与列 的三维矩阵中求最短距离得连接方式,得到行与行之间的连接。
3. 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎 纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片 数据。请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼 接复原结果。