当前位置:文档之家› 碎纸片的拼接复原

碎纸片的拼接复原

全国大学生数学建模竞赛论文格式规范本科组参赛队从A、B题中任选一题,专科组参赛队从C、D题中任选一题。

(全国评奖时,每个组别一、二等奖的总名额按每道题参赛队数的比例分配;但全国一等奖名额的一半将平均分配给本组别的每道题,另一半按每题论文数的比例分配。

)论文用白色A4纸打印;上下左右各留出至少2.5厘米的页边距;从左侧装订。

●论文第一页为承诺书,具体内容和格式见本规范第二页。

●论文第二页为编号专用页,用于赛区和全国评阅前后对论文进行编号,具体内容和格式见本规范第三页。

●论文题目、摘要和关键词写在论文第三页上(无需译成英文),并从此页开始编写页码;页码必须位于每页页脚中部,用阿拉伯数字从“1”开始连续编号。

注意:摘要应该是一份简明扼要的详细摘要,请认真书写(但篇幅不能超过一页)。

●从第四页开始是论文正文(不要目录)。

论文不能有页眉或任何可能显示答题人身份和所在学校等的信息。

●论文应该思路清晰,表达简洁(正文尽量控制在20页以内,附录页数不限)。

●引用别人的成果或其他公开的资料(包括网上查到的资料) 必须按照规定的参考文献的表述方式在正文引用处和参考文献中均明确列出。

正文引用处用方括号标示参考文献的编号,如[1][3]等;引用书籍还必须指出页码。

参考文献按正文中的引用次序列出,其中书籍的表述方式为:[编号] 作者,书名,出版地:出版社,出版年。

参考文献中期刊杂志论文的表述方式为:[编号] 作者,论文名,杂志名,卷期号:起止页码,出版年。

参考文献中网上资源的表述方式为:[编号] 作者,资源标题,网址,访问时间(年月日)。

●在论文纸质版附录中,应给出参赛者实际使用的软件名称、命令和编写的全部计算机源程序(若有的话)。

同时,所有源程序文件必须放入论文电子版中备查。

论文及源程序电子版压缩在一个文件中,一般不要超过20MB,且应与纸质版同时提交。

(如果发现程序不能运行,或者运行结果与论文中报告的不一致,该论文可能会被认定为弄虚作假而被取消评奖资格。

)●本规范中未作规定的,如排版格式(字号、字体、行距、颜色等)不做统一要求,可由赛区自行决定。

●在不违反本规范的前提下,各赛区可以对论文增加其他要求(如在本规范要求的第一页前增加其他页和其他信息,或在论文的最后增加空白页等)。

●不符合本格式规范的论文将被视为违反竞赛规则,无条件取消评奖资格。

●本规范的解释权属于全国大学生数学建模竞赛组委会。

[注] 赛区评阅前将论文第一页取下保存,同时在第一页和第二页建立“赛区评阅编号”(由各赛区规定编号方式),“赛区评阅纪录”表格可供赛区评阅时使用(各赛区自行决定是否在评阅时使用该表格)。

评阅后,赛区对送全国评阅的论文在第二页建立“全国统一编号”(编号方式由全国组委会规定,与去年格式相同),然后送全国评阅。

论文第二页(编号页)由全国组委会评阅前取下保存,同时在第二页建立“全国评阅编号”。

全国大学生数学建模竞赛组委会2013年8月26日修订承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):吉林农业大学参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期: 2013 年 9 月 15 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文根据对问题的分析和数据的总结,通过matlab软件将碎纸片的拼接复原问题转化为对数字图像的拼接问题。

对图像进行数字化处理并对其二值化,根据问题建立了三个数学模型。

针对问题1,建立了二值化边界匹配模型,通过该模型使用我们成功实现了附件1、附件2的拼接复原。

针对问题2,在问题1的基础上,通过人工的干预选出纸的边界,再通过纸片边界对碎纸片进行边界像素点匹配,最终实现了附件3、附件4的拼接复原。

针对问题3,建立了特征点对匹配算法,通过人工与计算机的结合,最终也实现了附件5的碎纸片的拼接复原。

关键词:纸片拼接、二值化、点对匹配1、问题的提出1.1问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。

特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。

随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。

请建立数学模型分析研究下面的问题:1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

复原结果以图片形式及表格形式表达(见【结果表达格式说明】)。

2. 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

复原结果表达要求同上。

3. 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。

附件5给出的是一页英文印刷文字双面打印文件的碎片数据。

请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果,结果表达要求同上。

【数据文件说明】(1)每一附件为同一页纸的碎片数据。

(2)附件1、附件2为纵切碎片数据,每页纸被切为19条碎片。

(3)附件3、附件4为纵横切碎片数据,每页纸被切为11×19个碎片。

(4)附件5为纵横切碎片数据,每页纸被切为11×19个碎片,每个碎片有正反两面。

该附件中每一碎片对应两个文件,共有2×11×19个文件,例如,第一个碎片的两面分别对应文件000a、000b。

【结果表达格式说明】复原图片放入附录中,表格表达格式如下:(1)附件1、附件2的结果:将碎片序号按复原后顺序填入1×19的表格;(2)附件3、附件4的结果:将碎片序号按复原后顺序填入11×19的表格;(3)附件5的结果:将碎片序号按复原后顺序填入两个11×19的表格;(4)不能确定复原位置的碎片,可不填入上述表格,单独列表。

1.2问题分析本题是破碎文件的拼接复原问题,传统的破碎文件拼接工作需要人工完成,准确率高,但效率低。

当碎片数量巨大,手动的拼接很难在短时间内完成。

本题要求利用计算机开发破碎文件纸片的自动拼接技术,建立碎纸片拼接复原模型和算法,提高复原效率。

针对本文中附件中给出的中英文内容进行分析可知,破碎纸片是来自同一页的印刷文件由碎纸机纵切而成。

由纵切形成碎纸边缘而产生的文字痕迹可手动找出边缘纸张的两条。

剩余17条文字图像可对其进行二值化处理。

通过数字化处理即可将图像转化为数字匹配问题。

假设任意两条碎纸片匹配,则边缘特征就越相似。

取一条文字图像的右边界与另一条文字图像的左边界进行与运算。

如个数相同且占两边界的总数比例越高,则越匹配.2、模型假设为了简化解题步骤,需要对模型进行合理的假设和简化,具体如下:(1)假设忽略用灰度值二值化处理像平面产生的误差。

(2)假设本题给定的附件中碎纸片的文字具体规格如字体、字号、文字间间距等一致。

(3)假设本题给定的附件文件纸张大小规格一致。

3、模型中使用的主要参数说明为了便于描述问题,我们用一些符号来代替问题中涉及的一些基本变量。

如下表所示。

其他一些变量将在文中陆续说明。

4、建立模型4.1 模型Ⅰ的建立根据附件1、附件2的数据,可以发现碎纸片都是通过摄像机拍摄下来的图片,所以我们可以把碎纸片的拼接复原转化为图像的拼接复原模型。

4.1.1图片预处理预处理阶段的目的是求出待处理图像的轮廓线上各点的坐标, 保证匹配的成功率和精度。

首先,读取附件1中的碎纸片图像,使用matlab软件将图片数字化处理得到一个二维矩阵,。

其中M是图像的宽度; N是图像的高度。

为了便于检测图像的轮廓,其次是将待处理图像二值化,即将待拼合图像的部分(即文字)设置为黑色0,背景设置为白色255, 设待匹配图像的灰度级是256, 且背景为白色,则对待匹配图像进行二值化处理的数学表达式为:()提取图像的左边界L和右边界R::,提取矩阵,的第一列:,提取矩阵,的最后一列每一列就表示一个图像的一个边界,每个碎纸片图像都有左右边界,边界的值要么为1,1代表纸条边界为白色,要么为0代表有边界有文字。

4.1.2 图片配准算法在碎片拼接复原的过程中,匹配策略也是非常重要的,直接关系到匹配的正确性和效率,在问题一中,我们根据以下步骤进行匹配:第一步:因为根据对碎纸片和问题的分析,我们知道碎纸片是由碎纸机通过纵切获取到的,而且每页纸被切为19条碎片。

所以通过对二值化以后的图像矩阵分析有:为第个碎纸片()为第个碎纸片为其他的碎纸片第二步:将第一个碎纸片作为基准,从剩下的17个图片中随机找一个碎纸片的R 与第一个碎纸片的L作与运算,判断黑白色像素点相同的个数Num。

第三步:计算相似度S,问题采用加权平均的方法,则有数学表达式:(5-3)第四步:判断匹配是否成功:如果相似度S大于给定的阈值T,我们就认为匹配成功,反之,继续匹配其他的碎纸片,直到所有的碎纸片都匹配完成。

4.1.3 模型1的求解根据上述的算法使用matlab编写程序,根据测试,设置阈值T=0.9,对附件1中的4.2 模型Ⅱ的建立4.2.1图片预处理在问题一的基础做了改进,问题是对图像二值化再取图像矩阵的边界,而在问题二中,因为只对图像的边界进行匹配,所以没有必要把所有的像素点都进行二值化处理,只对使用的边界R和L进行二值化,其数学表达式为:表示矩阵的最后一列;表示矩阵的第一列4.2.2 图像配准算法第一步:读取附件3中的碎纸图像,将R或者L等于1的图片(即左边界和右边界全是白色图片)识别出来。

相关主题