当前位置:文档之家› 规则碎纸片的拼接复原

规则碎纸片的拼接复原

论 文 检 测 报 告报告编号: 5d95e0aadf5149a5a9ef1ecb397c466d送检文档: 规则碎纸片的拼接复原论文作者: 陈芳芳文档字数: 2981检测时间: 2015-01-07 12:39:34检测范围: 论文库,中文期刊库(涵盖中国期刊论文网络数据库、中文科技期刊数据库、中文重要学术期刊库、中国重要社科期刊库、中国重要文科期刊库、中国中文报刊报纸数据库等),Tonda论文库(涵盖中国学位论文数据库、中国优秀硕博论文数据库、部分高校特色论文库、重要外文期刊数据库如Emerald、HeinOnline、JSTOR等),资源共享库。

一、检测结果:总相似比: 36.05% [即复写率与引用率之和]检测指标: 自写率 63.95%复写率 36.05%引用率 0.0%相 似 比: 互联网 36.05% 学术期刊 0.0% 学位论文 0.0% 资源共享 0.0%其他指标: 表格 0 个 脚注 0 个 尾注 0 个章节抄袭比36.05% 规则碎纸片的拼接复原二、相似文献汇总:序号标题文献来源作者出处发表时间11213年碎纸片拼接复原数模论文互联网互联网213年碎纸片拼接复原数模论文-豆丁网互联网互联网32013年全国大学生数学建模竞赛国家一等奖论文B题碎纸片的拼接...互联网互联网4【图】科密碎纸机 深圳碎纸机 黑金刚碎纸机 可碎光碟 - 罗湖办公...互联网互联网5一种碎纸自动拼接中的形状匹配方法-《计算机仿真》2006年11期-...互联网互联网6国家奖碎纸片的拼接还原_百度文库互联网互联网7基于蚁群优化算法的碎纸拼接-豆丁网互联网互联网8求2013数学建模题B题(2)的中文原题以及附件3不胜感激_百度知道互联网互联网9沈阳建筑大学_徐俊杰.郭书恒.唐杰_百度文库互联网互联网10碎纸机批发,厂家,图片,商贸城-马可波罗网互联网互联网三、全文相似详情: (红色字体为相似片段、浅蓝色字体为引用片段、深蓝色字体为可能遗漏的但被系统识别到与参考文献列表对应的引用片段、黑色字体为自写片段)碎纸机,是用来切碎销毁纸张的机器,为了达到废弃文件保密的目的,要把纸张分割成很多的细小纸片,碎纸机切割的纸粒工整利落,能达到保密的效果。

随着数据时代发展,大量的政府机关、企事业单位都采用了碎纸机对废弃文件或失效的机密文件进行破碎处理。

碎纸方式是指当纸张经过碎纸机处理后被碎纸刀切碎后的形状。

市面上有些碎纸机可选择两种或两种以上的碎纸方式。

不同的碎纸方式适用于不同的场合,如果是一般性的办公场合则选择段状、粒状、丝状,条状的就可以了。

但如果是用到一些对保密要求比较高的场合就一定要用沫状的。

随着现代技术的不断发展和市场的需求,现在的碎纸机,除了对纸张的处理,也可以对信用卡、光盘等进行切割。

本文研究的只是针对印刷文字文件在碎纸机中被切割的碎片,它是规则的黑白图片,对于非印刷文字文件的碎纸片、彩色碎纸片、形状不规则或边缘有破损的碎纸片等都是该碎纸片拼接技术的重要影响因素。

随着科学技术的不断发展,人们对信息交流、存储和销毁的需求也不断的增加。

目前,大量政府机关、企事业单位都是用打印机来打印文件,也都采用了碎纸机对废弃文件或失效的机密文件进行破碎处理。

当遇到误销毁的文件时,就要靠人工对碎纸片进行拼接,而人工拼接工作量大,不仅费力耗时,可能还会出现拼接错误等情况。

如果应用当前的图像处理与模式识别技术来开发碎纸片的自动拼接技术,用计算机对所有碎片进行搜索和筛选,对能够在某种指标上匹配的碎片进行拼接复原。

这样会大大的提高拼接复原的效率,从而降低了人工的工作量和难度。

目前在情报资料碎片整理、司法技术鉴定等领域中, 碎纸的拼接工作大部分都是靠人工的方式完成。

虽然国外对这项工作有进行了一些研究, 但是由于碎纸的自动修复技术应用背景的特殊性, 目前几乎没有公开的研究资料可以参考。

类似的研究主要是集中在文物碎片的自动修复、虚拟考古、故障分析以及计算机辅助设计、医学分析等领域。

所以对规则碎片自动拼接问题的研究,不仅具有广阔的应用前景,而且具有很强的理论意义。

问题1:对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(纵切),建立碎纸片拼接复原模型和算法,针对附件1、附件2针对文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

分析:针对问题1,在附件一及附件二中,碎纸片仅纵切,则纸片边缘的字有可能出现完整、残缺、标点符、空格四种情况,每个字又由多个像素点组成,故我们利用Matlab图像处理函数imread()将各个碎片文字像素二值化,并取出代表各个碎片左右两边缘的像素点的列向量,如此在每张碎片左右两边缘所获的值都可组成一组向量,且分别设左边缘 ,右边缘 ( )。

设复原图像的第1列像素为 向量,第72列像素为 向量列,以此类推直到最后一列像素为 。

因为原图像的第一列像素全为255(白色),所以可找出 ,从而可以确定 和 对应的 和 ,将该碎纸片数据放入向量A中,再将列向量 逐一与剩下的所有图片的列向量 元素作差,列方向绝对值求和,则和最小的就是能与 匹配的碎片,以此类推。

匹配完成后用Matlab图像处理函数imshow()将向量A转换成图片。

问题2:对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

分析:针对问题2,加入横向分割后,各碎片便出现上下左右四个边缘,此时,需要多提取碎片图像上边缘 及下边缘 像素的向量( ),图片处理方法同问题1;因为原图像的左上角碎片具有左边、上边全白的特点,右上角碎片具有右边、下边全白的特点,左下角碎片具有左边、下边全白的特点,右下角碎片具有下边、右边全白的特点,所以可以先找出左上角的第一块碎纸片,接下来用二叉树搜索方法进行匹配,此时有两个匹配方向:一是先向右进行匹配,完成一行,再向下匹配完成下一行直至匹配完成;二是先向下匹配,完成一列,再向右匹配完成下一列直至匹配完成;考虑到原图除了第一行的碎纸片会出现上边缘为全白,最后一行的碎纸片会出现下边缘全白的情况,中部也有可能出现全白的情况,若选第一个匹配方法匹配的精准率不大理想,有可能出现不能匹配而中断,所以本文选择第二种匹配方法:用问题1的匹配模型将第一块碎纸片的下边缘与剩下的碎纸片上边缘进行匹配直至下侧边缘碎片完成第一列碎纸片拼接。

再将左上角碎纸片右边缘 逐一与剩下的所有碎纸片的左边缘 进行匹配,确定第二列第一张碎纸片,再向下进行匹配,可以得到第二列碎纸片,以此类推直至匹配完成,用Matlab图像处理函数imshow()将向量A转换成图片。

针对问题1,在附件一及附件二中,碎纸片仅纵切,则纸片边缘的字有可能出现完整、残缺、标点符、空格四种情况,每个字又由多个像素点组成,故我们利用Matlab图像处理函数imread()将各个碎片文字像素二值化,并取出代表各个碎片左右两边缘的像素点的列向量,如此在每张碎片左右两边缘所获的值都可组成一组向量,且分别设左边缘 ,右边缘 ( )。

设复原图像的第1列像素为 向量,第72列像素为 向量列,以此类推直到最后一列像素为 。

因为原图像的第一列像素全为255(白色),所以可找出 ,从而可以确定 和 对应的 和 ,将该碎纸片数据放入向量A中,再将列向量 逐一与剩下的所有图片的列向量 元素作差,列方向绝对值求和,则和最小的就是能与 匹配的碎片,以此类推。

匹配完成后用Matlab图像处理函数imshow()将向量A装换成图片。

针对问题2,加入横向分割后,各碎片便出现上下左右四个边缘,此时,需要多提取碎片图像上边缘 及下边缘 像素的向量( ),图片处理方法同问题1;因为原图像的左上角碎片具有左边、上边全白的特点,右上角碎片具有右边、下边全白的特点,左下角碎片具有左边、下边全白的特点,右下角碎片具有下边、右边全白的特点,所以可以先找出左上角的第一块碎纸片,用问题1的匹配方法将第一块碎纸片的下边缘与剩下的碎纸片上边缘进行匹配直至下侧边缘碎片。

接下来用二叉树搜索方法进行匹配,将左上角碎纸片右边缘 逐一与剩下的所有碎纸片的左边缘 进行匹配,确定第二列第一张碎纸片,再向下进行匹配,可以得到第二列碎纸片,以此类推直至匹配完成,用Matlab图像处理函数imshow()将向量A转换成图片。

本论文针对不同碎纸片的类型和尺寸,具体问题具体分析,为每一种情况设计了不同的算法来实现碎纸片的复原。

对匹配率相近的碎纸片,采用人工干预的方法提高精准度。

本论文针对不同碎纸片的类型和尺寸,具体问题具体分析,为每一种情况设计了不同的算法来实现碎纸片的复原。

对匹配率相近的碎纸片,采用人工干预的方法提高精准度。

规则碎纸片的拼接复原是数学建模中一个特殊的案例。

以数学中的相似度的基本原理为基础,以计算机图像处理技术为手段,根据读取的图片文字特征值,建立匹配模型,在适当的算法下寻求最优的匹配方案。

利用最优匹配方法对碎纸片进行拼接复原。

在较强的理论基础,以及相应的MATLAB软件支持下,自动拼接技术不仅匹配度高,而且简单易行。

比用其他软件或人工拼接,在拼接效率上就占有较大优势,使得自动拼接得到的结果准确又省时,该技术不仅具有广阔的应用前景,而且具有很强的理论意义。

四、指标说明:1. 总相似比即类似于重合率。

总相似比即送检论文中与检测范围所有文献相似的部分(包括参考引用部分)占整个送检论文的比重,总相似比=复写率+引用率。

2. 引用率即送检论文中被系统识别为引用的部分占整个送检论文的比重(引用部分一般指正确标示引用的部分)。

3. 自写率即送检论文中剔除雷同片段和引用片段后占整个送检论文的比重,一般可用于论文的原创性和新颖性评价,自写率=1-复写率-引用率。

4. 复写率即送检论文中与检测范围所有文献相似的部分(不包括参考引用部分)占整个送检论文的比重。

5. 红色字体代表相似片段;浅蓝色字体代表引用片段、深蓝色字体代表可能遗漏的但被系统识别到与参考文献列表对应的引用片段;黑色字体代表自写片段。

五、免责声明:鉴于论文检测技术的局限性以及论文检测样本库的局限性,网站不保证检测报告的绝对准确,相关结论仅供参考,不做法律依据。

Gocheck论文检测服务中使用的论文样本,除特别声明者外,其著作权归各自权利人享有。

根据中华人民共和国著作权法相关规定,Gocheck网站为学习研究、介绍、评论、教学、科研等目的引用其论文片段属于合理使用。

除非经原作者许可,请匆超出合理使用范围使用其内容和本网提供的检测报告。

相关主题