精品实验项目字符识别预处理的设计和实现专业:电子信息工程姓名:高勇学号:2010021204指导老师:郑蕊蕊目录一、实验类型:设计性实验 (2)二、实验目的 (2)三、实验设备:扫描仪、安装有MATLAB软件的计算机 (2)四、实验内容及原理 (2)(1)字符图像的获取 (2)(2)字符图像预处理 (2)(3)字符图像分割 (2)(4)函数的作用 (3)五、实验步骤 (7)1.载入车牌图像: (7)2.将彩图转换为灰度图并绘制直方图: (7)3. 用roberts算子进行边缘检测: (8)4.图像实施腐蚀操作: (9)5.平滑图像 (9)6. 删除二值图像的小对象 (10)7.车牌定位 (11)8.字符分割和识别 (13)9.车牌识别: (19)六、思考题 (26)一、实验类型:设计性实验二、实验目的1. 掌握图像的获取、预处理和分割的原理及MATLAB实现方法。
2. 掌握使用扫描仪和计算机获取数字图像的方法,理解扫描仪的原理。
3. 自学一种字符图像的分割算法并用MA TLAB编程实现该算法。
三、实验设备:扫描仪、安装有MATLAB软件的计算机四、实验内容及原理(1)字符图像的获取用扫描仪获取图像是字符图像处理常用的数字化过程的方法之一。
以办公设备中常用的台式扫描仪为例,其主要性能指标有x、y方向的分辨率、色彩分辨率(色彩位数)、扫描幅面和接口方式等,这些指标都可以从扫描仪的说明手册中获得。
分辨率的单位是dpi(Dot Per Inch),意思是每英寸的像素点数。
扫描仪工作时,首先由可移动带状光源将光线照在欲输入的图稿上,并沿y方向扫描稿件,产生表示图像特征的反射光或透射光。
照射到原稿上的光线经反射后穿过一个很窄的缝隙,形成沿x方向的光带,经光学系统采集和过滤成RGB三色光带分别照射到RGB分量的CCD上,CCD将光信号转换为模拟电信号。
内部电路的A/D变换器将模拟电信号转变为数字电子信号输送给计算机。
将稿件全部扫描一遍,一幅完整的图像就输入到计算机中去了。
(2)字符图像预处理根据扫描仪扫描的文档实际情况,有选择地用MA TLAB编程实现字符图像倾斜校正、滤波、灰度化、二值化和归一化等图像预处理。
根据具体需要,还可进行图像的正交变换、边缘提取、形态学和图像细化等操作。
(3)字符图像分割通过查找资料,自学字符图像分割的常用算法,根据原始扫描图像的实际情况,设计一种字符图像分割的方法并用MA TLAB编程实现,并绘制流程图。
(4)函数的作用1.Imerode功能:对图像实现腐蚀操作,即膨胀操作的反操作。
用法:IM2 = imerode(IM,SE)IM2 = imerode(IM,NHOOD)IM2 = imerode(IM,SE,PACKOPT,M)IM2 = imerode(...,PADOPT)IM2 = imerode(IM,SE) 腐蚀灰度,二值,压缩二值图像IM,返回IM2。
参数SE为由strel 函数返回的结构元素或者结构元素对象组。
IM2 = imerode(IM,NHOOD)腐蚀图像IM,这里NHOOD是定义结构元素邻域0和1的矩阵。
IM2 = imerode(...,PADOPT)指出输出图像的大小(是否和输入图像大小一致)。
2.imdilate功能:对图像实现膨胀操作。
用法:IM2 = imdilate(IM,SE)IM2 = imdilate(IM,NHOOD)IM2 = imdilate(IM,SE,PACKOPT)IM2 = imdilate(...,PADOPT)IM2 = imdilate(IM,SE) 膨胀灰度,二值,压缩二值图像IM,返回IM2。
参数SE为由strel 函数返回的结构元素或者结构元素对象组。
IM2 = imdilate(IM,NHOOD)膨胀图像IM,这里NHOOD是定义结构元素邻域0和1的矩阵。
IM2 = imdilate(IM,SE,PACKOPT)定义IM是否是一个压缩的二值图像。
IM2 = imdilate(...,PADOPT)指出输出图像的大小。
3.strel功能:用于膨胀腐蚀及开闭运算等操作的结构元素对象(本论坛随即对膨胀腐蚀等操作进行讲解)。
用法:SE = strel(shape,parameters)创建由指定形状shape对应的结构元素。
其中shape的种类有‘arbitrary','pair','diamond','periodicline','disk','rectangle''line','square','octagon参数parameters一般控制SE的大小。
4.edgeBW = edge(I)采用灰度或一个二值化图像I作为它的输入,并返回一个和I相同大小的二值化图像BW,在函数检测到边缘的地方为1,其他地方为0。
BW = edge(I,'sobel') 自动选择阈值用Sobel算子进行边缘检测。
BW = edge(I,'sobel',thresh) 根据所指定的敏感度阈值thresh,用Sobel算子进行边缘检测,它忽略了所有小于阈值的边缘。
当thresh为空时,自动选择阈值。
BW = edge(I,'sobel',thresh,direction) 根据所指定的敏感度阈值thresh,在所指定的方向direction上,用Sobel 算子进行边缘检测。
Direction可取的字符串值为horizontal(水平方向)、vertical(垂直方向)或both(两个方向)。
[BW,thresh] = edge(I,'sobel',...) 返回阈值BW = edge(I,'prewitt') 自动选择阈值用prewitt算子进行边缘检测。
BW = edge(I,'prewitt',thresh) 根据所指定的敏感度阈值thresh,用prewitt算子进行边缘检测,它忽略了所有小于阈值的边缘。
当thresh为空时,自动选择阈值。
BW = edge(I,'prewitt',thresh,direction) 根据所指定的敏感度阈值thresh,在所指定的方向direction上,用prewitt算子进行边缘检测。
Direction可取的字符串值为horizontal(水平方向)、vertical(垂直方向)或both(两个方向)默认方向为both。
BW = edge(I,'roberts') 自动选择阈值用roberts算子进行边缘检测。
BW = edge(I,'roberts',thresh) 根据所指定的敏感度阈值thresh,用Roberts算子进行边缘检测,它忽略了所有小于阈值的边缘。
当thresh为空时,自动选择阈值。
5.Imclose功能:对图像实现闭运算,闭运算也能平滑图像的轮廓,但和开运算相反,它一般融合窄的缺口和细长的弯口,去掉小洞,填补轮廓上的缝隙。
用法:IM2 = imclose(IM,SE)IM2 = imclose(IM,NHOOD)用法和imopen相同。
6.imopen功能:对图像实现开运算,开运算一般能平滑图像的轮廓,消弱狭窄的部分,去掉细的突出。
用法:IM2 = imopen(IM,SE)IM2 = imopen(IM,NHOOD)IM2 = imopen(IM,SE)用结构元素SE实现灰度图像或二值图像的IM的形态开运算。
SE可以是单个结构元素对象或者结构元素对象数组。
IM2 = imopen(IM,NHOOD)用结构元素strel(NHOOD)执行开运算。
7.bwareaopen功能:删除小面积对象格式:BW2 = bwareaopen(BW,P,conn)作用:删除二值图像BW中面积小于P的对象,默认情况下conn使用8邻域。
8.tic和toc函数这两个函数一般配合使用,tic表示计时的开始,toc表示计时的结束。
格式如:tic任意表达式toct=toc9.fspecial功能:用于建立预定义的滤波算子,其语法格式为:h = fspecial(type)h = fspecial(type,para)其中type指定算子的类型,para指定相应的参数;type的类型有:1、'average'averaging filter为均值滤波,参数为hsize代表模板尺寸,默认值为【3,3】。
'disk'circular averaging filter为圆形区域均值滤波,参数为radius代表区域半径,默认值为5.'gaussian'Gaussian lowpass filter为高斯低通滤波,有两个参数,hsize表示模板尺寸,默认值为【3 3】,sigma为滤波器的标准值,单位为像素,默认值为0.5.'prewitt'Prewitt horizontal edge-emphasizing filter用于边缘增强,大小为【3 3】,无参数'sobel'Sobel horizontal edge-emphasizing filter用于边缘提取,无参数9. filter2J = filter2(h,I);使用指定的滤波器h对I进行滤波,结果保存在J中10.bwarea函数功能:计算二值图像中对象的总面积。
调用格式:total = bwarea(BW)估算二值图像BW中对象的总面积。
返回的total是一个标量,它的值大致地反映了和图像中on像素的个数。
由于对于不同像素类型,度量标准不同,因此结果可能并不十分精确。
BW可以是数值类型(整型、浮点型)或者逻辑类型。
对于数值类型,像素值不为0被视为on。
返回值total是double类型的。
11.sum功能:函数求和sum(x,2)表示矩阵x的横向相加,求每行的和,结果是列向量。
而缺省的sum(x)就是竖向相加,求每列的和,结果是行向量。
A>0的结果是得到一个逻辑矩阵,大小跟原来的A一致,A中大于零的元素的位置置为1,小于等于零的位置置为0。
所以横向求和以后,就是求A中每行大于零的元素个数。
12.round功能:四舍五入调用格式:Y = round(X)在matlab中round也是一个四舍五入函数。
五、实验步骤1.载入车牌图像:I=imread('car1.jpg');figure(1),imshow(I);title('original image');%将车牌的原图显示出来,结果如下:2.将彩图转换为灰度图并绘制直方图:I1=rgb2gray(I);%将彩图转换为灰度图figure(2),subplot(1,2,1),imshow(I1);title('gray image');figure(2),subplot(1,2,2),imhist(I1);title('灰度图直方图');%绘制灰度图的直方图结果如下所示:3. 用roberts算子进行边缘检测:I2=edge(I1,'roberts',0.18,'both');%选择阈值0.18,用roberts算子进行边缘检测figure(3),imshow(I2);title('roberts operator edge detection image');结果如下:4.图像实施腐蚀操作:se=[1;1;1];I3=imerode(I2,se);%对图像实施腐蚀操作,即膨胀的反操作figure(4),imshow(I3);title('corrosion image');5.平滑图像se=strel('rectangle',[25,25]);%构造结构元素以正方形构造一个se I4=imclose(I3,se);%图像聚类、填充图像figure(5),imshow(I4);title('smothing image');结果如下所示:6. 删除二值图像的小对象I5=bwareaopen(I4,2000);%去除聚团灰度值小于2000的部分figure(6),imshow(I5);title('remove the small objects'); %用imshow函数显示滤波后图像结果如下所示:7.车牌定位[y,x,z]=size(I5);%返回I5各维的尺寸,存储在x,y,z中myI=double(I5);%将I5转换成双精度tic %tic表示计时的开始,toc表示计时的结束Blue_y=zeros(y,1);%产生一个y*1的零阵for i=1:yfor j=1:xif(myI(i,j,1)==1)%如果myI(i,j,1)即myI的图像中坐标为(i,j)的点值为1,即该点为车牌背景颜色蓝色 %则Blue_y(i,1)的值加1Blue_y(i,1)= Blue_y(i,1)+1;%蓝色像素点统计endendend[temp MaxY]=max(Blue_y);%Y方向车牌区域确定%temp为向量yellow_y的元素中的最大值,MaxY为该值的索引PY1=MaxY;while ((Blue_y(PY1,1)>=5)&&(PY1>1))PY1=PY1-1;endPY2=MaxY;while ((Blue_y(PY2,1)>=5)&&(PY2<y))PY2=PY2+1;endIY=I(PY1:PY2,:,:);%行方向车牌区域确定%%%%%% X方向 %%%%%%%%%Blue_x=zeros(1,x);%进一步确定x方向的车牌区域for j=1:xfor i=PY1:PY2if(myI(i,j,1)==1)Blue_x(1,j)= Blue_x(1,j)+1;endendendPX1=1;while ((Blue_x(1,PX1)<3)&&(PX1<x))PX1=PX1+1;endPX2=x;while ((Blue_x(1,PX2)<3)&&(PX2>PX1))PX2=PX2-1;endPX1=PX1-1;%对车牌区域的校正PX2=PX2+1;dw=I(PY1:PY2-8,PX1:PX2,:);t=toc;figure(7),subplot(1,2,1),imshow(IY),title('Line direction areas');%行方向车牌区域确定figure(7),subplot(1,2,2),imshow(dw),title('positioning color images');%定位后的车牌区域如下所示:8.字符分割和识别1)车牌的进一步处理对分割出的彩色车牌图像进行灰度转换、二值化、均值滤波、腐蚀膨胀以及字符分割以从车牌图像中分离出组成车牌号码的单个字符图像,对分割出来的字符进行预处理(二值化、归一化),然后分析提取,对分割出的字符图像进行识别给出文本形式的车牌号码。