第二章概念图像的数字化——对模拟图像信号的离散化过程,包括空间离散化和幅值离散化像素——构成数字图像的最小单位,即软件和硬件能够控制的最小单位灰度——亮度,即色彩的深浅程度采样与量化采样:对图像进行空间上的离散化处理量化:对图像灰度值进行离散化处理数字图像的大小M,N: 正整数L: 2~kb:存储数字图像需要的比特数b=M×N ×k当 M = N 时,b=N~2k像素的邻域f(x,y): 一幅图像p,r,s: 图像中的像素4-邻域对角邻域/D-邻域8-邻域像素的邻接描述图像中目标边界两个条件:两个像素的位置在某种意义上是否相邻两个像素的灰度是否满足某种相似准则准则:假设用V表示定义邻接性的灰度值集合。
eg1: 二值图像 V={1}eg2: 4bit : V={8,9, (15)4邻接:像素p和q都在V中取值,并且q在N4(p)中8邻接:像素p和q都在V中取值,并且q在N8(p)中路径如果图像中的两点p和q之间存在一系列点p=p0,p1,…,pn=q,其中,pi与pi-1邻接,1≤i≤n,则称p和q之间存在长度为n 的路径。
4-路径 8-路径像素在图像子集中的连通设S是图像中的一个子集,p和q是S 中的点。
如果从p到q之间存在一条完全由S中的点组成的路径,则称p和q 在S中是连通的。
对于S中的任意一点p,S中所有与p 连通的点的集合称为S的连通分量。
p① 1 0 0 01 1 0 0 00 0 1 0 00 0 0 1 10 0 1 1 ①q像素间的距离p: (x, y) q: (s, t) z: (v,w) 如果(a) D(p,q)≥0(D(p,q)=0 if p=q),(b) D(p,q)= D(q,p),(c) D(p,z)≤ D(p,q)+ D(q,z). 则D 是距离函数或度量。
欧式距离距点(x,y)的欧氏距离小于或等于某一值r 的像素形成一个中心在(x,y)半径为r 的圆D4距离(城市街区距离) D4(p,q)=|x-s|+|y-t|D8距离(棋盘距离) D4(p,q)=max(|x-s|+|y-t|)DE=5 D4=7 D8=4算术运算1、一元加法:g(x,y) = f(x,y)+C 对图像中每个像素加上C2、一元减法:g(x,y) = f(x,y)-C 对图像中每个像素减去C加法与减法运算改变图像的整体亮度 3、一元乘法:g(x,y) = f(x,y)*C 将图像中每个像素乘以C4、一元除法:g(x,y) = f(x,y)/C 将图像中每个像素除以C乘法法与除法运算按比例改变图像的亮度5、二元加法:h(x,y) = f(x,y)+g(x,y)将图像f 与g 中每个像素对应相加 6、二元减法:h(x,y) = f(x,y)-g(x,y) 将图像f 与g 中每个像素对应相减 7、二元逻辑运算 与: s(x,y) = f(x,y) & g(x,y) 或:s(x,y) = f(x,y) | g(x,y)异或: s(x,y) = f(x,y) ^ g(x,y) 8、二元逻辑运算通常用于模板运算 求反运算:g(x,y) = 255 - f(x,y) 9、几何运算(不了解)几何运算可以改变图像中物体之间的空间关系。
这种运算可以看成是图像内的各物体在图像内移动的过程 平移:x`=x+x0 y`=y+y0 旋转: 22)()(),(t y s x q p D e -+-=22122101221222222221112210122111222222⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡110010011''00y x y x y x θθsin cos 'y x x -=θθcos sin 'y x y +=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡11000cos sin 0sin cos 1''y x y x θθθθ缩放:第四章 图像增强目的:对图像进行加工,以得到对具 体应用来说视觉效果更“好”,更“有 用”的图像。
定义:图像增强是指按特定的需要突出 一幅图像中的某些信息,同时,消弱 或去除某些不需要的信息的处理法。
结果:可能会引起图像降质。
图像增强的方法:图像间运算 二元运算g(x,y) = f 1(x,y) + f 2(x,y) g(x,y) = f 1(x,y) - f 2(x,y) g(x,y) = f 1(x,y) × f 2(x,y) g(x,y) = f 1(x,y) / f 2(x,y) g(x,y) = f 1(x,y) & f 2(x,y) g(x,y) = f 1(x,y) | f 2(x,y) g(x,y) = f 1(x,y) ^ f 2(x,y)对比度增强增加原始图像中某两个灰度值之间的动态范围第六章 压缩编码 图像压缩编码的分类分类标准:解压后的图像和原始图像之间是否存在误差无损压缩:利用数据的统计冗余进行压缩(冗余度压缩/ 信息保持编码/ 熵编码)哈夫曼编码、算数编码、行程编码优点:不引入任何失真缺点:压缩率受到数据统计冗余度的限制有损压缩:(信息量压缩方法/ 失真度编码/ 熵压缩编码)预测编码、频率域方法、其他编码方法优点:通常能获得较大的压缩比 缺点:原始数据有损失(对理解图像的影响较小) 变长最佳编码定理在变长编码中,对出现概率大的信息符号赋以短码字,对出现概率小的信息符号赋以长码字。
如果码字长度严格按照所对应符号出现概率大小逆序排列,则编码所得的平均码长为最小。
该定理是霍夫曼编码的理论基础。
压缩比cx x ='dy y ='⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡110000001''y x d cy x压缩比是衡量数据压缩程度的指标之一。
目前常用的压缩比定义为其中LB 为源代码长度,Ld 为压缩后代码长度,Pr 为压缩比。
压缩比的物理意义是被压缩掉的数据占据源数据的百分比。
当压缩比Pr 接近100%时压缩效果最理想。
哈夫曼编码(Huffman Coding ) 方法首先求出图像中灰度分布的灰度直方图;根据该直方图,对其按照分布概率从大到小的顺序进行排列;每一次从中选择出两个概率为最小的节点相加,形成一个新的节点,构造一个称为“Huffman 树”的二叉树; 对这个二叉树进行编码,就获得了Huffman 编码码字。
信源熵为: H=-∑Pilog2Pi平均码字长度:R=∑βiPi 编码效率:η=H/R(%) 第七章 图像分割定义:1.把图像分解成构成它的部件和对象的过程2.有选择性地定位感兴趣对象在图像中的位置和范围 图像分割的基本策略1.分割算法基于灰度值的两个基本特性:不连续性和相似性2.检测图像像素灰度级的不连续性,找到点、线(宽度为1)、边(不定宽度)。
先找边,后确定区域。
3.检测图像像素的灰度值的相似性,通过选择阈值,找到灰度值相似的区域,区域的外轮廓就是对象的边 图像分割方法的分类1.基于阈值的分割-通过阈值对不同物体进行分割2.基于边缘的分割-先确定边缘像素,并把它们连接在一起,以构成所需的边界3.基于区域的分割-把各像素划归到各个物体或区域中4.基于运动的分割-通过视频物体运动进行分割阈值分割是一种广泛应用的分割技术 阈值分割利用图像中要提取的目标与其背景在灰度特性上的差异,把图像视为具有不同灰度级的两类区域(目标和背景)的组合,选取一个合适的阈值,以确定图像中每个像素点应该属于目标还是背景区域,从而产生相应的二值图像。
可以大量压缩数据,减少存储容量,而且能大大简化其后的分析和处理步骤。
设原始图像f(x,y),以一定的准则在f(x,y)中找出一个合适的灰度值,作为阈值t ,则分割后的图像g(x,y),可由下式表示:另外,还可以将阈值设置为一个灰度范围[t1,t2],凡是灰度在范围内的像素都变为1,否则皆变为0,即%100⨯-=BdB r L L L P某种特殊情况下,高于阈值t的像素保持原灰度级,其它像素都变为0,称为半阈值法,分割后的图像可表示为:阈值分割图像的基本原理,可用下式表示:由此可见,阈值化分割算法主要有两个步骤:1. 确定需要的分割阈值2. 将分割阈值与像素值比较以划分像素阈值的选取是阈值分割技术的关键,如果过高,则过多的目标点被误归为背景;如果阈值过低,则会出现相反的情况。
阈值选取方法1.直方图阈值分割法在利用阈值方法来分割灰度图像时一般都对图像有一定的假设,是基于一定的图像模型的。
最常用的模型:假设图像由具有单峰灰度分布的目标和背景组成,处于目标或背景内部相邻像素间的灰度值是高度相关的,但处于目标和背景交界处两边的像素在灰度值上有很大的差别。
如果一幅图像满足这些条件,它的灰度直方图基本上可看作是由分别对应目标和背景的两个单峰直方图混合构成的。
60年代中期,Prewitt提出了直方图双峰法,即如果灰度级直方图呈明显的双峰状,则选取两峰之间的谷底所对应的灰度级作为阈值直方图双峰法不适合直方图中双峰差别很大或双峰间的谷比较宽广而平坦的图像,以及单峰直方图的情况。
2.类间方差阈值分割法P149基本思想一幅图像被一个阈值分为目标与背景两部分,当两部分之间的方差最大时,分割效果最好3.最大熵值分割法4.模糊阈值分割法基于边缘的分割P156分为点、线、边缘检测边缘检测:两个具有不同灰度值的相邻区域之间总存在边缘。
边缘是灰度值不连续的结果,这种不连续通常可以利用求导数方便地检测到,一般常用一阶和二阶导数来检测边缘。
所用到的各种方法:算子(P83-87)基于区域的分割P165图像分割-把图像分解为若干个有意Z1 Zi Zt Zj Zk暗亮PB1 B2背景目标义的子区域,而这种分解是基于物体有平滑均匀的表面,与图像中强度恒定或缓慢变化的区域相对应,即每个子区域都具有一定的均匀性质。
前面所讨论的边缘、阈值,没有明显使用分割定义中的均匀测度度量。
常用的区域分割方法 只了解过程,不了解细节 区域增长(区域生长)P165 区域分裂-合并 二值图像的形态学处理数学形态学是分析几何形状和结构的数学方法,是建立在集合代数基础上,用集合论方法定量描述几何结构的科学。
A: 图像集合 B: 结构元素 膨胀膨胀是先把结构元素B 相对于自身原点进行映象,然后将映象平移z 之后得到(B )z ,使(B )z 与A 相交不为空集的所有点z 构成的集合。
腐蚀腐蚀是把结构元素B 平移z 之后得到Bz ,使Bz 完全包含于A 中的所有点z 构成的集合开运算和闭运算 开运算 清除图像中的小颗粒 闭运算 填充小的空隙和孔洞} Ø)ˆ(| {≠⋂=⊕A B z B Az})(| {A B z B A z ⊆=⊗BB A B A ⊕⊗=)(BB A B A ⊗⊕=∙)(。