图像分类:根据图像空间坐标和幅度(亮度或色彩)的连续性可分为模拟(连续)图像和数字图像。
模拟图像是空间坐标和幅度都连续变化的图像,而数字图像是空间坐标和幅度均用离散的数字(一般是整数)表示的图像。
图像的数学表示:一幅图像所包含的信息首先表现为光的强度(intensity),即一幅图像可看成是空间各个坐标点上的光强度I 的集合,其普遍数学表达式为:I = f (x,y,z,λ,t) 式中(x,y,z)是空间坐标,λ是波长,t是时间,I是光点(x,y,z)的强度(幅度)。
上式表示一幅运动的(t)、彩色/多光谱的(λ)、立体的(x,y,z)图像。
图像的特点:1.空间有界:人的视野有限,一幅图像的大小也有限。
2.幅度(强度)有限:即对于所有的x,y都有0≤f(x,y) ≤Bm其中Bm为有限值。
图像三大类:在每一种情况下,图像的表示可省略掉一维,即1.静止图像:I = f(x,y,z, λ)2.灰度图像:I = f(x,y,z,t )3.平面图像:I = f(x,y,λ,t)而对于平面上的静止灰度图像,其数学表达式可简化为:I = f(x,y)数字图像处理的基本步骤:1.图像信息的获取:采用图像扫描仪等将图像数字化。
2.图像信息的存储:对获取的数字图像、处理过程中的图像信息以及处理结果存储在计算机等数字系统中。
3.图像信息的处理:即数字图像处理,它是指用数字计算机或数字系统对数字图像进行的各种处理。
4.图像信息的传输:要解决的主要问题是传输信道和数据量的矛盾问题,一方面要改善传输信道,提高传输速率,另外要对传输的图像信息进行压缩编码,以减少描述图像信息的数据量。
5.图像信息的输出和显示:用可视的方法进行输出和显示。
数字图像处理系统五大模块:数字图像处理系统由图像输入、图像存储、图像通信、图像处理和分析五个模块组成。
1.图像输入模块:图像输入也称图像采集或图像数字化,它是利用图像采集设备(如数码照相机、数码摄像机等)来获取数字图像,或通过数字化设备(如图像扫描仪)将要处理的连续图像转换成适于计算机处理的数字图像。
2.图像存储模块:主要用来存储图像信息。
3.图像输出模块:将处理前后的图像显示出来或将处理结果永久保存。
4.图像通信模块:对图像信息进行传输或通信。
5.图像处理与分析模块:数字图像处理与分析模块包括处理算法、实现软件和数字计算机,以完成图像信息处理的所有功能。
三基色原理:人眼的视网膜上存在有大量能在适当亮度下分辨颜色的锥状细胞,它们分别对应红、绿、蓝三种颜色,即分别对红光、绿光、蓝光敏感。
由此,红(R)、绿(G)、蓝(B)这三种颜色被称为三基色。
根据人眼的三基色吸收特性,人眼所感受到的颜色其实是三种基色按照不同比例的组合。
则任一彩色C可表示为:C = R(R)+ G(G)+ B(B)颜色模型:1.RGB模型(面向机器):在三维直角坐标系中,用相互垂直的三个坐标轴代表R、G、B三个分量,并将R、G、B分别限定在[0,1],则该单位正方体就代表颜色空间,其中的一个点就代表一种颜色。
2.HSI模型(面向颜色处理或人眼视觉):HSI模型利用颜色的三个属性色调H(hue)、饱和度S(saturation)和亮度I(intensity)组成一个表示颜色的圆柱体。
人眼的机理:1.瞳孔:透明的角膜后是不透明的虹膜,虹膜中间的圆孔称为瞳孔,其直径可调节,控制进入人眼内之光通量(照相机光圈作用)。
2.晶状体:瞳孔后是一扁球形弹性透明体,其曲率可调节,以改变焦距,使不同距离的图在视网膜上成象(照相机透镜作用)。
3.视细胞:视网膜上集中了大量视细胞,分为两类:锥状细胞:明视细胞,在强光下检测亮度和颜色;杆(柱)状细胞:暗视细胞,在弱光下检测亮度,无色彩感觉。
人的视觉模型:人眼的亮度感觉:1.图像“黑”“白”(“亮”、“暗”)对比参数对比度: c = Bmax/ Bmin,相对对比度: cr = (B-B0)/B02.人眼亮度感觉范围①总范围很宽(c = 10^8)②人眼适应某一环境亮度后,范围限制适当平均亮度下:c = 10^3 ,很低亮度下:c = 103.同时对比度:人眼对亮暗程度所形成的“黑”“白”感觉具有相对性,即按对比度c感觉物体亮度对比。
马赫带(Mach Band)效应:马赫带效应的出现,是因为人眼对于图像中不同空间频率具有不同的灵敏度,而在空间频率突变处就出现了“欠调”或“过调”。
主观亮度S与实际亮度B之间的关系:S = K lnB+ k0人眼亮度感觉之应用:若一幅原图像经过处理,恢复后得到重现图像,重现图像的亮度不必等于原图像的亮度,只要保证二者的对比度及亮度层次(灰度级)相同,就能给人以真实的感觉。
续图像到数字图像的转化过程:数字图像的特点:1.信息量大2.占用频带宽3.像素间相关性大4.视觉效果的主观性大例:人观察如图所示两幅形状相同的目标图像时,会觉得哪一个目标更亮一些?与实际亮度有无不同?简述理由。
[黑色(最暗)灰度值定为0,白色(最亮)灰度值定为255]解答:两个不同亮度的目标物处于不同亮度的背景中,人会按对比度感觉目标物的亮度对比,因此人感觉(a)要亮一些,但事实上,目标(b)的实际亮度要高于(a)的实际亮度。
例:在串行通信中,常用波特率描述传输的速率,它被定义为每秒传输的数据比特数。
串行通信中,数据传输的单位是帧,也称字符。
假如一帧数据由一个起始比特位、8个信息比特位和一个结束比特位构成。
根据以上概念,请问:1.如果要利用一个波特率为56kbps(1k=1000)的信道来传输一幅大小为1024×1024、256级灰度的数字图像需要多长时间?2.如果是用波特率为750kbps的信道来传输上述图像,所需时间又是多少?3.如果要传输的图像是512×512的真彩色图像(颜色数目是32 bit),则分别在上面两种信道下传输,各需要多长时间?解答:1.传输的比特数为1024×1024×8×(1+8+1)/8=10485760,则在波特率为56kbps 的信道上传输时,所需时间为10485760/56000=187.25 秒。
2.传输的比特数为1024×1024×8×(1+8+1)/8=10485760,则在波特率为750kbps 的信道上传输时,所需时间为10485760/750000=13.98 秒。
3.传输的比特数为512×512×32×(1+8+1)/8=10485760。
在波特率为56kbps 的信道上传输时,所需时间为10485760/56000=187.25 秒;在波特率为750kbps 的信道上传输时,所需时间为10485760/750000=13.98 秒。
例:1.存储一幅1024×768,256 个灰度级的图像需要多少bit?2.一幅512×512 的32 bit 真彩图像的容量为多少bit?解答:1.一幅1024×768,256 个灰度级的图像的容量为:b=1024×768×8=6291456 bit2.一幅512×512 的32位真彩图像的容量为:b=512×512×32=8388608 bit像素间的基本关系:1.像素的相邻与邻域:4-邻域和4-相邻:N4(p) 8-邻域和8-相邻:N8(p)2.像素间的邻接和连通:4邻接、8邻接4通路、8通路4连通、8连通3.区域和边界:两个像素p和q邻接的条件:1.相邻:p(m,n)和q(s,t)位置上满足相邻;2.灰度值相近,即称为灰度值相近(似)准则。
常用的三种距离:D8(p,q) < De(p,q) < D4(p,q)矩不变性:如果目标区域中的灰度分布是已知的,在用矩描述来表示目标特征时,它有以下性质:1.平移不变性;2.旋转不变性;3.缩放不变性。
例:若灰度相似准则V={1},试按四连通和八连通分别标出题图8.13所示图像的目标物区域边界。
四连通目标物区域边界八连通目标物区域边界例:类似于书图8.1.6给出距中心点的距离不大于4的三种距离对比图图像信息的频域处理具有如下特点:1.能量守恒,但能量重新分配;2.有利于提取图像的某些特征;3.正交变换具有能量集中作用,可实现图像的高效压缩编码;4.频域有快速算法,可大大减少运算量,提高处理效率。
图像的几何变换:图像的空间平移、比例缩放、旋转、仿射变换和图像插值。
平移、比例缩放和旋转变换都是一种称为仿射变换的特殊情况。
图像几何变换的实质:改变像素的空间位置或估算新空间位置上的像素值。
仿射变换性质:1.仿射变换只有6个自由度(对应变换中的6个系数),因此,仿射变换后互相平行直线仍然为平行直线,三角形映射后仍是三角形。
但却不能保证将四边形以上的多边形映射为等边数的多边形。
2.仿射变换的乘积和逆变换仍是仿射变换。
3.仿射变换能够实现平移、旋转、缩放等几何变换。
灰度插值:1.最近邻插值法:令变换后像素的灰度值等于距它最近的输入像素的灰度值2.双线性插值:沿图像矩阵的每一列(行)进行插值,然后对插值后所得到的矩阵再沿着行(列)方向进行线性插值。
3.卷积插值法:当图像放大时,图像像素的灰度值插值可以通过卷积来实现,即将输入图像两行两列中间插零值,然后通过低通模板滤波2D-DFT的性质:1.变换核的可分离性:该性质说明2D-DFT可通过两次1D-DFT完成2.移位特性: a.空间移位 b.频域移位 c.移位时幅度不变d.频谱中心化:通过给图像f(m,n)乘以(−1)m+n,就可以使f(m,n)的频谱重原点移到中心(N/2,N/2),而得到一个完整的频谱。
3.周期性和共轭对称性4.旋转不变性5.实偶函数的DFT:仅有余弦项的实部6.实奇函数的DFT: 仅有正弦项的虚部7.线性性 8.比例性(尺度变换) 9.平均值 10.卷积定理增强图象目的:1.改善图像的视觉效果,提高图像的清晰度;2.将图像转换成一种更适合于人或机器分析处理的形式。
图象增强方法分类:1.空域法:直接对图像的像素灰度值进行操作。
包括图像的灰度变换、直方图修正、平滑和锐化处理、彩色增强等。
2.频域法:在图像的变换域中,对图像的变换值进行操作,然后经逆变换获得所需的增强结果。
常用的方法包括低通滤波、高频提升滤波以及同态滤波法等。
灰度的线性变换:设原图像灰值f(m,n)∈(a,b) 线性变换后的取值g(m,n)∈(c,d)。
变换关系式为g(m,n)=c+k[f(m,n)-a]1.扩展动态范围2.改变取值区间3.缩小动态范围4.反转或取反灰度的非线性变换:1.对数变换g(m,n)=λlog(1+f(m,n)) 对数变换的作用是扩展图像的低灰度范围,同时压缩高灰度范围,使得图像灰度分布均匀,与人的视觉特性相匹配。