第一章机器视觉系统构成与关键技术1、机器视觉系统一般由哪几部分组成?机器视觉系统应用的核心目标是什么?主要的分成几部分实现?用机器来延伸或代替人眼对事物做测量、定位和判断的装置。
组成:光源、场景、摄像机、图像卡、计算机。
用机器来延伸或代替人眼对事物做测量、定位和判断。
三部分:图像的获取、图像的处理和分析、输出或显示。
2、图像是什么?有那些方法可以得到图像?图像是人对视觉感知的物质再现。
光学设备获取或人为创作。
3、采样和量化是什么含义?数字化坐标值称为取样,数字化幅度值称为量化。
采样指空间上或时域上连续的图像(模拟图像)变换成离散采样点(像素)集合的操作;量化指把采样后所得的各像素的灰度值从模拟量到离散量的转换。
采样和量化实现了图像的数字化。
4、图像的灰度变换是什么含义?请阐述图像反色算法原理?灰度变换指根据某种目标条件按照一定变换关系逐点改变原图像中每一个像素灰度值,从而改善画质,使图像的显示效果更加清晰的方法。
对于彩色图像的R、G、B各彩色分量取反。
第二章数字图像处理技术基础1、对人类而言,颜色是什么?一幅彩色图像使用RGB色彩空间是如何定义的?24位真彩色,有多少种颜色?对人类而言,在人类的可见光范围内,人眼对不同波长或频率的光的主观感知称为颜色。
一幅图像的每个像素点由24位编码的RGB 值表示:使用三个8位无符号整数(0 到255)表示红色、绿色和蓝色的强度。
256*256*256=16,777,216种颜色。
2、红、绿、蓝三种颜色为互补色,光照在物体上,物体只反射与本身颜色相同的色光而吸收互补色的光。
一束白光照到绿色物体上,人类看到绿色是因为?该物体吸收了其他颜色的可见光,而主要反射绿光,所以看到绿色。
3、成像系统的动态范围是什么含义?动态范围最早是信号系统的概念,一个信号系统的动态范围被定义成最大不失真电平和噪声电平的差。
而在实际用途中,多用对数和比值来表示一个信号系统的动态范围,比如在音频工程中,一个放大器的动态范围可以表示为:D = lg(Power_max / Power_min)×20;对于一个底片扫描仪,动态范围是扫描仪能记录原稿的灰度调范围。
即原稿最暗点的密度(Dmax)和最亮处密度值(Dmin)的差值。
我们已经知道对于一个胶片的密度公式为D = lg(Io/I)。
那么假设有一张胶片,扫描仪向其投射了1000单位的光,最后在共有96%的光通过胶片的明亮(银盐较薄)部分,而在胶片的较厚的部分只通过了大约4%的光。
那么前者的密度为:Dmin=lg(1000/960)= 0.02;后者的密度为:Dmax=lg(1000/40)= 1.40那么我们说动态范围为:D=Dmax-Dmin=1.40-0.02=1.38。
只要是扫描仪的动态范围能够大于胶片的动态范围,就可以真实的表现原稿上的信息,包括真实的反映出一些细微的暗部细节。
动态范围(Dynamic Range),最早是信号系统的概念,一个信号系统的动态范围被定义成最大不失真电平和噪声电平的差。
而在实际用途中,多用对数和比值来表示一个信号系统的动态范围,对于底片扫描仪来说,动态范围是指扫描仪能记录原稿的色调范围,即原稿最暗点的密度(Dmax)和最l亮处密度值(Dmin)的差值。
而对于胶片和感光元件来说,动态范围表示图像中所包含的从“最暗”至“最亮”的范围。
动态范围越大,所能表现的层次越丰富,所包含的色彩空间也越广。
相机的动态范围越大,它能同时记录的暗部细节和亮部细节越丰富。
请注意,动态范围与色调范围(tonal range)是不同的。
当我们采用JPEG格式拍摄照片时,相机的图像处理器会以明暗差别强烈的色调曲线记录图像信息。
在这个过程中,处理器常常会省去一部分RAW数据上的暗部细节和亮部细节。
而使用RAW格式拍摄,则能图像保持感光元件的动态范围,并且允许用户以一条合适的色调曲线压缩动态范围和色调范围,使照片输出到显示器或被打印出来后,获得适当的动态范围。
相机的感光元件是由数以百万个像素组成的,这些像素在像素曝光的过程中吸收光子,转化成数字信号,然后成像。
这个过程就像我们拿数百万个水桶到户外收集雨水。
感光区域越光亮,收集的光子量自然越多。
感光元件曝光后,按照每个像素收集的光子量不同,赋予它们不连续的值,并转化为数字信号。
没有吸收光子和吸收光子至满载的像素值分别显示为"0"和"255",即代表纯黑色和纯白色。
一旦这些像素满载,光子便会溢出,溢出会导致信息(细节)损失。
以红色为例,高光溢出使满载红色的像素附近的其它象素的值都变成255,但其实它们的真实值并没有达到255。
换句话说,画面的细节发生了损失,这样会造成高光部分的信息缺失。
如果我们以减少曝光时间来防止高光溢出,很多用来描述昏暗环境的像素则没有足够的时间接收光子量,得出的像素值为0,这样就会导致昏暗部分的信息缺失。
通过上面的说明,我们现在就可以理解为什么采用大尺寸感光元件的数码单反会拥有更大的动态范围。
原因很简单:数码单反的感光元件尺寸一般是消费级相机的4~10倍,允许承载更多的像素而不至于缩小像点之间的距离,而产生噪点。
更多的像素不会很快被“填满”,因此表现昏暗环境的像素在表现光亮环境的像素“满载”之前,有更多时间吸收光子,从而画面细节便会更加丰富。
数字相机DSLR、DC等等的动态范围表示方法目前似乎并没有统一的约束,各个厂家也只是在他们的宣传内容上提到了“大的动态范围”之类的话,并未给出具体的指标。
所以有时我们用比值来描述DSLR的动态范围,或者换算成光圈数,而较少用到密度值概念。
因为数字图象设备也可以看作一个信号系统,所以动态范围可以分为两个部分,即光学动态范围和输出动态范围。
光学动态范围(DR_Optical) = 饱和曝光量 / 噪声曝光量(暗电流)输出动态范围(DR_Electrical) = 饱和输出振幅 / 随机噪声前者主要是由CCD/CMOS等感应器决定的,后者主要由A/D、DSP来决定。
其中饱和曝光量相当于传统胶片的肩部范围,噪声曝光量相当于传统胶片的趾部范围。
对于数字相机,因为其最终还是以数字量输出,所以输出动态范围公式并不适用。
我们提到的动态范围主要指的是输入部分的动态范围,也就相当于胶片的宽容度。
4、图像的位深度是什么含义?用于指定图像中的每个像素可以使用的颜色信息数量。
每个像素使用的信息位数越多,可用的颜色就越多,颜色表现就更逼真。
5、图像分辨率是什么含义?指图像中存储的信息量,是每英寸图像内有多少个像素点,分辨率的单位为PPI(Pixels Per Inch),通常叫做:像素每英寸。
6、图像的直方图是如何定义的?其反映了什么信息?请绘制下图像的直方图。
灰度直方图是灰度级的函数,描述图像中该灰度级的像素个数(或该灰度级像素出现的频率):其横坐标是灰度级,纵坐标表示图像中该灰度级出现的个数(频率)。
反映了图像灰度的分布情况。
7、中值滤波是什么含义?请计算下图像的中值滤波结果?这样,在一定条件下可以克服线性滤波带来的图像的细节模糊问题,而且对滤除噪声干扰及图像扫描噪声非常有效。
8、图像锐化是什么含义?如何实现?补偿和增加图像的高频成分,使图像中的地物边界、区域边缘、线条、纹理特征和精细结构特征等更加清晰、鲜明。
分为空间域法和频域法两类,可使用理想滤波器、梯形滤波器、巴特沃斯滤波器、指数型滤波器进行滤波处理以达到锐度提高的目的。
9、请阐述“最小组内方差图像分割”算法原理?设计思想:阈值将图像分为两类,用组内方差来衡量一致性,组内方差最小对应最佳阈值。
算法步骤:计算得到原图的灰度直方图h;给定一个初始阈值Th=Th0,则将原图分为C1和C2两类;分别计算两类的类内方差分别计算两类像素在图像中的分布概率:选择最佳阈值Th=Th*,使下式成立:10、什么是傅立叶变换?图像的功率谱是什么含义?傅里叶变换是将时域信号分解为不同频率的正弦和/余弦和的形式,实现图像由时域到频域的转换。
图像的功率谱指单位频带内信号功率随频率的变换情况。
11、频域滤波与空域滤波是什么关系?频域滤波如何实现?空域滤波是指直接对采集得到的图像处理,即直接对像素灰度处理;频域滤波指对图像进行某种变换,如傅里叶变换,在变换域处理,即间接对像素灰度处理。
12、什么是低通滤波?如何实现?让图像使高频分量抑制,低频分量通过,使图像模糊,平滑。
使不同颜色或灰度间有一定的过度,棱角分明的图像模糊化。
利用各种滤波器如巴特沃斯或指数低通滤波器对图像进行频域滤波实现。
第三章机器视觉应用基础之视觉标定技术1、摄像机的几何模型(成像畸变和内部参数)含义?摄像机几何模型解决的是三维场景中的点如何和图像平面上的点联系起来的问题。
图像是视觉信息表示的一种物理形式,要了解其所携带信息的内在性质,必须了解三维场景是如何形成二维图像的几何模型,就要用适当的数学模型表征图像的形成过程,这种数学模型称为摄像机的几何模型。
成像畸变包括径向及切向畸变,径向畸变来源于镜头放大率随径向距离不同而不同,切向畸变来源于各个镜头的光轴中心并不严格共面。
一般切向畸变相对较小。
摄像机的内部参数指线性模型的参数如有效焦距、水平像素单位长度、垂直像素单位长度、像素平面中心坐标,和非线性畸变的参数。
2、摄像机的外部参数、内部参数的标定原理?如何实现?传统的摄像机标定方法按其求解的方法可分为三类:线性方法、非线性优化方法和考虑畸变补偿的两步法。
第四章机器视觉硬件系统1、CCD的工作原理?当CCD表面受到光线照射时,每个感光单位会将电荷反映在组件上,所有的感光单位所产生的信号加在一起,就构成了一幅完整的画面。
2、镜头的视场范围的定义是什么?镜头能够观察到的最大范围,通常以角度来表示,视场范围越大,可观测到的范围越大。
3、镜头的景深是什么含义?在镜头前方被摄主体(调焦点)前后有一段一定长度的空间,其影像仍然有一段清晰范围。
这段空间的长度,就叫镜头的景深。
4、镜头的F数的定义?F数为相对孔径的倒数,称为光圈系数,是衡量镜头通光量的参数。
5、镜头的分辨率是如何定义的?镜头的分辨率是指在成像平面上1毫米间距内能分辨开的黑白相间的线条对数,单位是“线对/毫米”。
分辨率就是在物体反差无限大的时候(就是所有物象在纯白和纯黑下)镜头记录物体细节的能力。
6、F数与图像的亮度、景深、镜头的分辨率之间的关系?当照相机镜头的焦距f和调焦距离S不变时,F数越大(即光孔越小——光圈越小)时,进光量越少,亮度越低,这时拍摄出来的画面的景深就越大;相反,F数越小(即光孔越大——光圈越大)时,进光量越多,亮度越高,其景深就越小。
镜头分辨率随着F数减小而增加。
7、镜头的传递函数的含义?将镜头看作一个信息传递系统,被拍摄景物发出来的光线是它的输入信息,而成像面上的成像就是它的输出信息。