当前位置:文档之家› 第2章 视觉感知与图像的基本概念

第2章 视觉感知与图像的基本概念


• 分辨率 或者是指要精确测量和再现一定 尺寸的图像所必需的像素个数。 • 单位:像素×像素
(如:数码相机指标1210万像素(4000×3000))
26
图像的数字化 —— 量化概念
量化是将各个像素所含的明暗信息离散化后,
用数字来表示。一般的量化值为整数。 充分考虑到人眼的识别能力之后,目前非特殊 用途的图像均为8bit量化,即采用0 ~ 255的整数 来描述“从黑到白”。 在3bit以下的量化,会出现伪轮廓现象。
10
相对视敏函数
人眼对不同波长的光有不同的敏感度,不同波 长而幅射功率相同的光不仅给人以不同的色彩 感觉,而且亮度感觉也不同。 视敏函数:描述人眼视敏特性的物理量为视敏 函数和相对视敏函数。在相同亮度感觉的条件 下,不同波长光辐射功率 V 的倒数用来衡量人 眼对各波长光明亮感觉的敏感程度。 对于人眼, 是钟形曲线。 V
0 150 200 I 120 50 180 250 220 100
20
数字图像的概念与描述 —— 彩色图像
彩色图像是指每个像素的信息由RGB三原色构 成的图像,其中RGB是由不同的灰度级来描述 的。 彩色图像不能用一个矩阵来描述了,一般是用 三个矩阵同时来描述。
第2章
视觉感知与图像的基 本概念
本章内容简介
视觉感知 数字图像的概念与描述 图像的数字化 数字图像的存储格式 灰度直方图
2
2.1 视觉感知
图像处理的研究需要了解人类视觉机理:
人们能够区分的光强度差别有多大? 我们眼睛的空间清晰度是多少?对运动的感觉如何? 我们估计和比较距离和面积的精度是多少? 人类特性视觉的光谱是怎样的? 人的视觉中彩色起什么作用? 人类是如何获得视觉感知,如何认知周围事物的?
5
视觉感知
视觉感知是视觉的内在表象。 视觉感知包括两个不同的感知层次:
视觉的低级感知层次 视觉的高级感知层次
6
视觉低级感知层次
视觉系统从外界获取图像。 眼睛视网膜上获得周围世界的光学信号,然后 视觉接收器发生光电化学反应(杆状细胞和锥 状细胞在视网膜上作为视觉接收器),产生视 神经脉冲,从而将光图像信息转化为视网膜的 神经活动电信息,最后通过视神经纤维,把这 些图像信息传送入大脑,由大脑获得图像感知。 视觉系统的可视波长范围为 =380nm~780nm; 视觉系统的可响应的亮度范围是:1~10个量级的 幅度范围。
2.2 数字图像的概念与描述
所谓的数字图像的描述是指如何用一个数值 方式来表示一个图像。 数字图像是图像的数字表示,像素是其最小 的单位。 可以用矩阵来描述数字图像。 描述数字图像的矩阵目前采用的是整数阵, 即每个像素的亮暗,用一个整数来表示。
17
数字图像的概念与描述 —— 图像的坐标系
矩阵是按照行列的顺序来定位数据的,但是图 像是在平面上定位数据的,所以有一个坐标系 定义上的特殊性。 为了实现方便起见,这里以矩阵坐标系来定义 图像的坐标。
列(j) Y轴(j)
矩阵 A(i,j)
行(i)
图像 f(i,j)
X轴(i)
矩坐标系
直角坐标系
18
数字图像的概念与描述 —— 黑白图像
黑白图像是指图像的每个像素只能是黑或 者白,没有中间的过渡,故又称为2值图 像。 2值图像的像素值为0、1。
19
数字图像的概念与描述 —— 灰度图像
灰度图像是指每个像素的信息由一个量化的 灰度级来描述的图像,没有彩色信息。
线阵CCD :
单元数有: 256, 1024, 2048, 4096 等;
面阵CCD:
CMOS
CMOS和CCD一样都是可用来感受光线变化的半导体。 CMOS是利用硅和锗两种元素做成的半导体,通过CMOS上 带负电和带正电的晶体管来实现基本功能的。产生的电流即 可被处理芯片纪录和解读成影像。 CMOS针对CCD最主要的优势是价格低廉、制造工艺较简单 且非常省电,其耗电量只有普通CCD的1/3左右。 CMOS传感器可以在每个像素基础上进行信号放大,采用这 种方法可以进行快速数据扫描; CMOS主要问题是在处理快速变化的影像时,由于电流变化 过于频繁而过热。但是现在CMOS绝非只局限于简单的应用, 也在发展高清系列。
31
CCD的三层结构
第一层“微型镜头”: CCD 成像的关键是在于其感光层, 为了扩展CCD 的采光率,必 须扩展单一像素的受光面积, 增加感光面积。 第二层“分色滤色片”:有 两种分色方式,一是RGB原 色分色法,另一个则是 CMYK补色分色法。这两种 方法各有优缺点。 第三层感光层:主要是负责 将穿过滤色层的光源转换成 电子信号,并将信号传送到 影像处理芯片,将影像还原。
采样点数M×N (行和列) 量化级别G (灰度级数)
为了便于处理,采样点数N与量化级别G都为2的幂 次方,即M=2m,N=2n ,G=2k (m,n,k均为正整 数)。记录一幅图像所需的字节(byte)B可由下 式计算: B=M×N×k÷8 实际上: M、N一般取64、128、256、640、1024、 1240等值;k一般取1、4、8、16、24、32等值。 一般地说,图像质量随M、N和k的增加而增高。
255 240 240 R 255 0 80 255 0 0
0 160 80 G 255 255 160 0 255 0
80 160 0 B 0 0 240 255 255 255
21
2.3 图像的数字化
13
同时对比度
在相同亮度的刺激下,由于背景亮度不同,人 眼所感受到的主观亮度不同,这种效应称为 同时对比度。 由于同时对比是由亮度差别引起的,故也称 为亮度对比。相对应的还有色度对比。
14
马赫带
Mach在1865年讨论了“Mach带”现象 “Mach带”
一条有均匀黑的区域和均匀白的区域 每级阶跃的灰度差相同
11
相对视敏曲线
视杆细胞和视锥细胞的相对视敏曲线有所不同, 对视锥细胞情况,在 =555nm 时绿光亮度最敏 感,对视杆细胞暗视情况,则 =505nm 时绿光最 敏感。
12
对比灵敏度
在均匀照度背景 I 上,有一照度为 I+△I的光 斑,称眼睛刚好能分辨出的照度差△I与 I 的 比(△I/ I)为对比灵敏度; 由于背景亮度 I 增大, △I 也需要增大,因 此在相当宽的强度范围内,对比灵敏度是一 个常数,约等于0.02,这个比值称为韦伯比 (Weber比)。亮度很强(弱)时不为常数。
“Mach带”,人们在观察现象:
每个条带内灰度是不均匀的 每级阶梯的右边比左边更暗
15
人类视觉感知能力的特点
人类视觉系统在对物体的识别上有特殊强大的功 能;但在对灰度、距离和面积的绝对的估计上却 有某些欠缺; 以传感器单元的数目比较:视网膜包含接近1.3亿 个光接收器,这极大的大于CCD片上的传感器单 元数; 和它每次执行运算的数目比较:和计算机的时钟 频率相比,神经处理单元的开关时间将比之大约 104倍; 慢 不论这慢的定时和大量的接收器,人类的视觉系 统是比计算机视觉系统要强大得多。它能实时分 析复杂的景物以使我们能即时的反应。
人们对于自己视觉机构的生物、生理、物理过程的 了解,以及神经、精神方面的了解还处于低级阶段, 认识还很不完善,还有很大的局限性。
3
人 眼 构 造
4
视杆细胞与视锥细胞
视网膜上有杆状细胞和锥状细胞两类视觉接收器; 视杆细胞(Rod cell):细长而薄,数量上约1.2亿 个,它们提供暗视(Scotopic Vision),即在低几 个数量级亮度时的视觉响应,其光灵敏度高。 视锥细胞(Cone cell):结构上短而粗,数量少, 约600万~700万,光灵敏度较低,它们提供明视 (Photopic Vision),其响应光亮度范围比视杆细 胞要高5~6个数量级。在中间亮度范围是两种视 觉细胞同时起作用。视锥体集中分布在视网膜中 心。
27
图像的数字化 —— 量化方法
量化可分为均匀量化和非均匀量化。 1. 均匀量化是简单地在灰度范围内等间隔量化。
2. 非均匀量化是对像素出现频度少的部分量化间 隔取大,而对出现频度大的部分量化间隔取小。
• 一般情况下,对灰度变化比较平缓的部 分用比较多的量化级。
28
图像质量的确定
数字化时,关键是要决定:
34
2.4 数字图像的存储格式
数字图像是由排成矩形点阵的像素组成的。 图像有不同的编码方式:无压缩、无损压缩、有损 压缩。 图像文件通常与操作系统有关:Windows、Linux、 Mac; 把一幅图像记录进文件时,必须同时记录下各像素 在点阵中的位置及像素的灰度值。 实际上我们可以利用各像素在文件中的记录位置来 表示其在图像点阵中的位置,这样就可以省去记录 像素位置坐标的数据量,而各像素的数据只用来记 录其灰度值。
9
视觉特性
视觉特性是视觉的外在表现; 图像是周围世界的一种映射,对于运动图像,空间座标x,y,z 都是时间 t 的函数,若在连续的不同时间获取图像,可以获 得序列图像
I1 , I 2 , I n
对于按不同波段获取图像,可获得彩色图像或不同波段的图 像信号(如遥感图像,医学图像等)。 对于按不同视角,即不同的 x,y,z 间相互关系,可以得到不 同视角的不同图像。 因此,视觉特性包括有视觉对光强,对各种波长、彩色的光 谱效应,对物体边缘等空间频率变化的响应,以及视觉对时 间瞬时变化运动的响应。
采样时的注意点是:采样间隔的选取。 采样间隔太小,则增大数据量; 采样间隔太大, 则会发生信息的混叠,导致细 节无法辨认。
采样列 采 样 行 像素 行 间 隔 列间隔
25
图像的数字化 —— 采样指标分辨率
分辨率 是指映射到图像平面上的单个像
素的景物元素的尺寸。
单位:像素/英寸,像素/厘米
相关主题