当前位置:
文档之家› 第2章视觉感知与图像的基本概念
第2章视觉感知与图像的基本概念
14
视杆体和视锥体的相对视敏曲线有所不同,对视
锥体情况,在 =555nm 时绿光亮度最敏感,对视 杆体暗视情况,则 =505nm 时最敏感。
图2.4 相对视敏度曲线
对比灵敏度和同时对比度
一、对比灵敏度 在均匀照度背景 I 上,有一照度为 I+△I的光
斑,称眼睛刚好能分辨出的照度差△I与 I 的比 (△I/ I)为对比灵敏度;
由于背景亮度 I 增大, △I 也需要增大,因此 在相当宽的强度范围内,对比灵敏度是一个常 数,约等于0.02,这个比值称为韦伯比(Weber 比)。亮度很强(弱)时不为常数。
16
二、同时对比度 在相同亮度的刺激下,由于背景亮度不同,
人眼所感受到的主观亮度不同,这种效应称 为同时对比度。
由于同时对比是由亮度差别引起的,故也 称为亮度对比。相对应的还有色度对比。如: 红色背景下的灰色物体显绿色;
2.3 图像的数字化
我们日常生活中见到的图像一般是连续形式 的模拟图像,可由一个二维连续函数f(x, y) 来描述。 其中: (x, y)是图像平面上任意一个二维坐标点,
f(x, y)则是该点颜色的深浅。 图像处理的方法有模拟式和数字式两种。 数字图像处理的一个先决条件就是将连续图 像经采样、量(离散)化,转换为数字图像。
人们对于自己视觉机构的生物、生理、物理过程的 了解,以及神经、精神方面的了解还处于低级阶段, 认识还很不完善,还有很大的局限性。
3
人眼构造
4
视杆体与视锥体
视网膜上有杆状体和锥状体两类视觉接收器; 视杆体(Rods):细长而薄,数量上约100 million, 它们提供暗视(Scotopic Vision),即在低几个数量 级亮度时的视觉响应,其光灵敏度高。 视锥体(Cons):结构上短而粗,数量少,约6.5 million,光灵敏度较低,它们提供明视 (Photopic Vision),其响应光亮度范围比视杆体 要高5~6个数量级。在中间亮度范围是两种视觉 细胞同时起作用。视锥体集中分布在视网膜中心。
彩色图像不能用一个矩阵来描述了,一般是用 三个矩阵同时来描述。
255 240 240
R 255 0
80
255 0 0
0 160 80 G 255 255 160
0 255 0
0 80 160
B
0
0 240
255 255 255 24
10
视 觉 错 觉
11
视觉错觉2
12
视觉特性
视觉特性是视觉的外在表现; 图像是周围世界的一种映射,对于运动图像,空间座标x,y,z都 是时间 t 的函数,若在连续的不同时间获取图像,可以获得序
列图像I1, I 2 , I n
对于按不同波段获取图像,可获得彩色图像或不同波段的图 像信号(如遥感图像,医学图像等). 对于按不同视角,即不同的 x,y,z 间相互关系,可以得到不同视 角的不同图像. 因此,视觉现象包括有视觉对光强,对各种波长、彩色的光谱 效应,对物体边缘等空间频率变化的响应,以及视觉对时间瞬 时变化运动的响应.
数字图像的概念与描述 —— 灰度图像
灰度图像是指每个像素的信息由一个量化的 灰度级来描述的图像,没有彩色信息。
0 150 200 I 120 50 180
250 220 100
23
数字图像的概念与描述 —— 彩色图像
彩色图像是指每个像素的信息由RGB三原色构 成的图像,其中RGB是由不同的灰度级来描述 的。
38
图像质量的确定
数字化时,关键是要决定:
采样点数M×N (行和列) 量化级别G (灰度级数)
为了便于处理,采样点数N与量化级别G都为2的幂 次方,即M=2m,N=2n ,G=2k (m,n,k均为正整 数)。记录一幅图像所需的字节(byte)B可由下 式计算:
B=M×N×k÷8 实际上: M、N一般取64、128、256、640、1024、 1240等值;k一般取1、4、8、16、24、32等值。 一般地说,图像质量随M、N和k的增加而增高。
量化是将各个像素所含的明暗信息离散化后,
用数字来表示。一般的量化值为整数。 充分考虑到人眼的识别能力之后,目前非特殊 用途的图像均为8bit量化,即采用0 ~ 255的整数 来描述“从黑到白”。 在3bit以下的量化,会出现伪轮廓现象。
33
34
低bit量化的伪轮廓现象图例
35
图像的数字化 —— 量化方法
5
视觉感知
视觉感知是视觉的内在表象。 视觉感知包括两个不同的感知层次:
视觉的低级感知层次 视觉的高级感知层次
6
视觉低级感知层次(一)
视觉系统从外界获取图像,就是在眼睛视网膜上 获得周围世界的光学成象,然后由视觉接收器 (杆状体和锥状体在视网膜上作为视觉接收器), 将光图像信息转化为视网膜的神经活动电信息, 最后通过视神经纤维,把这些图像信息传送入大 脑,由大脑获得图像感知。
41
CCD的三层结构
第一层“微型镜头”:在 感光层前面加上一副眼镜, 增加感光面积。
第二层“分色滤色片”: 有两种分色方式,一是 RGB原色分色法,另一 个则是CMYK补色分色 法。这两种方法各有优缺 点。
第三层感光层:主要是负 责将穿过滤色层的光源转 换成电子信号,并将信号 传送到影像处理芯片,将 影像还原。
13
相对视敏函数
人眼对不同波长的光有不同的敏感度,不同波 长而幅射功率相同的光不仅给人以不同的色彩 感觉,而且亮度感觉也不同。 视敏函数:描述人眼视敏特性的物理量为视敏 函数和相对视敏函数。在相同亮度感觉的条件
下,不同波长光辐射功率 V 的倒数用来衡量人
眼对各波长光明亮感觉的敏感程度。
对于人眼,V 是钟形曲线。
17
18
人类视觉感知能力的特点
人类视觉系统在对物体的识别上有特殊强大的功 能;但在对灰度、距离和面积的绝对的估计上却 有某些欠缺; 以传感器单元的数目比较:视网膜包含接近130 millions 光接收器,这极大的大于CCD片上的传 感器单元数;
和它每次执行运算的数目比较:和计算机的时钟 频率相比,神经处理单元的开关时间将比之大约 慢10倍4 ; 不论这慢的定时和大量的接收器,人类的视觉系 统是比计算机视觉系统要强大得多。它能实时分 析复杂的景物以使我们能即时的反应。
7
视觉低级感知层次(二)
光图像激活视杆体或视锥体时,发生光电化学 反应,同时产生视神经脉冲,视觉系统散布视 神经中有80万神经纤维,视觉系统传播视神经 脉冲。许许多多的视杆体和视锥体相互连接到 神经纤维上。
视觉系统的可视波长范围为 =380nm~780nm;
视觉系统的可响应的亮度范围是:1~10个量级 的幅度范围。
第2章
视觉感知与图像的基 本概念
本章内容简介
视觉感知 数字图像的概念与描述 图像的数字化 数字图像的存储格式 灰度直方图
2
2.1 视觉感知
图像处理的研究需要了解人类视觉机理:
人们能够区分的光强度差别有多大? 我们眼睛的空间清晰度是多少?对运动的感觉如何? 我们估计和比较距离和面积的精度是多少? 人类特性视觉的光谱是怎样的? 人的视觉中彩色起什么作用? 人类是如何获得视觉感知,如何认知周围事物的?
39
采样传感器
采样传感器
CCD(Charge Couple Device):电荷耦合器件; CMOS(Complementary Metal Oxide Semiconductor):互补性金属氧化物半导体。
40
CCD
CCD是20世纪70年代初发展起来的半导体器件。 CCD以电荷为信号,而不是以电压为信号。 CCD利用感光二极管(photodiode)进行光电转换, 将图像转换为数字数据. CCD的基本功能是电荷的产生、存储和转移。其基 本原理是:通过光学系统将景物成像在CCD象敏面 上,象敏面将照在每一个象敏单元上的光照强度转 换为电荷存储在象敏单元中,然后再转移到CCD的 移位寄存器中,在驱动脉冲的作用下顺序移出器件, 形成强弱不同的电信号。
量化可分为均匀量化和非均匀量化。 1. 均匀量化是简单地在灰度范围内等间隔量化。 2. 非均匀量化是对像素出现频度少的部分量化间
隔取大,而对频度大的量化间隔取小。
• 一般情况下,对灰度变化比较平缓的部分用 比较多的量化级,在灰度变化比较剧烈的地方用 比较高的采样密度。
36
均匀量化效果示意图
37
非均匀量化效果示意图
为了实现方便起见,这里以矩阵坐标系来定义 图像的坐标。
列(j)
矩阵 A(i,j)
行(i)
矩阵坐标系
Y轴(j)
图像 f(i,j)
X轴(i)
直角坐标系
21
数字图像的概念与描述 —— 黑白图像
黑白图像是指图像的每个像素只能是黑或 者白,没有中间的过渡,故又称为2值图 像。 2值图像的像素值为0、1。
22
空间坐标(x, y)的数字化被称为图像采样; 颜色深浅幅度的数字化被称为灰度级量化。
28
29
图像的数字化 —— 采样间隔
采样时的注意点是:采样间隔的选取。
采样间隔太小,则增大数据量;
采样间隔太大, 则会发生信息的混叠,导致细 节无法辨认。
采样列
像素
采
样 行
行 间
隔
列间隔
30
图像的数字化 —— 采样指标分辨率
8
视觉高级感知层次
大脑对视神经纤维传送来的图像信息进行分析 和理解,通过图像获得对周围世界感知的信息 和知识。 人们对大脑的高级感知层次至今知之甚少,仍是 生理学、神经科学、生物物理学、生物化学研 究的重要课题。
9
视觉和视觉感知
“视觉是一个信息处理过程。它能从外部世界的图 像中得到一个即对观察者有用又不受无关信息干扰 的描述。” “视觉感知又是和过去留存于记忆中的同类活动有 关,视觉储积起大量的视觉意象。记忆形象可用于 对知觉对象的辨认,解释和补充。” 使计算机具有人类视觉能力,研究人类的视觉感知, 模仿人类的视觉感知,是研究工作的重要途径。