当前位置：文档之家› DSP 图像处理算法的实现-III要点

DSP 图像处理算法的实现-III要点

本科毕业论文(科研训练、毕业设计)题目：DSP 图像处理算法的实现-III姓名：翁彬彬学院：信息技术与科学学院系：电子工程系专业：电子信息工程专业年级：2004学号：04140059指导教师（校内）：杨涛职称：教授指导教师（校外）：职称：2008 年 5 月20 日1摘要本文研究的是基于TI 公司DSP 硬件平台的数字图像处理技术。

考虑到可移植性，采用C 语言编写代码。

采用空域法设计图像处理的算法，所涉及运算包括卷积，相关，中值滤波等。

由于图像处理要处理大量的数据，需用DSP 处理器来提高效率。

TMS320C6000 系列DSP 是TI 公司最新推出的一种并行处理的数字信号处理器，其特有的代码优化器也使得C 优化更加方便。

我们根据TMS320C6000 系列的结构特点，对C 代码进行一系列优化，例如：选用适当的编译器选项，内联函数的使用，字处理技术，打开循环，流水线技术，线性汇编等一系列方法对C 代码进行优化，从而极大地提高了数字图像处理的工作效率。

关键字数字图像处理TMS320C6000 系列DSP C 语言优化Abstract: In this thesis, based on the DSP hardware platform of TI Co., the algorithms of digital image processing were studied. C language was used to program these algorithms for the purpose of maximizing the portability of program modules. These algorithms, which include convolutions, correlations and medium filters, were designed based on spatial patterns. To make real-time image processing possible, DSP processors are used to process the massive data in images. The TMS320C6000 DSPs from TI Co. are parallel digital image processors, of which the C-complier makes the compilation and optimization of C-codes seamless and highly efficient. The C-code optimization was highly improved based on the unique designing features of TMS320C6000 series, such as proper choices of compiling options, the utility of intrinsics, the word processing technology, loop opening, pipeline technologies, linear assembly and etc.Keywords: Digital image processing technology TMS320C6000 C code optimization2目录：引言 (4)第一章数字图像处理的基本知识 (4)1.1 数字图像处理简述 (4)1.2 几种处理算法 (4)第二章TMS320C6000DSP芯片的特点 (6)2.1 数字信号处理器的特点………………………………………… ..62.2 TMS320C6000 的硬件结构简介 (7)2.3 TMS320C6000 指令系统................................................10.第三章基于TMS320C6000DSP系列的代码优化 (11)3.1 第一个阶段代码优化 (11)3.2 第二个阶段代码优化 (13)3.3 第三个阶段代码优化 (17)第四章对所编C代码进行优化处理 (20)4.1 小循环的打开 (20)4.2 较大循环的打开 (21)结论 (22)致谢语 (24)参考文献 (24)3随着计算机技术的发展，数字图像处理技术以其广阔的应用领域，受到人们越来越多的关注，本次实验是以DSP 为平台，对数字图像处理系统进行仿真。

由于图像处理需要处理大量的数据，并且对运算速度提出了很高的要求，因此我们选用DSP 平台，并根据它的结构特点，对所编的C 代码进行了优化，极大地提高了运算速度第一章数字图像处理的基本知识第一节数字图像处理的概述数字图像处理（Digital Image Processing）又称为计算机图像处理，它是指利用计算机和其它高速、大规模集成数字硬件，对从图像信息转换来的数字电信号进行某些数字运算或处理，以期提高图像的质量或达到人们所预想的结果。

数字图像处理方法大致可分为两大类，即空域法和变换域法。

1、空域法这种方法是把图像看作是平面中各个像素组成的集合，然后直接对这一二维函数进行相应的处理。

空域处理法主要有下面两大类。

(1)领域处理法包括梯度运算、拉普拉斯算子运算、平滑算子运算和卷积运算。

(2)点处理法包括灰度处理及面积、周长、体积、重心运算等。

2、变换域法数字图像处理的变换域处理方法是首先对图像进行正交变换，得到变换域系数阵列，然后施行各种处理，处理后再反变换到空间域，得到处理结果。

在我们的设计中采用的是空域法中的域处理法.第二节几种图像处理算法的介绍对于一张数字图像，我们采用RGB 模式真彩色位图来表示它，一张图像由4像素矩阵构成，每个像素包含它对应的位置信息，以及RGB 三个通道各自亮度值的大小，R 对应红色，G 对应绿色，B 对应蓝色，它们统称为三基色，这三中色彩的不同搭配，就可以搭配成各种现实中的色彩。

如果是单色图像，只要让三个通道的值相等就可以了。

在实现数字图象处理的过程中，主要是通过对图像中的每一个像素点运用各种图像处理算法来达到预期的效果，在本实验里主要涉及了卷积运算，相关运算，中值滤波。

1 卷积运算：使用一个m*n 的掩模，依次覆盖在要处理图像的各个像素上，掩模中心与该像素重合。

掩模上的各个元素均有其自身的权值。

将掩模各元素权值与覆盖在其下的像素值分别相乘后求和，在除以掩模权值之和，所得结果称为响应，赋给当前处理的像素。

通过选取不同的矩阵，我们可以对图像得出很多不同的结果，这个结果取决于所选取的卷积矩阵不同，可以是高通滤波，低通滤波等等，通过滤波我们可以得到所需要处理图像的一些特性，比如可以采用高通滤波突出某些边缘轮廓，用低通滤波来平滑图像，去掉图像中的高频成分。

2 相关运算：图像的相关性运算与卷积运算基本上类似，不同点是卷积矩阵mask 取自图像本身的某一块值，这里不对相关性的图像处理做图像处理，主要说明一下相关性的意义。

利用相关性可以检测出图像的矩阵模板，用于模板的匹配，检测等等。

3 中值滤波：同样使用一个m*n 的掩模依次处理各个像素，但是掩模没有权值，而是将掩模覆盖下的像素值排序后取中间值，将这个中值赋值给当前处理的像素。

中值滤波可以将图像中的高频成分去掉，使图像变得平滑，这个特性和低通滤波有点类似。

掩模在图像边缘时，会遇到覆盖了非图像部分的情况，这里可以有多种方式处理，比较常见的有部分滤波和补零法(zero-padding)。

部分滤波为在遇到图像边界时，忽略超出图像边界的部分，采用部分掩模处理边界像素。

补零法是将图像边缘部分补上相应于掩模大小的零值(也可以为其它常值)，处理完成后再将这部分切除，恢复至原图像大小，但是这样图像边缘往往会出现灰度值偏小的情况。

5一般来说图像边缘往往是不重要的部分，所以这些处理带来的缺点是可以容忍的。

第二章、TMS320C6000 DSP 芯片的硬件系统第一节数字信号处理器的特点1 算术单元硬件乘法器由于DSPS 的功能特点，乘法操作是DSPS 的一个主要任务。

在通用微处理器内是通过程序实现乘法操作的，这往往需要耗费很大的时钟周期，因此在DSPS 内部设有硬件乘法器来完成乘法乘法操作，以提高乘法速度。

所以硬件乘法器是DSP 区别于通用微处理器的一个重要标志。

多功能单元为进一步提高速度，可以在CPU 内设置多个并行操作的功能单元（ALU, 乘法器，地址产生器等）。

如C6000 的CPU 内部有八个功能单元，即两个乘法器和六个ALU,八个功能单元最多可以在一个周期内同时执行八条32 位指令。

由于多功能单元的并行操作，使DPS 在相同时间内能够完成更多的操作，因而提高了程序的执行速度。

2 总线结构通用微处理器是为计算机设计的，通常采用冯诺依曼总线结构，统一的程序和数据空间，共享的程序和数据总线，由于总线的限制，微处理器执行指令时，取指和存取操作数必须共享总线，因而程序指令只能串行执行。

对于DSP 而言，采用冯诺依曼总线结构将使系统的性能受到很大的限制，因此DSP 采用了独立程序总线的哈弗总线结构，而且很多DSP 甚至有两套以上内部数据总线，这种总线结构称为修正的哈佛结构，对于乘法或加法等运算，一条指令要从存储器中取两个操作数，多套数据总线就使得两个操作数可以同时取得，提高了程序效率3 专用寻址单元6DSP 面向的是数据密集型应用，因为需要频繁地访问数据，数据地址的计算时间也线性增长，如果不做特殊处理，计算地址的时间有时会比实际的算术操作时间还长。

因此，DSP 通常都有支持地址计算的算术单元——地址产生器与ALU 并行工作，因此地址的计算不再额外占用CPU 时间4 流水处理除了多功能单元外，流水技术是提高DSP 程序执行效率的另一个主要手段。

流水技术使两个或更多不同的操作可以重叠执行，流水线操作是DSP 实现高速度、高效率的关键技术之一。

TMS320C6000 只有在流水线充分发挥作用的情况下，才能达到1600MIPS 的速度。

C6000 的流水线分为三个阶段：取指、解码、执行、总共11 级。

和以前的C3x、C54x 相比，有非常大的优势，主要表现在：简化了流水线的控制以消除流水线互锁；增加流水线的深度以消除传统流水线结构在取指、数据访问和乘法操作上的瓶颈。

其中取指、数据访问分为多个阶段，使得C6000 可以高速地访问存储空是。

5 大容量片内存储器大容量片内存储器外部存储器一般不能适应高性能DSP 核的处理速度, 因此在片内设置较大容量的程序/数据存储器以减少对外部存储器的访间速度, 充分发挥DSP 核的高性能,数据RAM 的容量高达7MB。

e商务文档

DSP 图像处理算法的实现-III要点

相关文档推荐：