当前位置:文档之家› 第2章 高速数字信号处理概述要点

第2章 高速数字信号处理概述要点


②精度和动态范围。数据字宽、定点/浮点; ③是否具备本应用所需要的某些特殊功能。如串行通 信口、片内语音处理功能、片内 A / D 或 D / A 集成、 与特定外部设备接口等等; ④ 价格成本。不单指芯片本身价格,还包括必需的外 部配套器件成本; ⑤ 体积。同样包括了构成最小系统的电路尺寸; ⑥ 功耗。是否有低功耗(3.3 V/2.5 V)型号,能否 电池供电; ⑦ 应用开发时间周期。应具备完善的开发调试工具, DSP本身易学易用; ⑧ 型号延续性。产品有较好的应用前景,或者未来有 兼容/替代型号,这要求生产厂家有相当实力,能在 芯片生产或开发调试系统上得到其它厂商的支持。
§2.2 数字信号处理器的应用领域
随着DSP性能的迅速提高和成本价格的大幅度下 降, DSP 的应用范围不断扩大,成为当前产量和销售 量增长最快的电子产品之一。 DSP 应用几乎遍及整个 电子领域,常见的典型应用有: 1.通用数字信号处理 数字滤波、卷积、相关、FFT、希尔伯特变换、 自适应滤波、窗函数、波形发生等。 2.通信 高速调制解调器、编译码器、自适应均衡器、传 真、程控交换机、蜂窝移动电话、数字基站、回音消 除、噪声抑制、电视会议、保密通信、卫星通信、 TDMA/FDMA/CDMA等各种通信制式。随着互联网络 的迅猛发展,DSP又在网络管理/服务、信息转发、 IP电话等新领域扮演着重要角色,而软件无线电的提 出和发展进一步增强了DSP在无线通信领域的作用。
图2.1 冯· 诺依曼结构
图2.2 哈佛结构及改进的哈佛结构
⑤许多DSP带有DMA通道控制器,以及串行通信口等, 配合片内多总线结构,数据块传送速度大大提高; ⑥配有中断处理器和定时控制器,可以很方便地构成 一个小规模系统; ⑦具有软、硬件等待功能,能与各种存储器接口。 数字信号处理器(DSP)、通用微处理器(MPU)、 微控制器(MCU)三者的区别在于:DSP面向高性能、 重复性、数值运算密集型的高速实时处理;MPU大量 应用于计算机;MCU则适用于以控制为主的处理过程。 DSP本身具有以下功能,支持其高速实时数字信 号处理应用:
因此, DSP 的运算速度要高得多,以 FFT 、相关为 例,高性能 DSP 不仅处理速度是 MPU 的 4 ~ 10 倍,而且 可以流水无间断地完成数据的高速实时输入/输出 。 DSP 结构相对单一,普遍采用汇编语言编程,其任务完 成时间的可预测性比结构和指令复杂(超标量指令)、 严重依赖于编译系统的 MPU 强得多。以一个 FIR 滤波器 实现为例,每输入一个数据,对应每阶滤波器系数需要 一次乘、一次加、一次取指、二次取数,有时还需要专 门的数据移动操作, DSP 可以单周期完成乘加并行操作 以及 3 ~ 4 次数据存取操作,而普通 MPU 至少需要 4 个指 令周期,因此,在相同的指令周期和片内指令缓存条件 下,DSP是MPU运算速度的4倍以上。 正是基于DSP的这些优势,在新推出的高性能通用 微处理器(如 Pentium MMX、PentiumⅢ、Pentium 4等) 片内已经融入了 DSP的功能,而以这种通用微处理器构 成的计算机在网络通信、语音图像处理、高速实时数据 分析等方面的效率大大提高。
当选择一种 DSP 满足上述要求后,还应选择更具 体的类型,如速度、工作温度范围、封装等等。许多 DSP都提供了具备片内ROM型的产品,片内ROM可以 将定型的程序代码固化到 DSP 片内,从而减少了系统 的体积、功耗、电磁辐射干扰,速度也有所提高,当 大批量生产时可降低成本。但这种ROM几乎都是一次 性写入的,而且需要由厂家专门制作,其批量起点高 (万片),带来了很大的资金投入和生产风险,因此 对 普 通 使用 者 ,这些 ROM 是无用的 。有 些 DSP 如 TM320C31/C40,其片内有少量 ROM固化为加电引 导程序,供各种加载模式下自动调用。有些 DSP 如 TM320F206,其片内则有FLASH。
不同类型 DSP 适用于不同场合。早先 DSP 都是定 点的,可以胜任大多数数字信号处理应用,但在某些 场合,如雷达、声纳信号处理中,数据的动态范围很 大,按定点处理会发生数据溢出或下溢出,严重时处 理无法进行。如果用移位定标或用定点模拟浮点运算, 程序执行速度将大大降低。浮点 DSP 的出现解决了这 些问题,它拓展了数据动态范围,常见的 16bit 定点 DSP 动态范围仅 96dB ,每增加 1bit ,动态范围只增加 6dB ;而 32bit 浮点数据的动态范围为 1536dB 。浮点 DSP 的处理性能在许多情况下要比定点 DSP 高得多。 得益于VLSI技术,32位浮点DSP在各项指标上都远好 于定点 DSP,它可以完成 32位定点运算,具备更大的 存储访问空间,而且最新发展的并行 DSP 大都采用浮 点格式,还有一点就是高级语言(如C语言)编译器主 要面向浮点 DSP ,这使得普通计算机上的源码程序可 以移植到DSP设计中而无需大的修改。

3.语音处理 语音识别、合成、矢量编码、语音信箱。 4.图形/图像处理 三维图像变换、模式识别、图像增强、动画、电 子出版、电子地图等。 5.自动控制 磁盘、光盘、打印机伺服控制、发动机控制。 6.仪器仪表 测量数据谱分析、自动监测及分析、暂态分析、 勘探、模拟试验。 7.医学电子 助听器、CT扫描、超声波、心脑电图、核磁共振、 医疗监护等。 8.军事与尖端科技
雷达和声纳信号处理、雷达成像、自适应波束合成、 阵列天线信号处理、导弹制导火控系统、战场C3I系统、 导航、全球定位 GPS、目标搜索跟踪、尖端武器试验、 航空航天试验、宇宙飞船、侦察卫星。 9.计算机与工作站 阵列处理机、计算加速卡、图形加速卡、多媒体 计算机。 10.消费电子 数字电视、高清晰度电视、图像/声音压缩解压 器、VCD/DVD/CD播放机、电子玩具、游戏机、数 字留言/应答机、汽车电子装置、音响合成、住宅电 子安全系统、家电电脑控制装置。
DSP处理系统中除了DSP外,另外的不可缺器件 就 是 存 储 器 , 一 个 独 立 系 统 必 须 有 EPROM 、 EEPROM、FLASH、SSD(固态盘)等非易失性存储 器来存放程序、初始化数据、表格等,为了采用低成 本、小体积的存储器,就要选用那些带有8bit字节方式 加载功能的DSP,如 TMS320C31等,而 TM320C30 则必须用32 bit的存储加载。当DSP的片内存储器不够 使用时,有必要采用可读写的片外存储器, SRAM 速 度高,与 DSP 连接简单,能被 DSP 全速访问(无等 待 ) , 但 成 本 高 、 容 量 小 、 体 积 大 , DRAM 则 与 SRAM 完全相反。为了克服 DRAM 必须刷新所带来的 不 利 影 响, 已经有一种带一页 SRAM 缓存的增强型 DRAM(EDRAM),除了DSP访问跨页时需要插入等 待周期外,大多数情况下,EDRAM几乎与SRAM的性 能一样,但容量大得多,而且DSP无须考虑对EDRAM 中DRAM的刷新。
目前DSP峰值运算能力达每秒24亿次,但相对于 所要求的每秒几百亿、上千亿次运算来说仍远远不够。 而且VLSI技术的发展已经受到开关速度极限的限制, 提高DSP主频所遇到的难度和付出的成本越来越大, 单处理器性能的提高空间受到限制,为此,引入了并 行处理技术。其实在许多DSP的多级流水处理、相乘 /累加同时进行等功能中已经融入了片内并行技术, TMS320C6X进一步发展了超长指令字(VLIW)和多 流水线技术。在每条长达256bit的指令字中规定了多条 流水线、多个处理单元的并行操作。DSP并行技术的 主流则是向片外/片间并行发展,因为这种并行可以 不受限制地扩大并行规模。以TMS320C4X和 ADSP2106X为代表的并行DSP为用户提供了设计大规 模并行系统的硬件基础,它们都提供了6个通信(链路) 口,并为共享总线系统的设计提供了相应的总线控制 信号线,可以组成松耦合的分布式并行系统和紧耦合 的总线共享式并行系统。
①DSP普遍采用了数据总线和程序总线分离的哈佛结 构及改进的哈佛结构,比传统处理器的冯·诺依曼结构 有更高的指令执行速度; ② DSP 大多采用流水技术,即每条指令都由片内多个 功能单元分别完成取指、译码、取数、执行等多个步 骤,从而在不提高时钟频率的条件下减少了每条指令 的执行时间; ③片内有多条总线可以同时进行取指令和多个数据存 取操作,并且有辅助寄存器用于寻址,它们可以在寻 址访问前或访问后自动修改内容,以指向下一个要访 问的地址; ④针对滤波、相关、矩阵运算等需要大量乘法累加运 算的特点, DSP 大都配有独立的乘法器和加法器,使 得同一时钟周期内可以完成相乘、累加两个运算,许 多 DSP 可以同时进行乘、加、减运算,大大加快了 FFT的蝶形运算速度;
高,如果它能获得市场的承认而得到广泛应用,其价 格会大幅度下降。 另外,各种 DSP面向不同应用领域,有其各自的 结 构 和 功 能 特 点 。 以 TMS320 系 列 为 例 , TMS320F240 适合于电机控制, TMS320C54X 适合于 通信及语音处理,TMS320C80则面向多媒体应用,雷 达、声纳信号处理所需要的大动态范围和高速实时处 理需要 TMS320C4X / C67X这样的高性能或并行 DSP。 综合起来,选择合适的 DSP所应考虑的主要方面有: ①性能指标; 指令速度 MIPS 或运算速度 MFLOPS ,考虑是否 必须多片并行处理。高速实时信号处理要求 DSP 处理 系统必须在限定时间内完成任务,或者在允许的输出— 输入响应迟延范围内,系统的数据输入/输出吞吐率 必须达到一定速度。
①单指令周期的乘、加操作; ②特殊的高速寻址方式,可以在其它操作进行的同时完 成地址寄存器指针的修改,并具有循环寻址、位反序 寻址功能。循环寻址用于FIR滤波器,可以省去相当于 迟延线功能的大量数据移动,用于 FFT 则可以紧凑地 存放旋转因子表;位反序利于FFT的快速完成; ③针对高速实时处理所设计的存储器接口,能在单指令 时间内完成多次存储器或I/O设备访问; ④专门的指令流控制,具有无附加开销的循环功能以及 延迟跳转(相当于预跳转)指令; ⑤专门的指令集和较长的指令字,一个指令字同时控制 片内多个功能单元的操作; ⑥单片系统,易于小型化设计; ⑦低功耗,一般为 0.5~4W,采用低功耗技术的DSP只 有 0.1W,可用电池供电如TI的TMS320C54X系列, 对嵌入式系统很适合;而新型MPU,如 Pentium等功 耗达20~50W。
相关主题