高速实时数字信号处理硬件技术发展概述摘要:在过去的几年里,高速实时数字信号处理(DSP)技术取得了飞速的发展,目前单片DSP芯片的速度已经可以达到每秒80亿次定点运算(8000MIPS);其高速度、可编程、小型化的特点将使信息处理技术进入一个新纪元。
一个完整的高速实时数字信号处理系统包括多种功能模块,如DSP,ADC,DAC,RAM,FPGA,总线接口等技术本文的内容主要是分析高速实时数字信号处理系统的特点,构成,发展过程和系统设计中的一些问题,并对其中的主要功能模块分别进行了分析。
最后文中介绍了一种采用自行开发的COTS产品快速构建嵌入式并行实时信号处理系统的设计方法。
1.概述信号处理的本质是信息的变换和提取,是将信息从各种噪声、干扰的环境中提取出来,并变换为一种便于为人或机器所使用的形式。
从某种意义上说,信号处理类似于”沙里淘金”的过程:它并不能增加信息量(即不能增加金子的含量),但是可以把信息(即金子)从各种噪声、干扰的环境中(即散落在沙子中)提取出来,变换成可以利用的形式(如金条等)。
如果不进行这样的变换,信息虽然存在,但却是无法利用的,这正如散落在沙中的金子无法直接利用一样。
高速实时信号处理是信号处理中的一个特殊分支。
它的主要特点是高速处理和实时处理,被广泛应用在工业和军事的关键领域,如对雷达信号的处理、对通信基站信号的处理等。
高速实时信号处理技术除了核心的高速DSP技术外,还包括很多外围技术,如ADC,DAC等外围器件技术、系统总线技术等。
本文比较全面地介绍了各种关键技术的当前状态和发展趋势,并介绍了目前高性能嵌入式并行实时信号处理的技术特点和发展趋势,最后介绍了一种基于COTS产品快速构建嵌入式并行实时信号处理系统的设计方法。
2.DSP技术2.1 DSP的概念DSP(digital signal processor),即数字信号处理器,是一种专用于数字信号处理的可编程芯片。
它的主要特点是:①高度的实时性,运行时间可以预测;②Harvard体系结构,指令和数据总线分开(有别于冯·诺依曼结构);③RISC指令集,指令时间可以预测;④特殊的体系结构,适合于运算密集的应用场合;⑤内部硬件乘法器,乘法运算时间短、速度快;⑥高度的集成性,带有多种存储器接口和IO互联接口;⑦普遍带有DMA通道控制器,保证数据传输和计算处理并行工作;⑧低功耗,适合嵌入式系统应用。
DSP有多种分类方式。
其中按照数据类型分类,DSP被分为定点处理器(如ADI的ADSP218x/9xBF5xx,TI的TMS320C62/C64)和浮点处理器(如ADI的SHARC/Tiger SHARC系统·TI的TMS320C67)。
雷达信号处理系统对DSP的要求很高,通常是使用32bit的高端DSP;而且浮点DSP更能满足雷达信号大动态范围的要求。
2.2 DSP和其他处理器的比较目前在高性能嵌入系统/实时信号处理领域,占统治地位的处理器是DSP;而目前诸如MCU(微控制器)、GPP/RISC(通用处理器)、FPGA,ASIC等都在分享这一市场。
它们在性能、价格、开发难度、功耗等等方面有着不同的特点,因此各自适合不同的市场领域。
表1对它们的特点进行比较。
其中,GPP和MCU和DSP一样都可以通过高层语进行编程;而FPGA则需要硬件描述语言进行开发设计;ASIC则属于功能定制产品。
它们和DSP有着很大区别,主要在于GPP多用于通用计算机,内部采用冯·诺依曼结构,只有处理内核没有DMA控制器,没有丰富的IO设备接口,不适合实时处理,而且功率很大,如Intel的CPU的功耗多在20-100W左右,PowerPC的功耗最小也要5-10W,而且DSP可以做到1一2W。
而MCU主要用于嵌入式系统的控制,没有计算和处理能力。
就信号处理能力而言,DSP最适合信号处理的前端,GPP/RISC处理器比较适合复杂算法或者混合信号处理与数据处理的场合。
2.3DSP的发展和趋势1982年TI公司推出了世界上第一款成功商用的DSPTMS320C10。
在上世纪90年代,DSP技术有很大的发展,出现了几款典型的DSP,主要有ADI公司的ADSP2106x/ADSP21160和TI公司的TMS320C62x/C67x.ADI的DSP具有出色的浮点处理能力,多用于雷达/声纳等信号处理;独特的多DSP互联能力(总线直接互联和Link口互联),使它们被称为”多DSP系统的实现标准”。
而TI公司的DSP则更注重单片的处理能力,在民用高端DSP市场占有很大份额。
进入21世纪,DSP在各方面性能都有了飞跃。
ADI公司推出TigerSHARC 系列,TS101主频达到300MHz,目前已经得到大量的应用;2003年推出最新的TS201,主频达到600MHz,处理能力为3.6GFLOPs,是当前处理能力最强的浮点DSP之一。
TI公司则推出了C64系列,2004年初已经公布了1GHz的TMS320C6416的技术是目前少数突破1GHz的DSP之一,定点处理能力达到8000MIPS。
目前TS201和1GHzC64都仍处于工程样品阶段,ADI公司预计在2004年8月正式量产TS201。
目前DSP的发展趋势是向速度更快、集成度更高的方向发展。
DSP将会在其内部集成特殊的运算单元,以适合矩阵运算等运算密集的特殊算法。
另外,光DSP(ODSP>Optical DSP)也将成为一个新的发展热点。
ODSP采用光调制矩阵进行光速级的矢量和矩阵的运算。
目前以色列的LENSLET公司公布的ODSP原型机Enlight256,处理能力相当于1GHzC64的1000倍。
2.4当前DSP性能状态和比较下面表2中通过典型的技术指标,比较了目前多款主流DSP的技术性能。
表2中不仅给出了目前常见的4种DSP的主要指标比较,还给出了IBM公司的PowerPC系列处理器的典型性能指标。
PowerPC系列虽然属于MPU,但是由于它的出色处理性能,而且低功耗(相对于Intel的CPU)等特点,使得它非常适合嵌入式的实时信号处理系统中,目前PowerPC处理器在国际上军用信号处理市场占有大部分市场。
但由于PowerPC毕竟属于MPU,在结构上和DSP有些差异,例如它没有内部DMA控制器、10处理器、存储器外设接口,内核在计算的同时,还需要负责读取数据,使得整个处理时间加长。
因此虽然PowerPC系列有着标称值很高的指标,但是对于需要持续实时信号处理的系统并不一定都合适。
下面简单给出一个TS101,C64和MPC7410的比较结论:①Tiger SHARC适合于多DSP互联、动态范围大、带宽处理量比较平均的持续实时信号处理系统;②TMS320C64适合于动态范围不大、对DSP片间互联要求不高的持续实时信号处理系统;③MPC7410适合于动态范围大、对DSP片间互联要求不高、带宽处理量比较小的事后数据处理系统。
3. 外围器件技术一个高速实时信号处理系统除了DSP技术外,还需要配合大量的外围电路。
图1描述了一个典型的基于DSP的高速实时信号处理系统的主要功能框图。
3.1模拟信号数字信号的转换电路3.1.1ADC器件技术状态和趋势ADC器件对处理系统起到关键作用,影响到系统的可实现性和系统的性能。
ADC器件由其内部构造不同,可以分成串并行和全并行。
前者通过多级串行的逐次比较,可以很好地提供ADC量化精度,但缺点是速率较慢;目前500MHz 以下的ADC多是采用这种类型。
后者是将输入模拟信号同时和2N个比较器比较,并行产生量化值,因此也称为FlashADC:这种ADC器件可以实现很高频率的模数转换,但是缺点是精度较低,而且功耗很大。
串并行ADC以ADI公司的AD6645为例,可以实现最大采样率105MSPS,14bit量化精度。
全并行ADC以ATMEL公司的TS83102GO为例,可以实现最大采样率2GSPS,10bit量化精度,采用LVDS接口,功耗只有4.6W。
目前ADC器件发展的趋势是:①高输入带宽、高采样速率、高量化精度;②对外接口电平发展为LVDS等高速电平;③低功耗、多通道集成、多功能集成。
3.1.2DAC器件技术状态和趋势DAC器件在系统中的作用和ADC相反,所以其内部结构和ADC也相反的过程。
目前DAC的指标相对ADC要更高一些,例如ADI公司的AD736可以实现1.2GSPS的转换速率,精度为14bit,对外接口采用DDR方式的LVDS电平;而其功耗却只有0.55W。
当前DAC的发展趋势是:①高速、高精度、低功耗;②多功能集成,如增加滤波器;③接口电平采用高速协议:LVDS.DDR等技术。
3.1.3 DDS器件技术状态和趋势DDS器件内部结构基本分为两类:①相位累加器(如图2所示)。
②数据存储型(如图3所示)。
当前DDS的典型指标可以达到超过1GSPS以上,相位累加器精度可以保证在32bit;300MSPS的AD9854可以实现48bit的相位累加器精度。
图1基于DSP的高速实时信号处理系统功能框图按照功能分类,外围电路可以分成几类:①模拟信号数字信号的转换电路,ADC.DAC.DDS等;②用于数字信号下变频和上变频的DDC.DDU;③缓冲和存储电路,RAM,FIFO等;④逻辑控制和协处理器,CPLD和FPGA;⑤通信接口电路,光纤、LVDS等。
下面分别简单介绍每类外围器件的当前技术状态。
图2相位累加器图3数据存储型当前DDS的发展趋势:①更高时钟频率:目前最高到达了1G左右;②通过提高相位累加器的位数、查找表位数及DAC的位数以提高输出的信噪比和SFDR;③编程实现多种调制输出方式:幅度、相位调制;④实现任意波形输出的能力。
3.2RAM.FIFO技术存储器技术目前的技术状态是同步技术、双沿和多沿传输技术的广泛应用。
目前同步静态存储器成为高速、大容量SRAM中的主要力量,例如SBSRAM.ZBTSRAM等同步SRAM,时钟频率可以高达200MHz以上。
另外,新型DDRSRAM、甚至QDRSRAM,可以在一个时钟周期内传输2个或者4个数据,这将大大提高SRAM的读写带宽。
而动态RAM中,由于DDR技术的应用,使得存储速率可以达到每线400Mb/s:而且由于新的芯片封装技术和制造工艺的应用,使得单片DRAM的容量越来越大,目前单片最大1Gbit的DDRSDRAM已经大量应用。
目前常用的FIFO器件仍然是高速同步FIFO,同步时钟可以达到100MHz以上。
目前出现了DDR接口的FIFO器件,可以达到250MHz以上,大大提高了带宽。
目前存储器发展的主要趋势是:①高速、大带宽:采用DDR,QDR等技术,甚至LVDS等接口电平逻辑;②低功耗、高密度:采用更新的芯片封装和制造工艺,提高单片容量、降低功耗。