当前位置:文档之家› FPGA硬件设计基本方法1

FPGA硬件设计基本方法1


定点仿真
从系统总体性能确定模块的字长精度
基本可以采用逆推顺述的方式,先确定纠错 解码器的字长,在向前推进确定速率匹配模 块,检测器模块和信道估计模块等,实际设 计时也可并行进行。 参数优化可以先将其他模块用浮点,仅对其 中某一模块实施定点仿真,减少其他模块的 影响。但要注意模块参数之间的联系。
9
Creating The Wireless Future
存储器的并行与串行复用
存储器类型
寄存器型:一般寄存器和移位寄存器 单端口ram,一个时钟只能支持一次读写 双端口ram,一个时钟支持2次读或写,或者一读 一写,同时读写同一单元有竞争问题。 对ASIC设计来说其需要的芯片面积寄存器最高, 移位寄存器次之,双端口ram,单端口ram最少。
最大值归一化,平均功率归一化,平均功率 倍数的归一化。
2014/1/29 5
Creating The Wireless Future
定点仿真
归一化截取方法优点是充分利用字长精度 模块内部都采用归一化需要计算资源太多, 大多采用简单的直接截位,模块间有时采 用归一化截位方法。
一般在解交织过程中采用归一化截取方式。 对DSP或嵌入式CPU完成的部分硬件计算功能 可以减少中间部分计算的截位操作。
运算器与存储器精度

浮点运算与定点运算考虑
浮点运算精度高,占资源多,浪费严重, 定点运算资源节省,中间需要截位,会造成精 度损失。


定点运算需事先确定字长精度和截位方式

定点仿真:确定各个量的字长精度和每个运算 器输入和输出字长。
2
2014/1/29
Creating The Wireless Future
2014/1/29
实际系统中又分为固定与自适应截取
4
Creating The Wireless Future
定点仿真
定点仿真中参数优化截取实际等效于两次 量化操作过程
有效的模拟到数字转换是AGC+A/D变换器。 AGC可以看着是一个归一化操作,A/D是量化 器。
常见的三种归一化方法
Creating The Wireless Future
FPGA及ASIC设计基本考虑
硬件运算器与存储器字长精度 硬件运算单元与存储单元的并行度与 串行复用(含存储单元的类型) 关键模块的pipeline 主控状态机与模块间接口 常见的资源互换方式

2014/1ss Future
8
Creating The Wireless Future
并行度确定简单算例

实际WCDMA系统的解码器在器件工作主频100M时,最 少32个蝶形计算单元。 系统级的实时要求解码器必须更快工作,系统级实 时性一般要求下一帧时间内解出上一帧数据。 系统中信道估计,解扩(检测)单元,解复用(交 织)都需要时间完成,数据输出也需时间。 解码器在一帧中可用时间大约为1/2到2/3帧 除非增加额外的存储器,才可能所有时间都能用
2014/1/29 7
Creating The Wireless Future
并行度确定简单算例


设计一个16阶FIR滤波器,支持50M数据处理速度, 器件工作主频100M 50x16=900(M次)乘加 900/100=9最少使用9个乘法累加器才能达到实时。 WCDMA系统中,256状态维特比解码器,完成2M数据 的解码,器件主频100M,需要多少蝶形处理单元? 每解一个比特需要完成128个蝶形 (每个蝶形2次加比选,4次分支度量计算) 100M主频下平均解一比特只有5个时钟,最少蝶形运 算器数目:128/5大于26个。
定点仿真的参数确定需迭代优化
2014/1/29 6
Creating The Wireless Future
并行与串行复用
最小并行度
器件工作频率与任务的实时要求决定 实时性要求要符合整个系统要求 算法本身要按可并行化进行改造和分解
串行复用
当运算单元使用效率过低时考虑串行复用提供核 心单位的利用率,如DSP是最典型的串行复用。 串行复用会增加总线宽度和控制复杂度 串行复用增加布线延时和pipeline深度
2014/1/29 3
Creating The Wireless Future
定点仿真
大功能模块的精度先确定输入输出,然后 优化内部参数。具体操作方法为
统计各参数的变化范围,如实际传输条件下 的最大绝对值,绝对值的平均值,方差等等。 结合算法分解综合考虑存储空间大小,确定 各参数截取方法。 常用的为最大值截取,平均功率值的饱和截 取以及部分饱和截取。
选用原则
对存储量较大的数据尽量使用ram,实时要求能满 足时深度优先于宽度。
2014/1/29 10
相关主题