当前位置：文档之家› 基于FPGA的语音识别前端算法研究实现

基于FPGA的语音识别前端算法研究实现

信号。对每一帧经过预处理的语音信号进行自相关分
R ( k )= Σ x ( i-k ) x ( i ) ， 0 ≤ k ≤ P
i=k
(3)
式中 P 是 LPC 的阶数，取 P =10 。所采用结构如图 1 。在计算自相关系数的部分，如果在累加部分采用移位寄存器来计算保存 11 个 LPC 系数，会产生不必要的移位功耗 [6] 。考虑到 FPGA 丰富的存储器资源，采用 RAM 进行累加部分的计算，从而使功耗得到降低，如图 1 所示。寄存器的输出形成了连接到加法器的数据通路，而加法器的输出存储在指定位置的寄存器中，主状态机提供操作地址，并控制读﹑ 写次序以避免在同一位置同时进行读写操作。采用此结构，可以避免不必要的移位功耗，而性能上与采用移位寄存器无差别，故优于后者。
中图分类号： TN47 文献标识码： A
Realization of speech recognition front-end algorithm based on FPGA
LIU Wen Shu ， JI Ai Ming ， WANG Zi Ou
(Soochow University, Suzhou 215021 ， China ) Abstract ： According to the research of distributed speech recognition (DSR ),this paper introduces a front -end processing sys tem ,which is based on the FPGA. Especially, the system adopts LUT (look_up table ) divider and constant divider. Finally, after comparing the system simulation with the result of Matlab modeling , the system could compute LPCC coefficient in shorter clock cy cle . The experiment results show that comparing with the method used previously, this method saves numbers of operation time and some areas in the chip. Key words ： speech recognition ； DSR(distributed speech recognition ) ； FPGA ； divider
设 ξi = ici 则有：
n-1
ξn =-nan - Σ ( n-m ) am ξn-m ，其中 1 ≤ n ≤ P
m=1 p
(11) (12)
2 仿真验证
为了验证算法的可行性，本文用 VerilogHDL 语言对整个语音参数的提取进行建模。依照图 2 进行了 LPC 系
式中 P 是 LPC 的阶数，取 10 阶。采用 Levinson - Durbin [ 7] 方法来解。在该方法的计算中，可以看到求偏相关系数
(Parcor) k 时，由于存在式 (5) 中的关系： ki = temp E ( i - 1)
(5)
表 1 两种除法器算法性能比较表格
ncn =-nan - Σ ( n-m ) am cn-m ，其中 1 ≤ n ≤ P
m=1
(9) (10)
器。这里的除法运算所涉及到的除数仅为一组有限的常数，采用一个通用的除法器就显得没有必要了。为此使用文献 [10] 中提到的专用常数除法器，它的主要运算部分由规则的处理单元阵列所构成，大大节省面积，易于实现并易于扩展。
1.2 LPC 系数
采用自相关法来计算 LPC 系数。解 LPC 系数的矩阵方程为：
p
Rn ( i )= Σ ak Rn (| i-k |) ， 1 ≤ i ≤ p
k=1
(4)
位数）个时钟周期短得多。该除法器有 2 点好处：一是 2 个乘法和查表可以并行执行，除法器延时较短；二是乘法数据位数较少，乘法器面积较小，而由其决定的 LUT 面积也不大 [ 8] 。两种除法器算法性能比较如表 1 。
H =1- hz -1 (1) 本系统中 h 取 15 ，所以加重的语音信号为： 16 y ( n +1)= x ( n +1)- 15 x ( n ) (2) 16 窗函数采用汉明 (Hamming) 窗，汉明窗函数要先计算
好放于 ROM 中，直接与语音信号相乘得到加窗的语音
n-1
Σ Σ 1- m ≤ c =- Σ ≤ a c ，其中 P≤n≤Q n
p n m n-m m=1
m cn =- an - Σ 1am cn - m ，其中 1 ≤ n ≤ P n m=1
r1
r2
(7) (8)
r4 multipler r3
P 是 LPC 的阶数， Q 是 LPCC 的阶数。
1.1 自相关
对语音信号进行分帧，使得每一帧有 N =256 个采样，帧移为 64 。对每一帧信号进行预加重和加窗。预加重采用：
tributed Speech Recognition) 。移动终端只需进行语音采
近年来，语音识别在通信与电子系统、自动控制等领域中有着广泛的应用。其中一个重要的发展方向是硬件实现语音识别算法的研究。这个方向主要是小型化、便携式语音产品的应用，在这类设备上，通常是小词汇量的孤立词识别，例如：手机﹑ PDA 以及车载应用等装置上。国外在硬件实现方面的研究较早，而国内起步较晚，因此对基于 FPGA 的语音识别前端算法研究具有重要的意义 [ 1] 。近两年国际上提出了分布式语音识别 DSR (Dis-
集、特征提取，有关信息则通过无线数据信道送往网络中的远程服务器，由服务器中的识别单元完成语音识别功能 [ 2] 。就目前的研究情况来看，通常用相关的方法实现 LPCC 系数的提取。而在 LPC 系数提取部分的除法器，采用的结构不尽相同，有采用搜索算法 [ 3] ，也有采用减并移位法 [ 4] ；在 LPCC 系数提取时，可以直接计算，也可以经过一定的变换 [ 5] 。为了将面积和性能得到最好的折中，并且考虑实际的应用场合，在以上两个除法器的
Matlab 的建模结果进行了对比。结果表明，与之前的方法相比，系统能够在较短的时钟周期内计算出 LPCC 系数，节省了大量的运算时间和一定的面积。关键词：语音识别； DSR(distributed speech recognition) ； FPGA ；除法器
查找表法乘法器数目搜索算法
2 1 2 MUL or 1 MUL + 1 LUT
1 0 N( 数据位数 )
LUT 数目
延时
自相关输出
图 1 计算自相关系数结构图
《电子技术应用》 2010 年第 2 期
41
集成电路应用
1.3 LPCC 系数
Application of Integrated Circuits
按照上面的分析，如果依计算公式计算，缺点是资源占用过多，需要时钟周期过长。所以采用节省资源的方法计算中间系数，对公式进行一定的变形，算法进行一定的改进，资源得到充分利用，并且能够缩短时钟周期，节省乘法器资源 57% [ 5] 。计算 LPCC 系数结构图，如图 3 所示。实现节省资源的方法：
n-1
adder
图 3 计算 LPCC 系数结构图
其中 P 是 LPC 的阶数， Q 是 LPCC 的阶数，取 P = Q =10 。然而，在这个结构当中，可以看到最终的计算结果是 ξ ，而并不是真正的 LPCC 系数。 பைடு நூலகம் 此仍需要一个除法
集成电路应用
Application of Integrated Circuits
基于 FPGA 的语音识别前端算法研究实现
刘文姝，季爱明，王子欧 ( 苏州大学，江苏苏州 215021)
摘要：通过分布式语音识别 DSR 的研究，提出了基于 FPGA 平台的前端处理系统结构。对其中两个除法器分别采用了 LUT 查找表和常数除法器的结构。用 VerilogHDL 语言进行建模仿真，并与

e商务文档

基于FPGA的语音识别前端算法研究实现

相关文档推荐：