音语音信号处理第九讲:语音信号的线性预测分析应冬文中国科学院声学研究所提纲☐简介(为何建模)⏹Linear Prediction Coefficient 缩写为LPC☐原理(如何建模)⏹信号模型⏹LPC误差滤波⏹LPC语音建模☐在语音上的应用(具体于语音, 如何建模)☐经典解法(求解模型参数)☐频域特性(物理意义)建音域段语音信号采样点(LPC建模的动机:语音时域波形的相关性 一段语音信号采样点x t 样点,构造散点图(x t , x t+p )语音信号波形采样值存在强烈的相关性线性预测理论的发展史☐N.Wiener C.E.Shannon Gunnar Fant1919-2009器官发音的机理官音中☐语音是由声道中的激励信号产生,它受声道、鼻腔和咽喉的形状而形成的共振峰调节。
☐三种激励信号⏹声带周期性开合而产生的声门波,声门波的开合周期决定了语音信号的基音频率。
⏹肺部收缩而产生的空气流。
肺部收缩而产生的空气流⏹上述二者的组合。
声道鼻腔和咽喉中的声☐声道、鼻腔和咽喉中的声波共振由共振峰描述。
音成语音生成过程激励源滤波器卷积语音声波基本用途与思想基想☐LPC基本思想:⏹利用信号间相关性,用过去值预测现在或未来的值,即用过去若干个取样值的线性组合逼近一个取样值。
⏹在某种测度准则下,通过使实际的取样值与预测值之间的差别达最小,确定唯一的一组预测系数。
☐语音领域的用途⏹参数估计:基音周期、共振峰频率、谱特征、声道截面积函数等⏹特点:LPC能精确估计语音参数,用少量参数有效表示语音,计算LPC参数较简单。
⏹语音编码、语音增强、语音合成、声源定位、解混响、语音识音别等。
☐本次课的内容⏹如何建模、求解模型参数、模型的物理意义。
如何建模求解模型参数模型的物理意义☐简介(Linear Prediction Coefficient LPC)提纲(Linear Prediction Coefficient, LPC)☐原理(如何建模)⏹信号模型⏹LPC 误差滤波⏹LPC 语音建模☐在音(何建模)在语音上的应用(如何建模)☐经典解法(求解模型参数)☐频域特性(物理意义)☐简介(Linear Prediction Coefficient LPC)提纲(Linear Prediction Coefficient, LPC)☐原理(如何建模)⏹信号模型⏹LPC 误差滤波⏹LPC 语音建模☐在音(何建模)在语音上的应用(如何建模)☐经典解法(求解模型参数)☐频域特性(物理意义)信号模型(1)☐☐信号模型(2)☐☐三种信号模型(按滤波器的有理分式)信号模型(3)种信号模型(按滤波器的有理分式)⏹ARMA 模型:传递函数含有极点和零点(零极点模型)(自回归−滑动平均模型)过程序列ARMA 模型产生的序列称为ARMA 过程序列。
⏹AR 模型:传递函数的分子多项式为常数(全极点模型)。
(自回归模型)输出只取决于过去的信号值。
AR 模型产生的序列称为AR 过程序列。
⏹MA 模型:传递函数的分母多项式为常数(全零点模型)(滑动平均模型)输出只由模型的输入来决定。
MA 模型产生的序列称为MA 过程序列。
☐ARMA 模型是AR 模型和MA 模型的混合结构。
信号模型(4)☐LPC ☐LPC ☐求解☐推导正交方程的另一种形式☐☐最佳预测时,误差的最小方均值,即正向预测误差功率2min 1[()][()(()())][()()][()()]pp i i pi E E e n E e n x n a x n i E e n x n a E e n x n i ===--=--∑因1i =∑[()()]0;1,2,,p E e n x n j j p -==⎧⎪⎨=-- 即1[()()][()()][()()]pp i i E E e n x n E x n x n a E x n i x n ===--∑(00)(0p -1()()()i i e n x n a x n i =⎪⎩∑☐上式成立条件,最佳预测系数时。
☐合并标准方程式和上式,最后得到:1(0,0)(0,)p i i E c a c i ==∑解出1;0(,0)(,)0;1,2,,p p i i E j c j a c j i j p==⎧-=⎨=⎩∑ ——称为标准方程。
可解出p +1个未知数a 1,a 2,…,a p ,E p 。
正向预测误差功率☐结论☐☐(Linear Prediction Coefficient LPC)提纲简介(Linear Prediction Coefficient, LPC)☐原理⏹信号模型⏹LPC 误差滤波⏹LPC 语音建模☐在音的在语音上的应用☐经典解法☐频域特性语音信号的☐☐音求解滤波器参数和增益常数的过程称为语音信号的LPC 分析☐语音信号的LPC分析。
⏹基本问题是从语音信号序列确定一组LPC 系数。
⏹预测系数的估计须在一短段(帧)语音信号的范围内进行。
☐激励源问题用模型合成语音时产生的序列与和被分析序列⏹清音:用模型合成语音时,产生的序列与和被分析序列有相同的谱包络特性⏹)的谱是一组幅度相同的浊音:激励源u (n )的谱是组幅度相同的谐波线谱,与模型化中的信号源假设有所不同。
⏹但激励源u (n ) 的大部分时间的值非常小(零值),由于均方预测误差最小准则使预测误差e (n )逼近于u (n ),与u (n )能量很小这一事实并不矛盾。
因此,为简便起见,认为模型适于清音、浊音。
语音信号的LPC分析音☐使用全极点模型进行语音信号LPC分析的主要缺点:⏹理论上,语音是极零点模型(特别是清音和鼻音),应用模型;应该用ARMA⏹模型中,对于浊音时,激励源不满足白噪声的假设条件。
☐全极点模型求解方便,在相当广泛的条件适于工程,在数字语音信号处理的众多领域得到了非常成功的应用。
☐(Linear Prediction Coefficient LPC)提纲简介(Linear Prediction Coefficient, LPC)☐原理⏹信号模型⏹LPC 误差滤波⏹LPC 语音建模☐在音的在语音上的应用☐经典解法☐频域特性☐LPC LPC 分析的解法求信号模型参数可以通过C 完成⏹LPC 系数以及预测误差功率可从下式标准方程解出:j =⎧⏹1;(,0)(,)0;1,2,,pp i i E c j a c j i j p=-=⎨=⎩∑ 解线性方程组的方法有多种⏹以系数矩阵的特殊性质可简化解法标准方程=--☐的系数矩阵中,的值取决于求数学期望的方法。
⏹c j,i 的定义不同,导致不同的LPC 解法。
(,)[()()]c j i E x n i x n j (j,)的定不同,导不同的解☐经典解法:自相关法、协方差法。
自自相关法☐☐利用Toeplitz Yule–Walker Levinson–杜宾法快速求解对称p 矩阵,方程可用Durbin (杜宾法)递推算法高效地求解。
⏹算法的计算复杂度为O (p 2)(一般解法复杂度为O (p 3))Y l W lk 为☐设已知p -1阶Yule–Walker 方程的解为:1,11,21,11[1,,,,],Tp p p p p a a a E -------- 则有:11,11(0)(1)(2)(1)(1)(0)(1)(2)0p p r r r r p E a r r r r p ---⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥--⎢⎥⎢⎥⎢⎥1,211(2)(1)(0)(3)0p a r r r r p -⎢⎥-⎢⎥⎢⎥=-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥----☐由方程的系数矩阵的对称特点知,将p 阶和p -1 阶两方程中1,(1)(2)(3)(0)0p p a r p r p r p r --⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦后面两个列矢量倒置,再代入到原方程中,等式保持不变。
杜宾法快速求解(2)杜宾法☐Levinson–Durbin的递推公式r ⎡11,1121(0)(1)(2)(1)(1)(0)(1)(2)0p p r r r p E a r r r r p ---⎡⎤⎤⎡⎤⎢⎥⎢⎥⎢⎥--⎢⎥⎢⎥⎢⎥-- 1,211(2)(1)(0)(3)01)(2)(3)(0)0p a r r r r p a r r p r r -⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥----1,()))()p p p p --⎣⎦⎣⎦⎣⎦11110(0)(1)(2)()111r r r r p a a r r r r ⎡⎤⎡⎡⎤⎢⎥⎢⎥--- 10p p E k q -⎧⎫-⎤⎡⎤⎪⎪⎢⎥⎢⎥1,1,11,21,2()(0)()()(2)(1)(0)(2)p p p p p p p p a a r r r r p k ------⎢⎥⎢⎥⎢⎥--⎢⎥--⎢⎥⎢⎥⎢⎥⎢⎥0⎪⎪⎢⎥⎢⎥⎪⎪⎢⎥⎢⎥⎪⎪=⎢⎥⎢⎥⎨⎬⎢⎥⎢⎥⎪⎪ 1,11,1(1)(2)(3)(1)()(1)(2)(0)01p p p a a r p r p r p r r p r p r p r ---⎢⎥⎢⎥-----⎢⎥⎢⎥--⎢⎥⎣⎦⎣⎦ 10p p q k E -⎢⎥⎢⎥⎪⎪⎢⎥⎢⎥⎪⎪-⎢⎥⎢⎥⎪⎪⎣⎦⎣⎦⎩⎭杜宾法((1)结论从式☐(Linear Prediction Coefficient LPC)提纲简介(Linear Prediction Coefficient, LPC)☐原理⏹信号模型⏹LPC 误差滤波⏹LPC 语音建模☐在音的在语音上的应用☐经典解法☐频域特性最小预测误差的频域解释最小预测误差的频域解释因最小预测误差的频域解释定义:预测误差信号LPC ☐LPC ☐逼近语音信号谱即:型谱则以任意小的误差逼近语音信号谱,即:22j j lim (e)(e)p H X ωω→∞=☐p →∞,表明成立式:22j j (e )(e )H X ωω=812☐因相位的因素,但不一定成立式j j (e (e H X ≠ωω131620()()信号功率谱元音☐在信号谱的谷底处,LPC谱和信号谱匹配较差;☐浊音语音谱,在谐波成分处匹配效果要远比谐波之间好得多。
的准则原因:源于方均误差最小的准则,谱值大时误差要小。
LPC谱与实际谱的比较参☐p 从、、LPC谱参数选择阶数p 的选择:谱估计精度计算量存储量综合考虑,与LPC 求解方法无关。
一般原则:先保证足够的极点模拟声道响应的谐振结构。
通常,每kHz 两个极点(或共轭极点)表征声道响应,需3~4个极点逼近可能的零点、声门激励和辐射效应。
10 kHz 取样时,要求12~24阶数。
若谱估计关注声道谐振特性,取p =12~14N ☐帧长N 的选择N 小,则求解LPC 参数的计算量小一般,帧长N 取2~3个基音周期才是合理的☐语音信号谱的高频分量小,常采用预加重提高之。