当前位置:文档之家› 语音信号处理课件-第02章基础知识

语音信号处理课件-第02章基础知识


前三个共振峰的频率范围
2、语音信号产生过程
频率范围/Hz
成年男子
成年女子
带宽
F1
200~800
250~1 000 40~70
F2
600~2 800 700~3 300 50~90
F3
1 300~3 400 1 500~4 000 60~180
2、语音信号产生过程
2. 语音产生过程
理想状态下共振峰的计算:假设声道截面是均匀的(此
激励模型 根据发浊音和发清音的机理 又分为:(a)浊音激励 (b)清音激励
(1)激励模型
(a)浊音激励 由前面所讲发音过程可知, 发浊音时声带不断地张开和 闭合将产生间歇的准周期性 脉冲波,其周期为基音周期, 单个脉冲的波形类似于斜三 角波,故数字模型中可用周 期为T0单位取样序列串作为 声门脉冲模型g(n)的输入, 其输出就是浊音激励。 由于人类语音的频率范围主 要集中在300Hz~3400Hz, 数字模型中的信号取样率一 般为8KHz。
2. 语音产生过程
语音的两个重要声学特性: 浊音的基音频率(F0):由声带的尺寸、特性和声带所受张力
决定,其值等于声带张开和闭合一次的时间的倒数。人类 基音频率的范围在80~500 Hz左右。 共振峰(Fn , n=1,2,...):声道是一个谐振腔,它放大声音气 流的某些频率分量而衰减其他频率分量,被放大的频率我 们称之为共振峰或共振峰频率。 声道具有的一组共振峰,声道的频谱特性主要反映出这些共 振峰的不同位置以及各个峰的频带宽度 。共振峰及其带 宽取决于声道某一瞬间的形状和尺寸,因而不同的语音对 应于一组不同的共振峰参数。实际应用中,头三个共振峰 最重要,越多越精确。
声音是一种波,能被人耳听到,它的振 动频率在20~20 000 Hz之间。
1. 人类的语言器官
1、人类的语言器官
人体发音器官—肺、气管、喉(包括声带) 和声道,肺是语音产生的能源所在;声带 为产生语音提供主要的激励源;声道是指 声门至嘴唇的所有器官:咽、鼻腔 、口 腔等,它们具有非均匀截面,且随时间变 化,起共鸣器(或谐振器)的作用。
语音产生模型(Speech Production/Generation Model)
4、语音信号的特性
语音信号(Speech Signal)
4、语音信号的特性
数字语音信号表示(Representations of Speech Signals)
(1)激励模型
3、语音信号产生的数字模型
由此模型框图,我们可将语音信号看成准周 期序列或随机噪声序列作为激励的线性非 移变系统的输出,此模型可分为三个部分: 激励模型、声道模型、辐射模型
时可把声道看作一个粗细均匀的圆筒),从喉到唇的距
离L=17 cm,音速c=340 m/s,则共振峰将发生在:
c (2n 1)c
Fn
n
Байду номын сангаас
4L
n 1,2,
(n为第n个共振峰的波长)
我们们计算一下前三个振峰:
F1
c
1
c 4L
340 4 17 102
500Hz
F2
c
2
3c 1500Hz 4L
,
F3
c
3
1. 人类的语言器官
1、人类的语言器官
图2-1 人类的发音器官
鼻腔(nasal cavity) 口腔(oral cavity)
唇(lips)
齿龈(alveolar ridge) 硬颚(hard palate) 软颚(velum) 小舌头(uvula) 声门(glottis)
齿(teeth)
舌(tongue) 咽(pharynx)
5c 2500Hz 4L
谐振频率发生在500Hz的奇数倍
3、语音信号产生的数字模型
3. 语音信号产生的数字模型
在研究了发声器官和语音的产生过程以后,便可以建立 一个离散时域的语音信号产生的数字模型,它将是我们 将数字信号处理技术应用于语音信号的基础。下图是一 个完整的语音信号产生的数字模型:
4、语音信号的特性
激励源
谐振源
辐射源
声门气流和嘴部声压
2、语音信号产生过程
物理模型
2、语音信号产生过程
2、语音信号产生过程
2.语音产生过程
语音的形成过程—空气由肺部排入喉部,经过声带 进入声道,最后由嘴辐射出声波,形成语音。
浊音(Voiced sounds) :声带绷紧,气流通过时会使 得开口变成一开一闭的周期性动作,这时候就造成 周期性的激发气流,如a,o;
2、语音信号产生过程
口腔对声源频谱的调制——共振峰
共振峰是声道的重要声学特性。声道对于一个激励信号的响应, 可以用一个含有多对极点的线性系统来近似描述。每对极点都 对应一个共振峰频率。这个线性系统的频率响应特性称为共振 峰特性,它决定信号频谱的总轮廓,或称谱包络。
语音的频率特性主要是由共振峰决定的。而声道的共振峰特性 决定所发声音的频谱特性,即音色。
第2章 语音信号基础知识
1. 人类的语言器官 2. 语音产生过程 3. 语音信号产生的数字模型 4. 语音信号的特性 5. 人类的听觉功能
1. 人类的语言器官
1、人类的语言器官
人类能以语言沟通,进而累积知识,形 成文化,其中一个主要的原因,就是人类具 有较其它生物优越的发音器官。
人类的发音器官能够产生多样性的声音, 构成丰富的词汇,无疑是最关键的因素。
清音(Unvoiced or Fricative sounds) :声带完全 舒展,声道某部位收缩形成一个狭窄的通道,产生 空气湍流,如t,d;
爆破音:声带完全舒展,声道的某部位完全闭合,一旦 闭合点突然开启,空气压力快速释放 ,如b,p。
能被人耳听到,它的振动频率在20~20 000 Hz之间
2、语音信号产生过程
元音的音色和区别特征主要取决于声道的共振峰特性。共振峰 特性可以从语音信号频谱分析得到的幅频特性观察到。
在声学语音学中通常考虑F1和F2,但在语音识别技术中至少要 考虑三个共振峰,而在语音合成技术中考虑五个共振峰是最为 现实的。
声波的共振也称为共鸣。声道截面积随纵向位置而改变的函数, 称为声道截面积函数,它决定共振峰的特性。
喉(larynx)
注:喉部以上的部分统称为声道;气管和肺在声门以下
1. 人类的语言器官
图2-2 最重要的发音器官之一:声带
1、人类的语言器官
(a)闭合状态
(b)张开状态
甲状软骨 杓状软骨 环状软骨 声门 声带
2.语音产生过程
2、语音信号产生过程
直流气流 交流气流
速度波
声压波

声带
声道
嘴唇
声音
能源
相关主题