模式识别-句法方法
· · ·· · · · · · · · · · · ·
x(n)= x(nT):取样值 时间 采样周期(T)
模式识别,第十章
18
语音信号预处理
• 频率预加重
• 语音信号受声门激励和口鼻辐射的影响,高频部分(清
音)幅度快速跌落
• 预加重的目的是提升高频部分,使信号频谱平坦,以便
于提取特征参数
• 通常采用一阶FIR滤波器
20
语音信号预处理
• 分帧处理与加窗
• 通过加窗处理实现语音信号分帧
j w(n) j + N-1 x(n)
xj(n) = x(j+n)w(n)
模式识别,第十章
21
语音信号预处理
• 矩形窗:
WR =
{ 0 = (Other)
1 = (0≤n<N-1)
• 汉明窗(Hamming):
WHM =
{ 0 = (Other)
较困难
• 声学识别基元(如音素)受前后音素发音方式的影响(协同
发音)使特征变得不稳定
• 不同人、不同心理和生理以及在不同的说话环境下说同一词
时,声学信号特征会发生变化
• 一个词的读音不仅包含了词义特征,而且还包含了说话人性
别、年龄、情绪等大量与词义无关的信息,而这些信息的分 离是不容易的
模式识别,第十章
• 话音(也称语音),频率范围通常为300Hz~3400Hz • 音乐( 由乐器演奏形成的规范的符号化声音),其带宽可
达到20Hz~20kHz
• 语音信号的采样频率一般为8kHz,音乐信号的采样频率则
应在40kHz以上
模式识别,第十章
17
语音信号预处理
• 语音信号数字化
振 幅 xa(t):模拟波形
• 1998年11月5日,微软中国研究院在北京成立 • 重点研究计算机在中文环境下的易用性
模式识别,第十章
6
语音识别概述
• IBM:ViaVoice仍居主流
• IBM公司潜心研究语音识别技术迄今已达30年之久,投资超
过2亿美元。
• IBM公司于1995年在北京成立了中国研究中心,中文语音信
息处理成了该中心三大研究领域之一
• 按识别器的类型
• 孤立单词识别 • 连续单词识别 • 连续言语识别
模式识别,第十章
12
语音识别的分类
• 按使用者情况
• 特定人语音识别 • 非特定人语音识别
• 按词汇表大小
• 有限词汇识别 • 无限词汇识别
模式识别,第十章
13
语音识别的关键问题
• 连续语音词与词之间没有明显的停顿,词与词之间的分割比
14
语音识别系统结构
训练
模型 建立
语音输入
预处理
特征 提取 识别 判决结果
模式 匹配
判决 规则
模式识别,第十章
15
语音信号预处理
• 对语音信号进行转换,使之更适合计算机处理,并符
合特征提取的要求
• 语音信号数字化 • 频率预加重 • 分帧 • 加窗
模式识别,第十章
16
语音信号预处理
• 语音信号数字化
H ( z) 1 z
1
模式识别,第十章
19
语音信号预处理
• 分帧处理与加窗
• 语音信号是时变的非平稳过程 • 由于人的发音器官运动速度较慢,可以认为语音信号是局部
平稳的,或短时平稳的
• 采用分段或分帧来进行分析,即认为在同一帧时间内语音信
号是平稳的
• 一般每秒帧数为33-100帧
模式识别,第十章
• 1997年9月4日,
ViaVoice。
IBM 在北京推出了中文连续语音识别产品
模式识别,第十章
7
语音识别概述
• Intel:做语音技术倡导者
• 1998年,英特尔公司也宣布致力于推广语音识别技术,除了
在北京举办首届语音技术国际论坛之外,还在北京、上海、 成都、广州等地展开了“基于英特尔框架的语音识别技术” 的宣传活动。
• 联合了七家世界著名学术机构(中科院自动化所、清华大学、
香港科技大学、香港中文大学、麻省理工学院、俄勒岗研究 院、 WATERLLOO大学)成立了“国际语音技术研究组织”, 致力于计算机语音技术的基础研究
模式识别,第十章
8
语音识别概述
• 国内开展语音识别的科研机构和高等院校主要有中科
院声学所、自动化所、清华大学、北方交通大学。已 有不少语音识别系统已研制成功
金融证券和旅游等方面的信息查询及服务成为可能, 进而成为电子商务进展中的重要一环
• 作为声控产业,语音识别技术将对编辑排版、办公自
动化、工业过程和机器操作的声控技术起到重大的推 进作用。 教育等诸方面事业产生革命性的影响
模式识别,第十章
• 可以预言,语音技术必将对工业、金融、商业、文化、
4
语音识别概述
• 语音识别是研究如何采用数字信号处理技术自动提取
以及决定语音信号中的上述信息的一门新兴的边缘学
科
• 是模式识别的重要应用领域之一
模式识别,第十章
10
语音识别的分类
• 按识别任务
• 说话人识别:说话人辩识、说话人确认 • 语种识别 • 关键词识别 • 语音识别与理解
模式识别,第十章
11
语音识别的分类
第十章: 语音识别基础
2
语音识别概述
• 语音是人类信息交流的基本手段之一 • 让计算机能说会听是智能计算机系统的重要特征 • 语音识别技术的应用将从根本上改变计算机的人机界
面,从而对计算机的发展以及推广应用产生深远的影 响
模式识别,第十章
3
语音识别概述
• 基于电话的语音识别技术,使计算机直接为客户提供
0.5-0.46cos(2πn/(N-1)) (0≤n<N-1)
• 哈宁窗(Hanning):
WHN =
• 面对如此广阔的应用领域,目前国内外众多公司正积
极推动语音识别技术的应用。
•微软:让计算机能说会听 •IBM:ViaVoice仍居主流 •Intel:做语音技术倡导者
模式识别,第十章
5
语音识别概述
• 微软:让计算机能说会听
• Bill
Gates 在97 年世界计算机博览会 (COMDEX) 主题演讲会 上描绘IT事业的发展宏图时,率先指出: 下一代操作系统和应用程序的用户界面将是语音识别。 工业界应对语音识别领域的重大突破做好充分准备,因为那 将是一场席卷全球的另一次热潮。
• 清华大学电子工程系与中国电子器件公司合作研制成
功特定人语音识别与理解实时系统
• 四川大学计算机中心研发的特定人连续英语---汉语语
音翻译演示系统
•投入实际使用
模式识别,第十章
9
语音识别概述
说话人信息、情感信息等
• 语音中包含有多种有用的信息:语义信息、语言信息、