当前位置:文档之家› 1第一章语音信号处理实验解析

1第一章语音信号处理实验解析

21
语音和语言
一、语音的定义 语音是人类发音器官发出的、具有一定意义的、能起信 息交流作用的声音;由一连串的音所组成,是组成语 言的声音。 语音 (Speech):

语音是人类最重要、最有效、最方便的交换信息
其它信息 20% 图像信息 语音信息 其它信息
语音信息 20%
图像信息 60%
人类从大自然获取信息的分布图
19
语音信号处理基本概念



语音信号处理是以语音、语言学和数字信号处理为基 础而形成的一门涉及面很广的综合性学科,与生理学、 心理学、计算机科学、人工智能、数学等学科有密切 的关系。 语音信号处理是研究用数字信号处理技术对语音信号 进行处理的一门学科。其目的是要得到一些反应语音 信号重要特征的语音参数,或者通过某种运算的处理 达到某种用途的要求。 例如:
10


语音合成

以语言信息压缩、存储为主要目的对语音信号 数字模型进行研究,同时研究音素、音节、词 组与句子的发音规则。最终恢复出自然流畅的 语音来。例如文语转换系统(Text-to-speech)。 语音分析与合成将赋予计算机说话的功能。也 是进行话音编码、语音识别研究的基础。

11
语音识别

1972 年 CCITT 组织公布了第一个语音编码标准 G.711— 对数 PCM 编码,从此,数字程控交换网络淘汰了传统的模拟交换传输方式。 1988 年欧共体 13 个国家数字移动特别工作组 (GSM) 制定了采用长 时预测规则码激励的编码标准(13k bps RPE-LTP);1989年美国蜂 窝通信工业协会(CITA)宣布了北美数字移动通信话音编码标准 (8K bps矢量和激励VSELP)。 VoIP技术:是通过TCP/IP网络,在网络上对压缩的语音数据以数 据包的形式进行传输,而通常称之为IP电话技术;所用的话音编码 标准有G.723.1、G.728、G.729等。
采集: wavrecord 转换: wavread 播放:soundview 滤波:filter 自相关: xcorr 语谱图: specgram;specgramdemo 同态滤波:cceps,rceps 线性预测: lpc
17
第一篇 语音信号处理基础
第一章 语音及其产生和感知过程
18
语音信号处理概述
12
语音识别

根据对说话人说话方式的要求,可以分为孤立 字语音识别系统,连接字语音识别系统以及连 续语音识别系统。 根据对说话人的依赖程度可以分为特定人和非 特定人语音识别系统。 根据词汇量大小,可以分为小词汇量、中等词 汇量、大词汇量以及无限词汇量语音识别系统。
13


语音信号的数字处理方法
1 语音信号的特点—短时平稳性 2 短时时域处理方法—短时能量、短时平均过 零率以及短时自相关函数计算 3 短时频域分析—短时傅立叶分析 4 线性预测技术—本质上属于时域分析方法, 但其结果可以是频域参数 5 倒谱和同态分析、矢量量化和隐马尔可夫模 型

研究如何使计算机能够听懂人类的语言。



以汉语语音为例:汉语约有400个音节,加上 声调约1330个音调节,把这些语音信号的特征 存储到计算机内,并与计算机接收到的汉语发 音进行比较,找到特征相同的音节或音调节, 这个过程就是语音识别。 将识别出的音节序列转换成文字,就是语言理 解。 许多算法将理解过程溶入到识别中来提高识别 的准确性。因此可以将语音识别与理解归入同 一类应用。
14
语音信号的特点—短时平稳性
ห้องสมุดไป่ตู้
15
语音处理过程的结构框图
语音输入
模型特征参数 反混叠滤波 数模转换 分析
预处理
数字化
特征提取
传输 解压缩 语音输出 压缩处理 合成 存储
语音识别 训练
参考模式库 识别结果
识别 模式匹配
图1.2
语音处理过程的结构框图
16
实验学习工具:Matlab



高效的传输或存储 人工合成出语音 辨识出说话者 识别讲话的内容等。 语音编码 语音合成 语音识别
20
语音信号处理的研究内容

研究包括两个方面:


从语音的产生和感知进行研究。 将语音作为一种信号来处理。



基础知识 :声学,语言学,语用学,语音生产/ 感知 信号分析:时域,频谱,倒谱,线性预测参数 算法:无声检测(背景噪声),浊音-清音,基 音周期检测,共振峰估计 应用:编码,合成,识别,理解,验证,语言 翻译,加速/减速
第二章 语音信号处理的基础知识
2.1 概 述 2.2 语音产生的过程 2.3 语音信号的特性 2.4 语音信号产生的数字模型 2.5 语音感知
7
第二篇 语音信号分析
第三章 语音信号的时域分析 第四章 语音信号的短时傅里叶分析 第五章 语音信号的同态滤及倒谱分析 第六章 语音信号的线性预测分析 第七章 语音信号的矢量量化 第七章 语音信号的矢量量化 第八章 隐马尔可夫模型 第九章 语音检测分析
8
第三篇 语音信号处理技术与应用
第十章 语音编码(一)--波形编码 第十一章 语音编码(二)--声码器技术及混合编码 第十二章 语音合成 第十三章 语音识别 第十四章 说话人识别 第十五章 语音增强
9
语音编码的应用:

在保证一定语音质量的前提下,尽可能降低编码比特率, 以节省频率资源。例如:音符,乐谱。 在移动通信、卫星通信、军事保密通信和IP电话通信中 的应用:
5
课程内容
第一部分 语音信号处理的基础知识
第二部分 语音信号分析
时域分析、短时傅里叶分析、同态滤波及倒谱分析、 线性预测分析、矢量量化、语音基音和共振峰检 测
第三部分 语音信号处理技术与应用
语音编码 语音合成 语音识别 语音增强
6
第一篇 语音信号处理基础
第一章 绪 论
1.1 语音信号处理概述 1.2 语音信号处理的发展概况 1.3 本书的内容
语音信号处理实验
绪论
1
基础实验(12学时)
语言信号处理工具
短时时域分析
短时频域分析
线性预测编码(LPC)分析
基音与端点检测
共振峰检测
2
综合实验(8学时)


语音编码 语言合成 语音增强 语音识别
3
教材
胡航 .《语音信号处理》(第4版) 哈尔滨工业大学出版社
4
参考书

赵力《语音信号处理》机械工业出版社 《离散时间语音信号处理(原理与应用)》(美) 夸特尔瑞(Quatieri,T.F.)著,赵胜辉等译、电 子工业出版社
相关主题