汉语方言语音信号特征提取
水平方向 DCT
其中基特征分别采用MFCC和LPCC进行研究
动态时频倒谱特征的提取过程
(1)计算各语音帧的基特征,记第i帧的MFCC特征为 ci (n), n 1,2,3, , N (2)构造每帧的倒谱矩阵 X i ci ci 1 ... ci ( M 1)
(3)对倒谱矩阵进行水平方向Biblioteka 离散余弦变换得到变换后的矩阵 Yi
• 韵律特征:f0 能量 持续时间 • 声学特征:LPCC MFCC 一阶差分 SDC • 音素特征 • 词汇与语法特征 • 声调特征
研究内容
多种动态时频倒谱特征的提取
基于新特征的汉语方言辨识
研究方案
动态时频倒谱特征的提取原理
语音信号 预处理 基特征 提取 倒谱矩阵
动态时频倒谱 特征(DTFC) 矩阵元素 重组
Yi X iCT
(4)对的元素进行重组,可以得到新的向量
yiDTFC rearrangeD (Y i )
矩阵元素重组方式
重组方式1
重组方式2
重组方式3
基于新特征的汉语方言辨识系统
语音信号
预 处 理
特 征 提 取
GMM 训 练
分 类 器
识别方言类型
研究进展
重组方式1所得新特征的实验结果如下:
99
平 均 识 别 率 (%)
99
平 均 识 别 率 (%)
98 97 96 95 94 28 36
特征维度D
98 97 96 95 94 12 15 18 21
45
上下文宽度M
进一步工作计划
• 分别按重组方式2和3提取新的特征,并 进行汉语方言辨识实验,检验其有效性 • 进一步对以上三种特征在含噪环境下检 验其性能
汉语方言语音信号特征提取
目录
• • • • • • 选题背景和意义 研究现状 研究内容 研究方案 研究进展 研究成果
选题背景和意义
背景
语音识别/信息检索/刑事及军事监听
意义
• 寻求简单有效同时反映不同方言本质的特征 • 推动汉语方言辨识研究的进展 • 促进对生理学学科中人脑进行语言识别的研究
研究现状