软件系统的设计与实现
原始 语音
复 制
Writer
语音 滞后
滞后后的语音
文件名,首部,数据
File.wav
Result.txt
端点检测 模块
求出端点 的语音
特征提取模块
提取语音特征
语句识别模块
系统中的关键类(架构)
它支持16位不同格式PCM声音的采集。
负责播放声音数据。
并将采集到的原始语音数据进行预处理,
根据需要向识别处理模块、播放线程、 端点检测,用于检测用户在何时停 或是主线程传送数据。 止语音输入并到达去除噪音的功能。
CWaveFormView
CThreadRecord
原始 语音
复 制
Writer
帧移
帧移后的语音
文件名,首部,数据
File.wav
Result.txt
端点检测 模块
求出端点 的语音
特征提取模块
提取MFCC
单词识别模块
语句练习数据流图(录音同时端检)
声音 处理 处理后语音
CWaveFormView
CThreadRecord
软件系统的设计与实现
韩顺平 2001年7月4日
目录
• 系统开发目的
• 系统的需求分析
• 系统的分析与设计
• 致谢
开发目的
开发一套具有自动发音评价功能和发音错 误纠正功能的英语发音学习系统。
软件系统的需求分析
• 语音的采集和回放;
• 语音波形显示;
• 语音信号的端点自检;
• 语音文件存储和读取;
波 形 显 示 模 块
标 注 显 示 模 块
识 别 结 果 模 块
识 别 结 果 存 盘
识 别 线 程
实 时 显 示 波 形
单 通 道 显 示 波 形
标 尺 模 块
舌 位 图
文 字 显 示 模 块
语 音 提 示 模 块
单 词 识 别
语 句 识 别
身 份 识 别
单词练习数据流图(录音同时端检)
声音 处理 处理后语音
系统中的关键类(界面)
显示用户发音结果,同时 单词练习界面 语句练习界面 给出改进发音的建议。
用户信息界面 实时显示语音波形 用户登陆界面 绘制标尺
系统中的关键类(识别)
端点检测,用于检测语 音输入何时停止,并达 到去除噪音的功能
提取语音特征参数 (MFCC)
单词评分模型
单词识别过程中对象间的时序图
• 单词搜索功能; • 系统运行过程中的工作状态指示和日志;
软件系统分析和设计
• 整体结构框架 • 数据流程图 • 系统中的关键类 • 系统对象间的时序图 • 用户界面设计
整体结构框架
英语学习系统
语音模块
界面模块
识别模块
录 音 模 块
播 放 模 块
存 盘 模 块
端 检 测 点 模 块
用 户 信 息 模 块
界面图示4: 语句练习实时显示波形
界面图示5: 语句练习(语音识别后)
致谢
谢谢大家!