当前位置:文档之家› 特定人语音控制音乐播放器软件系统设计

特定人语音控制音乐播放器软件系统设计

特定人语音控制音乐播放器软件系统设计摘要语音识别技术是人类迈向高度智能化和自动化的信息社会所必备的关键技术之一。

经过几十年的艰苦探索和研究,语音识别技术获得了极大的发展,一些比较成熟的技术已经逐步应用于日常生活中。

语音识别是解决机器“听懂”人类语言的一项技术。

作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。

如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。

以语音识别技术开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。

本文阐述了基于MATLAB软件上实现的特定人语音控制播放器软件系统的设计,实现应用MATLAB软件编程达到控制播放器的功能,语音控制模式能够识别特定人“开”、“关”、“暂停”等语音指令并实现相应控制,以代替传统的鼠标或按键操作控制播放器的开关机和播放。

关键词:DTW算法语音识别特征提取语音控制IDesign of music player software system control of specific humanvoiceAbstractSpeech recognition is one of the most indispensable technologies for human to realize a highly intellectual and fully roboticized information society in the future. With many researchers' enormous efforts, the past tens of years have witnessed significant progress in speech recognition technologies and parts of them have already been applied in people's daily life.Speech recognition is to solve machine "understand" a human language technology. As the leading direction of the intelligent computer study and the key technology of man-machine voice communication, speech recognition technology has received extensive attention of national science. Now, with voice recognition technology research breakthroughs, the development of computer and the importance of social life is becoming more and more apparent. Based on speech recognition technology developed has a very wide range of product applications, such as voice-activated telephone exchange, information query, family services, hotel services, medical services, banking services, industrial control, voice communication system, etc., almost into every industry and every aspect of society.This paper describes the design of specific human voice control player software system based on the MATLAB software, and realizes the application of MATLAB software to control the functionality of the player, voice control mode to identify the specific "open", "closed", "pause" voice command and control, to replace the traditional mouse or keyboard operation switch control the player and play.Key words: DTW algorithm; Speech recognition ;feature extraction ; Speech control目录摘要 (I)Abstract..................................................................................................... I I 第一章绪论. (1)1.1语音识别概述 (1)1.2 毕业设计任务 (1)1.3 本文研究内容和章节安排 (2)第二章语音识别的基本原理与技术 (3)2.1语音识别系统 (3)2.1.1 概述 (3)2.1.2语音识别原理简介 (3)2.2.3语音识别系统的分类 (4)2.2 语音信号预处理 (5)2.2.1 分帧 (5)2.2.2 预加重 (6)2.2.3 加窗 (6)2.3 端点检测 (7)2.3.1 短时能量 (7)2.3.2 短时过零率 (8)2.3.3短时自相关函数 (10)2.3.4 双门限端点检测 (11)2.4特征参数提取 (12)2.4.1 LPC与LPCC系数 (13)2.4.2 MFCC系数 (13)2.4.3 语音信号的分析 (15)第三章语音识别算法 (18)3.1概述 (18)III3.2 DTW算法 (18)3.3 非特定人语音识别算法——HMM (19)3.4 人工神经网络(ANN) 识别算法 (24)第四章特定人语音控制音乐播放器的软件系统设计 (25)4.1 语音录制 (25)4.2 窗口的选择 (25)4.3 语音信号的特征提取 (27)4.4 DTW算法实现 (28)4.5 DTW算法的改进 (30)4.6 其他一些相关程序的编写 (31)4.7 特定人语音的识别结果 (32)第五章特定人语音控制播放器软件的功能实现 (34)5.1任务与实现方法 (34)5.2语音控制播放器程序流程图 (34)5.3 实验结果分析 (35)第六章结束语 (36)参考文献 (37)致谢 (39)南京工业大学本科生毕业设计(论文)第一章绪论1.1语音识别概述自从计算机诞生以来,通过语音与计算机交相互动一直是人类的梦想,随着计算机软硬件和信息技术的飞速发展,人们对语音识别功能的需求也更加明显和迫切。

语音识别技术就是让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,属于多维模式识别和智能计算机接口的范畴[1]。

传统的键盘、鼠标等输入设备的存在大大妨碍了系统的小型化[2],而成熟的语音识别技术可以辅助甚至取代这些设备。

在PDA、智能手机、智能型家电、工业现场、智能机器人等方面语音识别技术都有着广阔的前景。

语音识别技术起源于20世纪50年代,以贝尔实验室的Audry系统为标志[3]。

取得了动态时间归整(DTW)、线性预测分析(LP)、隐马尔可夫模型(HMM) 、矢量量化(VQ)等一系列关键技术的突破和以IBM的ViaVoice、Microsoft的VoiceExpress[9]为代表的一批显著成果。

而国内的语音识别起步较晚,1987年开始执行国家863计划后语音识别技术才得到广泛关注。

比较具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室,中科院声学所等[6]。

其中中科院自动化所研制的非特定人连续语音听写系统和汉语语音人机对话系统,其准确率和系统响应率均可达90%以上[4]。

常见的语音识别方法有矢量量化技术(VQ)、动态时间归整技术(DTW)、隐马尔可夫模型(HMM)、基于段长分布的非齐次隐马尔可夫模型(DDBHMM)和人工神经元网络(ANN)[8]。

DTW是较早的一种模式匹配和模型训练技术,它应用动态规划的思想比较成功的解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能。

虽然HMM模型和ANN在连续语音大词汇量语音识别系统优于DTW,但由于DTW算法计算量较少、无需前期进行长期训练,也很容易将DTW算法移植到单片机、DSP上实现语音识别且能满足实时性[5]要求,故其在孤立词语音识别系统中仍然得到了广泛的应用。

1.2 毕业设计任务本课题运用语音信号识别与处理功能应用MATLAB软件编程达到控制播放第一章绪论器的功能,语音控制模式能够识别特定人“开”、“关”、“暂停”等语音指令并实现相应控制,以代替传统的鼠标或按键操作控制播放器的开关机和播放情况。

要求独立负责完成本设计任务,要求完成主要程序的编写、调试并能在答辩时进行该语音识别系统的演示。

主要内容包括语音库的确立、录音工具的选择、语音特征参量提取、识别算法实现以及相应控制功能实现程序的编写及调试等内容。

1、通过录制采集语音生成语音库2、录音工具及采样频率的确定3、语音特征参量提取4、程序的编写及调试5、实现特定人语音识别1.3 本文研究内容和章节安排本文的主要研究内容是特定人语音控制音乐播放器软件系统的设计,基于M ATLAB的软件环境,研究特定人的语音控制播放器的软件系统设计。

具体的内容安排如下:1.讨论语音识别系统的基本原理。

讲述了孤立词识别系统的分类、基本构成及工作原理。

2.研究了语音信号的预处理和特征参数提取。

内容涉及语音信号的数字化、加窗处理、端点检测,及特征向量。

3.研究特定人孤立词识别算法,包括DTW识别法、HMM识别法以及神经网络识别法。

4.设计一个基于DTW算法的特定人语音识别系统,可以通过特定人的语音控制音乐播放器。

相关主题