基于语音识别的智能小车摘要随着计算机技术、模式识别和信号处理技术及声学技术等的发展,使得能满足各种需要的语音识别系统的实现成为可能。
近二三十年来,语音识别在计算机、信息处理、通信与电子系统、自动控制等领域中有着越来越广泛的应用。
本设计是语音识别在控制领域的一个很好实现,它将原本需要手工操作的工作用语音来方便地完成。
语音识别按说话人的讲话方式可分为孤立词(Isolated Word)识别、连接词(Connected Word)识别和连续语音(Continuous Speech)识别。
从识别对象的类型来看,语音识别可以分为特定人(Speaker Dependent)语音识别和非特定人(Speaker Independent)语音识别。
本设计采用的识别类型是特定人孤立词语音识别。
本系统分上位机和下位机两大方面。
上位机利用PC上MATLAB强大的数学计算能力,进行语音输入、端点监测、特征参数提取、匹配、串口控制等工作,根据识别到的不同语音通过PC串口向下位机发送不同的指令。
下位机是单片机控制的一个小车,单片机收到上位机传来的指令后,根据不同的指令控制小车完成不同的动作。
该设计对语音识别的现有算法进行了验证和实现,并对端点检测和匹配算法进行了些许改进。
本设计达到了预期目标,实现了所期望的功能效果。
关键词:MATLAB,语音识别,端点检测,LPC,单片机,电机控制SMART CAR GASED SPEECH RECOGNITIONABSTRACTWith the development of computer technology,pattern recognition,signal processing technology and acoustic technology etc, the speech recognition system that can meet the various needs of people is more possible to achieve.The past three decades, the voice recognition in the field of computer, information processing, communications and electronic systems, automatic control has increasingly wide range of applications.Speech recognition by the speaker's speech can be divided into isolated word (Isolated Word) identification, conjunctions (Connected Word) and continuous speech recognition (Continuous Speech) identification. Identifying the type of object from the point of view, the voice recognition can be divided into a specific person (Speaker Dependent) speech recognition and non-specific (Speaker Independent) speech recognition. This design uses the identification type is a specific person isolated word speech recognition.This design is of a good implementation of speech recognition in the control field, it does the work that would otherwise require manual operation by the voice of people easily.This system includes two major aspects:the host system and the slave system. The host system use the MATLAB on the computer which has powerful mathematical computing ability to do the work of voice input, endpoint monitoring, feature extraction, matching, identification and serial control,then it send different commands through the PC serial port to slave system according different recognised voice. The slave system is a car controlled by a single-chip micro-controller.It controls the car do different actions according different instructions received.The design is checking and realization of the existing speech recognition algorithm and I the endpoint detection and matching algorithms were slight improved.This design achieved the expected goals and achieved the desired functional effect.KEY WORDS:MATLAB,Speech Recognition,Extreme Points Test,LPC,Chip Microcomputer,Motor Drive目录前言 (1)第1章系统总体设计方案介绍 (3)第2章上位机设计 (4)§2.1 语音识别简介 (4)§2.1.1 语音识别发展 (4)§2.1.2 语音识别的分类 (4)§2.2 声音录入 (5)§2.3 声音的预处理 (6)§2.3.1 欲加重处理 (6)§2.3.2 分帧处理 (6)§2.4 端点检测 (6)§2.4.1 过零率 (6)§2.4.2 音量 (7)§2.4.3 过零率和音量积谱 (8)§2.4.4 用过零率和音量积谱来检测端点 (9)§2.5 特征参数提取 (10)§2.5.1 特征参数概述 (10)§2.5.2 用MATLAB实现LPC系数的计算 (14)§2.6 语音识别中的模式匹配 (14)§2.6.1 DTW算法原理 (14)§2.6.2 程序实现 (16)§2.7 MATLAB上的GUI设计 (18)第3章下位机设计 (20)§3.1 小车总体设计 (20)§3.1.1 小车总体框图 (20)§3.1.2 小车结构设计 (20)§3.2 小车硬件设计 (20)§3.2.1 单片机电路设计 (21)§3.2.2 驱动电路设计 (23)§3.2.3 稳压电路设计 (24)§3.3 小车软件设计 (24)§3.3.1 主程序流程图 (24)§3.3.2 部分主程序 (25)§3.3.3 底层驱动程序 (27)结论 (29)参考文献 (30)致谢 (31)附录 (32)前言随着计算机技术、模式识别和信号处理技术及声学技术等的发展,使得能满足各种需要的语音识别系统的实现成为可能。
近二三十年来,语音识别在计算机、信息处理、通信与电子系统、自动控制等领域中有着越来越广泛的应用。
语音命令控制可广泛用于家电语音遥控、玩具、智能仪器及移动电话等便携设备中。
使用语音作为人机交互的途径对于使用者来说是最自然的一种方式,同时设备的小型化也要求省略键盘以节省体积。
当今,语音识别产品在人机交互应用中已经占到越来越大的比例。
语音识别按说话人的讲话方式可分为孤立词(Isolated Word)识别、连接词(Connected Word)识别和连续语音(Continuous Speech)识别。
孤立词识别是指说话人每次只说一个词或短语,每个词或短语在词汇表中都算作一个词条,一般用在语音电话拨号系统中。
连接词语音识别支持一个小的语法网络,其内部形成一个状态机,可以实现电话语音查询、航空定票等系统。
连续语音识别是指对说话人以日常自然的方式发音,通常特指用于语音录入的听写机。
从识别对象的类型来看,语音识别可以分为特定人(Speaker Dependent)语音识别和非特定人(Speaker Independent)语音识别。
特定人是指只针对一个用户的语音识别,非特定人则可用于不同的用户。
实际上,非特定人语音识别的初始识别率往往都比较低,一般都要求用户花一定的时间对系统进行训练,将系统的参数进行一定的自适应调整,才能使识别率达到满意的程度。
本设计采用的识别类型是特定人孤立词语音识别。
本设计是语音识别在控制领域的一个很好实现,它将原本需要手工操作的工作用语音来方便地完成。
本系统分上位机和下位机两大方面。
上位机利用PC上MATLAB强大的数学计算能力,进行语音输入、端点监测、特征参数提取、匹配、串口控制等工作,根据识别到的不同语音通过PC串口向下位机发送不同的指令。
下位机是单片机控制的一个小车,单片机收到上位机传来的指令后,很据不同的指令控制小车完成不同的动作。
该设计对语音识别的现有算法进行了验证和实现,并对端点检测和匹配算法进行了些许改进。
为了更方便的进行上位机的操作,本设计用MATLAB的GUI设计了一个图形界面。
上面设置了串口选择框、录音开始按钮、语音识别结果框等。
下位机采用STC2C5A60S2单片机作为控制中心,采用L298专用驱动芯片搭建双桥,进行点击的正反转调速等控制。
本设计达到了预期目标,实现了所期望的功能效果。