当前位置:文档之家› 语音识别机器人的设计—毕业论文

语音识别机器人的设计—毕业论文

毕业论文(设计)题目语音识别机器人的设计系部电子信息工程专业电子信息工程年级 06级学生姓名学号指导教师语音识别机器人的设计【摘要】语音识别可划分为训练和识别两个过程。

在第一阶段,语音识别系统对人类的语言进行学习,把学习内容组成语音库存储起来,在第二阶段就可以把当前输入的语音在语音库中查找相应的词义或语义。

凌阳16位SPCE061A单片机内嵌32K字闪存,2K字SRAM,内置10位ADC、DAC,有多达14个的中断源。

它的CPU内核采用16位具有DSP功能的微处理器芯片, 而且CPU可最高工作在49MHz的主频下,能够非常容易地、快速地处理复杂的数字信号,因此与其他类型的单片机相比,在数字语音处理方面SPCE061A更具有优势。

基于SPCE061A设计了一个具有语音识别功能的机器人。

经过训练,训练人可使用各种命令让机器人完成许多有趣的动作,使得人机交互更具智能化。

【关键词】SPCE061A单片机语音识别机器人The Design of the Speech Recognition Robot【Abstract】The speech recognition is divided into two stages, namely, training and recognition. At the first stage, the speech recognition system learns about the language and stores what it a speech database. Then at the next stage, the meaning of each inputted speech can immediately be found in the speech database.Sunplus 16-bit SPCE061ASCM is embedded with 32K word Flash and 2K word SRAM, with built-in 10-bit ADC and DAC as well as more than 14 interrupt sources. The core of its CPU is a 16-bit microprocessor chip which of DSP. Besides, the CPU can work with a frequency up to 49 MHz, and process complex digital signals easily and quickly. Therefore, compared with other types of SCM, SPCE061A speech processing. Based on SPCE061A, a speech recognition robot designed. After training, the robot can complete many interesting actions according to the orders, which makes the -computer interaction more intelligent.【Key words】SPCE061A SCM Speech Recognition Robot目录绪论 (1)1 SPCE061A单片机 (1)1.1 SPCE061A简介 (1)1.2 芯片特性 (1)1.3 SPCE061A精简开发板 (2)2 所用语音算法 (2)2.1语音识别算法 (2)2.1.1 语音识别概述 (2)2.1.2 语音识别原理 (2)2.1.3 SPCE061A实现语音识别的步骤 (3)2.2 凌阳音频概述 (4)2.2.1音频压缩编码 (4)2.2.2 凌阳语音的播放、录制、合成和辨识 (5)2.2.3 常用的应用程序接口API的功能及应用 (5)3 系统总体设计方案 (8)4 系统的硬件设计 (9)4.1 SPCE061A最小系统 (9)4.2 SPCE061A的时钟 (10)4.2.1 时钟电路 (10)4.2.2 锁相环 (10)4.2.3 系统时钟 (11)4.3 电源模块 (13)4.4 语音录放 (13)4.4.1 录音 (13)4.4.2 放音 (14)4.5 机器人硬件驱动电路 (14)5 系统软件设计 (15)5.1 擦除FLASH模块 (16)5.2 位操作模块 (17)5.3 语音播放函数 (17)参考文献 (20)附录 (21)致谢 (22)绪论目前制造业市场上,工业机器人具有相当大的市场潜力,要使工业机器人真正应用于生产线上的各个方面,满足人们日益增长的需求,就离不开高性能的语音识别控制系统。

随着计算机软硬件技术、半导体技术、电子技术、通讯技术等的飞速发展人类已经进入后PC时代。

语音识别技术得到了迅猛发展, 支持语音识别的各种产品纷纷面世。

人类实现了语音命令控制空调、电视、灯光、自动窗帘等的使用,让人们的生活“随音所欲”,更加舒适,更加便捷。

基于凌阳16位SPCE061A单片机设计了一个具有语音识别功能的机器人。

在经过训练后使机器人对训练人的命令做出应答,完成跳两首舞曲、走步、转向、转头、发射飞盘等动作。

1 SPCE061A单片机本系统采用凌阳16位SPCE061A单片机作为控制中心,对输入的语音指令进行识别和处理,从而驱动机器人不同部位的直流电机,做出前进、后退、左传、右转等不同动作。

1.1 SPCE061A简介SPCE061A是凌阳科技研发生产的性价比很高的一款16位单片机,使用它可以非常方便灵活的实现语音的录放系统,该芯片拥有八路10位精度的ADC,其中一路为音频转换通道,并且内置有自动增益电路,用于录音。

两路10精度DAC,只需外接功放(SPY0030A)即可完成放音。

凌阳16位单片机所拥的一套指令系统和集成开发环境具有易学易用、效率高等特点。

在集成开发环境中,支持标准C语言编程,并可以实现C语言与凌阳汇编语言的相互调用,语音的录放只需调用相应的库函数就可实现。

SPCE061A片内还集成了一个ICE(在线仿真电路)接口,使得对芯片的编程和仿真变得非常方便,而且ICE接口不占用芯片上的硬件资源,结合凌阳科技提供的集成开发环境(unSP IDE)可以对芯片进行仿真;而程序的下载(烧写)也是通过该接口进行下载。

1.2 芯片特性SPCE061A 性能简介[1]:(1) 16位微处理器(2)工作电压(CPU)VDD 为3.0~3.6V,(IO)VDDH 为3.0~5.5V(3) CPU 时钟:0.32~49.152MHz(4)内置2K字SRAM(5)内置32K字FLASH(6)可编程音频处理(7)晶体振荡器(8)系统处于备用状态下(时钟处于停止状态),耗电仅为2uA3.6V(9) 2个16 位可编程定时器计数器(可自动预置初始计数值)(10) 2个10 位 DAC(数模转换)输出通道(11) 32位通用可编程输入输出通道(12) 14个中断源可来自定时器 AB、时基、2个外部时钟源输入和键唤醒(13)具备键唤醒的功能(14)使用凌阳音频编码SACM_S480可以播放压缩的语音资源(15)锁相环PLL振荡器提供系统时钟信号(16) 32768Hz实时时钟(17) 7通道10位电压模数转换器(ADC)和单通道声音模数转换器(18)声音模数转换器输入通道内置麦克风放大器,并具有自动增益控制(AGC)功能(19)具备串行设备接口(SIO)(20)具备低电压复位(LVR)功能和低电压检测(LVD)功能(21)内置ICE(在线仿真电路)接口(22)具有 WatchDog 功能1.3 SPCE061A精简开发板SPCE061A精简开发板(简称61板),是以凌阳16位SPCE061A单片机为核心的精简开发、仿真实验板。

61板除了具备单片机最小系统电路外,还包括电源电路、音频电路(含MIC输入部分和DAC音频输出部分)、复位电路等。

61板上有调试器接口(Probe接口)以及下载线接口(EZ_Probe接口),分别可接凌阳科技的在线调试器、简易下载器。

实现程序的下载、在线仿真调试只需配合unSP IDE 使用。

2 所用语音算法2.1语音识别算法2.1.1 语音识别概述根据对说话人的依赖程度,分为:(1)特定人语音识别(SD):只能辨认特定使用者的语音,训练→使用。

(2)非特定人语音识别(SI):可辨认任何人的语音,无须训练。

根据对说话方式的要求,分为:(1)孤立词识别:每次只能识别单个词汇。

(2)连续语音识别:用者以正常语速说话,即可识别其中的语句。

2.1.2 语音识别原理特征提取,抽取反应语音本质的特征参数,形成特征矢量序列。

语音模型库,从一个或多个讲话者多次重复讲话中提取的语音参数模板。

匹配检测,把输入语音的特征参数与语音模型库进行比较分析,得到识别结果。

语音识别原理参看图 2-1,如下:图 2-1 语音识别原理2.1.3 SPCE061A实现语音识别的步骤SPCE061A实现语音识别的步骤,分为训练部分与识别部分,以及在训练、识别过程中中断的情况,参看图 2-2,如下:图 2-2 SPCE061A实现语音识别2.2 凌阳音频概述我们所说的音频是指频率在20Hz~20KHz的声音信号,分为:波形声音、语音和音乐三种,其中波形声音就是自然界中所有的声音,是声音数字化的基础。

语音也可以表示为波形声音,但波形声音表示不出语言、语音学的内涵。

语音是对讲话声音的一次抽象,是语言的载体,是人类社会特有的一种信息系统,是社会交际工具的符号。

音乐与语音相对更规范一些,是符号化了的声音。

但音乐不能对所有的声音进行符号化。

为了让数字计算机更加便利处理音频信号,需要将模拟的(连续的)声音波形数字化(离散化),该过程主要包括采样和量化两个方面。

数字音频的质量取决于:采样频率和量化位数这两个重要参数。

此外,声道的数目、相应的音频设备也是影响音频质量的原因。

语音处理技术是建立在语言学和数字信号处理基础之上的综合学科,其过程大致可以分为AD采样输入、编码处理、存储、解码处理和DA等。

如今,要实现语音处理有多种渠道,可以选用专用语音芯片也可以选用单片机,二者区别参看表 2·1,如下:表 2·1 语音处理器件性能对照表[2]SPCE061A单片机具有八路10位ADC和两路10位DAC,两个16位可编程定时器计数器,内置MIC放大器和自动增益控制(AGC)电路,CPU时钟主频最高达49MHz且具有DSP 功能,有能力执行复杂压缩算法。

相关主题