当前位置:文档之家› 人工智能 语音识别 论文

人工智能 语音识别 论文

基于神经网络的语音信号识别摘要语言是人类之间交流信息的主要手段之一,自电脑发明以来,人们就一直致力于使电脑能够理解自然语言。

语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。

神经网络是在现代科学研究成果的基础上提出来的模拟人脑结构机制的一门新兴科学,它模拟了人类神经元活动的原理,具有自学习、联想、对比、推理和概括能力,为很好地解决语音识别这样一个复杂的模式分类问题提供了新的途径。

本文针时语音识别的特点.BP 神经网络在语音识别技术中的应用进行了探索性研究,对进而结合人工智能领域较为有效的方法——遗传(GA)算法。

针对传统BP 算法识别准确率高但训练速度慢的缺点,对BP 网络进行改进,构建了一种基于遗传神经网络的语音识别算法(GABP),并建立相应的语音识别系统。

仿真实验表明,该算法有效地缩短了识别时问,提高了网络训练速度和语音的识别率。

关键词:语音识别,神经网络,遗传算法,遗传神经网络,BP 网络RECOGNITIO THE RSREARCH OF SPEECH RECOGNITION BASED ON THE NEURAL NETWORK ABSTRACT Language is one of the most important means of exchanging information among the mankind.Since the computer was invented,many scientists have been devoted to enabling the computer to understand the natural language.Speech recognition is a comprehensive technology of such areas as acoustics,phonetics,linguistics,computer science,information processing and artificial intelligence,which can be used widely.The research of speech recognition technology has been focused by the world for a long time.The neural network is a new developing science,which simulates the mechanism of human brain and was putted forward by the developing of modern science.is not the overall description of human brain,the abstract,It but simulation and simplifying of the physical neural networks of human beings. The purpose of the research in this area is exploring the human brain mechanisms in information processing,storing and searching.If people can understand these mechanisms,a new way for the research of artificial intelligence,information processing and etc. can be opened up. Artificial neural network is a system which using a physically feasible system to imitate the structure and function of nerve cells in human brain,which has the ability of self—learning,contrasting,reasoning and summarizing .It have offered a new way in solving such complicated pattern classification problems as speech recognition.This paper mainly studies the application of the BP neural network in the research of speech recognition. BP neural network can get higher identification precision, but its training speed is very low, a new recognizing algorithm based on BP algorithm by combining with good effect method in ANN which named genetic algorithm (GA) was proposed and used to improve the BP neural network. Experiments results show that the training speed can be accelerated by the method and the recognition performance is also promoted.words: Key words speech recognition, neural network, genetic algorithm, genetic neural network, BP network 1.绪论1.1 1.1 课题背景1.1.1 语音识别概述随着计算机技术的发展,人与机器之间的交流也越来越广泛和深入,计算机己经渗透到人们生活的各个方面。

在现代社会中,人们逐渐习惯借助计算机来完成各项事务。

在这种情况下,如何让计算机智能化地与人进行通信,使人机交互更加自然方便成为现代计算机科学的重要研究课题之一。

语音识别(Speech Recognition)主要是指让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息,执行人的各种意图。

语音识别是一门涉及面很广的交叉学科,它是目前发展最为迅速的信息研究诸领域中的一个。

语音识别的最大优势在于使得人机用户界面更加自然和容易使用。

随着计算机技术、模式识别和信号处理技术及声学技术等的发展,使得能满足各种需要的语音识别系统实现成为可能。

近二三十年来,语音识别在工业、军事、交通、医学、民用诸方面,特别是在计算机、信息处理、通信与电子系统、自动控制等领域中有着越来越广泛的应用。

1.1.2 数字语音识别研究的意义语音识别的目标是让机器能听懂人类口述的语言,语音识别中的汉语数字语音识别,具有更为重要的意义,在众多场合的实用化都会给人们带来极大的便利。

语音电话拨号的应用是现阶段语音识别技术中最重要的一个应用方向,在很多场合下,如司机开车、黑夜或盲人拨打电话时,用手指拨电话号码是很不方便或不安全的,此时最自然的方式就是采用语音拨号。

今天计算机和电子通信设备日益微型化,未来的计算机将会微缩成腕上的手表般大小,而如果仍采用键盘输入是不可能的,有了数字语音识别技术,就可以在桌面上用声音命令、控制或操纵计算机。

利用语音进行工业控制可以避免复杂的控制面板,只要一声令下,所有的机器就都在你的指挥之下了,它们真的可以做到听到你的话了。

语音控制也是以后家电遥控的一个必然发展方向,而家电遥控中不可避免地会用到数字的识别,如电视机的频道、空调设定的温度、洗衣机的定时等。

总之,数字语音识别的研究对于推动社会发展具有重要的作用。

我们将在生活工作中渐渐体会到数字语音识别带来的种种便利,它将有可能涉足人类生活的每一领域。

1.2 语音识别的发展和现状语音识别的研究工作大约开始于50 年代,当时AT& T Bell 实验室实现了第一个可识别十个英文数字的语音识别系统——Audry 系统,可以识别10 个英文数字发音[1]。

60 年代,计算机的应用推动了语音识别的发展。

这时期的重要成果是提出了动态规划(DP)和线性预测分析技术(LP)[2],其中后者较好地解决了语音信号产生模型的问题。

70 年代,语音识别领域取得了突破。

在理论上,LP 技术得到进一步发展,动态时间归正技术(DTW)基本成熟,特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。

在实践上,实现了基于线性预测倒谱和DTW 技术的特定人孤立语音识别系统。

80 年代,语音识别研究进一步走向深入,其显著特征是HMM 模型和人工神经元网络(ANN)在语音识别中的成功应用。

HMM 模型的广泛应用应归功于AT&T Bell 实验室Rabiner 等科学家的努力,他们把原本艰涩的HMM 纯数学模型工程化,从而为更多研究者了解和认识。

ANN 和HMM 模型建立的语音识别系统,性能相当。

进入90 年代,随着多媒体时代的来临,迫切要求语音识别系统从实验室走向实用。

美国、日本、韩国以及IBM、Apple、AT&T、NTT 等著名公司都为语音识别系统的实用化开发研究投以巨资。

我国语音识别研究工作一直紧跟国际水平,国家把大词汇量语音识别的研究列入“863”计划,除了要加强理论研究外,更要加快从实验室演示系统到商品的转化。

2.语音识别的基本原理语音识别SR(Speech Recognition)是指让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息,执行人的各种意图[3]。

现代语音识别技术以神经网络为主要发展趋势,进入20 世纪90 年代以来,神经网络已经成为语音识别的一条重要途径。

由于神经网络反映r 人脑功能的基本特征,故具有自组织性、白适应性和连续学习能力等特点,特别适合于解决像语音识别这类模拟人的认知过程和智能处理能力,难以用算法来描述[4] 而义有大量样本可供学习的问题。

人工神经网络(ANN)是采用大量的简单处理单元广泛连接起来构成的一种复杂信息处理网络。

网络的训练学习是应用一系列输入矢量,通过已确定的算法逐步调整网络的权值,最终达到期望的目标。

相关主题