多媒体音频信息处理
第8章 数字音频处理技术
声音是多媒体信息的一个重要组成部 分,也是表达思想和情感的一种必不可少的 媒体。无论其应用目的是什么,声音的合 理使用可以使多媒体应用系统变得更加丰 富多彩。在多媒体系统中,音频可被用作 输入或输出。输入可以是自然语言或语音 命令,输出可以是语音或音乐,这些都会 涉及到音频处理技术。
用声音录制软件记录的英文单词“Hello”的语音实际波 形
8.1.3 声音基本特点
● 声音定义
声音是振动的波,是随着时间连续变化的物 理量。
声音的3个重要指标 1)振幅----波的高低幅度,表示声音的强弱。 2)周期----两个相邻波之间的时间长。 3)频率----每秒钟振动的次数,以HZ(赫兹)为单位。
评价值的测量 响度和响度级,噪音级,清晰度指 数,噪音评价数。
声源的测量 频谱的时间变化,声功率,指向性, 效率,频谱特征,幅值分布等。
音质的测量 混响时间,隔音量,吸音量。
声测量的基本仪器是声级计。声级计是一种能对声 音作出类似人耳的反应的仪器,同时,它能进行客 观而可重复的声压和声级测量。声压测量的好处很 多:它能帮助音乐厅提高音响效果;能对烦扰声音 进行精密的、科学的分析。声级测量还能明确地告 诉我们什么声音会引起听力损害,并提醒人们采用 适当的听力保护措施。因此,声测量是不可少的。
音色是不同的发音体所发出的音波都有自己的特 异性。一般可分为纯音和复合音两大类。大自然 中的声音是特殊的复合音。
音强是声波振幅的主观属性,它是由声波的振幅 引起的,振幅越大则响度越大。
8.1.4 声音的A/D与D/A转换
模拟信号很容易受到电子干扰,因此随着技术的
发展,声音信号就逐渐过渡到了数字存储阶段, A/D转换和D/A转换技术便应运而生。
8.1 音频信号及其概念
8.1.1 声音处理技术历史回顾
人类很早就开始研究声音,并利用当时已掌握了的声 音的某些规律来制造乐器、进行建筑设计或传声装置 设计,使发出的声音传得更远。可是几千年来,人类 只能凭耳朵来辨别声音的高低、强弱,而不能把声音 记录和储存起来。所以与其他研究领域相比,声学的 研究相对滞后。直到19世纪爱迪生发明了留声机,人 们才能用机械的方法把各种声音记录在唱片上。可是 声音、机械振动不容易传递,也不容易放大,机械方 法很不方便。随着电学、电子学的发展,人们开始尝 试记录下这些真实的声音,利用把声的振动转换成电 信号的原理,使声音的记录成为可能。最终电声技术 获得了迅速发展。
得到数字音频信号,它在时间上是不连续的离散 信号。
借助于A/D或D/A转换器,模拟信号和数字信号可以互相转换
8 位可编程 A/D 转换芯片
8.1.5 声音质量的评价
我们经常会对某一位歌手的歌声发表意见,并与其他 歌手进行比较,这其实是在对声音的质量进行评价。声音 质量的评价是一个很困难的问题,也是一个值得研究的课 题。目前来看,声音质量的度量有两种基本方法,一种是 客观质量度量,另一种是主观质量的度量。
8.1.2 音频信号的形式
在日常生活中,音频信号可分为两类: 语音信号:它包含了丰富的语言内涵,是人类进
行信息交流所特有的形式。 非语音信号:包括音乐和自然界存在的其他声音
形式。信息量低、识别简单。
声音是通过空气传播的一种连续的波,也叫做 声波。在物理上,声音可用一条连续的曲线来表 示。这条连续的曲线无论多复杂,都可分解成一 系列正弦波的线性叠加。因声波是在时间和幅度 上都连续变化的量,我们称之为模拟量。
A/D转换就是把模拟信号转换成数字信号的过程, 模拟电信号变为了由“0”和“1”组成的Bit信号。 这样做的好处是显而易见的,声音存储质量得到 了加强,数字化的声音信息使计算机能够进行识 别、处理和压缩,这也就是为什么如今磁带逐渐 被淘汰,CD唱片却趋于流行的原因。 A/D转换的一个关键步骤是声音的采样和量化,
声音的质量与它所占用的频带宽度有关,频带越宽,信号 强度的相对变化范围就越大大,音响效果也就越好。按照 带宽可将声音质量分为4级: 数字激光唱盘质量 ,通常又CD-DA质量,这种质量也就
是我们常说的超高保真(10HZ—22KHZ) 调频无线电广播,简称FM质量。 (20HZ—15KHZ) 调幅无线电广播,简称AM质量。 (50HZ—7KHZ) 电话质量。(300HZ—3.4KHZ)
传统的声音记录方式就是将模拟信号直接记 录下来,例如磁带录音和密纹唱片就是将声音拾 取处理后以磁记录或机械刻度的方式记录下来。 密纹唱片、盒式磁带等是记录储存这种模拟声音 信号的载体,而能够播放和(或)记录这些软件 的信号处理设备,诸如电唱机、磁带录音机等, 则称为模拟音响设备。
新的技术把声信号转换成电信号,经扩声系 统直接进行扩声;或者将其信号利用磁带、CD或 其他存储形式,使声音可超越时间和空间,通过 重放系统将其信号经过放大,由扬声器或耳机转 换成声信号,进入最后的终端---人耳,以实现任 何时间和地点的声音重现。
数字化处理的核心是对音频信息的采样,通 过对采集到的样本进行加工,生成各种效果。音 频信息在多媒体中的应用是极为广泛的,当计算 机配有声卡和音箱后,就能够发出各种悦耳的声 音,尤其是视频图像配以娓娓动听的音乐和语音, 使计算机的操作得以藉由视觉以外的听觉加以辅 助而成为一种愉快的过程。静态或动态图像配以 解说和背景音乐,可使图像充满生气;立体声音 乐可增加空间感,使人身临其境;语音电子邮件, 听声如见其人,游戏中的音响效果对于渲染气氛 则为显得更为重要;此外,在多媒体通信中,可 视电话、电视会议、这些都离不开数字化音频处 理技术。
● 声音三要素 (1) 音调 — (高低) (2) 音强 — (强弱) (3) 音色 — (特质)
●
特质
简称音质,与频率范围成正比,频率范围越宽音质越好。
● 声音的连续时基性 声音具有连续性和过程性,数据前后相关,并具有实时性。
音高是人对声波频率的主观属性,它首先与声波 的频率有关。声波的振动频率高,我们听到的声 音就高,反之亦然。