多媒体信息处理技术
2. MIDI音乐的合成方式 1)调频合成方式 2)波表合成方式
上一页 下一页 返回
任务1 音频处理技术
3.MIDI消息与MIDI文件 MIDI传送的信息不是声音波形本身,而是电子乐器操作指
令和控制代码。 MIDI文件是由一系列MIDI指令组成的。一个MIDI指令通
常由3个字节组成,其中第一个字节是指令状态字节,状态 字节后面紧跟着两个数据字节。状态字节的最高有效级被设 置为“1”,低4位是通道信息,一共可以表示16个通道;其 余3位表示消息的类型。MIDI的消息类型如图3 -5所示。
(2)基于声学参数的压缩:通过对音频的参数,如共振峰、线 性预测系数、滤波器组等的分析,对音频信号进行压缩编码。
上一页 下一页 返回
任务1 音频处理技术
(3)基于人类听觉特性的压缩:利用人类听觉系统的特点和人 类听觉心理特点以及掩蔽效应等讲行压缩编码,可以得到很 高的压缩效率。
3. 1. 3音乐设备数字接口技术
上一页 下一页 返回
任务1 音频处理技术
3. 1. 2音频数据的压缩与编码
1.音频信号的冗余度 1)频域冗余度 (1)非均匀长时功率谱密度。在较长的时间间隔内对音频信
号进行平均统计,可以得到音频信号的功率谱密度函数。通 过对该函数的分析,可以发现音频信号的功率谱是非常不平 坦的,就是说音频信号在给定的频段上呈现出非常的不均匀 性。这说明音频信号存在着固有的冗余度。
下一页 返回
任务1 音频处理技术
2.人对声音强弱的感觉—声压级 人对声音强弱的感觉,就是人们平时说的声音的大小。人对
声音强弱的感觉与外界声音的强弱成正相关的关系,但是人 对声音的感觉与声音的强度并不是成正比的,它们之间的关 系是非线性的。通过实验发现,人对声音的感觉与对声音的 强度值取对数后基本呈线性关系,所以通常将声强值取对数 来表示声音的强弱。这种表示声音强弱的数值,称为声压级 或声强级,单位是分贝,用dB表示。
模块3 多媒体信息处理技术
任务1 任务2 任务3 任务4
音频处理技术 图形/图像处理技术 数字视频处理技术 多媒体动画处理基础
任务1 音频处理技术
3.1.1声音的基本概念
1.声音的本质 声音的本质是机械振动或气流扰动引起周围弹性物质发生波
动。声音可以沿着弹性物质向外传播,因此在物理学上,声 音又被称为声波或弹性波。引起声波的物体称为声源。声波 所及的空间范围称为声场。 声音是一种常见的物理现象。既然声音是一种波,那么它就 具有一般波动现象所具有的特性。 简单的机械振动是简谐振 动,在数学上可以用一个正弦函数来描述。对于单一频率的 声音来说也是一个简谐振动,将其称为简谐声。简谐声的图 像如图3-1所示。
上一页 下一页 返回
任务1 音频处理技术
(2)有损压缩:音频信号的压缩不仅仅根据可完全恢复的冗余 度进行,还可以基于各种声学参数、相关性等进行压缩。
2)根据压缩编码的理论和方法的不同时,语音压缩编码进行 分类
(1)基于统计特性的压缩:通过对音频信号进行抽样统计分析, 得出音频幅度的分布规律和相邻样本所具有的相关性,从而 找出压缩算法。
上一页 下一页 返回
任务1 音频处理技术
MIDI标准的建立和推广给电子乐器的应用和计算机多媒体 技术的进一步发展创造了条件。MIDI接口和计算机音频卜 的声音合成能力为音乐创作、存储、传输和播放都带来了极 大的好处和方便。
MIDI并不仅仅是一个简单的接口标准,应该说它代表着计 算机电子音乐子系统的构成。以MIDI为接口标准的计算本间相关 (2)幅度的非均匀分布。 (3)静止系数。
上一页 下一页 返回
任务1 音频处理技术
(4)周期之间的相关性。 (5)基音之间的相关性。 2.音频信号压缩编码的分类 通过上述对音频信号冗余度的分析,可以知道对于音频信号
来说,有很多对音频信号进行压缩编码的切入点。因此音频 信号压缩编码就可分为很多不同的类型。 1)根据压缩编码对语音信号的质量是否有损失对语音压缩编 码进行分类 (1)无损压缩:音频信号的压缩仅仅根据可完全恢复的冗余度 进行。
上一页 下一页 返回
任务1 音频处理技术
3.人对声音频率的感觉—音高和音阶 人们对声音频率的感觉,就是人们平时说的声音粗和细。人
对声音频率的感觉在声学上称为音调的高低,在音乐中称为 音高。声音的频率越高,人感觉到的声音就越细,即音调越 高;反之,则越粗,即音调越低。 图3 -2是在一个倍频程(8度音)的频率范围内按频率的对数 刻度分成12个等分而得到的音阶,称之为12平均律。
上一页 下一页 返回
任务1 音频处理技术
(2)语音信号特有的短时功率谱密度。人类语音信号在短时 功率谱上有着非常强烈的不均匀性。在某些频率上出现峰值, 在另外一些频率上则出现低谷。出现峰值的频率称为共振峰 频率。在给定的频段上会出现几个这样的共振峰频率。这些 共振峰频率决定了不同的语音特征。由于共振峰频率的峰值 随着频率的升高递减,所以前两个共振峰频率谱决定了语音 特征。这说明,可以对语音信号的高频部分进行适当地压缩。
上一页 下一页 返回
任务1 音频处理技术
4.人类听觉的频率响应 人耳对不同频率的声音所感觉到的强弱是不同的。人类对声
音的频率有一个响应的范围,即人听觉频率响应不是平直的。 此外,当声压级不同时人的频率响应也不同,如图3-3所示。 5.几种声音的频率范围与带宽 1)声音的频率范围 频率范围是衡量声音质量的重要指标。现在,常将声音质量 分为四个等级,见表3-2。 2)带宽 带宽是无线电技术、通信工程和计算机网络技术中的术语, 是指频率的覆盖范围。带宽表示一条通信线路(包括有线和无 线)可以传输的载波频率范围。
1. MIDI技术简介 人们在说到多媒体音频技术时总会提起MIDI(Musical
Instrument Digital Interface,音乐设备数字接口)音 频技术。这里所说的音乐设备一般指的是带有键盘的电子乐 器。MIDI是由音乐家制定的播放录制电子音乐的国际标准。 MIDI为各种电子乐器与各种计算机的连接建立了一个共同 的软件和硬件标准。