当前位置:文档之家› 第二章数字声音及MIDI

第二章数字声音及MIDI

Windows Media Player 播放 MIDI音乐
制作软件Midisoft Studio 6
MIDI文件
记录MIDI信息的标准格式文件称MIDI文件,其中 包含音符、定时和多达16个通道的乐器定义以及 键号、通道号、持续时间、音量和击键力度等各 个音符的有关信息。定义和产生乐曲的MIDI信息 和数据组存放于MIDI文件中,每个MIDI文件最多 可存放16个音乐通道的信息。
1. 从模拟信号到数字信号
模拟信号:在时间与幅度上都连续,连续 记为x(t).
离散信号:按一定的时间间隔T,得到的 x(nT).
T为抽样周期,1/T抽样频率
量化:把抽样序列x(nT)量化成一个有限个幅 度之的集合x’(nT).
对模拟音频信号进行采样量 化编码后,得到数字音频。数字 音频的质量取决于
第二章 数字声音及MIDI
信息:数、文、形、音、图 音频:麦克风、扬声器 多媒体计算机:
声音的输入、存储、处理、输出
声音:消息、意向、情感
表示方式 汉字内码 点阵 声音
数据量
表达信息
2-4字节
编码
32—数百字节 汉字形、体
几千字节
声学、意向、情感
2.1 声音与听觉
声音:通过空气传播的一种连续的波, 又称声波。
WAV文件来源于对声音模拟波形的采样。用不同 的采样频率对声音的模拟波形进行采样可以得到 一系列离散的采样点,以不同的量化位数(8位或 16位)把这些采样点的值转换成二进制数,然后 存入磁盘,这就产生了声音的WAV文件,即波形 文件。WAV文件是由采样数据组成的,所以它需 要的存储容量很大。
(2) VOC文件
(3) MIDI文件
MIDI(musical instrument digital interface)是一种技术规范,从它的英文全 名可以看出,它用于音乐。
其他音频文件
最重要的是PCM格式,它是模拟的音频信号经数模转 换(A/D变换)直接形成的二进制序列,该文件没有 附加的文件头和文件结束标志。在声卡提供的软件中, 可以利用VOC HDR程序,为PCM格式的音频文件 加上文件头,而形成VOC格式。Windows的 Convert工具也可以将PCM音频文件转换成 Microsoft的WAV格式。
•采样频率 •量化位数 •声道数
采样频率
采样频率是指一秒钟时间内采样的次数。 在计算机多媒体音频处理中,采样频率通
常采用三种:11.025KHz(语音效果)、 22.05KHz(音乐效果)、44.1KHz(高保真效 果)。常见的CD唱盘的采样频率即为 44.1KHz。
量化位数
量化位数也称“量化精度”,是描述每个 采样点样值的二进制位数。
音序器是一种为MIDI作曲而设计的软件或设备, 可用来记录、播放及编辑MIDI事件,大多数音序 器可输入输出MIDI文件。当演奏MIDI文件时,音 序器将MIDI信息从文件中取出并送至合成器中。
MIDI作品
MIDI作者可以购买现成的产品,也可以自己制作。 当然,开发自己的MIDI作品,除了必须拥有计算 机方面的知识与设备之外,还需要具备专业音乐 知识和专用工具。
振 幅
周期
基线
•基线是测量模拟信号的基准点。 •声波的振幅表示声音信号的强弱程度。 •声波的频率反映出声音的音调,声音细尖 表示频率高,声音粗低表示频率低。
•振幅和频率不变的声音信号,称为单音。 单音一般只能由专用电子设备产生。
•在日常生活中,我们听到的自然界的声音 一般都属于复音,其声音信号由不同的振
3. 常见声音文件的扩展名 表2-2
声音文件
在多媒体技术中,存储声音信息的常用文 件格式主要有:WAV文件、VOC文件、 MIDI文件、AIF文件、SNO文件和RMI文件 等。
(1) WAV文件
WAV是Microsoft公司的音频文件格式。利用 Microsoft Sound System软件Sound Finder可 以将AIF、SND和VOD文件转换到WAV格式。
声音的度量:频率与幅度(声波压力的 大小)
频率用音高表示,幅度用声强表示 与看得见的水波类似
波形声音
波形声音,实际上包含了所有的声音形式。任何 声音信号,包括麦克风、磁带录音、无线电和电 视广播、光盘等各种声源所产生的声音,都要首 先对其进行模数转换,然后再恢复出来。
语音(speech)
声卡:附带wave studio 网上:cool edit, goldwave
Windows Media Player
播放和组织计算机和 Internet 上的数字媒体文件。 这就好象把收音机、视频播放机、CD 播放机和 信息数据库等都装入了一个应用程序中
Windows Media Player 播放器支持的文件类 型.doc
10
lg
2
( signal 2 noise
)
6R
5. 音频数据率
未经压缩的数字音频数据率(bit/s)= 采样频率(Hz)×量化位数 (bit)×声道数
音频数据存储量(Byte)= 数据率(bit/s)×持续时间(s) / 8
存储量=采样频率×量化位数/8×声道数×时间
例:采样率11.025KHz、量化位8位,采集1分钟, 则:音频数据率=11.025(KHz)×8(bit) = 88.2 (Kbit/s) 音频数据量=11.025(KHz)×8(bit) ×60(s)/8= 0.66 (MByte)
人的声音不仅是一种波形,而且还有内在的语言、 语音学的内涵,可以利用特殊的方法进行抽取, 通常将语音也作为一种媒体。
音乐
音乐是符号化了的声音。这种符号就是乐曲,乐 谱是转化为符号媒体的声音。电子乐器数字接口 (musical instrument digital interface, MIDI ) 是十分规范的一种形式。
16
立体声 176.4 20~2000
DAT
48
16
立体声 192.0 20~2000
2.3 声音文件的存储格式
1. 声音文件的格式:
PC机:.wav Apple: .aiff, .snd Unix: .au
2. 波形文件格式:1991年IBM与微软开发(以 .wav 为扩展名) Fig 2.3
把几种乐音的波形用数字表达,存于计算机中 并通过数模转换器来生成乐音。专利售给 Yamaha公司。乐音由一组参数控制。
4.波形表合成
把乐器的真实声音记录下来,生成各种音符 在乐器上演奏音符,采样 存于ROM中 合成。图2-9
5.MIDI系统:
MPC:MIDI 接口与声音模块组合在卡上。 SoundMAX Wavetable synthesizer(MIDI音 乐播放器)
2. 声音数字化:
Sampling, Quantization, Coding 采样频率与量化精度
3.采样频率
奈奎斯特(Nyquist)定理(1928年提出原理, 仙侬(Shannon)形成定理并应用,1933年卡 切尼科夫用公式表述):
采样频率2f
这里f为被采样信号的最高频率。
4. 量化精度
例如,8位量化位数表示每个采样值可以用 28即256个不同的量化值之一来表示,而16 位量化位数表示每个采样值可以用216即 65536个不同的量化值之一来表示。常用的 量化位数为8位、12位、16位。
声道数
声音通道的个数称为声道数,是指一次 采样所记录产生的声音波形个数。
记录声音时,如果每次生成一个声波数据, 称为单声道;每次生成两个声波数据,称 为双声道(立体声)。随着声道数的增加, 所占用的存储容量也成倍增加。
2.5 声音质量的度量
1.声音信号的带宽 2.客观质量度量
signal-to-noise ratio,SNR 3.主观质量度量:人的感觉
MOS:mean opinion score
声音质量 MOS标准
分数 5 4 3 2 1
质量级别 优 ( Excellent )
良 ( Good ) 中 ( Fair ) 差 ( Poor ) 劣 ( Bad )
失真级别 察觉不到 (刚)察觉但不讨厌 (察觉)及有点讨厌 讨厌而不反感 极讨厌(令人反感)
2.5 声音质量的度量
作业
1. 使用“录音机”软件把10秒钟的CD音乐录制成 CD音质(44.1kz、16位、双声道、PCM) 的.wav文件)。
2. 把录制的文件分别转换为“22.05kz、16位、单 声道、PCM”, “11.025kz、8位、单声道、PCM”以及“44.1kz、 4位、单声道、ADPCM”
VOC文件是Creative公司波形音频文件格式,也 是声卡使用的音频文件格式。每个VOC文件由文 件头块(header block)和音频数据块(data block)组成。文件头包含一个标识、版本号和 一个指向数据块起始的指针。数据块分成各种类 型的子块,如声音数据、静音、标记、ASCII码 文件、重复的结束,以及终止标记、扩展块等。
简谱 1 2 3 4 5 6 7
频率 261 293 330 349 392 440 494
20log频率 48.3 49.3 50.3 50.8 51.8 52.8 53.8
(1). 采样和量化 数字化音频的过程如下图所示。
(a) 模拟音频信号
(b) 音频信号的采样
(c) 采样信号的量化
2.2 声音信号数字化
带宽与听觉
次声带
音 频 ( Audio ) 带 宽
超声带
语 音 ( Speech ) 带 宽
20 300 f(Hz)
3K
20K
18k
Hertz,Amplitude, Frequency infra-sound, ultrasound, hypersound
感知声音的幅度:用dyne(达因)/平方厘米 表示,常转换成0—120dB(decibel),但对不 同的频率,同样的声强,感觉不同。
相关主题