当前位置：文档之家› 2019精品多媒体技术音频处理技术数学

2019精品多媒体技术音频处理技术数学

2、声音的分类按频率分
亚音频：
0~20Hz
音频（Audio）：20Hz~20KHz
超音频：
20KHz~1GHz
过音频：
1GHz~1THz
按原始声源划分
语音：人类为表达思想和感情发出的声音乐音：演奏乐器时乐器发出的声音声响：除语音和乐音以外的所有声音。如
自然界的声音
按存储形式划分
3. 编码
模拟信号量经过采样和量化以后，形成一系列的离散信号——脉冲数字信号。这种脉冲数字信号可以一定的方式进行编码，形成计算机内部运行的数据。
所谓编码，就是按照一定的格式把经过采样和量化得到的离散数据记录下来，并在有用的数据中加入一些用于纠错、同步和控制的数据。
2.1.3 数字音频的文件格式
100101100011101
1. 采样
信息论的奠基者香农（Shannon）指出：在一定条件下，用离散的序列可以完全代表一个连续函数，这是采样定理的基本内容。
为实现A/D转换，需要把模拟音频信号波形进行分割，这种方法称为采样(Sampling)。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值，把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期，其倒数为采样频率。采样频率是指计算机每秒钟采集多少个声音样本。
在多媒体技术中，存储音频信息的文件格式主要有： WAV文件、VOC文件和MP3文件等。
1. WAV文件
WAV文件又称波形文件，来源于对声音模拟波形的采样，并以不同的量化位数把这些采样点的值轮换成二进制数，然后存入磁盘，这就产生了波形文件。WAV文件用于保存 Windows平台的音频信息资源，被Windows平台及其应用程序所广泛支持。
2.1.2 模拟音频的数字化过程
对模拟音频数字化过程涉及到音频的采样、量化和编码。采样和量化的过程可由A/D转换器实现。A/D转换器以固定的频率去采样，即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号，可以将其以文件形式保存在计算机的存储介质中。
模拟信号的数字化过程
第二章音频信息处理
多媒体技术
第2章音频信息处理
学习目标:
•了解声音信号的特点、存储格式及质量的度量方法 •理解音频信号压缩方法及音频编码标准 •掌握常用的音频处理软件对声音信号进行处理 •了解语音识别技术及其应用
2.1数字音频的基本概念
2.1.1声音与音频的概念 1、声音的定义：震动物体产生的声波，传入耳朵形成声音。
4. RealAudio文件——.RA/.RM/.RAM
RealAudio文件是RealNetworks公司开发的一种新型流式音频(Streaming Audio)文件格式；它包含在RealNetworks所制定的音频、视频压缩规范 RealMedia中，主要用于在低速率的广域网上实时传输音频信息；网络连接速率不同，客户端所获得的声音质量也不尽相同：对于28.8kb/s的连接，可以达到广播级的声音质量；如果拥有ISDN或更快的线
计算时要注意几个单位的换算细节：
时间单位换算：1分=60秒
采样频率单位换算：1kHz=1000Hz
数据量单位换算：1MB=1024×1024=1048576B
未压缩的声音文件的存储量可用下式计算：存储量（KB） =（采样频率KHZ×采样位数bit×声道数×时间秒）/8
2.VOC文件
VOC文件是Creative公司所使用的标准音频文件格式，多用于保存 Creative Sound Blaster(创新声霸)系列声卡所采集的声音数据，被Windows平台和DOS平台所支持。
2.2 波形音频文件的采集与制作
Windows录音机的主要功能是录音和放音，使用“录音机”可以录制、混合、播放和编辑声音。其主要功能操作如下所述：
（1）波形文件的录制：录音机常用的输入设备是麦克风和CD-ROM播放机。
（2）波形文件的存储：存储的文件格式为波形（.wav）文件。
（3）声音的编辑：复制、粘贴、插入、删除等操作。
量化：把压用用一个数字表示。
实验题
1、清制作一段自己的录音文件，并配背景音乐，写出制作步骤。
2、请叙述用Cool Edit Pro取出某段录音文件中的环境噪音的步骤。
3、请把某段正常速度录制的语音文件，在保持语调不变的情况下把语速降低到正常语速的70%。
思考题
请计算对于5分钟双声道、16位采样位数、44.1kHz采样频率声音的不压缩数据量是多少？
解：根据公式：数据量=（采样频率×采样位数 ×声道数×时间）/8 得，数据量 =[44.1×1000×16×2×（5×60）] / （8×1024×1024） =50.47MB 因此，声音的不压缩数据量约为50.47MB。
（4）音频变换与特殊效果：更改声音的大小、速度、回音等。
录制一段音频
2.3 常用音频处理软件简介 Gold Wave：
左声道右声道
GoldWave是一款相当不错的数码录音及编辑软件，除了附有许多的效果处理功能外，它还能将编辑好的文件存为WAV、AU、SND、RAW和AFC等格式。
作为Wave文件编辑处理工具，支持从MP3、MPG、 AVI、ASF、MOV等文件中提取音频进行编辑，所以除了它强大的编辑功能外，用作把以上格式的音频转换成WAV文件也是很方便的。
3.MPEG音频文件——.MP1/.MP2/.MP3
MPEG音频文件的压缩是一种有损压缩，根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer 1/2/3)，分别对应MP1、MP2和MP3这三种声音文件；
MPEG音频编码具有很高的压缩率，MP1和MP2的压缩率分别为4∶1和6∶1～8∶1，而MP3的压缩率则高达10∶1～ 12∶1 ，也就是说一分钟 CD 音质的音乐，未经压缩需要 10MB存储空间，而经过MP3压缩编码后只有1MB左右，同时其音质基本保持不失真。
采样和量化
D/A转换器从上图得到的数值中重构原来信号时，得到下图蓝色线段所示的波形。可以看出，蓝色线与原波形(红色线)相比，其波形的细节部分丢失了很多。这意味着重构后的信号波形有较大的失真。
失真是不可避免的，如何减少失真呢？在下图中，采样率和量化等级再提高了一倍。从图中可以看出，当用D/A转换器重构原来信号时（图中的轮廓线），信号的失真明显减少，信号质量得到了提高。
路连接，则可获得CD音质的声音。
5.AIFF文件——.AIF/.AIFF
AIFF是音频交换文件格式(Audio Interchange File Format)的英文缩写，是苹果计算机公司开发的一种声音文件格式；被Macintosh平台及其应用程序所支持，其他专业音频软件包也同样支持这种格式。
2. 量化
对声波波形幅度的数字化表示称之为“量化”。量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合，把落入某个区段内的样值归为一类，并赋于相同的量化值。
以８位(bit)或16位(bit)的方式来划分纵轴。也就是说在一个以8位为记录模式的音效中，其纵轴将会被划分为? 个量化等级，用以记录其幅度大小。
MPEG的层次与压缩比率
Layer1(相当于384kbps立体声信号)
4:1
Layer2(相当于192~256kbps立体声信号) 6:1~8:1
Layer3 (相当于112~154kbps立体声信号) 10:1~12:1
MP4压缩技术
MP4并不是MPEG-4或者MPEG-1Layer4，它的出现是针对MP3的大众化、无版权的一种保护格式，由美国网络技术公司开发，美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。
MP3压缩技术
MP3的全名是MPEG Audio Layer-3，简单地说就是一种声音文件的压缩格式。
ISO/MPEG音频压缩标准里包括了三个编码方案，按照压缩质量(每Bit的声音效果)和编码方案的复杂程度分别是Layer1、Layer2、Layer3。所有这三层的编码采用的基本结构是相同的。通过研究人耳和大脑听觉神经对音频失真的敏感度，在编码时先分析声音文件的波形，然后滤去人耳不敏感的信号，最后编码形成MPEG的文件。而音质听起来与CD相差不大。
1、声音类型转换
2、声音合并
3、回声效果
4、多普勒效果
5、制作铃声
1、打开原音乐文件
2、试听找到音乐高潮部分
3、将选中的音乐部分剪裁下来
4、选中开始的几秒钟，加淡入效果
5、选中结束的几秒钟，加淡出效果
制作好的铃声图
第2章讨论题
1.声音按其特性分为哪几类？举例说明。
模拟声音：模拟方式存储，如磁带数字声音：用0、1表示的声音数据
3、音频
20HZ~20KHz范围内的声波，也是人的耳朵可以听到的声音。
4、声音质量的评价标准（信噪比、频带宽度）按照声音频率的变化幅度可以分为：
电话话音质量：200~3400Hz 调幅广播音质：50~7000Hz ，简称AM音质调频广播音质：20~15000HZ，简称FM音质激光唱盘音质：10~20000HZ，简称CD音质
分为规则和不规则两类。不规则指不含任何信息的噪音；规则声音分为语音、音乐和音效。语音是指具有语言内涵和人类约定俗成的特殊媒体，音乐是规范的、符号化的声音，音效是指人类熟悉的其他声音，如雨声、雷声、机器轰鸣声。
2.声音具有哪3个要素？
音强、音调、音色。
3.声音数字化分为哪两个步骤？
采样：就是每隔一段时间就读一次声音信号的幅度，记录下来的原始模拟声波在某一时刻的状态，称之为样本；

e商务文档

2019精品多媒体技术音频处理技术数学

相关文档推荐：