当前位置:文档之家› 2019精品多媒体技术音频处理技术数学

2019精品多媒体技术音频处理技术数学


2、声音的分类 按频率分
亚音频:
0~20Hz
音频(Audio):20Hz~20KHz
超音频:
20KHz~1GHz
过音频:
1GHz~1THz
按原始声源划分
语音:人类为表达思想和感情发出的声音 乐音:演奏乐器时乐器发出的声音 声响:除语音和乐音以外的所有声音。如
自然界的声音
按存储形式划分
3. 编码
模拟信号量经过采样和量化以后,形成一系列的离散 信号——脉冲数字信号。这种脉冲数字信号可以一定的方 式进行编码,形成计算机内部运行的数据。
所谓编码,就是按照一定的格式把经过采样和量化得 到的离散数据记录下来,并在有用的数据中加入一些用于 纠错、同步和控制的数据。
2.1.3 数字音频的文件格式
100101100011101
1. 采样
信息论的奠基者香农(Shannon)指出:在一定条件下, 用离散的序列可以完全代表一个连续函数,这是采样定理 的基本内容。
为实现A/D转换,需要把模拟音频信号波形进行分割, 这种方法称为采样(Sampling)。采样的过程是每隔一个时 间间隔在模拟声音的波形上取一个幅度值,把时间上的连 续信号变成时间上的离散信号。该时间间隔称为采样周期, 其倒数为采样频率。采样频率是指计算机每秒钟采集多少 个声音样本。
在多媒体技术中,存储音频信息的文件格式主要有: WAV文件、VOC文件和MP3文件等。
1. WAV文件
WAV文件又称波形文件,来源于对声音模拟波形的采样, 并以不同的量化位数把这些采样点的值轮换成二进制数, 然后存入磁盘,这就产生了波形文件。WAV文件用于保存 Windows平台的音频信息资源,被Windows平台及其应用 程序所广泛支持。
2.1.2 模拟音频的数字化过程
对模拟音频数字化过程涉及到音频的采样、量化和编码。 采样和量化的过程可由A/D转换器实现。A/D转换器以固定 的频率去采样,即每个周期测量和量化信号一次。经采样 和量化后声音信号经编码后就成为数字音频信号,可以将 其以文件形式保存在计算机的存储介质中。
模拟信号的数字化过程
第二章 音频信息处理
多媒体技术
第2章 音频信息处理
学习目标:
•了解声音信号的特点、存储格式及质量的度量方法 •理解音频信号压缩方法及音频编码标准 •掌握常用的音频处理软件对声音信号进行处理 •了解语音识别技术及其应用
2.1数字音频的基本概念
2.1.1声音与音频的概念 1、声音的定义: 震动物体产生的声波,传入耳朵形成声音。
4. RealAudio文件——.RA/.RM/.RAM
RealAudio文件是RealNetworks公司开发的一种 新型流式音频(Streaming Audio)文件格式;它包含 在RealNetworks所制定的音频、视频压缩规范 RealMedia中,主要用于在低速率的广域网上实时传 输音频信息;网络连接速率不同,客户端所获得的 声音质量也不尽相同:对于28.8kb/s的连接,可以 达到广播级的声音质量;如果拥有ISDN或更快的线
计算时要注意几个单位的换算细节:
时间单位换算:1分=60秒
采样频率单位换算:1kHz=1000Hz
数据量单位换算:1MB=1024×1024=1048576B
未压缩的声音文件的存储量可用下式计算: 存储量(KB) =(采样频率KHZ×采样位数bit×声道数×时间秒)/8
2.VOC文件
VOC文件是Creative公司所使用的标准音频文件 格式,多用于保存 Creative Sound Blaster(创新 声霸)系列声卡所采集的声音数据,被Windows平台 和DOS平台所支持。
2.2 波形音频文件的采集与制作
Windows录音机的主要功能是录音和放音,使用“录音 机”可以录制、混合、播放和编辑声音。其主要功能操作 如下所述:
(1)波形文件的录制:录音机常用的输入设备是麦克风 和CD-ROM播放机。
(2)波形文件的存储:存储的文件格式为波形(.wav) 文件。
(3)声音的编辑:复制、粘贴、插入、删除等操作。
量化:把压用用一个数字表示。
实验题
1、清制作一段自己的录音文件,并配背景音乐,写出 制作步骤。
2、请叙述用Cool Edit Pro取出某段录音文件中的环 境噪音的步骤。
3、请把某段正常速度录制的语音文件,在保持语调不 变的情况下把语速降低到正常语速的70%。
思考题
请计算对于5分钟双声道、16位采样位 数、44.1kHz采样频率声音的不压缩数据量 是多少?
解: 根据公式: 数据量=(采样频率×采样位数 ×声道数×时间)/8 得,数据量 =[44.1×1000×16×2×(5×60)] / (8×1024×1024) =50.47MB 因此,声音的不 压缩数据量约为50.47MB。
(4)音频变换与特殊效果:更改声音的大小、速度、回 音等。
录制一段音频
2.3 常用音频处理软件简介 Gold Wave:
左声道 右声道
GoldWave是一款相当不错的数码录音及编辑软件, 除了附有许多的效果处理功能外,它还能将编辑好 的文件存为WAV、AU、SND、RAW和AFC等格式。
作为Wave文件编辑处理工具,支持从MP3、MPG、 AVI、ASF、MOV等文件中提取音频进行编辑,所以除 了它强大的编辑功能外,用作把以上格式的音频转 换成WAV文件也是很方便的。
3.MPEG音频文件——.MP1/.MP2/.MP3
MPEG音频文件的压缩是一种有损压缩,根据压缩质量 和编码复杂程度的不同可分为三层(MPEG Audio Layer 1/2/3),分别对应MP1、MP2和MP3这三种声音文件;
MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率 分别为4∶1和6∶1~8∶1,而MP3的压缩率则高达10∶1~ 12∶1 , 也 就 是 说 一 分 钟 CD 音 质 的 音 乐 , 未 经 压 缩 需 要 10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时 其音质基本保持不失真。
采样和量化
D/A转换器从上图得到的数值中重构原来信号时,得 到下图蓝色线段所示的波形。可以看出,蓝色线与原波 形(红色线)相比,其波形的细节部分丢失了很多。这意 味着重构后的信号波形有较大的失真。
失真是不可避免的,如何减少失真呢?在下图中,采样 率和量化等级再提高了一倍。从图中可以看出,当用D/A转 换器重构原来信号时(图中的轮廓线),信号的失真明显减 少,信号质量得到了提高。
路连接,则可获得CD音质的声音。
5.AIFF文件——.AIF/.AIFF
AIFF是音频交换文件格式(Audio Interchange File Format)的英文缩写,是苹果计算机公司开发 的一种声音文件格式;被Macintosh平台及其应用程 序所支持,其他专业音频软件包也同样支持这种格 式。
2. 量化
对声波波形幅度的数字化表示称之为“量化”。量化的 过程是先将采样后的信号按整个声波的幅度划分成有限个 区段的集合,把落入某个区段内的样值归为一类,并赋于 相同的量化值。
以8位(bit)或16位(bit)的方式来划分纵轴。也就是说 在一个以8位为记录模式的音效中,其纵轴将会被划分为? 个量化等级,用以记录其幅度大小。
MPEG的层次与压缩比率
Layer1(相当于384kbps立体声信号)
4:1
Layer2(相当于192~256kbps立体声信号) 6:1~8:1
Layer3 (相当于112~154kbps立体声信号) 10:1~12:1
MP4压缩技术
MP4并不是MPEG-4或者MPEG-1Layer4,它的出现是 针对MP3的大众化、无版权的一种保护格式,由美国 网络技术公司开发,美国唱片行业联合会倡导公布的 一种新的网络下载和音乐播放格式。
MP3压缩技术
MP3的全名是MPEG Audio Layer-3,简单地说就是一 种声音文件的压缩格式。
ISO/MPEG音频压缩标准里包括了三个编码方案 ,按 照压缩质量(每Bit的声音效果)和编码方案的复杂程度分 别是Layer1、Layer2、Layer3。所有这三层的编码采用的 基本结构是相同的。通过研究人耳和大脑听觉神经对音频 失真的敏感度,在编码时先分析声音文件的波形,然后滤 去人耳不敏感的信号,最后编码形成MPEG的文件。而音质 听起来与CD相差不大。
1、声音类型转换
2、声音合并
3、回声效果
4、多普勒效果
5、制作铃声
1、打开原音乐文件
2、试听找到音乐高潮部分
3、将选中的音乐部分剪裁下来
4、选中开始的几秒钟,加淡入效果
5、选中结束的几秒钟,加淡出效果
制作好的铃声图
第2章讨论题
1.声音按其特性分为哪几类?举例说明。
模拟声音:模拟方式存储,如磁带 数字声音:用0、1表示的声音数据
3、音频
20HZ~20KHz范围内的声波,也是人的耳朵 可以听到的声音。
4、声音质量的评价标准(信噪比、频带宽度) 按照声音频率的变化幅度可以分为:
电话话音质量:200~3400Hz 调幅广播音质:50~7000Hz ,简称AM音质 调频广播音质:20~15000HZ,简称FM音质 激光唱盘音质:10~20000HZ,简称CD音质
分为规则和不规则两类。不规则指不含任何信息的噪 音;规则声音分为语音、音乐和音效。语音是指具有 语言内涵和人类约定俗成的特殊媒体,音乐是规范的、 符号化的声音,音效是指人类熟悉的其他声音,如雨 声、雷声、机器轰鸣声。
2.声音具有哪3个要素?
音强、音调、音色。
3.声音数字化分为哪两个步骤?
采样:就是每隔一段时间就读一次声音信号的幅度, 记录下来的原始模拟声波在某一时刻的状态,称之为 样本;
相关主题