当前位置:文档之家› 音频信号处理技术

音频信号处理技术


上午7时36分
17
音频的格式
4. CD格式:音质最好的数字音频格式, CDA文件只含索引信息。 5. RealAudio格式:适用网上在线音乐欣 赏,可随带宽不同改变音质。 6. WMA格式:音质强于MP3,内置版权保 护技术,支持音频流技术。
上午7时36分
18
媒体的播放、转换与分享

媒体文件的播放

对原始声波采样

采样后得到的数据
上午7时36分
6
波形音频三个参数

量化位数:将采样数据按大小存储的过程。 一般有8、16、32位等,量化位数越大,声音的幅度分辨 率越高,还原时声音的品质越好,声音数据占用的存储空 间越大
上午7时36分
7
波形音频三个参数

声道数:数字音频声音质量的另一个因素。 一般有单声道 、双声道、多声道

Windows Media Player可以播放影音媒 体文件、影音CD、DVD、图片。 将CD音乐文件转换为WMA、MP3或WAV CD翻录音乐

声音格式的转换

上午7时36分
19
4.2.3 音频处理技术

音频处理:



录音 编辑 添加音效 格式转换

GoldWave:数字音乐编辑器
4.2
音频信号处理技术
课程内容: 11版第4章 4.2
上午7时36分
1
音频信号处理技术
1 . 音频的数字化与MIDI合成音乐
2 . 音频媒体的管理
3 . 音频处理技术(GoldWave) 4 . 语音合成与识别技术
上午7时36分 2
4.2.1 音频的数字化与MIDI合成音乐 多媒体计算机中产生声音的方式
27
二、语音识别技术


上午7时36分
习题与实践

实验16 多媒体技术体验

准备:可以事先拍摄数码照片带来,并带相 关驱动程序
准备:自己携带耳机话筒 自己携带音乐CD唱片 语音合成:Windows讲述人 语音识别:Windows语音识别

实验17 声音的处理


体验:

上午7时36分
28
波表合成器
计算机存储 声卡合成器
上午7时36分
混音器混合后由 扬声器输出
12
合成器

利用DSP或其他芯片产生音乐或声音的电子装置 FM合成器

采用频率调制的原理产生声音 FM合成器能发出128种乐器的声音 对真实乐器声采样,制波表保存,由DSP查表调用处 理


波表合成器

DSP(digital signal processor)是一种独特的微处理器,是 以数字信号来处理大量信息的器件。其工作原理是接收模拟 信号,转换为0或1的数字信号,再对数字信号进行修改、删 除、强化,并在其他系统芯片中把数字数据解译回模拟数据。


上午7时36分

声音效果与真实的乐器声几乎无差别 声卡带有波形表ROM的接口 或 本身带有波形表ROM ROM的容量越大,可存储的乐器音就越多
13ቤተ መጻሕፍቲ ባይዱ
MIDI音乐产生原理
MIDI标准:规定了电子乐器与计算机连接的电缆、 硬件标准和通信协议 乐谱的数字描述(MIDI指令信息) 由音符序列、定时和多达16个通道的演奏音符 定义组成 演奏音符定义由键号、通道号、音长、音量和 力度组成 建立MIDI文件:设备演奏时输入或软件编辑产生 MIDI文件特点:是一系列指令不是波形,文件小 MIDI设备端口 :MIDI In、MIDI Out、MIDI Thru 媒体播放器可直接播放 上午7时36分 14
波形音频的数字化
一、波形音频特征(三个参数)
采样频率 量化位数 声道数
上午7时36分
5
波形音频三个参数

采样频率:每秒从模拟声波中采集声音样本的个数。 频率越高,采集的样本数越多,声音质量越好,占用 存储空间越大。 人耳感受范围:0~20kHz 一般采用:11.025kHz、22.05kHz、44.1kHz
存储量计算: 采样频率×量化位数×声道数×时间/8 (字节)

举例:
采样频率44.1kHz,16位量化,双声道,一分钟的 音频所需要的存储量为: 44.1×1000×16×2×60/8=10584000(字节)
上午7时36分 8
Wave音频文件


标准数字音频,扩展名是.WAV
多数声卡能以16位、44.1kHz采样率 录制和播放 主要缺点:产生的文件太大,不适合 长时间记录 压缩方法:从PCM(均匀量化)到 ADPCM(自适应差分量化)


外部声音源录制和重放:Wave 音频(波形音乐) MIDI电子音频

上午7时36分
3
波形音频的数字化

Windows中最基本的波形声音格式: 扩展名是.WAV 的文件
麦克风/录音机 /CD激光唱盘
声卡A/D转换 (采样、量化)
计算机存储
声卡D/A转换
混音器混合后由 扬声器输出
上午7时36分 4
上午7时36分
20
GoldWave界面
上午7时36分
21
使用GoldWave录音

录制从麦克风输入的声音 录制计算机中其他播放器通过声卡播放 的声音
上午7时36分
22
声音的编辑

剪裁波形 删除波形 复制、粘贴波形 混音
上午7时36分
23
声音的特效处理
调整音量 调整播放时间和播放速度 添加回声 音乐淡入淡出效果 消除音乐中的静音段

上午7时36分 24
利用GoldWave转换音频格式

单个文件转换

文件/另存为 “保存声音为”对话框中选择保存类型 文件/批处理 “批处理”对话框添加文件 选中“转换文件格式为”复选框 选择“另存类型”
25

批量转换文件格式

上午7时36分
4.2.4

语音合成与识别

语音合成技术 - 赋计算机“讲话”能力 - 用语音输出结果 语音识别技术 使计算机具有“听懂”语音的能 力 用语音替代键盘输入

MIDI是乐器数字接口的缩写,文件扩展名 是 .MID
MIDI文件的内容是能使合成音乐芯片演奏乐 曲的代码 多媒体PC平台能够通过内部合成器或连接到 计算机MIDI端口的外部合成器播放MIDI文件
11


上午7时36分
MIDI合成音乐
产生:
电子乐器演奏时 的指令信息
合成器: FM合成器
声卡 Midi控制器
9


上午7时36分
Wave音频文件的制作工具

录音机:Wave文件录制、播放和进行一些简单 处理的基本工具 Adobe Audition Ulead Audio Editor


GoldWave
上午7时36分
10
MIDI合成音乐
MIDI
(Musical Instrument Digital Interface)
26
上午7时36分
语音合成与识别
一、语音合成技术

方法:语音合成方法、参数合成方法 目标:可懂、清晰、自然、具有表现力 应用:文语转换(TTS) ViaVoice中文连续语音识别系统 输入速度:150汉字/分 识别率:95% 发展方向: 自然话语识别与理解 解决语音识别中的一系列难题

4.2.2 音频媒体管理


Windows Media Player 媒体文件的导入 媒体文件的管理
上午7时36分
15
音频媒体管理
菜单栏 地址栏 工具栏 功能选项卡
导航窗格
播放列表
详细信息窗格
窗口切换按钮 播放控制区
上午7时36分 16
音频的格式
1. WAV格式:Windows标准波形文件,多 数音频编辑软件支持,文件较大。 2. MP3格式:高压缩比,文件较小,音质 接近CD。 3. MIDI文件:存储指令,文件短小,播 放效果因软硬件而异。
相关主题