当前位置:文档之家› 多媒体应用系统技术之音频素材制作与处理

多媒体应用系统技术之音频素材制作与处理



严格把控质量关,让生产更加有保障 。2020年12月 上午2时 19分20.12.102:19Dec ember 1, 2020

重规矩,严要求,少危险。2020年12月1日星 期二2时19分40秒02: 19:401 December 2020

Байду номын сангаас
好的事情马上就会到来,一切都是最 好的安 排。上 午2时19分40秒 上午2时19分02:19:40 20.12.1
5.1 模拟音频
❖ 模拟音频的处理
▪ 被转换成电信号,由模拟元部件处理。
❖ 模拟音频的特点
▪ 频率范围 ▪ 连续性 ▪ 音质(与频率范围、设备、噪音等因素有关)
5.2 数字音频
❖ 数字音频 ▪ 以二进制的方式记录的音频,是模拟音频的数字化表达。 ▪ 实现:声卡 (采样、量化、编码) ▪ 比较 模拟信号 数字信号
是连续的模拟信号,可以用振幅、周期、频率描述
声源振动,通过空气等介质,把这种振动以机械波的形式 传播,这就是声波。声波传入人的耳朵,促使耳膜产生振 动,这种耳膜振动被传导到人的听觉神经,就产生了对 “声音”的感觉
5.1 模拟音频
▪ 振幅:声音波形振动的幅度,表示声音的强弱,即音量 (分贝dB)
▪ 周期:声音波形完成一次全振动经过的时间

弄虚作假要不得,踏实肯干第一名。02:19:40 02:19:4002:1912/1/2020 2:19:40 AM

安全象只弓,不拉它就松,要想保安 全,常 把弓弦 绷。20. 12.102: 19:4002:19Dec -201- Dec-20

重于泰山,轻于鸿毛。02:19:4002:19:4002:19Tuesda y, December 01, 2020

不可麻痹大意,要防微杜渐。20.12.120.12.102:19:40 02:19:40Dece mber 1, 2020

加强自身建设,增强个人的休养。2020年12月1日上 午2时19分20. 12.120. 12.1

追求卓越,让自己更好,向上而生。2020年12月1日 星期二 上午2时19分40秒02: 19:4020.12.1

每天都是美好的一天,新的一天开启 。20.12. 120.12. 102:1902:19:4002:19: 40Dec- 20

务实,奋斗,成就,成功。2020年12月1日星 期二2时19分40秒Tue sday, December 01, 2020

抓住每一次机会不能轻易流失,这样 我们才 能真正 强大。20.12.12020年12月1日 星期二 2时19分40秒20.12.1
计算机科学与技术学院
多媒体应用系统技术
第五章:音频素材制作与处理
1 模拟音频、数字音频 2 语音合成技术 3 语音识别技术
5.1 模拟音频 ❖ 模拟信号、数字信号
时间和幅度上都是连 续的信号称为模拟信 号。
幅度是离散的信号称数字信号。
5.1 模拟音频
❖ 声音
▪ 声源:正在发声的物体 ▪ 产生:声音是由物体振动产生的声波 ▪ 声波:是随时间连续变化的物理量,
(3)语音合成 波形编辑合成 参数合成分析 规则合成
❖ 语音合成特点
自然度 清晰度 表现力 复杂度
5.4 语音识别技术
❖ 语音识别
计算机通过识别和理解过程把语音信号转变为相应的文本或命 令的技术。即让计算机能够听懂人类的语言。
例如:IBM的语音识别软件ViaVoice,可以帮助人们通过话筒用 语音向字处理软件输入文字
▪ 频率:声音波形在一秒钟内完成全振动的次数(赫兹
HZ) 亚音信号:频率<20hz
人耳听不见
超音频信号:频率>20000
音频信号:介于中间的信号
5.1 模拟音频
❖ 声音三要素
▪ 音强:声音的强弱,即音量,与声波振幅成正比 ▪ 音调:声音的高低,与频率有关 ▪ 音色:声音的特色。分纯音和复音(不同频率、不同振幅)
▪ 三个层次
文字到语音、 概念到语音、 意向到语音
▪ 文语转换实现
文字 文本文件
输入
文字处理
韵律处理
语音合成
语音输出
词典规则 文本分析器
语音库 韵律分析模块 语音生成模块
5.3 语音合成技术
❖ 文语转换过程
(1)文本分析器根据发音字典,将文本字符串分解为带有属性标 记的词和读音符号
(2)韵律分析:再根据语义规则和语音规则,为每一个词、每一 个音节确定重音等级和语句结构及语调,以及各种停顿等。
关键技术:特征提取技术、模式匹配技术、模型训练技术
Thank You !
20.12.102:19:4002:1 902:1920.12.120.12. 102:19
谢谢
02:19 20.12 102:1
2020年12月1日星期二2时19分40秒

踏实,奋斗,坚持,专业,努力成就 未来。20.12.120.12.1T uesday , December 01, 2020
谢谢大家!
存储
磁带、唱片 光盘、硬盘
编辑
不易
容易
压缩
压缩率有限 压缩率高
▪ 常用格式:wav(微软),midi(乐器数字接口), cda(cd音乐),mp3,wma(微软,网络音频格式), ra/rm(real networks)
5.3 语音合成技术
❖ 语音合成
▪ 是指利用计算机合成语音的一种技术,使计算机能够产生高 清晰度、高自然度的连续语音,具有类似于人一样的说话的 能力
相关主题