当前位置:文档之家› 上海大学875多媒体技术基础考研专业课笔记

上海大学875多媒体技术基础考研专业课笔记

E DF; ℎ
������D =
E DF; ������
������D ������ ������D = −
E DF; ������
������D ������������������: ������ ������D
其中: ℎ ������D 为事件������D 的熵 ������ ������D 为事件������D 的信息量 Ø ������ = ������# − ������ ������ ������D 为事件������D 发生的概率
Vsignal:信号电压 Vnoise:量化噪声压
n:采样精度的位数 3、 声音质量与数据率 按频带可将声音质量划分为五个等级: (由低到高) 电话(telephone) 调幅广播(amplitude modulation, AM) 调频广播(frequency modulation, FM) 激光唱片(CD-Audio) 数字录音带(digital audio tape, DAT) P48 表 3-1 声音质量的 MOS 评分: 由若干实验者对声音质量好坏进行评分,求其平均值作为对声音质量的评价,这种方法叫做主观平均判分法。所得的 分数叫做主观平均分(mean opinion score, MOS) 4、 脉冲编码调制(pulse code modulation, PCM) ① PCM 的概念: 输入:模拟声音信号
③信息量(具有确定概率事件的信息的定量度量) ������ ������ = ������������������:
; < =
= −������������������: ������(������),p(x)是事件 x 出现的概率
☆对于等概率事件的集合,其每个事件的信息量=该集合的决策量 ④熵(事件信息的平均值) ������ ������ =
输出:PCM 样本 防失真滤波器:滤除声音频带以外的信号(低通滤波器) 波形编码器:可理解为采样器 量化器:量化阶大小生成器,或量化间隔生成器 ② 均匀量化 概念:采用相等的量化间隔对采样得到的信号进行量化 Ø 为适应幅度大的输入信号,同时又满足精度要求,就需要增加样本位数,但对话音信号来说,大信号出现的机会不多, 增加的样本位数没有充分利用,为克服此不足,便引入了非均匀量化,也叫非线性量化。 ③ 非均匀量化 概念:对输入信号进行量化时,大信号采用大的量化间隔,小的输入信号采用小的量化间隔。 采样输入信号幅度和量化输出数据之间的两种对应关系: ( 1) µ 律压扩算法 运用于北美和日本数字电话通信中 A 律压扩算法(运用于欧洲和中国大陆数字电话通信中) ln (1 + ������|������|) ln (1 + ������)
数据无损压缩
一、数据冗余 ①概念: 人为冗余 冗余 试听冗余 数据冗余 ②决策量(事件数的对数值) ������# = ������������������ (������),其中,n 是事件数(互斥时间) ( 1) ( 2) ( 3) Sh,以 2 为底的对数 Nat,以 e 为底的对数 Hart,以 10 为底的对数
②、30 路制的重要参数
l l l l
每帧由 32 个时间片(信道)组成 每个信息每次传送 8 位代码 数据传输率 R=32×8×8000=2048 kb/s 每一个话路的数据传输率=8000×8=64 kb/s
Ø 由于当信道无数据传输时仍给那个信道分配时间槽,因此线路利用率较低,为解决此问题开发了统计时分多路复用技术 (statistical time division multiplexing, STDM) ,按照每个传输信道的传输需要来分配时间间隔, 提高了传输线路的效率。 6、 增量调制与自适应增量调制 ( 1) 增量调制(delta modulation, DM) 是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成“0”和“1”两种可能的取值,若 实际采样信号与预测的采样信号之差为“正” ,则用“1”表示,相反则用“0”表示。 ①斜率过载: 增量调制器的输出不能保持跟踪输入信号的快速变化,一般,当输入 信号的变化速度超过反馈回路输出信号的最大变化速度时就会发生斜率过载(主要原因:量化阶固定不变) ②粒状噪声: 在输入信号缓慢变化部分, 即输入信号与预测信号的差值接近零的区域, 增量调制器的输出出现随机交变的 “ 0” 和“1” ,这种噪声不可消除。 Ø ( 2) 自适应增量调制(adaptive delta modulation, ADM) 基本方法:检测到斜率过载时增大量化阶∆,而在输入信号的斜率减小时降低量化阶∆。 7、 自适应差分脉冲编码调制 ( 1) 自适应差分编码调制(adaptive pulse code modulation, APCM) 基本方法:根据输入信号幅度大小来改变量化阶大小。 瞬时自适应:量化阶大小每隔几个样本就改变 音节自适应:量化阶的大小在较长时间周期里发生改变 改变量化阶大小的两种方法: 前向自适应(forward adaption) 后向自适应(backward adaption) ( 2) 差分脉冲编码调制(differential pulse code modulation, DPCM) 基本方法:利用样本与样本之间存在的信息冗余来进行编码,根据过去的样本来估算下一个样本信号的幅度大小, 这个值成为预测值,然后对实际信号值与预测值之差进行量化编码,从而减少了表示每个样本信号的位数。 ( 3) 自适应差分脉冲编码调制(adaptive differential pulse code modulation, ADPCM) ①、利用自适应的思想改变量化阶大小,即用小的量化阶去编码小的差值,用大的量化阶去编码大的差值。 ②、使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。 8、 子带编码(sub-band coding, SBC) 基本思想:使用一组带通滤波器(band-pass filter, BPF)把输入声音信号的频带划分成若干个连续的频段,每个频段称为子 带,对每个子带的声音信号采用单独的编码方式去编码,在信道上传输时,将每个子带的代码复合起来,接收端译码时,将 每个子带单独译码,然后再进行重组,还原成原来的声音信号。 子带编码的两个好处: ①:对每个子带信号分别进行自适应控制,量化阶的大小可按照每个子带的能量电平加以调节 ②:根据每个子带信号在感觉上的重要性,对每个子带分配不同的位数,用来表示每个样本值。 Ø 由于分割频带的滤波器不是理想滤波器,经过分带、编码、译码后合成输出的声音信号会有混迭效应,采用正交滤波器 (quadrature mirror filter, QMF)来划分频带,混迭效应在最后合成时会消失。 9、 线性预测编码(linear predictive coding, LPC) 宋 :输出不变时量化阶增大 50%,改变时减小 50% 格林弗斯基:连续出现三个同样的值,量化阶加一个较大的增量,反之,加一个较小的增量 增大量化阶 ⟹ 斜率过载改善 ⟹ 粒状噪声加重 减小量化阶 ⟹ 斜率过载严重 ⟹ 粒状噪声改善
1 + ln (������ ������ ) 1 ≤ |������| ≤ 1 1 + ������������������ ������
5、 PCM 在通信中的应用 ( 1) 频分多路复用(frequency-division multiplexing, FDM) 概念:在一条通信线路上使用不同频段同时传送多个独立信号,是模拟载波通信的主要方法。 核心思想:把传输信道划分为 n 个窄带,每个窄带传送一路信号。 ( 2) 时分多路复用(time-division multiplexing, TDM) 概念:在一条通信线路上使用不同时段传送多个独立信号的方法,是数字通信的主要方法。 核心思想:将时间分成等间隔的时段,为每对用户指定一个时间间隔,每个间隔传输信号的一部分,这样便可使多 用户同时使用一条传输线路。 ①、24 路制的重要参数: l l l l l l l 每秒传送 8000 帧,每帧 125������s 12 帧组成 1 复帧(用于同步) 每帧由 24 个时间片(信道)和 1 位同步位组成 每个信道每次传送 8 位代码,1 帧有 24×8+1=193 位 数据传输率 R=8000×8=64 kb/s 每秒传送 8000 帧,每帧 125������s 16 帧组成 1 复帧(用于同步)
⑤数据冗余(决策量超过熵的量) 信息量 I = 数据量 D − 冗余量 R
信息熵就是对于一个不确定事件集合信息量的平均值
二、统计编码 ①香农-范诺编码 目的:产生具有最小冗余的码词 基本思想:产生编码长度可变的码词 估计码词长度的准则:符号出现的概率,概率越大,码词长度越短。 算法: 1、按照符号出现的概率减少的顺序将待编码的符号排成序列 2、将符号分成两组,使两组符号概率近似或相等 3、将第一组赋为 0,第二组赋为 1 4、对每组重复步骤(2) ,直至每组剩下一个信源符号 ②霍夫曼编码 算法: 1、按出现概率排序 2、将两个最小的概率相加作为新的概率与余下的概率重新排队,每次相加都将“0”和“1”赋予相加的两个概率 3、重复步骤(2)直到最后概率相加得 1 Ø Ø 霍夫曼编码没有错误保护功能。 霍夫曼编码是可变长度码, 在编码时不需要在生成码流中附加同步码, 因此也难以随意查找或调用压缩文件中的内容, 然后再译码。 ③算数编码 编码:将整个要编码的数据依照其出现的概率映射到一个位于[0,1)的实数区间中。并且输出一个小于 1 同时大于 0 的小数来 表示全部数据。 1、从实数区间[0,1)开始,按照信源符号的频度将当前区间分割为若干个子区间 2、根据当前输入的符号选择对应的子区间,从选择的子区间中继续下一轮的分割 3、重复步骤(2)知道所有符号编码完毕
ijDkElm iEnDjo
男声 300~3000 Hz 女声 300~3400 Hz 高保真声音(high-fidelity audio) 10—20 KHz
ቤተ መጻሕፍቲ ባይዱ
= 20������������
相关主题