《数字音频广播》各章归纳小结陈柏年(浙江传媒学院)第一章数字音频广播概述一、数字音频广播DAB概念:将传送的模拟音频信号经过脉冲编码调制(PCM)转换成二进制数代表的数字式信号,然后进行音频信号的处理、传输、存储,以数字技术为手段,传送高质量的声音节目。
数字音频广播除传送声音信号外,还传送数据信号。
它是继调幅广播、调频广播以后的第三代广播。
两个基本的数字音频广播:尤里卡147-DAB (Eureka147- DAB)和带内共信道(IBOC)广播。
二、DAB的工作频段:30MHz~3GHz。
DAB的技术要点:以数字技术为基础,采用先进的音频数字编码、数据压缩、纠错编码及数字调制技术,在接收端可获得与原始发送信息相同质量的节目内容。
三、DAB的五项关键技术:(1)信源编码:掩蔽型自适应通用子频带综合编码与复用(MUSICAM)(2)信道编码:①卷积编码,②循环冗余校验码CRC,③交织技术(3)传输方法:编码正交频分复用(COFDM)(4)插入保护间隔:使彼此相继的符号即使在有反射时也相互独立。
(5)同步网技术:通过同步网实现覆盖。
四、DAB系统结构框图DAB发送过程:(1)音频信源编码:采用MSICAM算法,得到的音频压缩数据;(2)信道编码:采用可删除型卷积编码和时间交织;(3)多路复用器:将多路音频数据送入多路复用器与数据业务一起复用,进行频率交织;(4)OFDM基带调制:复用信号以包的形式进行OFDM基带调制,其中还加入FIC、同步信号等;(5)发射机:OFDM基带调制信号经I/Q 正交调制器后产生I/Q两路模拟基带信号,进行中频调制后,送入射频部分进行载波调制、功率放大并发射。
五、音频压缩标准(一)MPEG-1音频压缩标准1、三种取样频率:32、44.1、48kHz2、数据率:32kbps~384kbps3、四种工作模式:单声道、双声道、立体声、联合立体声4、编码算法:(1)MUSICAM-掩蔽型通用子频带集成编码与频分复用。
(2)ASPEC-自适应频谱感知熵编码。
5、三个层次:L1(简化MUSICAM,1:4,每声道192kbps)L2(标准MUSICAM,1:8,每声道96~128 kbps)L3(MUSICAM与ASPEC结合,1:10~1:12,每声道64~56 kbps)。
(二)MPEG-2音频压缩标准1、对MPEG-l音频编码标准的发展和扩展:(1)多声道环绕声编码(5.1声道)和多语言(7种)节目编码;(2)低(半)取样频率(LSF:16、22.05、24kHz)低比特率编码。
2、两种音频编码标准:(1)MPEG-2 BC:兼容MPEG-1音频压缩编码算法。
应用层次:L1、L2、L3。
工作模式:5.1声道环绕声。
(2)MPEG-2 NBC/ MPEG-2 AAC:高级音频编码,与MPEG-1不兼容,结合使用多种最新技术,在极低数据率时实现广播级的音频质量。
应用层次:主要类型、低复杂度类型、可变化取样频率类型。
工作模式:最高48声道。
(三)MPEG-4音频编码标准1、基于内容的编码:引入音频对象,实现基于内容的编码。
2、三种编码形式:自然音频编码、结构音频缩码和合成/自然混合编码。
3、支持七种信号等级:码率从2kbps到64kbps 。
4、应用特点:(1)与MPEG-1、2的主要区别:提供多媒体系统的交互性和灵活性,尤其是低比特率的应用。
(2)优势:将音频的合成编码与自然声音的合成编码相结合。
第二章DAB的信源编码一、信源编码:解决模拟信号的数字化、降低冗余度和提高数字信号的有效性所进行的编码。
主要任务:(1)A/D变换;(2)压缩编码。
二、脉码调制PCM三个过程1、取样(Sample):将信号在时间域离散化。
取样定理:f s≥2 fm,要想取样后能够不失真地恢复出原信号,则取样频率必须大于信号最高频率的二倍。
原因是取样后信号频谱中各个周期之间(两个相邻部分)相互不产生频谱折叠,才能重建原始信号。
2、量化(Quantization):将信号幅度离散化。
量化比特数n与十进制的量化等级数M之间的关系是:n = log2 M。
量化信噪比:单极性的信号(如亮度信号)SNR[dB]=10.76+6.02n [dB]双极性的信号(如声音信号)SNR[dB]=1.76+6.02n [dB] 模拟信号数字化后的数码率(比特率)=取样频率(fs)×量化比特数(n)。
3、编码(Coding):将已量化的信号幅值用二进制数码表示。
三、AES/EBU专业音频接口协议1、AES3(AES/EBU):音频工程协会和欧洲广播联盟共同制定的传输和接收数字音频信号的数字设备接口协议,规定音频数据必须以2的补码进行编码,是专业数字音频系统首要互连方案。
2、要点:数据编码:2的补码。
传送方式:连续串行位传送。
传输介质:同轴电缆或双绞电缆。
传输格式:串行,用于线性地表示数字音频信号。
传输信道:两个信道(音频和非音频数据)。
音频信号:基于单根绞合线对,以及周期取样的两个信道和均匀量化的音频信号。
取样频率:22.05、24、32、44.1、48、88.2、96kHz等。
信道码型:自动计时的两相标记码是二进制频率调制信道码,用于在AES/EBU互联中传输数据。
四、声音信源编码理论基础:数据量=信息量+冗余量=听觉有关信息量(感知熵)+听觉无关信息量+时域冗余量+频域冗余量(1)减少冗余:尽量降低声音信号中时间和空间冗余。
(2)丢弃不相关:尽量降低声音信号中不相关,利用了人耳听觉的心理声学特性,只对人耳能感觉到的信号进行编码和传输。
五、掩蔽效应:指一种弱信号被另一个强信号所遮盖或淹没而造成听不见或看不见的现象。
1、声音掩蔽效应:在掩蔽信号的掩盖频带范围内和掩蔽前后期内相近信号被覆盖住而听不到的特性。
2、频域掩蔽效应的意义:(1)凡是处在总同听域以下的声音不必传送。
(2)处在总同听域以上的声音,可按照量化噪声保持在同听域以下的原则进行量化和编码传送。
3、三个指标的关系:掩蔽噪声比=信号噪声比-信号掩蔽比MNR(dB )= SNR(dB )- SMR(dB )六、利用心理声学进行时域和频域编码的方法1、时域编码:(1)预测(差值)编码:利用声音信源相邻的当前值和预测值的差值很小甚至为零来减少或不传送重复信息。
(2)熵编码:按声音信源数据出现的概率不同来配以不同长度的码字,降低平均码长,使之逼近信源熵。
2、频域编码:(1)变换编码:将一段时间的声音信号数据变换为频域的信号,对变换后的系数根据心理声学原理进行量化、传输实现消除冗余和压缩数码率。
(2)子频带编码:将时域内宽带的声音信号分割成许多子频带,根据子频带掩蔽效应不同,分别对样值进行处理和码率压缩编码。
3、MUSICAM:中文含义是:“掩蔽型自适应通用子频带综合编码与复用”。
实质是:利用人耳听觉的心理声学现象和音频信号统计的内在联系,将宽带的声音信号频谱分割为32个子频带,每个子频带根据人耳的听觉特性来确定清除语言和音乐信号中的冗余和不相关信息,以实现有效的数据压缩。
技术特征:(1)把声音信号的频谱分割为32个子频段(每子频带宽度24kHz/32=750Hz)。
(2)丢弃子频带内同听阈以下的频谱成分。
(3)子频带内同听阈以上的频谱成分采用不同的量化比特数,原则是只要量化噪声低于最小同听阈。
六、MUSICAM编码器框图1、32个子频带滤波器组:频率分割。
将宽带时域PCM信号窄带频域中32个子频带的数字信号。
2、快速傅利叶变换(FFT):分析计算输入音频信号的频率和能量,得到功率密度谱。
3、心理听觉模型:模拟人耳听觉掩蔽特性,精确计算SMR。
4、比例因子SCF:音频连续12个样值组成“块”中的最大值(无量纲系数)。
5、比例因子选择信息SCFSI:采用2bit附加编码,描述比例因子的位置和数量。
6、动态比特分配:对子频带动态分配不同的量化比特数。
7、子频带样值的量化和编码:将各子频带样值编码成一组码字,量化级数与子频带号有关。
8、帧形成器:将压缩后的子频带样值和辅助信息等一起格式化,再加入循环冗余校验码形成比特流输出。
七、DAB帧结构1、音频业务同步数据ASSD:16比特,提供同步字、音频标准、结构和采用校验方式的数据。
2、DAB帧头:16比特,提供与DAB解码有关的状态信息。
3、CRC校验:16比特,用于帧头、比特分配和比例因子选择信息的误码校验。
4、比特分配ALLOC:低频4比特,中频3 比特,高频2比特,分别用来代表15个、7个、3个不同的量化等级。
5、比例因子选择SCFSI:2比特,描述比例因子的位置和数量。
6、比例因子SCF:6比特,代表比例因子标记0~62个编码。
7、子频带样值:1152个样值编码信息。
8、辅助数据AD:用于填充比特、扩展节目伴随数据(X-PAD)、比例因子差错校验(SCF-CRC)、固定节目伴随数据(F-PAD)。
八、MUSICAM解码过程1、分解和校验:完成各种数据的分解和误码校验。
从接收的音频码流中,找到帧同步字。
将子频带样值、比例因子、比特分配、比例因子选择信息、辅助信息等进行分解,同时完成CRC纠错。
2、辅助信息解码(1)比特分配解码:从比特流中读出子频带的比特分配信息位(4、3或2比特),根据信息位找出量化级,找出逆量化系数,完成逆量化还原过程。
(2)比例因子选择信息解码:解出传送的比例因子的位置和数量。
(3)比例因子解码:解出比例因子的大小。
3、子带样值的逆量化:恢复出32个子带样值。
4、子带综合滤波器:根据各子带信号重建成宽带音频信号,输出PCM数字音频。
第三章DAB信道编码和调制一、信道编码:提高数字传输可靠性、降低误码率、按一定规则加入冗余码元所进行的编码。
主要任务:(1)码型变换;(2)差错控制。
二、COFDM:1、含义实质:中文含义是:“编码正交频分复用”,实质是:一种与无线电信道的传输特性相适应的、能使多径传输无线电信号的失真得到补偿的、包括编码和调制的多载波宽带传输系统。
2、具体内容:(1)编码(C):采用编码率可变的可删除卷积编码;(2)正交频分(OFD):数据流分配到有相等间隔的、频谱关系彼此正交的大量副载波上传送,副载波调制采用四相差分相移键控DQPSK。
(3)复用(M):多套节目数据相互交织地分布在大量副载波上,形成DAB 块复合在一起传送。
3、优点:①采用频率交织和时间交织双重措施,把“块差错”拆开为相距较远的单个比特差错,容易予以修正。
②采用保护间隙,克服多径传输造成的码间干扰。
③采用多载波,每个载波仅携带很少的信息,出现传输差错完全能够修正。
4、COFDM参数:(1)带宽(MHz),(2)载波间隔(kHz),(3)载波总数K T,(4)有效符号持续期T U(μs),(5)保护间隔T g(μs),(6)符号持续期T s(μs),(7)帧持续期T F(ms) ,(8)每个COFDM符号的比特数,(9)最高射频频率。