视听信息系统原理 2017年秋季学期
第三次作业 (占总成绩5分)
内容
1.列举几种历史上出现过的有代表性的语音识别方法。
基于信号-音素关系的识别方法,基于模板匹配(DTW)的识别方法,基于HMM 的统计模型方法,基于时延神经网络(TDNN)的识别方法,基于深度神经网络(DNN)的识别方法。
2.简述深度神经网络在语音识别中的优点和缺点?
优点:可以学习层次性特征,更好表征语音信号;可以用同样的参数表达更复杂的决策函数。
缺点:训练更慢,且更容易进入局部最优 (课件10第53页)
3.简述视听信号编码中采用的预测编码、变换编码和熵编码的基本原理。
预测编码,变化编码和熵编码是数字电视信源编码的主要技术。
预测编码旨在解除像素序列中的相关性,从已经接收到的符号(像素)来预测未收到的符号最可能的值,将预测值与实际值之间的差(通常接近零)进行编码。
理想的预测预测函数的构造需要知道信号的统计特性,在实际应用中常常采用较为简单的线性预测函数。
变换编码对图像信号进行一定形式的正交变换,一方面使得变换后的图像空间相关性减少,提高数据压缩的效率;令一方面使得变换系数在低频区域集中,结合人类视觉系统对图像的空间、时间分辨能力上的视觉掩盖效应,可以对高频部分的系数进行高压缩比的压缩甚至丢弃。
熵编码针对图像信号幅值分布不均匀性,采用变长编码以降低码率。
用较短的码字表示高概率出现的符号,而用较长的码字表示低概率出现的符号;使最终的平均码长趋近信息熵.
4. 已知某线性分组码的生成矩阵为:⎥⎥⎥⎦
⎤
⎢⎢⎢⎣⎡=011010101001110100G 1) 确定该分组码的格式(n,k),并计算其校验矩阵H ;
2) 写出该分组码可能产生的全部正确码字;
3) 线性分组码中,两个码字对应位上数字不同的位数称为码间距(哈明距离)。
确定该分组码的最小码间距并分析其检错、纠错能力。
5. 某16:9的LCD 数字电视显示屏垂直高度为54厘米,视力为1.0的用户最远可以在离屏幕3.438米处分辨出屏幕上距离为两行高度的两根水平条纹。
1. 求该电视的显示分辨率;
2. 假定帧频为30Hz ,亮度与色度信号按照4:1:1格式采样并10bit 量化,求该数字电视系统中未经压缩的图像数据的码率(bps ).
6. 已知8个符号的信源,其符号出现的概率如下表所示:
123456780.40.20.150.100.060.040.030.02i i x x x x x x x x x p ⎡⎤⎡⎤=⎢⎥⎢⎥⎣
⎦⎣⎦ 1. 求信源的熵H ;
2. 按照最小码方差原则,对信源进行Huffman 编码,并求本次编码的编码效率和码方差;
3. 求符号串 x 1x 1x 3x 8x 5x 2x 6 的算术编码数值.。