当前位置：文档之家› 作业三参考答案

作业三参考答案

视听信息系统原理 2017年秋季学期
第三次作业 (占总成绩5分)
内容
1.列举几种历史上出现过的有代表性的语音识别方法。

基于信号-音素关系的识别方法，基于模板匹配(DTW)的识别方法，基于HMM 的统计模型方法，基于时延神经网络(TDNN)的识别方法，基于深度神经网络(DNN)的识别方法。

2.简述深度神经网络在语音识别中的优点和缺点？
优点：可以学习层次性特征，更好表征语音信号；可以用同样的参数表达更复杂的决策函数。

缺点：训练更慢，且更容易进入局部最优 (课件10第53页)
3.简述视听信号编码中采用的预测编码、变换编码和熵编码的基本原理。

预测编码，变化编码和熵编码是数字电视信源编码的主要技术。

预测编码旨在解除像素序列中的相关性，从已经接收到的符号（像素）来预测未收到的符号最可能的值，将预测值与实际值之间的差（通常接近零）进行编码。

理想的预测预测函数的构造需要知道信号的统计特性，在实际应用中常常采用较为简单的线性预测函数。

变换编码对图像信号进行一定形式的正交变换，一方面使得变换后的图像空间相关性减少，提高数据压缩的效率；令一方面使得变换系数在低频区域集中，结合人类视觉系统对图像的空间、时间分辨能力上的视觉掩盖效应，可以对高频部分的系数进行高压缩比的压缩甚至丢弃。

熵编码针对图像信号幅值分布不均匀性，采用变长编码以降低码率。

用较短的码字表示高概率出现的符号，而用较长的码字表示低概率出现的符号；使最终的平均码长趋近信息熵.
4. 已知某线性分组码的生成矩阵为：⎥⎥⎥⎦
⎤
⎢⎢⎢⎣⎡=011010101001110100G 1) 确定该分组码的格式(n,k)，并计算其校验矩阵H ；
2) 写出该分组码可能产生的全部正确码字；
3) 线性分组码中，两个码字对应位上数字不同的位数称为码间距(哈明距离)。

确定该分组码的最小码间距并分析其检错、纠错能力。

5. 某16:9的LCD 数字电视显示屏垂直高度为54厘米，视力为1.0的用户最远可以在离屏幕3.438米处分辨出屏幕上距离为两行高度的两根水平条纹。

1. 求该电视的显示分辨率；
2. 假定帧频为30Hz ，亮度与色度信号按照4:1:1格式采样并10bit 量化，求该数字电视系统中未经压缩的图像数据的码率(bps ).
6. 已知8个符号的信源，其符号出现的概率如下表所示：
123456780.40.20.150.100.060.040.030.02i i x x x x x x x x x p ⎡⎤⎡⎤=⎢⎥⎢⎥⎣
⎦⎣⎦ 1. 求信源的熵H ；
2. 按照最小码方差原则，对信源进行Huffman 编码，并求本次编码的编码效率和码方差；
3. 求符号串 x 1x 1x 3x 8x 5x 2x 6 的算术编码数值.。

e商务文档

作业三参考答案

相关文档推荐：