当前位置:文档之家› 多媒体技术第一章

多媒体技术第一章

第一章1.媒体是指承载信息的载体。

按照ITU-T(CCTV)建议的定义。

2.媒体包括以下五种:感觉媒体(视觉,听觉,触觉)、表示媒体(图象,声音,视频,运动)、显示媒体(显示器,打印机,扬声器,键盘,摄象机和运动平台)和传输媒体(光缆,电缆,电磁波,交换设备)存储媒体(磁盘,光盘)。

3.多媒体技术:以数字为基础,能够对多种媒体信息进行采集、编码、存储、传输、处理和表现,综合处理多种媒体信息并使之建立有机的逻辑联系,集成为一个系统并能具有良好交互性的技术。

4.多媒体∶是在不同应用环境中文本、图象、声音和视频等各种媒体的集成。

是组合两种以上媒体的人机交互式信息传播媒体。

5.用户及计算机的信息交流采用的4种方式:人—人(经由计算机)、人—计算机、机—人和计算机—计算机。

6.多媒体数据库包括3个方面∶体系结构、数据模型和用户接口。

7.多媒体的主要特性为:多样性、集成性、交互性、非线性、实时性、信息使用的方便性和信息结构的动态性。

8.简答多媒体的关键特性?答:多媒体的关键特性主要包括信息载体的多样性、交互性、集成性3个方面(1)信息载体的多样性是相对与计算机而言的,指的就是信息载体的多样化,有人称之为信息多维化。

(2)交互性可以增加对信息的注意力和理解力,延长信息在头脑中的保留时间(3)多媒体的集成性主要表现在两个方面,一是多媒体信息媒体的集成,二是处理这些媒体的设备与设施的集成9.多媒体的研究一般分为两个主要的方面:(1)是多媒体技术,主要关心基本技术层面的内容;(2)是多媒体系统,主要重心在多媒体系统的构成与实现.10.处理大批非规则数据主要有两个途径∶(1)是扩充现有的关系型数据库,(2)是建立面向对象数据系统,以存储和检索特定信息.11.多媒体技术主要包括:媒体处理基础技术、数据压缩技术、软硬件平台技术、基础环境技术、信息管理技术、通信与网络技术。

12.多媒体技术研究的主要内容?答:1)多媒体技术的基础2)多媒体软硬件平台技术3)多媒体操作系统技术4)多媒体信息管理与处理技术。

第二章1.常见的媒体元素主要有∶文本、图形、图像、声音、动画和视频图像等。

2.媒体元素:多媒体的媒体元素是指多媒体应用中可显示给用户的媒体形式。

常见的媒体元素主要有文本、图形、图像、声音、动画和视频图像等。

3.文本:文本是用字符代码及字符格式表示出来的数据。

(计算机在进行文字处理时,依据的就是字符代码的识别,它是文本处理程序的基础,也是多媒体应用程序的基础)4.图形:图形一般指用计算机绘制的几何画面,如直线、圆、矩形、任意曲线和图表等。

5.图形格式:图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合。

6.图像处理一般考虑三个因素:分辨率、图像灰度、图像的文件大小。

7.矢量图:在图形文件中只记录生成图的算法和图上的某些特征点,因此也称矢量图。

8.图形的用途:图形主要用于表示线框型的图画、工程制图和美术字等。

绝大多数CAD和3D软件使用矢量图形来做为基本图形存储格式。

9.用字节为单位表示图像文件的大小,描述方法为:高×宽×灰度位数/810.掩蔽:声音的响度不仅取决与自身的强度和频率,而且也依赖于同时出现的其他声音。

声音的掩蔽特性常常用于声音的压缩。

11.MIDI:与波形声音相比,MIDI数据不是声音而是指令,所以它的数据量要比波形声音少得多。

12.电视主要有三种制式:即NTSC(525/60)PAL(625/50) 和SECAM(625/50)括号中的数字为电视显示的线行数和频率;视频文件的存储格式有:A VI、MPG MOV等。

13.在视频中有三个重要的技术参数:帧速数据量图像质量。

14.数字音频可以分为波形声音、语音和音乐。

15.计算机中音频技术主要包括声音的采集、数字化、压缩/解压缩以及声音的播放。

16.影响数字声音波形质量的主要因素有三个:采样频率、采样精度和通道数。

17.通道数一般分为单声道和立体声道,单声道产生一个波形,立体声道产生两个波形。

18.媒体的种类:可以分为视觉类媒体、听觉类媒体、触觉类媒体、嗅觉类媒体和味觉类媒体。

19.媒体的性质和特点:媒体数据具有一下性质:第一,媒体是有格式的;第二,不同媒体表达信息的特点和程度各不相同;第三,媒体之间可以相互转换,但可能会丢失部分原始信息,或增加一些伪信息;第四,媒体之间的关系也具有丰富的信息。

20.人的听觉频率范围是:20Hz~20KHz21.人们对声音的感觉主要有音量、音调和音色3个指标。

22.最基本的声音数字化方法是取样—量化法,它分成3个步骤:采样、量化和编码。

第三章1.评价一种数据压缩技术的性能好坏主要有3个关键指标:压缩比、图像质量、压缩和解压的速度。

a)第一指标是压缩比,压缩性能常常用压缩比来定义,也就是压缩过程中输入数据量和输之比。

b)第二指标是图像质量,这与压缩的类型有关。

压缩方法可以分为无损压缩和有损压缩。

c)第三指标是压缩解压速度,希望压缩和解压速度要快。

2.无损压缩:是指压缩以及解压过程中没有损失原始图像信息,不必担心图像的质量。

3.有损压缩:是指压缩以及解压过程中对原始图像做一些改变,虽然压缩前后图像不完全相同,4.简答数据冗余的类型?答:(1)空间冗余(2)时间冗余(3)信息熵冗余(4)视觉冗余(5)听觉冗余(6)其他冗余,包括结构冗余,知识冗余。

5.数据压缩方法的分类:㈠根据解码后数据与原始数据是否完全一致进行分类,压缩方法可被分为有失真编码(不可逆压缩法)和无失真编码(可逆压缩法)两大类。

㈡根据编码原理进行分类,大致有:预测编码、变换编码、统计编码、分析-合成编码、混合编码和其他一些编码方法。

其中统计编码(包括行程编码、LZW编码、霍夫曼编码)是无失真的编码,其他编码方法基本上都是有失真的编码。

6.常用数据压缩方法的基本原理:统计编码、预测编码、变换编码。

(1)统计编码(无失真编码):它包括行程编码、LZW编码和霍夫曼编码等,属于无失真编码。

它是根据信息出现概率的分布特性而进行的压缩编码。

1、行程编码(RLE)其算法是:重复的数据值序列用一个重复的次数和单个数据代替。

格式:先写控制符,其是重复的次数,再是被重复字符。

2、LZW编码Lempel-Ziv-Welch Encoding ,简称 LZW 的压缩算法。

LZW压缩算法的基本概念:LZW压缩有三个重要的对象:数据流(CharStream)、编码流(CodeStream)和编译表(String Table)。

3、霍夫曼编码霍夫曼压缩是个无损的压缩算法4、算术编码:把一信源集合表示为实数线上的0-1之间的一个区间。

(2)预测编码(有失真编码):是根据原始的离散信号之间存在着一定关联性的特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差(预测误差)进行编码。

包括一下两种预测编码:1、DPCM 差分脉冲编码调制,(PCM 脉冲编码调制:是将原始的模拟信号经过时间采样,然后对每一样值进行量化,做为数字信号传输。

)2、ADPCM是自适应差分脉冲编码。

(3)变换编码(有失真编码):变换编码系统中压缩数据有3个步骤:变换、变换或采样和量化。

是JPEG、MPEG、H.261、H.263等所采用的基本算化.有以下两种:1、最佳变换(K-L变换)。

2、离散余弦(DCT变换)典型的准最佳变换有DCT、DFT(DCT是从DET引出的)、WHT和HrT,最常用的是DCT。

(4)分成-合成编码又分为1、量化编码2、小波变换编码3、分形图像编码4、子带编码。

7.音频压缩信号的基本方法:1.无失真压缩包括:霍夫曼编码、行程编码。

2.有失真压缩包括:(1)波形编码包括:全频带编码(PCM、DPCM、ADPCM)、子带编码(自适应变换编码ATC、心理学模型)、矢量量化(量化编码)。

(2)参数编码包括:线性预测。

(3)混合编码包括:矢量和激励线性预测VSELP、多脉冲线性预测MP-LPC、码本激励线性预测CELP。

8.图像和视频压缩方法:1.无失真压缩包括:霍夫曼编码、行程编码、算术编码、LWZ编码。

2.有失真压缩包括:预测编码(运动补偿)、交换编码(DCT变换、小波变换编码、子带编码)、模型编码(分形编码)、基于重要性(虑波、子采样、矢量量化)、混合编码(JPEG、MPEG、H.26L)等六种。

9.简述R、G、B方式、Y、I、Q方式和Y、U、V方式的关系?答:1.原始的彩色图像,一般由红、绿、蓝3种基色的图像组成。

然而H(色调)、S(饱和度I(光的强度或亮度)彩色空间比R、G、B彩色空间更符合人的视觉特性。

2. R、G、B方式、Y、I、Q方式和Y、U、V方式三者之间是互相有关联的,Y、U、V 与R、G、B之间可以转换。

3.原始图像的R、G、B信号,经过坐标空间转换,生成信号Y、U、V信号。

再经A/D变换(抽样、量化)得到数字信号。

10.音频信号可分为:电话质量的语言、调幅广播质量的音频信号、高保真立体声信号。

1.电话质量语音信号的是10Hz-20KHz用标准的PCM,采样频率为8KHz,量化为数为8bit,信号速率为64kbit/s,采用G.711标准。

2.语音信号的频率范围是300Hz-3.4KHz。

3.调幅广播质量音频信号的频率范围是50Hz-7KHz。

采样频率为16KHz,量化为数为14bit,信号速率为224kbit/s,采用G.712标准。

4.高保真度音频信号的频率范围是10Hz-20KHz。

采样频率为44.1KHz,量化为数为16bit,信号速率为705kbit/s,11.ITU建议的用于电话质量的语音压缩标准:G.711 采用PCM,采样频率为8KHz,量化为数为8bit,速率为64kbit/s.G.712采用ADPCM,将64位比特流转为32位比特流,采样率为8KHz.G.713采用ADPCM,一种以24Kbit/s运行的有损压缩标准。

G.714采用LD-CELP压缩技术,比特率为16Kbit/s。

12.JPEG标准是一用于灰度或彩色图像的压缩标准,包括无损模式和多种类型的有损模式,非常适用那些不太复杂或一般取自真实景象的图像的压缩。

他使用离散余弦变换、量化、行程、霍夫曼编码技术,是一种混合编码标准。

JPEG的无损预测编码算法,JPEG的基于 DCT的有损编码算法:编码的简化过程;1、块准备 2、DCT 3、量化4、DCT系数的编码。

13.基于DCT的增强系统整个编码过程从上至下,从左至右的顺序扫描方式一次完成。

采用累进工作方式、分层工作。

两种累进操作方式如下:1、按频段累进2、按位逼近。

基于DCT的分层操作方式是对一副原始图像的空间分辨率进行变换,使水平方向和垂直方向分辨率以2的倍数因子下降,分层后再进行编码,编码过程如下:1.降低原始图像的空间分辨率。

相关主题