当前位置：文档之家› 多媒体期末复习

多媒体期末复习

计算机学科的学生(CS)从面向对象的角度理解多媒体(multimedia)：是由使用多模态技术（包括文本、图像、图形、动画、视频和音频等，以及交互活动）的应用程序构成的。

多媒体(multimedia)：意味着除了应用传统媒体之外，计算机信息还可以通过音频、图形、图像、视频和动画等多种形式来表达。

超媒体(hypermedia)：并不一定是基于文本的，它同样可以包含其他媒体，如图形、图像，特别是具有连续性的媒体，如声音和视频。

WWW是超媒体应用的一个最好的例子。

超文本(hypertext)：是非线性的，可以利用指向文档中其他部分或是其他文档的链接进行。

多媒体设计模式(Multimedia Authoring Metaphors)：脚本语言模式、幻灯片显示模式、层次模式、图标/流程图模式(EX.Authorware)、框架模式、卡片/脚本模式、角色/乐谱/脚本模式(EX.Director)。

(大)设计过程(design phase)：情节串联板/故事板、构造流程图、设计原型,用户测试、并行的媒体宣传等阶段构成。

（大）分镜动画(Sprite Animation)：分镜的概念是指任何资源的实例化。

原图、掩模图M、分镜S、背景B。

过程是B AND M OR S。

（大）视频切换(Video Transitions)：常用的切换类型有：剪切、擦拭、融化、淡入和淡出。

VRML节点类型(Virtual Reality Modelling Language)：是由多个节点组成的层次结构。

Shape 节点是VRML中所有对象的通用节点。

Material节点规定了对象的表面属性，它可以通过规定对象的红、绿、蓝值来控制对象的颜色。

VRML的目标(Objective of VRML)：将有色彩的对象置于3D环境中。

VRML贴图方式(VRML Shapes 3种)：ImageTexture，它可以使用外部的JPEG或PNG图像文件并将其匹配到形状上。

MovieTexture，允许将MPEG视频匹配到对象上，还可以规定起始和结束时间。

PixelTexture，使用ImageT exture来创建简单纹理对象。

VRML三种光线(Three types of lighting):DirectionalLight，用于在整个世界中沿着某一个方向进行照射；PointLight，从空间一个固定点上向四周发射光线；SpotLight，从一个点沿着一个方向发射光线。

一位图(1-bit Images)：图像的每个像素作为一个位存储(0或者1)称为二值图像(binary image)。

也称为1位单色图像(1-bit monochrome)。

八位灰度图像(8-bit Gray-level Images)：图像的每个像素有一个0~255之间的灰度值(gray value)。

每个像素由一个字节表示。

位平面(bitplane):把8位图像看作一组位平面，其中每个平面由图像的1位表示组成，平面的海拔不断升高，即图像的像素在某个位不是0就是1位图(bitmap)：整幅图像可以看作由像素值组成的二维数组。

24位真彩色图(24-bit Color Images)：每个像素用三个字节表示，通常表示为RGB，因为每个值的范围是0~255，支持255*255*255=16777216种可能的颜色组合。

α通道：许多24位彩色图像通常存储为32位图像，每个像素多余的数据字节存储一个alpha 值来表现特殊影响的信息。

3通道(RGB)：图像的红、绿、蓝通道，每个颜色通道的0~255的字节值表示亮度。

8位彩色图(8-bit Color Images)：许多系统只能够利用8位颜色信息(也称作256色)来生成屏幕图像。

颜色查找表(Color Look-up Tables (LUTs))：图像存储的不是颜色而仅仅是字节的集合，每个字节是指向一个表的索引。

该表表项具有三字节值，指明了像素(带有查找表索引)的颜色(大)。

怎样设计颜色查找表?中值区分算法(Median-cut algorithm):该算法的思想是将红色字节的值排序，并找到其中值。

然后，比中值小的值被标记为0位，比中值大的值被标记为1位。

这种方案关注那些最需要与大量颜色区别的位。

利用显示0~255数目的直方图，能很容易的找到中值。

（大）中值区分算法精确步骤：1)找出最小的方形区，它包含图像中的所有颜色。

2)沿方形区的长边排序它所包含的颜色。

3)在排序链表的中间处把该方区划分成两个区域。

4)重复上面步骤2、3，直到初始的颜色空间被分割成256个区域为止。

5)对每个方形区，把该方形区中RGB 的平均值作为其代表(中心)颜色。

6)根据一个像素的RGB值与每个方形区的中心值的欧氏距离，给每一个像素分配一个代表颜色。

在指向代表颜色的查找表中用编号代替像素。

（大）CIE色度图:中间值Y称为亮度(luminance)。

, x, y称为色度(chromaticity)。

超色域的颜色(Out-of-Gamut Colors)：如果RGB数值中某个值为负，这种问题在人们能够感知到颜色，但这种颜色所在使用的设备上不能被表现的情况下出现，则该颜色超色域。

解决办法为：一种是仅使用最接近的色域内的可用颜色。

另一种是选择最接近的补色。

加性颜色(additive color)：当两条光线照射到一个目标上时，它们的颜色会加起来。

减性颜色(Subtractive Color /CMY Color Model)：我们需要红色、绿色、蓝色的原色，即需要减去R、G和B。

这些减性原色是青(Cyan, C)、洋红(Magenta, M)、黄色(Yellow, Y)。

在加性(RGB)系统中，黑色是没有光，RGB=(0,0,0)。

在减性(CMY)系统中，黑色是使墨水的C=M=Y=1减去所有的光线产生的。

消除不足颜色(Undercolor Removal: CMYK System)：计算三色混合中为黑色的部分，从颜色比例中去除，用真正的黑色加回来，称为‘消除不足颜色’。

视频信号3种类型(Types of Video Signals):分量视频(Component):有三根线和连接器，颜色信号并不局限在RGB分色上，大多数计算机系统采用分量视频，没有任何色度、亮度干扰，颜色再现能力最好，需要更多的带宽和三种分量间良好的同步机制；复合视频(Composite)：颜色(色度)信号和强度(亮度)信号混合成一个的载波，用于彩色电视广播，并且它是兼容黑白电视广播的；S-Video：使用两条电线，一条亮度信号，另一条混合的色度信号，颜色信息与关键得灰度信息之间的色度亮度干扰会少一些，我们只看到较大的颜色块，因而就可以发送较少的颜色细节信息。

（大）模拟视频扫描过程(Analog Video):隔行扫描(interlaced scanning)先扫描奇数行，然后扫描偶数行，产生“奇数域”和偶数域组成一帧图像。

奇数行(从第一行开始)扫描到奇数域中最后一行的中间部位，偶数行扫描就从第一行的中间位置开始。

奇数行：P-Q……R-S，到T为止。

偶数行：U开始，到V停止。

从Q到R跳变称为水平回归(horizontal retrace)。

从T到U或者从V到P的跳变称为垂直回归(vertical retrace)。

垂直回归和同步的思想与水平回归非常相似，只是它仅仅在每个扫描中出现一次。

NTSC视频复合与分离：采用YIQ颜色模型。

复合信号是亮度信号Y和色度信号的复合信号，定义为：composite =Y+C=Y+I cos(F sc t)+Q sin(F sc t)。

分离时第一步是分离Y和C，低通滤波器用于分离Y分量，然后通过解调色度信号C分别提取出I和Q分量。

为了提取I分量需要两步：1）信号C乘以2 cos(F sc t)C · 2 cos(Fsct) = I · 2 cos2(F sc t) + Q · 2 sin(F sc t) cos(F sc t)= I · (1 + cos(2F sc t)) + Q · 2 sin(F sc t) cos(F sc t)= I + I · cos(2F sc t) + Q · sin(2F sc t).2）应用低通滤波器，摒弃两个高频项2F sc t，得到I类似的，将C乘以2 sin(F sc t)，然后通过低通滤波得到Q分量。

（大）色度的二次采样(Chroma Subsampling):目的：由于人类对色彩没有黑白那样敏感，因此消减色度信号是很有意义的。

数字化(Digitization):将连续值转换成一系列的离散值(考虑到效率，主要转换成整数)。

过程：采样(Sampling)、量化(Quantization)、结果。

(a): Sampling the analog signal in the time dimension.(b): Quantization is sampling the analog signal in the amplitude dimension.Nyquist rate:音频信号采样率一般从8kHz到48kHz人能够听见从20Hz到20kHz的声音。

高于20kHz的声音称为超声。

人发出的声音最高能够达到4kHz。

我们采样率的下限最少应该是这个频率的两倍。

信噪比(SNR):正确信号的能量和噪声能量的比称为信噪比(Signal to Noise Ratio SNR)，信噪比是信号质量的衡量标准之一。

信噪比是用电压平方比取10为底的对数来定义的，信号的能量和电压的平方成正比。

信号量化噪声比(SQNR)：量化质量使用信号量化噪声比(Signal to Quantization Noise Ratio (SQNR))来描述。

合成声音两种方法(Synthetic Sounds):调频(FM)、波形表法(Wave Table)。

详见书P94MIDI通道(channels)：:某种乐器和一个专门的MIDI通道相对应，MIDI通道是用来分隔消息的，一共有16个通道。

MIDI系统消息(System messages):在消息中，通道还可以用作占位符。

如果一个消息的前4位全部是1，那么这个消息就被认为是系统通用消息。

脉冲编码调制(PCM):三个阶段是transformed（转换）、loss（失真）、Coding（编码）。

失真主要在量化这一步产生。

预测编码(Predictive Coding)：预测编码最基本的想法就是传输差分值。

我们预测下一个采样值和当前采样值相等，我们不发送具体的采样值，而是发送采样值和预测值的误差。

无损预测编码(Lossless Predictive Coding)：最主要的特点是无损。

e商务文档

多媒体期末复习

相关文档推荐：