多媒体新技术展望
利用小波变换能够比较精确地进行图像拼接, 因此对较大的图像可以进行分块处理,然后再 进行拼接。
小波变换-JPEG2000
MPEG-21
1999年,MPEG组织在墨尔本会议上提出了 MPEG-21的概念。 MPEG-21的最终目标是协调不同层次间的多媒 体技术标准,建立一个交互式的多媒体框架, 此框架能够支持各种不同的应用领域,允许不 同用户使用和传递不同类型的数据,并且实现 对知识产权的管理和数字媒体内容的保护。
分辨率
平均值
细节系数 [1 [2] -1]
4 2
1
[9 7 3 5] [8 4]
[6]
哈尔变换过程事实上是用求均值和差值的方法对 函数或图像进行分解,对于f(x)=[9 7 3 5], 我们可作最多2层的分解。
对于2维图像,同样可以用依次对行列进行小 波变换得到2维图像的分解。这时经过一次小 波变换得到是2维图像的近似值(CA)以及水平 (CH)、垂直(CV)和对角(CD)细节分量值。显然, 从2维图像的CA、CH、CV和CD值可以重构出原 来的2维图像。
1,当0≤x<1/2 Ψ (x) = -1,当1/2≤x<1 0,其他 设有一幅分辨率只有4个像素的一维图像,对 应像素值为:[9 7 3 5]。 用哈尔小波变换的过程是 计算相邻像素对的平均值(averaging,亦可 称之为近似值approximation),得到一幅分 辨率为原图像1/2的新图像:[8 4]。这时图 像信息已部分丢失。
内容的管理和使用:它是为以下过程提供接口和协议, 经内容传输和消费价值练创建、制作、存储和使用的 内容。 知识产权的管理和保护:可通过大范围的网络和设备 对这些权利、兴趣和认定事项提供可靠的管理和保护, 同时在某种程度上获得、编辑、发布相关的政策、法 规、准则。 终端和网络(Terminals and Networks ): MPEG-21通 过屏蔽网络和终端的安装、管理和实现问题,使用户 能够透明地进行操作和发布高级多媒体内容。 事件报告(Event Reporting ): 它能使用户精确理解 框架中所有可报告事件的接口和计量。事件报告将为 用户提供特定交互的执行方法,同样允许大量超范围 的处理,允许其他框架和模型与MPEG-21实现互操作。
基于分形的压缩算法
什么是分形
分形(Fractal)一词,来自拉丁文Fractus, 是曼德勃罗创造出来的,原意具有不规则、 支离破碎等意义,分形几何学是一门以非规 则几何形态为研究对象的几何学。
分形几何与传统几何相比有什么特点 从整体上看,分形几何图形是处处不规则的。 例如,海岸线和山川形状,从远距离观察,其形 状是极不规则的。 在不同尺度上,图形的规则性又是相同的。上 述的海岸线和山川形状,从近距离观察,其局部 形状又和整体形状相似,他们从整体到局部,都 是自相似的。
由于小波及小波包技术可以将信号或图像分层次按小 波基展开,所以可以根据图像信号的性质及事先给定 的图像处理要求确定到底要展开到哪一级为止,从而 不仅能有效地控制计算量,满足实时处理的需要,而 且可以方便地实现渐进传输编码(即采取逐步浮现的 方式传送多媒体图像)。 利用小波变换具有放大、缩小和平移的数学显微镜的 功能,可以方便地产生各种分辨率的图像,从而适应 于不同分辨率的图像I/O设备和不同传输速率的通信系 统。
小波(wavelet)是定义在有限间隔且平均值 为0的函数。
小波分析是把一个信号分解成由原始小波经过移 位和缩放后的一些列小波,因此小波是小波变换 的基础函数,即小波可用作表示一些函数的基函 数。 小波变换的基本思想是用一组小波或基函数表示 一个函数或信号,例如图像信号。 哈尔(Hear)小波基函数为例 基本哈尔小波函数(Hear wavelet function)定 义如下
MPEG-21中的几个基本概念
用户(User):用户是一个广义的概念,可以 是世界各地的个人、消费者、团体、组织、公 司、政府以及其他标准化组织和主体。从技术 上讲,MPEG-21认为内容的提供者和消费者同 样都是MPEG-21的用户。用户可以各种方式 “使用”内容,包括对内容进行发布、传递构出4个像素的 原图像,必须把每个像素对的第一个像素值减 这个像素的平均值作为图像的细节系数 (detail coefficient)保存。 因此,原图像可用下面的两个平均值和两个细 节系数表示:[8 4 1 -1]。 可以把第一步变换得到的图像进一步变换,原 图像两级变换的过程如下表所示:
分形压缩的基本原理是利用分形几何中的自相 似性原理来进行图像压缩。所谓自相似性就是 指无论几何尺度如何变化,景物的任何一小部 分的形状都与较大部分的形状极其相似。 分形编码利用“自相似性”不是邻近样本的相 关性而是大范围的相似性,即图像块的相似性。 对相似性的描述是通过仿射变换来确定的,而 编码的对象就是仿射变换的系数。由于仿射变 换的系数的数据量小于图像块的数据量,因此 可以实现压缩的目的。
《微软电子百科全书》就是完全分形编码方法 把大量多媒体数据压缩到600MB以内的。在海 湾战争中,美军使用了分形技术,用于军事地 图的缩放、攻击目标的匹配追踪等。
分形图像压缩的一般过程 源图像 割成适当的块 对每一块,基于拼贴定 理求其IFS码 解码图 各块 对随机迭代定理重构各块
小波变换在图像压缩中的应用
MPEG标准
MPEG-21多媒体框架
MPEG-21多媒体框架是一个结构化的框架, 从结构上可分成以下要素 数字项声明(Digital Item Declaration ): 即一种对数字项进行声明的统一和灵活的提 取和可互方案。 内容展现手法(Content Representation ): 它是不同媒体的数据展现方式,如音频、视 频的播放。 数字项的标记和描述:这是对不同自然属性、 类型和粒度的数字项进行统一标记和描述的 结构。
使用(Use):MPEG-21提供了一个多媒体框架供一 个用户与另一用户进行以数字信息为目标相互作用。 这里所指的相互作用即为对内容的“使用”,它包 括内容创建、提供、存档、定级、增强、递送、聚 集、传输、发表、零售、消费、提交、管制等。 数字项(Digital Item):MPEG-21的数字项是一个 结构化的数字对象,是按标准进行表达、标记并带 有描述性的数据。数字项是数字资源及其相关内容 (包括图像、图形、动画、数据文件、音频、视频等) 的集合。它是MPEG-21框架中传送和交易的最基本 单元,是用户关联的目的。