【精选】数字媒体技术概述
JPEG H.261, MPEG-1, MPEG-2
无损+有损(Lossless and Lossy Together)
JPEG 2000
数据压缩的性能指标
衡量压缩算法的三个主要性能指标 (1)压缩比; (2)压缩质量(失真); (3)压缩与解压缩的速度。
不能兼得时要综合考虑
数字媒体处理技术
课程定位
2019/9/21
提纲
1.1 数字媒体的基本概念 1.2 数字媒体处理关键技术 1.3 数字媒体标准简介 1.4 数字媒体技术的应用
1.1 数字媒体的基本概念
4
计算机数字技术
计算机的社会角色
计算 信息交流 智能服务
信息交流(人类发展和人的成长/计算机发展) 情感—>语言—>文字—>bits (—>>简单化、精确化)
(b)将它们的频率和赋给父结点,并将其插入L; (c) 将树的左右孩子赋符号“0”和“1”,并从L中删除。
哈夫曼编码(Huffman Coding)示例
输入: “ALOHA HAWAII” 频率: 4A, 2H, 2I, 1L, 1O, 1 space, 1W 96 bits (8 bits * 12 characters) to 32 bits:
analog signal
sampled signal
Sampler
Quantizer &
Coder
digitized signal
Step 1: 采样与失真
通过某种频率的采样脉冲将模拟信息的值取出,变连续的模 拟信息为离散信号。
采样定理:采样频率>=原始信号频率的2倍时, 采样信号才可以保真地恢复为原始信号。
数据压缩
数据压缩可分成两种类型
无损压缩 有损压缩
无损压缩
指使用压缩后的数据进行重构(或者叫做还原,解压缩),重 构后的数据与原来的数据完全相同
用于要求重构的信号与原始信号完全一致的场合。一个很 常见的例子是磁盘文件的压缩。
有损压缩
指使用压缩后的数据进行重构,重构后的数据与原来的数 据有所不同,但不影响人对原始资料表达的信息造成误解。
Any Content+, Any Place, Any Device, Any Time
Conditional Access/Cable, Satellite,
+ As Authorized
Broadcast, Wireless
Services,Entertainment
1.2 数字媒体处理关键技术
传输 (Transmission)
信息交换
(Information Exchange)
什么是数字媒体
多媒体
Multimedia: 文本、图形、图像、视频和音频的组合形式, 使其内容更丰富,更便于交流。
数字媒体
Digital Media: 以数字化的形式存储、处理和传播信息的 媒体,以网络为主要传播载体,并具有多样性、互动性、 集成性等特点。
information, or entertainment (Merriam-Webster Dictionary ) medium的复数形式media
介质、媒介和媒体
● 多媒体定义 多媒体技术是利用计算机对文字、图像、图形、动画、音频、视
频等多种信息进行综合处理、建立逻辑关系和人机交互作用的产物。
压缩质量评价
主观评价 :平均意见得分(MOS)、五分制(优良中差劣)
客观评价:均方误差、加权均方误差、信噪比、峰值信噪比(图像)、 分段信噪比(音频)、似然比、谱失真测度
SNR(dB)
10
lo g10
2 x 2 r
PS NR (d B)
10 log10
x2 m ax
2 r
编码方式举例:哈夫曼编码(Huffman Coding)
多媒体信息:通过多媒体传播的信息。 多媒体系统:能够产生、存储、传播多媒体信息的系
统。
数字媒体技术的发展
WWW 数字视音频
图形操作系统
1980
Future
1990
32位处理器
CD-ROM, LAN, WAN, 16位处理器 桌面PC
1970-an
8位处理器
数字媒体计算机演变的关键技术
计算、通信、内容、消费电子融合(4C)
2
3
4
多媒体的特性
多媒体强调的是使用多种媒体、综合表达信息 内容并进行交互式处理的技术。
从本质上来说,具有三种最重要的特性:
媒体的多样性,其中至少有一种连续媒体; 媒体的集成性(综合性),多种不同媒体综合地表
现某个内容,取得更好的效果; 处理的交互性,使人们获取和使用信息的过程中具
什么是数字媒体:A Big Picture
多媒体
图像
视频
文本
音频
语音
数字媒体系统 分布式数字媒体系统
媒体内容管理
Authoring Frameworks Tools
网络
Streaming video
Web pages
Virtual worlds
Streaming audio Client-server
Huffman编码属于信息熵编码的方法之一,是根据信源 符号出现概率的分布特性而进行的压缩编码。
也称为最佳编码,平均码长最短。 编码过程:
1. 初始化:将信源符号按频率递减顺序排列,输入L; 2. 重复如下操作直至L中只有1个结点:
(a)从L中取得两个具有最低频率的结点,为它们创建一个父结 点;
音频、视频、语音、动画
基于描述空间中空间维分类
感觉 (Perception)
展现 (Presentation)
表示 (Representation)
媒体分类标准
1D媒体
单声道语音、音乐
2D媒体
双声道音乐、图像、二维图形
3D及多维媒体
存储 (Storage)
三维图形 , 全景图像 , 空间立体声音乐
0 A
1
0
1
01
0
I
H
01
L [space]
1
01
W
O
A=0, I=100, H=101, L=1100, space=1101, etc.
数字信息的最小单元就是比特,通过比特可以表述 各种媒体信息。
比特是信息的最小单元
比特没有颜色、尺寸和重量,它只是一种存在的状态:开 或关、真或假、高或低、黑或白,总之简记为0或1。
比特易于复制,而且复制的质量不会随复制数量的增加而 下降。
比特可以以极快的速度传播,而且在传播时不受时空的限 制。
18
媒体数字化
为什么要数字化?
数字化过程
媒体数字化关键技术
采样(Sampling) 压缩(Compression) 编码(Coding)
为什么要数字化?
模拟的问题:模拟失真,依赖载体 数字化的好处:
通用的存储和传输格式,数字化后处理更方便 适用于光盘存储和远距离传输 准确可靠,没有累计失真,可以无损传输和存储
数字化的问题
采样率失真,信息丢失 与模拟相比,需要很大的空间,例如35mm照片需要
420万像素,高清视频码率大于 1Gbps
需要压缩
数字悬崖:马赛克、画面暂停丢失
数字化过程
三步骤
采样(Sampling) 量化(Quantizing) 压缩(Compression)与编码(Coding)
为什么需要数据压缩?
压缩编码的理论基本原理
从信息论的角度来看,压缩就是去掉信息中的冗余,即保留 不确定的信息,去除确定的信息(可推知的),也就是用一种 更接近信息本质的描述来代替原有冗余的描述。
信息冗余的例子
你的朋友,Helen,将于明天晚上6点零5分在上海的虹桥机场接你。 (23*2+10=56个半角字符)
情感<—语言<—文字<—bits (<<—自然化、可觉化)
文字信息为主的信息交流时代
什么是多媒体
●“多媒体”一词源自“Multimedia”
Multi (Latin multus) -many; much; multiple
-多重、复合
1
Medium (Latin medius) -a substance regarded as the means of transmission of a force or effect; a channel or system of communication,
你的朋友将于明天晚上 6点零5分在虹桥机场接你。 (20*2+3=43个半角字符)
Helen将于明晚6点在虹桥接你。 (10*2+7=27个半角字符)
结论:只要接收端不会产生误解,就可以减少承载信息的数据量。
多媒体领域中的冗余分类
统计冗余
空间冗余——规则物体的物理相关性 时间冗余——视频与动画画面间以及音频帧
有细粒度的控制和操纵能力。
计算机与媒体
采集
表示
感觉
CPU Input Device
表示
存储
展现
Output Device
感觉
传输
什么是多媒体:分类
最常见的分类方法是基于感觉
文本 图像 音频(语音) 视频
基于描述空间中时间维分类
时间独立(离散)
文本、图形
时间依赖(连续)
间的相关性
信息熵冗余
编码冗余——数据与携带的信息