当前位置:
文档之家› 多媒体技术的应用现状与发展趋势
多媒体技术的应用现状与发展趋势
A>83 ( " 作为 A>83 家族中的一个新成员,正 式名称叫做 “多媒体内容描述接口”,它将为各种类 型的多媒体信息规定一种标准化的描述,这种描述 与多媒体信息的内容本身一起,支持用户对其感兴 趣的各种“资料”的快速、有效地检索。
以下一些应用领域将从 A>83 ( " 标准的制定 中获益:
&数字化图书馆 K 图像分类目录,音乐字典,… L &多媒体目录服务 &广播式媒体选择 K 收音机频道,电视频道,… L &多媒体编辑 K 个人电子新闻服务,媒体著作 L 还有一些潜在的应用领域: &教育 &旅游信息 &娱乐 K 例如寻找游戏、卡拉 %M 节目 L &购物 K 例如寻找你喜欢的衣服 L A>83 ( +! 的 范 围 可 以 描 述 成 是 一 个 决 定 性 K 关键 L 技术的集成,这些技术可以通过访问全球网 络和设备实现对多媒体资源的透明和增强的使用。 其功能包括:内容创建、内容产品、内容发布、内容消 耗和使用、内容表示、知识产权管理和保护、内容识 别与描述、财政管理、用户的隐私权、终端和网络资
&多重并行数据流的编码:多媒体表演,如虚拟 现实游戏,# 维动画,训练和飞行模拟,多媒体演示 和教育。
如今,越来越多的声像信息以数字形式存储和 传输,这为人们更灵活地使用这些信息提供了可能 性。但随之而来的问题是,随着网络上信息爆炸性的 增长,获取到我们感兴趣的信息的难度却越来越 大。传统的基于关键字或文件名的检索方法显然不 适于数据量庞大、又不具有天然结构特征的声像数 据,因此近些年来多媒体研究的一个热点是声像数 据的基于内容的检索,例如“从这段新闻片中找出有 首相、总统的镜头”这种形式的检索。实现这种基于 内容检索的一个关键性的步骤是要定义一种描述声 像信息内容的格式,而这与声像信息的存储形式 K 编 码 L 又是密切相关的。国际标准化组织运动图像专家 组注意到了这方面的需求和潜在的应用市场,在推 出影响极大的 A>83—!、A>83 ( + 之后,尚未完成 A>83 ( H 的最后定稿,便开始着手制定专门支持多 媒体信息基于内容检索的编码方案:A>83 ( "。
’ 多媒体技术的应用现状 多媒体技术的开发和应用,使人类社会工作和 生活的方方面面都沐浴着它所带来的阳光,新技术 所带来的新感觉、新体验是以往任何时候都无法想 象的。 ’# ! 多媒体数据压缩,图像处理的应用 多媒体计算机技术是面向三维图形、环绕立体 声和彩色全屏幕运动画面的处理技术。而数字计算 机面临的是数值、文字、语言、音乐、图形、动画、图 像、视频等多种媒体的问题,它承载着由模拟量转化 成数字量信息的吞吐、存储和传输。数字化了的视频 和音频信号的数量之大是非常惊人的,它给存储器 的存储容量、通信干线的信道传输率以及计算机的 速度都增加了极大的压力,解决这一问题,单纯用扩 大存储器容量、增加通信干线的传输率的办法是不 现实的。 数据压缩技术为图像、视频和音频信号的压缩, 文件存储和分布式利用,提高通信干线的传输效率 等应用提供了一个行之有效的方法,同时使计算机 实时处理音频、视频信息,以保证播放出高质量的视 频、音频节目成为可能。 国际标准化协会,国际电子学委员会,国际电信 协会等国际组织,于二十世纪 23 年代领导制定了三 个重要的有关视频图像压缩编码的国际标准,4561 标准;$# ’"! 标准;7561 标准。 ’# !# ! 4561 它是国际上彩色、灰度、静止图像的第一个国际 标准,它不仅适于静态图像的压缩,电视图像序列的
频电话和电视会议,可以以较好的质量来传输更复 杂的图像。
+’ !’ # A>83 A>83 视频压缩技术是针对运动图像的数据压 缩技术。目前又分为 A>83 ( 5、A>83 ( !、A>83 ( 5$、A>83 ( " 和 A>83 ( +!。 A>83 ( 5 最初用于数字存储上活动图像及伴 音的编码,数码率为 !’ BACD= E F,图像采用 952 格式, 两 路 立 体 声 伴 音 的 质 量 接 近 G6 音 质 , 到 现 在 , A>83 ( 5 压缩技术的应用已经相当成熟,广泛地应 用在 $G6 制作,图像监控领域。 A>83 ( !是 A>83 ( 5 的扩充、丰富和完善。 A>83 ( 55 的视频数据速率为 H—BAD= E 9,能提供 "+, I HJ, K )79G L 或 "+, I B"@ K >1& L 分辨率的广播 级质量的视像,适用于包括宽屏幕和高清晰度电视 K ?67$ L 在内的高质量电视和广播。 随着网络、有线 E 无线通信系统的迅猛发展,交 互式计算机和交互性电视技术的普遍应用,以及视 频、音频数据综合服务等应用的发展趋势,对计算机 多媒体数据压缩编码、解码技术及其遵循的标准提 出 更 多 更 高 的 要 求 , 有 许 多 要 求 A>83 ( 5 和 A>83 ( !标准是难以支持的,因此 A>83 ( "应运 而生,它正是为解决这些高需求而推出的。 根据 A>83 ( "开发的不同的压缩编码,我们 可以分为如下几类: &基于内容的多媒体数据访问工具:应用于从 在线的程序库和传送信息的数据库中进行基于内容 的信息检索。 &基于内容的处理和比特流编辑:应用于交互 式家庭购物、影视的制作和编辑、数字特技。 &混合自然和人工数据编码:应用于动画和音 响的自然组合,在游戏节目中观众可以移动和传送 覆盖在要查看的视频之上的图形,从不同的观察点 描绘图形和声音。 &改进的时间随机访问:应用于音像数据的远 程终端随机访问。 &改进的编码效率:应用于低带宽信道上的有 效音像数据存储和传送。
! 多媒体技术涉及的内容 多媒体技术是使用计算机交互式综合技术和数 字通信网络技术处理多种表示媒体———文本、图形、 图像、视频和声音,使多种信息建立逻辑连接,集成 为一个交互式系统。 它主要涉及如下几个部分: !# ! 多媒体数据压缩,图像处理:它包括 $%& 与交互介面设计、多模态转换、压缩与编码和虚拟现 实等。 !# ’ 音频信息处理:它包括音乐合成、特定人 与非特定人的语音识别、文字———语音的相互转换 等。 !# ( 多媒体数据库和基于内容检索:它包括 多媒体数据库和基于多媒体数据库的检索等。 !# ) 多媒体著作工具:它包括多媒体同步、超 媒体和超文本等。 !# * 多媒体通信与分布式多媒体:它包括 %+%,、会议系统、-./ 和系统设计等。 !# " 多媒体应用:%0& 与远程教学、1&+ 与数 字地球、多媒体远程监控等。
!"
冼俊峰 赵小侠 钟玉琢 Y 著
多媒体技术的应用现状与发展趋势
源抽取、事件报告等。 #$ # 音频信息处理的应用 在多媒体技术中,存储声音信息的文件格式主
要有:%&’ 文件、’() 文件、*+,+ 文件、&+- 文件、 .(/ 文件及 0*+ 文件等。
#$ #$ ! 音频信息录制编辑 把音乐和语音加到多媒体应用中,是我们研究 音频处理技术的目的,下面是我们常用的音频信息 录制编辑软件。 %1234567 工具的 04) 命令;.89:5 ;<1=73> 卡 的 ’4567# 软件;*6?>8=8@7 .89:5.A=73B 卡的 C96?D 03?8>53> 软件;)88<3567 软件;%123 4567 工具; )>317623 %123.79568。 #$ #$ # 语音识别 语音的识别长久以来一直是人们的美好梦想, 让计算机听懂人说话是发展人机语音通信和新一代 智能计算机的主要目标。随着计算机的普及、越来越 多的人在使用计算机,如何给不熟悉计算机的人提 供一个友好的人机交互手段,是人们感兴趣的问题, 而语音识别技术就是其中最自然的一种交流手段。 自从 #E 世纪 "E 年代中期以来,新技术的不断 出现使语音识别有了实质性的进展。特别是隐马尔 可夫模型 F G** H 的研究和广泛应用,推动了语音识 别的迅速发展,陆续出现了许多基于 G** 模型的 语音识别软什系统。 当前,语音识别领域的研究正方兴未艾。在这方 面的新算法、新思想和新的应用系统不断涌现。同 时,语音识别领域也正处在一个非常关键的时期,世 界各国的研究人员正在向语音识别的最高层次应用 ———非特定人、大词汇量、连续语音的听写机系统的 研究和实用化系统进行冲刺,可以乐观地说,人们所 期望的语音识别技术实用化的梦想很快就会变成现 实。 #$ #$ I 文语转换 目前,世界上已研制出汉、英、日、法、德等语种 的文语转换系统,并在许多领域得到了广泛应用。 ,4) J1<D 文语转换系统:这是 ,4) 公司在 *+J 的 KL&JJ 教授研制的语音合成器的基础上开 发的语音生成系统,用于英语文语转换。 &JMJ ;3<< 文语转换系统:这是美国 &JMJ 贝尔实验室研制的文语转换系统,它最初用于英语
8 收稿日期 9’33’ > 3" > !*
!"
第 !# 卷第 # 期 +,,+ 年 - 月
广西广播电视大学学报 .%/0)1& %2 3/1)345 0165% 1)6 7$ /)5$80957:
$%&’ !# ( )*’ # 9;<=’ +,,+
帧内图像的压缩编码,也常采用 .>83 压缩标准。 +’ !’ + ?’ +@! 它是视频图像压缩编码国际标准,主要用于视
第 !( 卷第 ( 期 ’33’ 年 2 月
广西广播电视大学学报 4.BC@0? .D 1B0@1E& C0/&. 0@/ F- B@&-6C+&FG