当前位置:文档之家› 多媒体数据库及基于内容检索

多媒体数据库及基于内容检索


多媒体数据库的软件环境
文件管理系统
– Windows 的文件管理器或资源管理器; – 图形、图像浏览工具软件; – 文件系统方式一般只适用于小的项目管理或较特殊的数据对象, 所表示的对象及相互之间逻辑关系比较简单,如管理单一媒体信 息;
建立特定的逻辑目录
传统的字符、数值数据库管理系统
– 把文件管理系统和传统的字符、数值数据库管理系统结合起来; – 由文件管理系统来建立和管理非常规数据(音频、视频、图形等 ),把数据文件的全文件名作为一个字符串数据纳入传统的数据 库系统进行管理。
第六章多媒体数据库 及基于内容检索
信息量爆炸式增长
数据库系统
数据库作为一种独立的应用领域已得
到了计算机界的认可,数据库已和计 算机、网络一起成为用户应用系统的 三大支柱。 数据库系统(DBS)由四个要素组成:用 户、数据库、数据库管理系统(DBMS )以及支持它的 硬件和软件。DBMS 是管理数据库的系统软件,它是DBS 中最主要的成分。
多媒体数据库的基本功能
多媒体数据库系统除必须满足物理数据独立性和逻辑数据
独立性外,还应满足媒体数据独立性。
– 物理数据独立性是指物理数据组织(存储模式)改变时,不影响 概念数据组织(逻辑模式); – 逻辑数据独立性是指概念数据组织改变时,不影响用户程序使用 的视图(外模式); – 媒体数据独立性是指在多媒体数据库管理系统的设计和实现时, 要求系统能保持各种媒体的独立性和透明性,即用户的操作可最 大限度地忽视各种媒体的差别,而不受具体媒体影响和约束;同 时要求他不受媒体变换的影响,实现复杂数据的统一管理。 – 由于多媒体数据库的数据种类繁多,语义关联丰富,内部结构表 示各异,故各种模式及映像比传统数据库复杂得多,涉及的数据 量也大得多,要真正做到物理数据独立性、逻辑数据独立性和媒 体数据独立性并非易事。
–多媒体数据系统还应提供事务和版本管理功能
• 长事务:在MDBMS中,长事务的运行意味着在 一个可靠的方式下 花费大量的时间传输大容量的数据。检索一场电影就是长事务的 典型例子。
多媒体数据库的体系结构
协作型结构
–针对各种媒体单独建立数据库,每一种媒体的数据库 都有自己独立的数据库管理系统。虽然他们是相互独 立的,但是可以通过相互通信进行协调和执行相应的 操作。 –特点:对多媒体数据库的管理是分开进行的,可以利 用现在的研究成果直接进行“组装”,每一种媒体数 据库的设计也不用考虑与其他媒体的区别和协调; –缺点:对不同类型媒体的联合操作实际上是交给用户 去完成了。使得对多种媒体的联合操作、合成处理、 概念查询等较难完成。
多媒体数据库基于内容的检索
由于多媒体数据库中包含大量的图
像、声音、视频等非格式化数据, 对它们的查询和检索比较复杂,往 往需要根据媒体中表达的情节内容 进行检索,基于内容的检索(CBR )就是对多媒体信息检索使用的一 种重要技术。
多媒体数据库基于内容的检索
基于内容检索的特点 – 从媒体内容中提取信息线索
多媒体数据库的软件环境
扩充关系数据库的方式
– 引入新的数据类型,以便存储多媒体对象字段,大小可以达到GB 字节,用于存储文本信息和任何形式的二进制信息,包括图像、 声音; – 用专用字段存放全部多媒体文件; – 多媒体资料分段存放在不同字段中,播放时间重新构建;
超媒体方式
– 超媒体的方式就是以超文本的思想来实现对多媒体数据的存储、 管理和检索; – 一种非线性的网状结构,这种非线性技术可以按照人脑的联想思 维方式把相关信息联系起来,供读者浏览; – 超媒体是由称为结点和表达结点之间联系的链组成的有向图、用 户可以对其浏览、查询、修改等操作。
6.1.1 传统的数据管理
层次模型用树形结构来表示各类实体
以及实体间的联系,每一结点表示一 个记录类型(实体型),每个记录类 型包含若干个字段(实体媒体数据库 –多媒体数据库需处理的数据包括数值、 字符、文本、图形、图像、声音、动画 和视频等多种类型,对这些类型的数据 进行管理、运用和共享的数据库就是多 媒体数据库。
6.1.2 多媒体带来的问题
数据量巨大且媒体之间量的差异也极大,
从而影响数据库的组织和存储方法
媒体种类的增多增加了数据处理的困难 数据库不仅改变了数据库的接口,使其声、
图、文并茂,而且也改变了数据库的操作 形式。接口的多媒体化,对查询提出了更 复杂,但对用户更友好的设计要求。
传统的事物一般短小精悍,在多媒体数据
库管理系统中长事务较多。
多媒体数据库管理环境
多媒体数据的存储环境 –容量大、质量好、存取速度快、价格合 适; –4类存储介质
• 可更换的硬盘,既可做工作介质也可做档案介质; • 磁带备份介质,容量一般为1.2~3GB,平均存取时间 小于1分钟; • 光盘档案介质; • 磁盘阵列,有效存储海量多媒体数据的介质,支持 用户并发读写。
多媒体数据的传输环境
多媒体数据在不同硬件结构和不兼容
的操作系统之间传输; 使用可更换的介质进行人工传输,适 合小范围操作; 使用串口实行点到点传输; 使用网络系统,实现计算机之间的传 输。
6.1.3 多媒体数据与数据库管理
在数据库中,一般常用的多媒体数据有字
符、数值、文本、图像、图形一类的静态 数据,也有像声音、视频、动画等基于时 间的媒体类型。 字符数值 文本数据
数据库管理系统
数据库管理系统具有哪些功能
–实施对数据的管理,包括存储、查询、处理和 故障恢复等,同时也保证能在不同用户之间进 行数据共享。
数据库管理系统的三种模式:
–物理模式:物理模式的主要职能是定义数据的 存储组织方法,如数据库文件的格式、索引文 件组织方法、数据库在网络上的分布方法等 –概念模式:定义抽象现实世界的方法。概念模 式通过数据模型来描述,数据库系统的性能与 数据模型直接相关。 –外部模式:又称子模式,是概念模式对用户有 用的那一部分。
多媒体数据库的体系结构
集中统一型结构
多媒体数据库的体系结构
主从型结构
–不同数据类型的媒体数据仍然相互独立,系统将每一 种媒体的管理和操纵各用一个服务器来实现。所有服 务器的综合和操纵也用一个服务器来完成。与用户的 接口采用客户进程来实现。 –优点:可以针对不同的需求采用不同的服务器、客户 进程组合,所以很容易符合应用的需求,对每一种媒 体也可以采用与这种媒体相符合的处理方法; –缺点:但采用这种体系结构必须对服务器和客户进行 仔细的规划和统一的考虑,采用标准化和开放的接口 界面。
多媒体数据库的基本功能
多媒体数据库系统必须能表示和处理多媒体数据:
– 在多媒体数据库中,数据在计算机内的表示方法比传统数据库的 表示形式复杂,对非格式化的媒体数据往往要用不同的形式来表 示,多媒体数据库管理系统要提供管理这些异构表示形式的技术 和处理方法。
多媒体数据库系统必须能反映和管理各种媒体数据的特性
多媒体数据库的基本功能
多媒体数据库的数据操作功能 –信息重组织
• 应支持符合媒体在各通道分离后存入数据库。例如,将Vedio分解 为影像、配音等信息,把这些信息分别存储到数据库中,必要时 各种分离的信息可以重新组织后输出。
–多媒体数据库管理系统应具有开放功能
• 提供多媒体数据库的应用程序接口API(Application Program Interface);
• 允许通过举例查询和通过主题描述查询使复杂查询简单化;
–提供浏览功能
• 允许浏览数据库信息的目录结构 • 允许对某一具体题目,浏览与此题目有关的一般信息; • 允许浏览数据库去寻找用户假设的信息支持;
多媒体数据库的基本功能
多媒体数据库的数据操作功能 –提供构造解功能
• 使用一系列的应用约束和触发条件,解决要求访问大容量数据问 题和数据库的一致性问题;
– 关键字检索 – 全文检索
声音数据 –MIDI、波形
6.1.3 多媒体数据与数据库管理
图形数据 –描述图形数据的关键是要有可以描述层次结 构的数据模型。 –图形数据可以分解为点、线、弧等基本图形 元素 图像数据 –图像数据库较早就有研究,已提出许多方法, 包括属性描述法、特征提取、分割、纹理识 别、颜色检索等。 视频数据 –对视频的管理还要在时间空间上进行。检索 和查询的内容可以包括镜头、场景、内容等 许多方面,
多媒体数据库的体系结构
协作型结构
多媒体数据库的体系结构
集中统一型结构
–只存在一个单一的多媒体数据库和单一的多媒体数据 库管理系统。各种媒体被统一的建模,对各种媒体的 管理与操纵被集中到一个数据库管理系统中,各种用 户的需求被统一到一个多媒体用户接口上。 –优点:建模统一、管理/操作统一、用户接口统一、查 询和检索结果统一表示; –理论上,能够充分的做到对多媒体数据进行有效的管 理和使用。但实际上这种多媒体数据库系统是很难实 现的。
,或各种媒体数据之间的空间或时间的关联:
– 在客观世界里,各种媒体信息有其本身的特性或各种媒体信息之 间存在一定自然关联,包括时序关系(如多媒体对象在表达时必 须保证时间上的同步特性)和空间结构(如必须把相关媒体的信 息集成在一个合理布局的表达空间内的有关特性)。因此,在多 媒体数据库管理系统中,除了要对多媒体数据的内容与结构建模 外,还要提供对各种媒体数据的特性和集成机制的时空关联的组 织和管理方法。
–对非格式数据还应视不同多媒体提供不同的操纵如下:
• 图类数据:覆盖、邻接、镶嵌、交接、比例、剪裁、颜色转换、 定位等; • 声音数据:声音合成、声音信号的调度、声调和声音强度的增减 调整等;
–多媒体数据系统的网络功能
• 多媒体数据库由于它的数据来源、应用、数据量等原因,往往被 分布于网络的不同结点上。对于此种情况,应解决分布在网络上 的多媒体数据库中数据的定义、存储、操纵问题,并对数据的一 致性、安全性、并发性进行管理。
相关主题