当前位置:
文档之家› 企业多源数据集成与交换解决方案
企业多源数据集成与交换解决方案
平台支持基于资源的访问控制,并围绕 Java 安全模型来进行设计。这种基 于资源的机制允许系统管理员对平台管理的任何资源建立访问控制列表,包括 XML 文档,文档集合,数据视图,适配器等。
(8) 规则引擎
平台提供全面的商业规则检查能力,完全按照用户自定义的标准来筛选信息 和验证信息。规则检查实时地检查导入数据的内容,主要包括语法结构检查和基 于内容的语义检查。
图 3-2 视图构建器界面
视图构造器根据相应的元数据图形化显示底层的几个数据源及其内部数据 结构,同时根据相应的 XML Schema 图形化显示应用层的业务数据需求,从而轻 松的在业务数据需求及底层原始数据之间建立映射。
3.5 统一数据访问接口
建设数据中心的目的在于数据的标准化与实现数据共享,数据的共享是通过 统一数据访问接口来完成。下图给出了统一数据访问接口的管理与使用方法。
数据集成平台允许用户缓存由视图收集的集成数据信息。缓存技术加速了应 用的性能,并减少了对经常需要存储的后端系统的负载。利用在缓存数据上的索 引还可以进一步加强查询的性能。管理员可以对任何数据源进行缓存。
作为缓存机制的一部分,数据集成平台包含可配置的自动验证机制,当选择 一个缓存时,系统不仅可以根据事先定义的时间表刷新也可以在用户进行查询数 据后进行刷新。如果源信息已经不在了,用户可以选择回滚到自己定义的缓存里 进行再一次数据抽取以保持更新。这种动态的更新意味着信息随时都是最新的, 用户就可以根据应用需要做出决策。
Cache
/
应用系统
数据库
消息
文件
XML
图 2-1 数据集成平台框架图
3 平台组成
中科启信数据集成平台由数据源、适配器、数据集成服务、数据视图构造器、 统一数据访问接口、平台应用六个部分组成。
第 2 页 共 11 页
3.1 数据源
这里的数据源是指所有要集成的数据。可以是文本文件、XML、关系数据 库、应用系统、Web Services 等。也可以是企业资源计划 ERP 平台、客户关系管 理 CRM 平台、供应链管理 SCM 平台、集成质量管理平台和电子商务平台等
规则检查引擎是基于大量可靠、重复的事实做出决策的。不同的规则可以帮
第 6 页 共 11 页
助客户满足自己的个性化需求。规则着重于一些应用逻辑,帮助开发者更快速地 部署自己的应用,以满足快速变化的市场需要。
3.4 数据视图构造器
数据视图构造器是一个图形化的数据视图构造环境,用于创建和部署数据视 图。数据视图构造器可以指导设计者创建数据视图所需要的元数据文件,该构造 器是一个可视化的、可拖拽的开发工具,而且提供有设计向导,可以加速基于 XML 的应用。通过视图构造器形成的数据统一视图是统一数据访问接口提供数 据服务的基础。
第 7 页 共 11 页
1.
4.
2. 3.
图 3-3 统一数据访问接口的管理与使用方法
统一数据访问接口的用户角色可以分为接口开发人员、运行维护人员和应用 系统开发人员三类。其中接口开发人员根据上层应用对业务数据格式的不同需求 进行访问接口的封装、格式化,并注册接口描述;数据运行维护人员对新增访问 接口进行统一的配置,包括:访问权限、接口描述标准化及接口验证;应用系统 的开发人员根据给定的接口进行测井应用系统的开发。
视图定义产生的元数据可以跟踪数据元素之间的映射和关系。平台提供了图 形化的工具操作数据及其元数据。
元数据管理器除了自动从数据源收集信息外,管理员还可以用元数据对存储 的信息(如缓存视图)进行注解。系统在特定情况下也会增加一些元数据信息, 如一个查询操作的时间戳,需要某些特定类型信息用户的日志等。管理员会利用 这些补充的元数据实现数据的联合、数据的兼容、版本控制或其他的应用。
(5) 联邦查询引擎
联合查询引擎是查询并集合数据源里的数据。对于关系型或非关系型的数据 源,它都保存有一个 XML 格式的数据字典,来记录各数据源的位置和数据格式, 使用户可以以基于时间或事件驱动的方式访问测井数据。
第 5 页 共 11 页
联合查询引擎提供了很多查询函数,以类似 SQL 查询的方式查询所有数据。 它生成高效的 SQL 语句并把他们代理给底层的关系型数据库或可查询的数据 源。使用一个查询语句,应用程序就可以查询覆盖所有数据源的信息,并以单个 结果集的形式返回,从而无缝连接多个异构数据源。
为了高效执行各个异构数据源的联合查询,联合查询引擎从每个关系型数据 库里收集和分析元数据,综合考虑数据库各个表大小、已出现和未出现的索引、 选择的索引、表的主键、外键关系。当处理查询时,根据远端开销状况和数据通 过网络的开销来得到一个最优的执行计划,从而优化联邦查询效率。
(6) 事务管理
事务管理用来保证数据的完整性和一致性, 支持 JTA 事务。数据服务引擎 提供了一个数据视图级别的分布式事务处理模型,它把发生在多个数据源上的一 组逻辑事务当作一个分布式事务,这组事务在数据视图中被定义,因此所有通过 这个视图进行的数据更新都被当作一个逻辑事务。在视图被处理的过程中,如果 发生了致命错误,那么所有的事务都会被回滚,如果成功处理,那么所有的事务 都会被提交。这样可以保证多个数据源数据的一致性。
(1) 集成/转换引擎 集成/转换引擎连接底层数据源,集中所有的数据和内容,形成一个通用的 信息模型。 集成/转换引擎集成并标准化数据,允许用户在所有的信息集合上执行联合 查询和建立相应的视图。这种强大的信息收集能力使各孤立的数据源之间相互联 系起来,从而充分地利用信息。 统一数据视图用来对各种数据源的数据创建一个虚拟实时的快照。标准、通 用的视图使应用系统访问数据源更加简化。一个视图包含了用户获取数据的多个 测井数据源以及一些访问这些数据源所必须的信息。当一个视图建立好之后,只 要基于这个视图的查询请求被提交,信息就会从底层的数据源中提取出来。视图 的属性是在设计时被创建,存储在视图的定义中,以后可以随时修改视图的属性 定义。
第 3 页 共 11 页
多样的输出 方便的重构 方便的数据匹配 方便的数据连接
Views
XML模式 关系型模式
语法检查 数据检查 容错检查
源访问权限控制 ACL控制
本地缓存 定时更新
图 3-1 定义的视图包含从源端来的所有信息
开发人员不需要编程,仅仅通过简单、直观的图形界面就可以定义视图。视 图是从不同的数据源获取信息的,在之上可以执行基于视图的联合查询。为了减 轻后端系统的负载和提高应用系统的性能,可以采用缓存视图方式。通过合适的 缓存策略,优化查询效率。
XML Schema 管理器同时也支持模式演变的技术。当业务规则改变时,XML 模式也必须做相应的改变。模式管理器允许用户方便的将文档或文档集合从旧的 模式转向新的模式,管理器会记录这些变化并允许用户根据需要回滚到以前的任 何一种状态。这样花很小的代价就可以更新信息模型,也使基于数据集成中间件 的应用可以灵活地适应变化,这正是传统数据库技术所不具备的。
通过创建数据的逻辑视图,平台可以实现企业多个业务系统之间的数据共
第 1 页 共 11 页
享、数据交换。一个数据视图相当于一个数据抽取层,隐藏了数据的复杂性和它 们之间的关系,提出了一个更易于理解的数据模型,从而减少了访问应用程序数 据的复杂性。
中科启信数据集成平台的整体框架如下图所示。
XML Schema
企业应用集成包括数据集成、业务集成、界面集成等多个方面,其中数据集 成是具有基础性意义的一环,其主要目标便是能够实现各个异构数据源之间的数 据交换及共享,并且为上层用户提供统一的数据访问接口,有效地提高企业数据 资源的利用效率。
中科启信数据集成平台,就是在这样的背景下应运而生。它搭建了一个高效 统一的系统框架和数据架构体系,从整体上保持数据的一致性与高效访问,最大 限度地提高数据的共享,减少整体建设及运维成本。
(7) 安全管理
平台包含一个基于角色的安全管理框架,提供认证和授权功能,该框架符合 J2EE 标准。平台的安全模型符合 JAAS 的(Java 认证和授权服务)规格,提供 一致的基于 J2EE 的安全框架。使用 JAAS 模型,安全管理可以通过配置与 LDAP 和单点登录框架集成起来。
在安全框架内,每一个 XML 数据视图都可以指定一个特定的角色和组,角 色通过访问控制列表来管理,该列表指定哪些用户属于这个角色。这些角色通常 有应用服务器来管理,并通过 JAAS 暴露给平台。
2 方案概述
中科启信数据集成平台是企业级的数据集成服务产品,为分析型数据应用 (如基于数据仓库的多维分析、决策支持等)和操作型数据应用(如清单报表、 数据评估等)提供数据集成服务、数据集成平台和集成策略,满足数据应用项目 中各种数据集成需求。
方案以企业 IT 长远战略发展进行规划企业信息整合、数据集成架构;全面 评估企业数据基础,建立组织级数据规范和沟通标准;建立集中模式下统一管理、 稳定高效且灵活扩展的数据集成平台,引入先进集成工具或方法,综合系统发展 规划和e 管理
缓存管理器使用结果缓存技术把那些经常用到的信息保存在内存中,供应用 程序快速、高效率地访问。当用户定义一个视图时,可以根据需要选择是否缓存 视图,如果选择缓存,系统会创建一个时间表,表示在进行查询操作后进行缓存, 其时间间隔可以是分钟、小时、天、周或月。
(2) 元数据管理
元数据管理器用来跟踪和管理数据集成服务中间件中的所有元数据信息。元 数据可以来自于底层关系数据库,可以来自于对数据的集成定义,也可以从基于 客户的输入由数据集成服务引擎产生的附加注解中来。
元数据管理器会存储数据源位置、连接信息、格式、表结构、模式、关系、 命名惯例、索引、安全和系统共享等元信息。
统一数据访问接口以 XML 为数据交流格式,因为所有的编程语言都对 XML 提供了很好的处理支持,所以用不同程序语言开发的客户端都可以访问所有的数 据接口,从而实现真正意义上的数据统一访问。
3.6 平台应用
平台提供支持各种协议的应用接口,支持的协议包括 EJB、Servlet、Java API、 SOAP、HTTP 和 JMS,因此用户可以在平台之上做各种各样的应用。例如我们 可以基于平台做统计分析,生成报表、饼状图、柱状图等;可以通过集成平台为 数据仓库提供数据服务;可以在门户系统上使用数据集成平台等。