BI开源工具对比和分析
OPENI 基本介绍
标准J2EE WEB应用软件架构 支持以下三种数据源创建报表 多维数据库(OLAP Servers) 关系型数据库(RDBMS Servers,如:MSSQL,MYSQL,ORACLE等) 数据挖掘服务器(|Data Mining Servers) 数据源连接方式 XMLA连接多维数据库,支持提供XMLA接口的所有OLAP Servers,如 Mondrian, Microsoft Analysis Services ,Hyperion Essbase等. JDBC连接关系型数据库 R-PROJECT接口连接数据挖掘服务器 基于Jpivot开源框架(OLAP JSP TAG)开发OLAP展示层
PENTAHO使用的开放标准和协议
PENTAHO BI 平台使用的开放标准和协议包: XML – W3C 的可扩展标记语言 JSR-94 – JCP 的规则引擎 API JSR-168 – JCP 的 Portlet Spec SVG – W3C 的可扩展适量图形(Scalable Vector Graphics) XPDL – WFMC 的 XML 流程定义语言 XForms W3C 的 Web Forms MDX – Microsoft 的 OLAP 查询语言 WSBPEL – Oasis 的 Web 服务业务流程执行语言 WSDL - W3C 的 Web 服务描述语言 SOAP - W3C 的简单对象访问协议
OLAP概述
OLAP,(On-Line Analytical Processing)即联机分析处理,是 BI的一种全 新的数据封装方式,直接产物是报表或Cube,是使分析人员、管理人员或执行人 员能够从多角度对信息进行快速、一致、交互地存取,从而获得对 数据的更深入 了解的一类软件技术。 OLAP和OLTP的对比,如下图:
PENTAHO整合的第三方开源组件
BI 框架集成和增强了现有的流行的第三方开放源码组件: Mondrian OLAP 服务器和 jPivot Analysis Front-End Firebird RDBMS Enhydra ETL,Shark 和 JaWE 工作流 JBoss 应用程序服务器,Hibernate 和 Portal Weka 数据挖掘 JasperReport, JfreeReport报表组件 Eclipse 工作台和 BIRT 报表组件 JOSSO 单点登录和 LDAP 集成
OPENI架构图
开发框架 Mondrian Jpivot 报表引擎 jasper report, JFreeChart 数据挖掘接口 R-Project
OPENI 图表展示效果
PENTAHO基本介绍
Pentaho BI 平台是一个以工作流为核心,面向解决方案的,可扩展的商务智能 平台。其目的在于将一系列企业级BI产品、开源软件、API等等组件集成起来, 方便商务智能应用的开发。它的出现,使得一系列的面向商务智能的独立产品如 Jfree、Quartz等等,能够集成在一起,构成一项项复杂的、完整的商务智能解决 方案。 目前,Pentaho的主要组成元素包括OLAP Server,ETL,报表生成、分析、数据 挖掘和工作流管理等等。这些组件通过J2EE、WebService、SOAP、HTTP、 Java、JavaScript、Portals等技术集成到Pentaho平台中来。Pentaho的发行, 主要以Pentaho SDK的形式进行。
BI开源工具的介绍
独立功能项目: 数据库引擎 Mondrian ETL 工具 Enhydra Octopus,JasperETL OLAP客户端组件 Jpivot 报表引擎组件 JasperReport,JFreeChart,JfreeReport,BIRT 数据挖掘组件 Weka
BI开源工具的介绍
BI的来源和简介
BI是Business Intelligence的英文缩写, 中文解释为商务智能,用来帮助企业 更好地利用数据提高决策质量的技术 集合,是从大量的数据中钻取信息与 知识的过程。简单讲就是业务、数据、 数据价值应用的过程。
BI的技术实现步骤
从技术角度来说 BI 包含了 ETL、DW、OLAP、DM等多环节。简单的说就是把交易 系统已经发生过的数据,通过ETL工具抽取到主题明确的数据仓库中,OLAP后生 成Cube或报表,透过Portal展现给用户,用户 利用这些经过分类、聚集、描述 和可视化的数据,支持业务决策。
PENTAHO整合的第三方开源组件
BI 框架集成和增强了现有的流行的第三方开放源码组件: Mondrian OLAP 服务器和 jPivot Analysis Front-End Firebird RDBMS Enhydra ETL,Shark 和 JaWE 工作流 JBoss 应用程序服务器,Hibernate 和 Portal Weka 数据挖掘 JasperReport, JfreeReport报表组件 Eclipse 工作台和 BIRT 报表组件 JOSSO 单点登录和 LDAP 集成
PENTAHO总体架构图
PENTAHO工作流引擎
Pentaho BI 平台是一个以 业务流程 为中心的,面向 solution 的商业智能平 台 。 Pentaho BI 平台使用一个 工作流引擎 执行 活动。这个 工作流引擎 使用一 种标准语言,XML 业务流程 定义 Language (XPDL),在系统里执行 活动。例 如:你想运行一个查询,找出那个部门超出了预算,为每个那样的部门运行一个 预算报表,最后 email 每个报表给部门经理。这用 XPDL 进行定义,以一个 业 务流程 来执行。
Байду номын сангаас
产品整合项目: 轻量级项目: OpenI、Jasper Intelligence 基本介绍:二者主要功能都集中在前端展现这一块,且都是使用Mondrian和 Jpivot框架,报表引擎是jasper report,OpenI相对发展比较成熟,以下轻量级产 品将重点介绍OpenI 重量级项目: PENTAHO 、SpagoBI 基本介绍:功能相当,集成了相当多的开源项目,如JfreeReport、Mondrian、 Kettle、Weke等.开发组件包括工作流引擎、中心资源库、审计组件、报表设计 工具、ETL工具、OLAP Server、多维展示、数据挖掘组件等. PENTAHO在中 国使用比较多,文档多,中文支持做的相当好,开发较便利,而且Pentaho得到 了很大的投资,开发后劲很大,以下重量级产品将重点介绍PENTAHO.