BI平台选型
Pentaho介绍(DI)
1个server: DI Server: 使用DI engine来做数据转换和基础 4个Designer工具 Spoon: 定义job和转换的建模工具,转换:定义了数据的flow, job:包含了资源获 取,执行其他转换。 Kitchen: 执行job的命令行,可以通过crontab调用 Pan: 执行Transformation的命令行 Carte:远程执行job和transformation的web server 2个plugin: Instaview: 使用模板来管理复杂的数据访问和准备 Agile BI: 提供一套BI的协助工具
Bizgres Pentaho
SpagoBI jasper
Talend for ETL,JasperReports 使用Talend作为ETL
无
支持
C
1. BI系统概述
ontent
2. 主流开源BI系统
3. 建议选择
4. Pentaho平台
5. Pentaho计划
建议选择
• 基于以上的对比分析,建议选用pentaho作为我们的BI平台。 优点:
C
1. BI系统概述
ontent
2. 主流开源BI系统
3. 建议选择
4. Pentaho平台
5. Pentaho计划
Pentaho计划
鉴于pentaho是个庞大复杂的平台体系,学习掌握需要一定的时间和人员。但从其 功能范围以及扩展性来看,一旦为我所用,则能避免很多重复的开发工作,并为后 续的需求提供快捷的支持。 Pentaho分为两大体系:BA和DI,建议分2人各专注一块,用约1个月的时间熟悉其 使用,配置,开发。使用目前已有数据,建立ETL流程,建立演示环境,输出demo 报表。后续再评估其效用,根据产品需求和内部规划,建立正式的生产BI平台,承 担正式的产品需求,对外提供各种服务。
Data Integration: DI组件, ETL工具等,侧重数据模型和转换。
Pentaho介绍(BA)
1个核心server: BA Server和user console:web界面用来管理用户创建的报表内容和业务逻辑, 4个web based Designer工具 Report Designer: 报表设计器 Analyzer: 过滤和可视化数据 Interactive Reports: 交互性报表环境 Dashboard Designer:设计dashboard 3个client based Designer工具: Aggregation Designer:从不同维度创建聚合表 Metadata Editor:创建metadata domain和model Schema workbench:创建和编辑多维模型,为模型增加安全和计算
•
• •
成熟稳定性:pentaho社区版目前还不断更新中, 目前最新版本5.2
文档完备性:pentaho社区版的官方文档较完备,中文文档也较多。 中文支持:报表支持中文。
•
• • •
可扩展性:pentaho集成了很多优秀的开源组件,具,JfreeReport报表组件。
• •
BI系统介绍
C
1. BI系统概述
ontent
2. 主流开源BI系统
3. 建议选择
4. Pentaho平台
5. Pentaho计划
主流开源BI系统介绍
开源BI Openi 特点 量级 架构 使用Mondrian和Jpivot框架,报表引 擎是jasper report,数据挖掘接口是 R-Project, 相对来说开发和学习比较简单 大数据支持 无 中文 不 基于Java开发的Web应用,能对关系数据库和 轻 数据挖掘服务器进行分析和报表展示,非常 易于使用和部署;但目前已经不在发布单独 版本,而是和pentaho集成,为其提供plugin 卓越的数据处理性能, 但目前已经没有维护了 以工作流为核心的、强调面向解决方案而非 重 工具组件的 BI 套件, Pentaho 偏向于与业务流 程相结合的BI解决方案,侧重于大中型企业应 用。相对 spagoBi 来说功能较强,尤其是工作 流一块做的相当不错。相关文档比较全 使用java开发,有很强的扩展能力,相关文档 较少。 jasper report的支持最好,所以报表部分比较 好,其它部分较弱 重 轻 比较大的框架了,集成了相当多的 支持hbase, 开源项目, JfreeReport 、 Mondrian 、mapreduce Kettle 、 Weka 基本都使用了。特别 适合大型复杂项目的开发 支持
开源BI平台选型
C
1. BI系统概述
ontent
2. 主流开源BI系统
3. 建议选择
4. Pentaho平台
5. Pentaho计划
BI系统介绍
• BI(Business Intelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有 的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的 业务经营决策。通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的 业务经营决策的工具。 组成系统:由数据仓库(或数据集市)、ETL流程、联机分析处理 (OLAP) 、查询报表、 数据分析、数据挖掘等部分组成。 中端BI,数据分析。高端BI,数据挖掘。低端:报表阶段。
支持大数据接入,如Hbase, mapreduce. 重量级平台,它包含的组件很多,体系很庞大,学习掌握需要时间。 虽然中文文档相对于其他开源平台为多,但多是老版本的,最新版本的文档只有英文。
劣势:
C
1. BI系统概述
ontent
2. 主流开源BI系统
3. 建议选择
4. Pentaho平台
5. Pentaho计划
Pentaho介绍
Pentaho介绍
是一个统一,综合的开源商务智能平台套件(Suite),基于它,可以访问,集 成,操作,可视化,分析各种数据来源,帮助你从数据中发现所需要的知识, 有收费的EE版本和开源的CE版本。目前CE最新为5.2 采用的开源组件: OLAP : Mondrian 数据挖掘:WEKA 报表:JFreeReport ETL:kettle 分为2大系统: Business Analytics: BA组件,主要是可视化,报表,侧重于业务和展示。