当前位置:文档之家› 商业智能与数据挖掘

商业智能与数据挖掘

历史数据 分段数据存储 OLAP 数据集市 企业门户
数据仓库管理
数据分析
查询及报表
用户
MES/ OLTP
企业 数据仓库
数据仓库, 模型
ETL(抽取, 转换, 加载)
数据挖掘 数据集市
其它数据 Business Modeling
数据仓库的应用
服务器端制定统计分析:静态报表,动态报表,应用
系统(Decision Support System 【DSS】、Executive Information System 【EIS】)等 OLAP(On-Line Analytical Processing ):用多维概 念视图对信息进行多角度、多层次的灵活分析。 客户端个性化统计分析:用户使用各类BI工具,如 SAS、SPSS、Minitab、Microsoft Reporting等,进行 日常报表编制、数据分析。 数据挖掘(Data Mining):找出数据中隐藏的模
宝钢股份数据仓库建设历程
1999年3月,启动公司数据仓库建设项目
2000年6月,完成了多达近7万字的公司数据仓库规
划 2001年7月,技术质量主题数据仓库建成 2002年12月,市场营销、生产物流、财务成本主题 数据仓库建成 2003年8月,设备管理主题数据仓库建成
静态报表
式,构造分析模型,进行分类和预测,并用可视 化工具提供挖掘结果。
商业智能( Business Intelligence ) :商业智能的概
念最早在1996年提出。当时将商业智能定义为一类由数据 仓库(或数据集市)、查询报表、数据分析、数据挖掘、数 据备份和恢复等部分组成的、以帮助企业决策为目的技术 及其应用。为了将数据转化为知识,需要利用数据仓库、 联机分析处理(OLAP)工具和数据挖掘等技术。因此,从技 术层面上讲,商业智能并不是什么新技术,它只是E (Extraction)T(Transformation)L(Load)、数据仓 库、 OLAP、数据挖掘、数据展现等技术的综合运用。商 业智能实际上就是一种解决方案。
据进行科学地加工处理,运用一定的计算模 型和工具进行科学地统计分析,从而起到对 管理和决策的支持作用。
管理的信息化:通过网络将原先流程所设计岗
位员工的工作通过计算机来实现以提高业务处 理的效率,从而提高企业的整体劳动生产率。
数据的信息化:将企业的所有信息都以数字化的 方式保存起来,并实现简单的查询和处理。
宝 钢 股 份 整 体 信 息 系 统
公司ERP系统
采购供应链管理
公司主干网
产销供应链管理
企业工作流系统 (企业信息门户)
生产控制计算机 过程控制计算机 基础自动化
数据仓库及 决策支持系统
查询
报表
CRM
DSS
EIS
OLAP客户端
DM
宝 钢 股 份 数 据 仓 库 逻 辑 架 构
S85平台
数据接口 中间层服务器(WEB server等)
数据挖掘(Data Mining):数据挖掘是从大量的数
据中,抽取出潜在的、有价值的知识(模型或规则) 的过程。描述型数据挖掘和预测型数据挖掘两种
商业智能价值
数据转化为知识,用知识辅助决策
知识发现
(KDD knowledge discovery in database)
评估 挖掘 转换 预处理 抽取 预处理后 的数据 转换后 的数据 数据 源数据 模式 知识
企业数据仓库存储 ODS 主题数据 MOLAP数据
元 数 据 管 理
系 统 管 理
数据读取、清洗、整理、转化、装载
企业ERP系统 各类源数据
L3其它系统
宝钢股份数据仓库逻辑架构图
宝钢股份企业数据仓库现状

企业统计数据集市 技术质量数据集市 销售管理数据集市 生产管理数据集市 设备管理数据集市 财务成本数据集市: 计划值、金属平衡、 成本分析、财务分析 生产管制信息系统 企业指标体系系统 生产厂区域分析: 炼钢、热轧、冷轧、条钢
数据集市(Data Mart):数据集市也可叫做“小数据
仓库”。如果说数据仓库是建立在企业级的数据模型之 上的话。那么数据集市就是企业级数据仓库的一个子 集,他主要面向部门级业务,并且只面向某个特定的 主题。数据集市可以在一定程度上缓解访问数据仓库 的瓶颈。
企业数据仓库模型
数据仓库构建 数据源
动态报表
MOLAP
内容
商业智能与数据挖掘概念
商业智能价值 宝钢商业智能方案
宝钢商业智能案例
企业信息化
企业信息化:通过对信息技术的应用、开发和使用企业的
信息资源,提高管理水平、开发能力、经营水平的过程
目的:利用信息化手段提高企业的竞争能力、创新能力和
Байду номын сангаас
持续发展的能力。
企业信息化的三个层次
决策的信息化:通过对那些信息化的原始数
商业智能的效能
收集数据信息 分析数据信息
知识 制定决策 制定行动计划 执行行动
宝钢数据仓库及相关应用
生产管理计算机系统的架构
ERP系统
L4 L3 L2 L1
(分厂级)生产控制计算机系统
过程控制计算机系统 基础自动化 基础自动化
宝钢企业信息门户
电子商务在线 宝钢在线
企业数据信息模型
实现从业务运行到运行管理、战略管理的转变 ,有效支持决策
OLTP系统面临的问题
操作型数据库的数据组织面向事务处理任务,各个业
务系统之间各自分离 ,数据库之间相互独立,形成数 据屏障,产生信息孤岛。 主要关心当前某一个时间段内的数据 。 没有有效手段将大量的数据转化成信息和知识。 无法满足快速响应决策需求
数据仓库(Data Warehouse):一个标准的定义是:
数据仓库是一个面向主题、集成、时变、非易失、稳 定的数据集合,是支持管理部门的决策过程。简单地 说,数据仓库就是储存数据的地方。它既可能是原始 的业务数据库,也可能是另外生成的。既可能是标准 的关系型数据库,也可能是包括了一些特定面向分析 特性的专门产品。
相关主题