Informatica PowerCenter 7.1简易使用手册原:神州数码改:海联讯软件和集成中心编辑人:张旭2008 年11 月目录1. 使用Informatica PowerCenter 的准备工作 (3)1.1 启动Informatica Repository Server 和Informatica Server (3)1.2 创建资料库 (3)1.3 创建Folder (3)2. Informatica 客户端介绍 (3)3. Informatica PowerCenter 工作流程 (5)4. Step1:在Designer 中连接资料库 (5)5. Step2:打开Folder (7)6. Step3:引入数据源结构 (7)7. Step4:引入目标结构 (10)8. Step5:设计Mapping (11)9. Step6::设计Workflow (16)10. Step7:运行Workflow (20)11. Step8:查看作业运行情况 (21)1. 使用Informatica PowerCenter 的准备工作配合本手册使用的有两个文档:一个是安装手册;一个是中文的培训资料(介绍各客户端工具的用法)。
具体的可以参照使用,此处不再赘述1.1 启动Informatica Repository Server 和Informatica Server安装配置完后,就可以启动Informatica Repository Server:1、Windows 平台:控制面板-> 服务->启动Informatica Repository Server 和Informatica Server2、UNIX 平台:启动Repository Server 在安装目录RepServer 下,运行pmrepserver启动Informatica Server 在安装目录Server 下,运行pmserver1.2 创建资料库通过客户端Repository Server Administration Console 创建资料库具体参见安装手册相关章节1.3 创建Folder通过客户端Repository Manager 创建Folder具体参见安装手册相关章节2. Informatica 客户端介绍Informatica 提供基于对象的,无需编码的全图形化开发环境,最大地提高开发生产力,有5 个客户端工具:3. Informatica PowerCenter 工作流程在整个设计流程中涉及的客户端有:PowerCenter DesignerWorkflow ManagerWorkflow Monitor4. Step1:在Designer 中连接资料库需要连接已经创建好的资料库,方法如下:假设SQL_Test 是我创建的资料库,连接的方法有两种:1)选中后,鼠标右键->connect,见左图2)选中后,点击工具栏connect,见左图连接时需要输入用户名和密码5. Step2:创建并打开Folder资料库连接后,需要打开在Repository Manager 创建的Folder创建Folder方法:在菜单栏中找到Folder按钮,点击后选择Create打开Folder 的方法有几种:1)双击Folder2)选中Folder,右键—>open3)选中Folder,点击工具栏的OPEN6. Step3:引入数据源结构Folder 打开后,就可以进行实际的设计工作了。
首先要引入数据源结构介绍一下工作区:图Workspace_1Source Analyzer: 设定当前的工作区为Source Analyzer在Source Analyzer 中引入和创建源表结构,如:平面文件, XML, COBOL, Application 以及关系型数据源。
Warehouse Desinger: 设定当前的工作区为Warehuse Designer(8.1.1版中是Target Designer)使用Warehouse Designer 定义目标结构,如:关系型表, 平面文件, XML 文件等。
可以从关系型数据库、平面文件中引入结构,或者手工创建。
Transformation Developer: 设定当前的工作区为Transformation Developer使用Transformation Developer 来创建可复用的组件Mapplet Designer: 设定当前的工作区为Mapplet Designer使用Mapplet Designer 来创建mapplet,Mapplet 就是一系列可包含源结构以及转换组件的可复用逻辑。
Mapping Designer: 设定当前的工作区为Mapping Designer使用Mapping Designer 来创建mapping,mapping 就是一系列包括源、目标以及转换组件的逻辑组合,在这里面实现了数据转换的规则。
1、点击Source Analyzer,引入已经存在的数据源表结构。
数据源可以是RDBMS、Flat file、Cobol file、XML file、ERP(SAP 等)等对于RDBMS、Excel 等数据源需要定义ODBC,通过ODBC 连接以RDBMS 为例:图Workspace_2步骤:A.菜单栏中点SourceB.点击Import from Database按钮C.选择数据库类型,填入源数据库的用户名和密码D.选择要导入的表后,点OK键PS:导入的只是表结构按照图中标注操作,数据源结构就显示在Source Analyzer 工作区2、手工创建表结构在Source Analyzer 状态下,从菜单Sources->Create,弹出下面的界面:在上面的界面中选择Database type,输入Table name,然后点击Create->Done,这样就创建了一个空的结构。
双击或“Edit”,进入Column 定义界面,具体参见下图:数据源表结构引入后,就需要保存。
7. Step4:引入目标结构接下来引入目标结构。
在图Workspace_1 点击Warehouse Desinger(Target Designer),界面就由“Sources”变成了“Targets”。
引入目标结构的过程同“图Workspace_2:引入数据源结构”。
详细说明入下步骤:A.菜单栏中点TargetB.点击Import from Database按钮C.选择数据库类型,填入源数据库的用户名和密码(PS:因为要放入的目标库的表的结构和源数据一样,所以从源数据表中导入即可)D.选择要导入的表后,点OK键PS:导入的只是表结构。
但是上述步骤后,目标数据库中并没有相应的表,因为上述步骤只是将表结构导入到Designer软件的视图中。
所以下面还要在目标库中创建相应的表(结构)。
创建方法如下:通过菜单Targets->Generate/Execute SQL… ,见下图:在此界面中,generate from下的两项是指要在目标库中创建所有软件的操作界面(target designer)中的所有表还是在界面中选定的表,。
Generation options指创建表时,要把界面中的表结构的哪些属性传递给目标库中的表。
一般要选Create table,其它项根据实际项目情况选择,此例中按照上图中的选择点上勾就可以了。
然后点connect…按钮,在弹出的界面中填入目标库的连接信息以连接目标库,这个操作的作用是连接目标库,以便将最后产生的建表SQL语句在目标库中执行。
最后点Generate and execute按钮(作用:生成SQL语句,在目标库进行建表)。
完成后,会提示是否保存此次所执行的SQL语句,随意。
8. Step5:设计Mapping到此,数据源结构和目标结构都已经引入,接下来就可以设计Mapping 了。
Mapping 是ETL 设计的开始,是具体的ETL 规则设计,它包含三方面的信息:数据源信息、转换信息、目标信息。
在Mapping 中,主要工作就是转换。
Informatica PowerCenter 提供了20 多种组件,100 多个转换函数,基本上能够满足正常的需求;另外还可以调用外部的存储过程等。
此处举一个简单的例子,用来说明Mapping 设计流程。
需求描述:数据源是Customer 表,字段有CUST_ID、CUST_NAME 等,目标是ODS_CUSTOMER_ACTIVE,结构完全一样;转换的规则是将Customer.CUST_Name 分别加一后缀“_AA ”后赋给ODS_Customer.CUST_Name,其它数据原样加载。
设计思路:从需求看,转换部分需要使用表达式组件,负责CUST_Name 字符串处理。
在表达式组件中增加一新的字段,用来作为存储转换后的表达式结果,新的字段是CUST_Name_OUT,这个字段作为输出字段,输入字段就是CUST_Name(可以直接用鼠标从Source Qualifier 将字段拖入表达式组件),转换的表达式即CUST_Name||’_AA’。
1)点击Mapping Designer,将数据源和目标拖入工作区2)创建表达式组件,方法有二:①在工具栏处点击表达式组件,图标见下,直接拖入Mapping Designer 工作区②或者在菜单Transformation->Create,出现下面的界面在上图”Select transformation type”选择Expression,并输入新的名字:EXP_Cust_Name 3)将CUST_Name 拖入表达式组件,见下图:4)双击或编辑表达式组件,选择Ports,见下图图Workspace_3点击图Workspace_3 红颜色标注1 的按钮,新增一个Port,命名CUST_NAME_OUT,修改CUST_NAME 为输入,CUST_NAME_OUT 为输出(按照图Workspace_3 标识的操作)。
然后在图Workspace_3 红颜色标注2 处点击进入,书写表达式,见下图:图Workspace_4表达式的写法见图Workspace_4 ,这就是规则。
5)将CUST_NAME_OUT 传入目标表CUST_NAME,见下图:6)由于其它数据不做变化,直接加载,所以将SQL Qualifier 中的其它字段分别拖入目标ODS_CUSTOMER_ACTIVE,也可以利用Informatica 自动匹配功能,具体见下:①在Mapping Designer 工作区,右键,弹出一个菜单,见下:②选择Autolink,进入下图界面From:表示连接的源头,在这里选择SQ_CUSTOMERTo:表示连接的目标,在这里选择ODS_CUSTOMER_ACTIVEBy:Name 是按照名称匹配;Position 是按照位置匹配。