当前位置:文档之家› 最新KETTLE使用说明中文版

最新KETTLE使用说明中文版

❖ 选择表输入, excel 输出,建立节点 连接。右击连接线,可编辑连线属 性。
5.1常用输入:
❖ 表输入 ❖ Excel 输入 ❖ 文本文件输入 ❖ XML 文件输入 ❖ CUBE 输入(多维数据集) ❖ 获取系统信息
5.2输入:表输入
❖ 选择表输入,点击鼠标右键,选择编辑步骤。 ❖ 步骤名称可以更改,一般更改为和输入表相关的名称。 ❖ 数据库连接 : 选择一个已建好的数据库连接,也可以新建一个。 ❖ 点击”获取SQL查询语句”,可弹出数据库浏览器,选择自己需要的表或视图。 ❖ 选择好表或视图后,SQL 区域会显示相应的SQL,如选择在SQL里包含字段名,你所
KETTLE使用说明中文版
➢1. 5 资源库自动登录
可以设置以下环境变量,来让 Spoon 自动登录资源库。 环境变量:KETTLE_REPOSITORY,KETTLE_USER, KETTLE_PASSWORD
➢1.6 定义 1.6.1 转换
1. Value : Values 是行的一部分,且包含以下类型的数据: Strings, floating point Numbers 、 unlimited precision BigNumbers、Integers、 Dates 或者 Boolean.
➢2 新建一个转换或任务
❖ 可以通过工具栏上的文件/新建/ 来建立一个转换或任务,也可以 直接在主对象页签栏双击转换, 新建一个转换。选择好需要创建 的文件类型后,将会根据你的选 择,创建一个图形界面。
❖ 转换
作业
➢3 数据库连接
❖ 一个连接描述了 kettle连接数据 库的方法,左边 的菜单展示了所 有可用的连接。
2. 局限性 这只是一个简单的SQL 编辑器,它不可能完 全知道超过20种它所支持的数据库的方言。 这意味着创建存储过程,触发器或者其他的 数据库对象可能带来很多问题。在这种情况 下,应考虑使用数据库自带的工具。
➢ 4.数据库浏览器
1. 描述 数据库浏览器只显示可用的表,视图或者目

➢ 5.新建一个转换
6.1 转换:排序记录
❖ 这个步骤利用你指定的字段排序行,无论他们是按照升序还是降序。 ❖ 当行数超过5000行的时候,Kettle 使用临时文件来排序行。 ❖ 排序目录:临时文件存储的目录,如果缺省则为标准的系统临时文件
➢ 3.2 SQL 编辑器(SQL Editor)
1. 描述 Spoon 提供简单SQL 编辑器 ,可以实现
创建表,删除索引或者修改字段。大多数的 DDL,例如: create / alter table ,create index , create sequence 命令都可以通过 SQL编辑器窗口运行。(新建转换,输出是 表输出时,可打开SQL 编辑器)
入流中的字段全部会获取到,不 需要的字段,可选中不需要的行, 右键删除。
5.4 输出:插入/更新
❖ 插入/更新:若流里的数据在目标表中不存在,执行插入,否则执行更新, 数据量不大的情况下,一般采用插入/更新操作。
5.5 输出:更新
❖ 这个步骤类似于插入/更新步骤,除了对数据不作插入操作之外。它仅仅 执行更新操作。
5.6 输出:删除
❖ 这个步骤类似于更新步骤,除了不更新操作之外,其他的行均被删除。
5.7 输出:表输出
❖ 这个步骤可以存 取信息到数据库 中
5.8 输出:XML输出
❖ 这个步骤允许你从源中写入行到一个或多个xml文件。
6.0 转换:去除重复记录
❖ 这个步骤从输入流中移除重复的记录 ❖ 步骤名称 : 在单一步骤中必须唯一 ❖ Redirect duplicate: 如果想知道多少重复行被去掉,就勾选此项。 ❖ 字段名 : 用来比较的字段的字段名称。
6. Note: 一个Note 是一个转换附加的文本注释信息。
1.6.2 任务 1. Job Entry : 一个Job Entry 是一个任务的一部分,它执行某些内容。 2. Hop: 一个Hop 代表两个步骤之间的一个或者多个数据流。一个Hop总是代
表着两个Job Entry 之间的连接,并且能够被原始的Job Entry设置,无 条件的执行下一个JobEntry,直到执行成功或者失败。
3. Note: 一个Note 是一个任务附加的文本注释信息。
➢1.7选项
你可以改变很多选项来增强图形用户界面的个性化。例如设置窗体的字体 和颜色。此选项在 Tools/选项 中设置。
➢1.8搜索元数据
❖ 通过 编辑/搜索元数据(ctr+f) பைடு நூலகம்使用这个特 性。
❖ 这个选项将在可用的字段、连接器、注释以 及所有加载的任务和转换中搜索,并展示搜 索的结果。
选择的表的所有字段均会显示. ❖ 在SQL区域用户可手动修改SQL语句。
5.3 输出:Excel 输出
❖ Excel 输出编辑步骤选项,有三 个选项卡, 文件/内容/字段。
❖ 文件选项卡: 文件名选择输出文 件保存的路径。
❖ 扩展名: 系统默认为xls. ❖ 内容选项卡: 一般不需做修改。 ❖ 字段选项卡:点击获取字段,输
➢ 3.1 选项
1. Connection name :定义转换或任务访问的连接的唯一名称,可自行 设置,但不能为空。
2. Connection Type:连接的数据类型 3. Access: 可以是Native(JDBC),odbc, oci,jndi.一般选择JDBC 4. HostName: 指定数据库部署的主机或者服务器的名称,也可以指定IP 地址。 5. DataBase Name :指定连接的数据库的名称,如果是ODBC方式就指定 DSN名称。 6. port Number : 设定数据库监听的TCP/IP端口号 7. user Name / password : 指定连接数据库的用户名和密码
2. Row : 一行包含0个或者个Values
3.Output Stream : 一个Output Stream 是离开一个步骤时的行的堆栈。
4 .Input Stream : 一个Input Stream 是进入一个步骤时的行的堆栈。
5. Hop: 一个Hop 代表两个步骤之间的一个或者多个数据流。一个Hop总是代 表着一个步骤的输出流和一个步骤的输入流。
相关主题