当前位置:文档之家› 《数据采集与预处理》教学教案—02认识数据预处理技术

《数据采集与预处理》教学教案—02认识数据预处理技术

数据采集与预处理教案
干信息。

二.任务实施
1.Pig系统环境的搭建
(1)下载Pig 官方网站下载pig-0.17.0-src.tar.gz,并解压到/usr/local 目录,解压操作如图1-16所示。

图1-16 解压Pig文件到相应目录
解压完成后进入/usr/local,将文件“pig-0.17.0-src”重命名为“pig”,以方便后续使用,如图1-17所示。

(2)配置环境变量
环境变量配置完成并保存后,执行“source ~/.bashrc”命令,使配置的环境变量生效。

(3)验证Pig是否安装成功
2.Kettle系统环境的搭建
(1)下载Kettle 在官方网站下载pdi-ce-7.0.0.0-25.zip,并解压到/usr/local目录
解压完成后进入/usr/local,将文件“data-integration”重命名为“kettle”,以方便后续使用
(2)配置环境变量
打开命令行窗口,输入“sudo vim ~/.bashrc”,配置环境变量环境变量配置完成并保存后,执行“Source ~/.bashrc”命令,使配置的环境变量生效。

(3)验证Kettle是否安装成功
打开命令行窗口,切换到/usr/local/kettle路径,执行“./spoon.sh”命令。

相关主题