Kettle的部署与配置 详细步骤
一、ETL简介ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,它是构建数据仓库的重要环节,但其对象并不限于数据仓库。注:数据仓库是面向主题的、集成的、稳定的且随时间不断变化的数据集合,用以支持经营管理中的决策制定过程。二、Kettle简介(1)
一、ETL简介
ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,它是构建数据仓库的重要环节,但其对象并不限于数据仓库。
注:数据仓库是面向主题的、集成的、稳定的且随时间不断变化的数据集合,用以支持经营管理中的决策制定过程。
二、Kettle简介
(1)含义:Kettle的中文名称叫做水壶,该项目的主程序员Matt,希望把各种数据放到一个壶里,然后以一种指定的格式流出。
(2)背景:国外开源的ETL工具,纯Java编写
(3)运行平台:
服务器端支持:Windows Server, CentOS, RHEL, Ubuntu
开发客户端支持:Windows, Ubuntu Desktop, MacOS
浏览器端支持:Internet Explorer, Chrome, Firefox, Safari, Edge
可以在本地运行,也可以连接远程机器运行
(4)操作界面:图形化操作界面,同时也支持脚本编写开发
三、Kettle安装步骤
1.Java环境准备
由于 Kettle 是基于 java 的,因此需要安装 java 环境,并配置 JAVA_HOME 环境变量。
建议安装 JDK1.8 及以上,7.0以后版本的 Kettle 不支持低版本 JDK。
(1)如不知道自己电脑是否配置了java环境,可以先通过命令窗口检验,在键盘上同时按住Win+R,弹出运行窗口,输入cmd,回车进入
(2)输入java -version,看是否显示出版本信息,如未出现以下截图中的内容,说明未安装
已安装截图:
(3)下载jdk安装包,以window64为例
下载地址:https://www.oracle.com/cn/java/technologies/javase/javase-jdk8-downloads.html
(4)打开安装包,开始安装,一直点击下一步即可,直到显示安装完成,退出即可
(5)配置环境中心(以win10为例)
点击我的电脑->属性->高级系统设置->环境变量
【1】新建JAVA_HOME变量,变量值为jdk的安装目录
【2】编辑CLASSPATH变量,变量值为:
.;%JAVA_HOME%\lib;%JAVA_HOME%\lib\tool.jar
【3】编辑Path变量,添加变量的值为%JAVA_HOME%\bin
(6)测试:再次重复(1)~(2)步,在命令框里输入java -version,回车后显示版本信息则说明安装成功
2.Kettle下载与安装
(1)下载地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration/
(2)进入网站,可以选择现最新版本,也可以选择历史版本,选择最新版下载即可(此步将花费较长时间,建议至少空出3个小时以上的时间进行下载)
(3)将压缩包解压,找到spoon.bat,双击即可启动,如果经常用,建议右键创建快捷方式至桌面
3.mysql驱动下载与配置
(1)下载地址:https://downloads.mysql.com/archives/c-j/
(2)进入网站后可以选择下载版本以及操作系统
Product Version:选择你想下载的版本及可
Operating System :选择Platform Independen
(3)下载下方的zip文件,进行解压
(4)找到kettle的安装路径,再进入到lib文件夹下,将驱动包放到lib文件夹中
四、测试
(1)双击Spoon.bat,即启动Kettle
(2)双击会显示以下界面,要等待较长时间
(3)进去后选择File(文件)->New(新建)->Database Connection(数据库连接)
填写所要连接的数据库的基本信息,点击下方test,弹出测试成功的对话框即为成功
以上,Kettle就已安装配置完毕,连接好数据库后就可以根据你的需要来建立转换和作业啦
更多推荐
所有评论(0)