kettle连接hive
版本说明:kettle:pdi-ce-8.3.0.0-371.zip
Hadoop集群:hadoop-3.3.2
hive: hive-3.1.3
1、修改kettle的plugin.properties 文件(文件位置D:programfiledata-integrationpluginspentaho-big-data-plugin)
主要设置
active.hadoop.configuration=hdp30
.
2、从Hadoop、hive上下载相关文件并替换kettle中对应的文件
sz core-site.xml hdfs-site.xml yarn-site.xml mapred-site.xml

sz hive-site.xml

要替换kettle文件的位置:D:programfiledata-integrationpluginspentaho-big-data-pluginhadoop-configurationshdp30
3、从hive的lib目录上下载以hive开头的jar包并替换kettle中对应的包
sz hive-*

要替换kettle中的包的位置:
D:programfiledata-integrationpluginspentaho-big-data-pluginhadoop-configurationshdp30lib
说明:把hdp30中以hive开头的包删除后再替换即可;注意是要放在hdp30目录下的lib文件夹,而不是像把Oracle/MySQL驱动一样放在data-integration目录下的lib文件夹
4、验证
启动Hadoop集群及hiveserver2服务
重启ketlle
如下建立db连接,恭喜测试成功!

最后
以上就是大气台灯最近收集整理的关于kettle连接hive的全部内容,更多相关kettle连接hive内容请搜索靠谱客的其他文章。
发表评论 取消回复