使用Sqoop从mysql向hdfs或者hive导入数据时出现的一些错误

206 阅读 0 评论 136 点赞

我是靠谱客的博主喜悦高山，这篇文章主要介绍使用Sqoop从mysql向hdfs或者hive导入数据时出现的一些错误，现在分享给大家，希望可以做个参考。

1.原表没有设置主键，出现错误提示：

ERROR tool.ImportTool: Error during import: No primary key could be found for table xxx. Please specify one with --split-by or perform a sequential import with '-m 1'

提示说明的很清楚：在表xxx没有发现主键，使用--split-by指定一个column作为拆分字段或者在命令行上添加 ‘-m 1'，为什么会出现这样的错误提示，我们需要了解一下Sqoop的并行导入机制：

一般来说，Sqoop会创建4个进程，同时进行数据导入操作

如果要导入表的主键为id,并行的数量为4，那么Sqoop首先会执行如下一个查询：

select max(id) as max, select min(id) as min from table [where 如果指定了where子句];

通过这个查询，获取到需要拆分字段（id）的最大值和最小值，假设分别是1和1000。

然后，Sqoop会根据需要并行导入的数量，进行拆分查询，比如上面的这个例子，并行导入将拆分为如下4条SQL同时执行：

select * from table where 0 <= id < 250;

select * from table where 250 <= id < 500;

select * from table where 500 <= id < 750;

select * from table where 750 <= id < 1000;

注意，这个拆分的字段需要是整数。

如果要导入的表中没有主键，则我们应该手动选取一个合适的拆分字段。

首先查看表中有那些字段,如查看表student：desc student;

表中有id,name两个字段，那我们就可以选取id作为拆分字段，将表导入hive时在命令中添加 --split-by id,就不会报错了。

参考：http://www.cnblogs.com/gpcuster/archive/2011/03/01/1968027.html

2.Sqoop Hive exited with status 1

当从mysql向Hive导入数据时，执行：

 sqoop import --connect jdbc:mysql://localhost/hive --username hive --password hive --table dept_InnoDB --hive-table dept_InnoDB --hive-import --split-by deptno

出现以下错误：

13/06/27 18:35:05 INFO hive.HiveImport: Exception in thread "main" java.lang.NoSuchMethodError: org.apache.thrift.EncodingUtils.setBit(BIZ)B

13/06/27 18:35:10 ERROR tool.ImportTool: Encountered IOException running import job: java.io.IOException: Hive exited with status 1

google之，原来是机器上装的hive和hbase的版本不兼容造成的，在这里具体的说是hive和habse所使用的thrift版本不一样。当hive和hbase的jar包都添加到CLASSPATH时，运行Sqoop时只会激活一个版本的thrift，这样往往导致hive运行出错。

执行：

locate *thrift*.jar

看到：

果然，hive和hbase引用了不同版本的thrift.

这个问题解决起来也非常简单，将HBASE_HOME设置为空，让Sqoop不能加载hbase版本的thrift就OK了。

参考：http://stackoverflow.com/questions/16133156/sqoop-hive-exited-with-status-1

转载于:https://www.cnblogs.com/bjtu-leefon/p/3160549.html

最后

以上就是喜悦高山最近收集整理的关于使用Sqoop从mysql向hdfs或者hive导入数据时出现的一些错误的全部内容，更多相关使用Sqoop从mysql向hdfs或者hive导入数据时出现内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(136)

本文分类：数据库
浏览次数：206 次浏览
发布日期：2023-10-24 00:51:42
本文链接：https://www.kaopuke.com/article/k-p-k_13_u_23_o_22_f0_12__7__26_5.html

相关文章

sqoop 导入MySQL数据到Hive

sqoop 导入MySQL数据到Hive

hdfs mysql sqoop 失败_sqoop从mysql导入hdfs数据过程遇到的问题

hdfs mysql sqoop 失败_sqoop从mysql导入hdfs数据过程遇到的问题

sqoop从Mysql往HDFS导数据失败

sqoop从Mysql往HDFS导数据失败

Sqoop数据传输Sqoop简介一、RDBMS => HDFS二、RDBMS => Hive三、RDBMS => Hbase四、HDFS/Hive => RDBMS五、Hive => HDFS六、HDFS => Hive

Sqoop数据传输Sqoop简介一、RDBMS => HDFS二、RDBMS => Hive三、RDBMS => Hbase四、HDFS/Hive => RDBMS五、Hive => HDFS六、HDFS => Hive

使用Sqoop从mysql向hdfs或者hive导入数据时出现的一些错误

使用Sqoop从mysql向hdfs或者hive导入数据时出现的一些错误

sqoop将数据导入到hdfs

sqoop将数据导入到hdfs

sqoop导入数据常见问题解决方法

sqoop导入数据常见问题解决方法

mysql传到hdfs需要改格式吗_Sqoop将MySQL的表数据同步到HDFS（二）设置存储格式

mysql传到hdfs需要改格式吗_Sqoop将MySQL的表数据同步到HDFS（二）设置存储格式

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部