我是靠谱客的博主 娇气老师,这篇文章主要介绍配置Hive递归查询子目录,现在分享给大家,希望可以做个参考。

配置Hive递归查询子目录

Hive默认不递归查询子目录所以在创建表时,如果指定目录下有子目录会报ERROR:not a file,可以通过在hive-cli里面执行下面四条配置来在回话里面开启递归访问子目录,不会递归查询会把所有目录下面的数据加载进来,所以在子目录特别深或者子目录特别多时,速度会特别慢。

配置:
set hive.input.dir.recursive=true;
set hive.mapred.supports.subdirectories=true;
set hive.supports.subdirectories=true;
set mapred.input.dir.recursive=true;

最后

以上就是娇气老师最近收集整理的关于配置Hive递归查询子目录的全部内容,更多相关配置Hive递归查询子目录内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(137)

评论列表共有 0 条评论

立即
投稿
返回
顶部