概述
配置Hive递归查询子目录
Hive默认不递归查询子目录所以在创建表时,如果指定目录下有子目录会报ERROR:not a file,可以通过在hive-cli里面执行下面四条配置来在回话里面开启递归访问子目录,不会递归查询会把所有目录下面的数据加载进来,所以在子目录特别深或者子目录特别多时,速度会特别慢。
配置:
set hive.input.dir.recursive=true;
set hive.mapred.supports.subdirectories=true;
set hive.supports.subdirectories=true;
set mapred.input.dir.recursive=true;
最后
以上就是娇气老师为你收集整理的配置Hive递归查询子目录的全部内容,希望文章能够帮你解决配置Hive递归查询子目录所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复