我是靠谱客的博主 娇气老师,最近开发中收集的这篇文章主要介绍配置Hive递归查询子目录,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

配置Hive递归查询子目录

Hive默认不递归查询子目录所以在创建表时,如果指定目录下有子目录会报ERROR:not a file,可以通过在hive-cli里面执行下面四条配置来在回话里面开启递归访问子目录,不会递归查询会把所有目录下面的数据加载进来,所以在子目录特别深或者子目录特别多时,速度会特别慢。

配置:
set hive.input.dir.recursive=true;
set hive.mapred.supports.subdirectories=true;
set hive.supports.subdirectories=true;
set mapred.input.dir.recursive=true;

最后

以上就是娇气老师为你收集整理的配置Hive递归查询子目录的全部内容,希望文章能够帮你解决配置Hive递归查询子目录所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(41)

评论列表共有 0 条评论

立即
投稿
返回
顶部