秀丽柚子

文章
7
资源
0
加入时间
3年0月8天

解决Hive创建文件数过多的问题一. Hive的创建文件数的限制解决办法:如何解决小文件的问题

一. Hive的创建文件数的限制Hive对文件创建的总数是有限制的,这个限制取决于参数:hive.exec.max.created.files,默认值是10000。如果现在你的表有60个分区,然后你总共有2000个map,在运行的时候,每一个mapper都会创建60个文件,对应着每一个分区,所以60*2000> 120000,就会报错:exceeds 100000.Killing the job解决办法:最简单的解决办法就是调大hive.exec.max.created.files