微笑豆芽

文章
5
资源
0
加入时间
3年0月21天

hive端的map端的优化手段

map存在的问题;1>map数过大,如果map数过大。在map端会产生大量的小文件(初始化和创建map数消耗资源过大)                          2>map数太小,job的执行度变小                          map的数取决于输入文件的大小,和文件的数决定,                         3>2种方法来增加map的...