hive在left join时丢数据
最近在用 hive 做ETL时,出现丢失数据的问题,几番查找下,最终把问题定位在 left join 上,问题如下:select *from aleft join b on a.b_id = b.idleft jon c on b.c_id = c.id; 在过程中,出现部分 c 表数据丢失,然而通过 a 表在源表查找时,确认当前条件下,是可以关联到 c 表有数据的。最终找到两种解决办法: 1)在不影响业务的情况下,用 join...