工作中写hivesql容易犯错误的事项
最近工作由于接业务事项较多,发现写sql及容易犯的事项,即便工作多年的老sqlboy,也会犯这种错误,特此总结一下:1、null 字段不能做为关联字段,如果关联字段中有null,请用下边方式写,否则会丢失数据nvl(a.col,'-')=nvl(b.col,'-')2、where条件里的!= 会过滤值为null的数据这个和1的情况处理方式一样nvl(a.col,'-')!=3、左连接写也会数据倾斜,需要将数据单独取出处理数据量特别大的情况下连接也会出现数据倾斜,通常处理方式是将数据量特别