友好咖啡豆

文章
12
资源
0
加入时间
3年0月8天

Clickhouse 空缺值处理背景模拟构建1.删除法2.填充固定值3.填充相邻值4.填充平均值5.填充枚举值6.他山之石法7.其他高级算法

由于这样那样的原因,我们从各个端收集回来的数据不一定是完整的,经常会碰到某些关键字段缺失的情况。如果做一般的大数据分析或者数据可视化,小部分的缺失其实影响不大,在预处理把含有空缺值的整条数据删掉就行了。但是也有一些特定的场景下不能这么简单了事,需要对数据进行补全。本文介绍在clickhouse中进行空缺值处理的几种方法。