瘦瘦板栗

文章
4
资源
0
加入时间
2年10月21天

[hive]数仓分层|用户纬度拉链表|维度建模 一、数仓分层 二、纬度建模

针对上述场景可以设计一张地区表,其主键为地区ID,字段为:下单次数,下单金额,支付次数,支付金额等,上述所有指标统一进行计算,并将结果保存在该宽表中,这样就能有效避免数据的重复计算。数据时间漂移:用户手机中存的前端的数据会累积到一定条数再发送到服务器,例如80条,假如用户1-1存了40条就关掉了app,1-2打开了app,这40条的数据就会变成1-2的了。dwd层是对事实表的处理,代表的是业务的最小粒度层,任何数据的记录都可以从这一层获取,为后续的dws和dwt层做准备。用户维度表:维度表。