我是靠谱客的博主 着急水蜜桃,最近开发中收集的这篇文章主要介绍数据仓库-dwt层表的分区规划,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

行:维度对象的累计汇总行为

列:维度ID+维度模型中与该维度相关的事实表的度量的累积汇总。

分区:截止当日的全量的历史累计

dwt的字段是dws字段的n倍。dws仅计算用户当天的汇总数据,dwt包含 首次、末次、最近n天、开始到至今等指标。最近n天的指标每天都有,具有时效性。

用户主题

DROP TABLE IF EXISTS dwt_user_topic;
CREATE EXTERNAL TABLE IF NOT EXISTS dwt_user_topic
(
`user_id` STRING
COMMENT '用户id',
`login_date_first` STRING COMMENT '首次活跃日期',
`login_date_last` STRING COMMENT '末次活跃日期',
`login_date_1d_count` STRING COMMENT '最近1日登录次数',
`login_last_1d_day_count` BIGINT COMMENT '最近1日登录天数',
`login_last_7d_count` BIGINT COMMENT '最近7日登录次数',
`login_last_7d_day_count` BIGINT COMMENT '最近7日登录天数',
`login_last_30d_count` BIGINT COMMENT '最近30日登录次数',
`login_last_30d_day_count` BIGINT COMMENT '最近30日登录天数',
`login_count`

最后

以上就是着急水蜜桃为你收集整理的数据仓库-dwt层表的分区规划的全部内容,希望文章能够帮你解决数据仓库-dwt层表的分区规划所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(40)

评论列表共有 0 条评论

立即
投稿
返回
顶部