搞怪舞蹈

文章
4
资源
0
加入时间
2年10月21天

Flume采集HDFS audit log日志至HDFS

1、背景HDFS的audit log产生数据量很大,速度也很快,在机器系统盘上必须立即持久化到HDFS,否则数据会被覆盖或者磁盘会打满。用于数据治理-HDFS废弃文件、Hive废弃表检测与清理。2、实现① Apache Flume官网下载最新版本的Flume。② 配置audit_log_hdfs.conf# 一个channel一个source 配置3个sinka1.sources = r1a1.sinks = k1 k2 k3a1.channels = c1# 数据来源,给c1配置s

python 将有序list打乱

利用random模块下的shuffle函数就可以实现。关于官网对于shuffle,我感觉说法上有一定的误解。上面是官网的解释,他说会返回打乱的list,其实什么也没有返回。可以看到返回的是None,实际上不是返回,而是在原先的list上进行修改。