正直秀发

文章
3
资源
0
加入时间
3年0月21天

网站访问日志(二)通过Mapreduce 初步清洗数据得到weblogbean数据

网站访问日志(二)通过Mapreduce 初步清洗数据原始数据文件:百度网盘 /02.参考资料\网站流量日志分析:项目脚本-配置代码/access.log.fensi需求:对原始数据进行清洗 ,得到我们想要的11个字段数据。同时对不合法的数据标记为false 【1.状态码>400的 2.请求的request中包含过滤的静态资源的字段的 3.通过空格split 长度小于11的都标记为f...