故意香水

文章
5
资源
0
加入时间
2年11月11天

hadoop:MapReduce (Writable)输出结果中文乱码解决

hadoop涉及输出文本的默认输出编码统一用没有BOM的UTF-8的形式,但是对于中文的输出window系统默认的是GBK,有些格式文件例如CSV格式的文件用excel打开输出编码为没有BOM的UTF-8文件时,输出的结果为乱码,只能由UE或者记事本打开才能正常显示。因此将hadoop默认输出编码更改为GBK成为非常常见的需求。自定义 TextOutputFormat.class 子类TextOutputFormat.class 类代码展示:package com.ljt.hdfs;imp.

lambda分页

import java.util.stream.Collectors;List<Map<String, Object>> result = list.stream().skip(pageSize * (pageNo - 1)).limit(pageSize).collect(Collectors.toList());此处 list 为所有数据,pageSize、pageNo 为分页参数。

设置Flume监听文件内容应用场景操作方案

应用场景 按照Hadoop完全分布式安装Flume博文,测试使用了Flume监听文件夹,当文件夹中添加了文件,Flume设置会立马进行收集文件夹中的添加的文件,那么这是一种应用场景,但是