Flume中常用Source和Channel类型的特点
Source选择NetCat Source一个NetCat Source用来监听一个指定端口,并将接收到的数据的每一行转换为一个事件。TailDir Source:断点续传、多目录。Flume1.6以前需要自己自定义Source记录每次读取文件位置,实现断点续传。Exec Source可以实时搜集数据,但是在Flume不运行或者Shell命令出错的情况下,数据将会丢失。Spooling Directory Source监控目录,支持断点续传。Channel选择Kafka Channel