hadoop框架之flume总结及监控Ganglia整合Flume
Flume一、Flume简介1) Flume 提供一个分布式的,可靠的,对大数据量的日志进行高效收集、聚集、移动的服务,Flume 只能在 Unix 环境下运行。2) Flume 基于流式架构,容错性强,也很灵活简单。3) Flume、Kafka 用来实时进行数据收集,Spark、Storm 用来实时处理数据,impala 用来实时查询。二、Flume角色Source...