我是靠谱客的博主 眼睛大丝袜,最近开发中收集的这篇文章主要介绍Flume 小记(一) 入门、小结、注意事项,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

一. 入门:安装、部署、及简单案例

  Flume 的安装,介绍,特性,核心概念等在这就不再赘述,请参考 http://www.aboutyun.com/thread-8917-1-1.html ,作者的介绍和案例都比较详细

二. HttpSource 使用小结

  这次主要拿 Flume 的HttpSource 做案例,用到了 File Roll Sink , HDFS Sink, 以实现将Http 的请求体 存到本地、 存到HDFS、及存到  Hive库的目的

  HttpSource 的案例请参考 https://my.oschina.net/pengqiang/blog/537380?p=  (需注意里面的http_test.conf 配置有一处拼写错误)

  注意几点: 

     (1) HttpSource  source 默认采用的handler 是 org.apache.flume.source.http.JSONHandler , 它的接收体是 List<Event>, 换言之它的接收体 是一个JsonArray,而且是有固定格式的 JsonArray, 其格式为 [{"headers":{"":""},"body":"the first event"},{"headers":{"":""},"body":"the second event"}], 即最外层必须是 [], header 是一个键值对map ,body 则是个字符串 ,例如 想发送  {"username":"xyz","password":"123"} 这样的json串, 应写成 [{"body":"{'username':'xyz','password':'123'}"}]

    (2) 控制台在输出日志时,仅输出body数据16字节内的数据,大于16字节将不会显示,但其实是完整收到了

    (3) 需要自定义请求格式,只需自定义handler实现 HTTPSourceHandler ,并重写其 getEvents() 方法即可

三. 记Flume-NG 一些注意事项

  参考 http://www.cnblogs.com/lxf20061900/p/4012847.html

最后

以上就是眼睛大丝袜为你收集整理的Flume 小记(一) 入门、小结、注意事项的全部内容,希望文章能够帮你解决Flume 小记(一) 入门、小结、注意事项所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(52)

评论列表共有 0 条评论

立即
投稿
返回
顶部