flume抓取mysql数据_10分钟教你如何用flume抽取mysql数据至hdfs

328 阅读 0 评论 217 点赞

我是靠谱客的博主敏感饼干，这篇文章主要介绍flume抓取mysql数据_10分钟教你如何用flume抽取mysql数据至hdfs，现在分享给大家，希望可以做个参考。

本文主要向大家介绍了如何用flume抽取mysql数据至hdfs，通过具体的实例让大家了解，希望对大家学习mysql有所帮助。

场景分析：

一般情况下关系型数据库(mysql、oracle、sqlserver)数据抽取至hdfs、hive、hbase使用sqoop工具。

但sqoop数据抽取的底层依靠mapreduce，处理的实时性得不到保证。如果能将数据抽取和Sparkstreaming+Sparksql结合将大大提高了处理效率。因而想到了flume抽取关系型数据库数据至kafka中，有Sparkstreaming读取。本文介绍如何通过flume抽取mysql数据至hdfs，后面会介绍kafka+sparkStreaming的流程。

sql数据库表">1.建立mysql数据库表

控制台登录mysql后运行下命令：

use test;

create table wlslog

(id int not null,

time_stamp varchar(40),

category varchar(40),

type varchar(40),

servername varchar(40),

code varchar(40),

msg varchar(40),

primary key ( id )

);

insert into wlslog(id,time_stamp,category,type,servername,code,msg) values(1,’apr-8-2014-7:06:16-pm-pdt’,’notice’,’weblogicserver’,’adminserver’,’bea-000365’,’server state changed to standby’);

insert into wlslog(id,time_stamp,category,type,servername,code,msg) values(2,’apr-8-2014-7:06:17-pm-pdt’,’notice’,’weblogicserver’,’adminserver’,’bea-000365’,’server state changed to starting’);

insert into wlslog(id,time_stamp,category,type,servername,code,msg) values(3,’apr-8-2014-7:06:18-pm-pdt’,’notice’,’weblogicserver’,’adminserver’,’bea-000365’,’server state changed to admin’);

insert into wlslog(id,time_stamp,category,type,servername,code,msg) values(4,’apr-8-2014-7:06:19-pm-pdt’,’notice’,’weblogicserver’,’adminserver’,’bea-000365’,’server state changed to resuming’);

insert into wlslog(id,time_stamp,category,type,servername,code,msg) values(5,’apr-8-2014-7:06:20-pm-pdt’,’notice’,’weblogicserver’,’adminserver’,’bea-000361’,’started weblogic adminserver’);

insert into wlslog(id,time_stamp,category,type,servername,code,msg) values(6,’apr-8-2014-7:06:21-pm-pdt’,’notice’,’weblogicserver’,’adminserver’,’bea-000365’,’server state changed to running’);

insert into wlslog(id,time_stamp,category,type,servername,code,msg) values(7,’apr-8-2014-7:06:22-pm-pdt’,’notice’,’weblogicserver’,’adminserver’,’bea-000360’,’server started in running mode’);

commit;

2. 建立相关目录与文件

(1)创建本地状态文件

mkdir -p /var/lib/flume

cd /var/lib/flume

touch sql-source.status

chmod -R 777 /var/lib/flume

(2)建立HDFS目标目录

hdfs dfs -mkdir -p /flume/mysql

hdfs dfs -chmod -R 777 /flume/mysql

3. 准备JAR包

从https://book2s.com/java/jar/f/flume-ng-sql-source/download-flume-ng-sql-source-1.3.7.html下载flume-ng-sql-source-1.3.7.jar文件，并复制到Flume库目录。我用的是ambari搭建的集群因此命令如下：

cp flume-ng-sql-source-1.3.7.jar /usr/hdp/current/flume-server/lib/

将MySQL JDBC驱动JAR包也复制到Flume库目录。

cp mysql-connector-java-5.1.17.jar /usr/hdp/current/flume-server/lib/mysql-connector-java.jar

4. 配置Flume

ambari主页面如下操作：Ambari -> Flume -> Configs -> flume.conf中配置如下属性：agent.channels.ch1.type = memory

agent.sources.sql-source.channels = ch1

agent.channels = ch1

agent.sinks = HDFS

agent.sources = sql-source

agent.sources.sql-source.type = org.keedio.flume.source.SQLSource

agent.sources.sql-source.connection.url = jdbc:mysql://你的ip:3306/test

agent.sources.sql-source.user = root

agent.sources.sql-source.password = 你的密码

agent.sources.sql-source.table = wlslog

agent.sources.sql-source.columns.to.select = *

agent.sources.sql-source.incremental.column.name = id

agent.sources.sql-source.incremental.value = 0

agent.sources.sql-source.run.query.delay=5000

agent.sources.sql-source.status.file.path = /var/lib/flume

agent.sources.sql-source.status.file.name = sql-source.status

agent.sinks.HDFS.channel = ch1

agent.sinks.HDFS.type = hdfs

agent.sinks.HDFS.hdfs.path = hdfs://你的namenode主机名/flume/mysql

agent.sinks.HDFS.hdfs.fileType = DataStream

agent.sinks.HDFS.hdfs.writeFormat = Text

agent.sinks.HDFS.hdfs.rollSize = 268435456

agent.sinks.HDFS.hdfs.rollInterval = 0

agent.sinks.HDFS.hdfs.rollCount = 0

重启flume服务。hdfs对应目录下将会查看到数据

本文由职坐标整理并发布，了解更多内容，请关注职坐标数据库MySQL数据库频道！

最后

以上就是敏感饼干最近收集整理的关于flume抓取mysql数据_10分钟教你如何用flume抽取mysql数据至hdfs的全部内容，更多相关flume抓取mysql数据_10分钟教你如何用flume抽取mysql数据至hdfs内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：flume抓取mysql数据
浏览次数：328 次浏览
发布日期：2023-12-12 22:25:05

flume抓取mysql数据_10分钟教你如何用flume抽取mysql数据至hdfs

最后

评论列表共有 0 条评论

发表评论取消回复

flume抓取mysql数据_10分钟教你如何用flume抽取mysql数据至hdfs

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复