【flume监控oracle实时增量并推送至kafka】

110 阅读 0 评论 73 点赞

我是靠谱客的博主热情小笼包，最近开发中收集的这篇文章主要介绍【flume监控oracle实时增量并推送至kafka】，觉得挺不错的，现在分享给大家，希望可以做个参考。

概述

flume监控oracle实时增量并推送至kafka

- 启动kafka
- 检查topic
- - 创建topic
- 开启消费消息
- 检查flume配置文件
- - 启动agent
- 检查Kafka消费数据记录

该方式只能实现增量，修改删除不可用；

启动kafka

$KAFKA_HOME/bin/zookeeper-server-start.sh config/zookeeper.properties

$KAFKA_HOME/bin/kafka-server-start.sh config/server.properties

检查topic

$KAFKA_HOME/bin/kafka-topics.sh --list --zookeeper localhost:2181

创建topic

$KAFKA_HOME/bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 3 --topic testoracle

开启消费消息

./bin/kafka-console-consumer.sh   --bootstrap-server localhost:9092 --from-beginning --topic testoracle

检查flume配置文件

(数据库相关、增量开始字段、自定义查询等)

a1.channels = c1
a1.sources = r1
a1.sinks = k1
###########sql source#################
# For each one of the sources, the type is defined
#source组件类型名称，必须为org.keedio.flume.source.SQLSource
a1.sources.r1.type = org.keedio.flume.source.SQLSource
#与远程数据库连接的网址,这里我是oracle
a1.sources.r1.hibernate.connection.url = jdbc:oracle:thin:@X.X.X.X:1521/orcl
# Hibernate Database connection properties
#用于连接数据库的用户名
a1.sources.r1.hibernate.connection.user = user
#连接数据库的密码
a1.sources.r1.hibernate.connection.password = pwd
#是否自动提交
a1.sources.r1.hibernate.connection.autocommit = true
#Dialect to use by hibernate
a1.sources.r1.hibernate.dialect = org.hibernate.dialect.Oracle10gDialect
#驱动类
a1.sources.r1.hibernate.connection.driver_class = oracle.jdbc.driver.OracleDriver
#在运行查询完成后等待时间(ms)
a1.sources.r1.run.query.delay=10
#保存状态文件的路径
a1.sources.r1.status.file.path = /opt/flume/flumestatus
#保存状态文件的名称
a1.sources.r1.status.file.name = sqlSource.status
# Custom query
#查询开始的标识，使用你增量的字段。这里我用的时间毫秒值来做增量判断，可以根据业务来更改
a1.sources.r1.start.from = 0
#自定义查询语句，一定要确保查询结果的第一位置返回增量字段
a1.sources.r1.custom.query = SELECT * FROM (SELECT TO_NUMBER(create_time-TO_DATE('2021-11-01 08:00:00','YYYY-MM-DD HH24:MI:SS'))*24*60*60*1000 AS SJHM,id,name FROM testflume) WHERE SJHM>$@$ ORDER BY SJHM ASC
#批量大小
a1.sources.r1.batch.size = 1000
#最大行数
a1.sources.r1.max.rows = 1000
#连接池驱动类
a1.sources.r1.hibernate.connection.provider_class = org.hibernate.connection.C3P0ConnectionProvider
#连接池最小个数
a1.sources.r1.hibernate.c3p0.min_size=1
#连接池最大个数
a1.sources.r1.hibernate.c3p0.max_size=10
##############################
#channel的类型
a1.channels.c1.type = memory
#在channel中最多能保存多少个event
a1.channels.c1.capacity = 10000
#在每次从source获取数据后者将数据sink出去的一次事务操作中，最多处理的event数
a1.channels.c1.transactionCapacity = 10000
#在channel中最多容纳所有event body的总字节数
a1.channels.c1.byteCapacity = 800000
#这个值得含义跟上面一样，只不过这个计算event header跟最大可用内存的字节占比
a1.channels.c1.byteCapacityBufferPercentage = 20
##############################
#sink的类型
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
#kafka topic
a1.sinks.k1.topic = testoracle
#brokerList
a1.sinks.k1.brokerList = localhost:9092
#ack机制：1表示producer只要收到一个leader分区副本成功写入的通知就认为推送消息成功了。0代表producer发送一次就不在发送，不管成不成功。-1代表producer只有收到分区内所有副本成功写入的通知才认为推送成功
a1.sinks.k1.requiredAcks = 1
#batch的大小
a1.sinks.k1.batchSize = 20
a1.sinks.k1.channel = c1
 
a1.sinks.k1.channel = c1
a1.sources.r1.channels=c1

启动agent

./bin/flume-ng agent --conf ./conf --conf-file ./conf/test.conf --name a1 -Dflume.root.logger=INFO,console

检查Kafka消费数据记录

最后

以上就是热情小笼包为你收集整理的【flume监控oracle实时增量并推送至kafka】的全部内容，希望文章能够帮你解决【flume监控oracle实时增量并推送至kafka】所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错，欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：flume
浏览次数：110 次浏览
发布日期：2023-09-11 16:50:20
本文链接：https://www.kaopuke.com/article/k-p-k_14_uzo_6_f0_14__23__14_1.html

Oracle实时同步到HDFS、Kafka以及关系数据库的方法

flume全量抽取oracle,flume监控Oracle表变化增量抽取数据到kafka

flume+kafka+smart数据接入实施手册1. 概述2. 安装部署Flume3. 数据预处理4. Flume采集数据到Kafka5. Kafka数据落地6. 具体案例

企业级分布式实时搜索模型研究与实现SorlCloud+HBase+Flume-ng 企业级分布式实时搜索模型研究与实现SorlCloud+HBase+Flume-ng 通常我们在电信项目中采用HBase来存储用户终端明细数据等，供前台页面即时查询。HBase无可置疑拥有其优势，但其本身只对rowkey支持毫秒级的快速检索，对于多字段的组合查询却无能为力。针对HBase的多条件查询也有多种方案，实时搜索已成为信息检索领域的热点问题之一。但是有些方案要么太复杂，要么效率太低，本文

【flume监控oracle实时增量并推送至kafka】

概述

flume监控oracle实时增量并推送至kafka

启动kafka

检查topic

创建topic

开启消费消息

检查flume配置文件

启动agent

检查Kafka消费数据记录

最后

评论列表共有 0 条评论

发表评论取消回复

【flume监控oracle实时增量并推送至kafka】

概述

flume监控oracle实时增量并推送至kafka

启动kafka

检查topic

创建topic

开启消费消息

检查flume配置文件

启动agent

检查Kafka消费数据记录

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复