数仓工具—Hive集成篇之Kafka(03)

203 阅读 0 评论 134 点赞

我是靠谱客的博主冷傲犀牛，这篇文章主要介绍数仓工具—Hive集成篇之Kafka(03)，现在分享给大家，希望可以做个参考。

Hive 整合Kafka

这个方案很多，随便举几个例子,但是在此之前建议你先阅读优化实战篇—UDAF批量调用外部请求(02) 在这篇文章中我们实现了在UDAF 中实现了多线程。

Spark/Flink 读Hive 数据写入kafka ，反之也行
Flume 同步kafka 数据到hive
还有一些其他的工具 kafka-connect-hive,camus

基于kafka-connect平台实现的hive数据读取和写入插件，主要由source、sink两部分组成

source部分完成hive表数据的读取任务，kafka-connect将这些数据写入到其他数据存储层中，比如hive到ES数据的流入。

sink部分完成向hive表写数据的任务，kafka-connect将第三方数据源（如MySQL）里的数据读取并写入到hive表中

不过今天我们介绍两种我们我们不需要引入其他组件就可以搞定的方案

UDF 方案

下面是我们的代码，主要是UDAF 进行批量数据发送

package com.changan.voc.udf</

最后

以上就是冷傲犀牛最近收集整理的关于数仓工具—Hive集成篇之Kafka(03)的全部内容，更多相关数仓工具—Hive集成篇之Kafka(03)内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(134)

本文分类：# Hive
浏览次数：203 次浏览
发布日期：2023-12-18 01:25:16
本文链接：https://www.kaopuke.com/article/k-p-k_13_u_23_o_2_fz_14_j_26_w.html

相关文章

centos7部署两个mysql_基于 Canal 和 Kafka 实现 MySQL 的 Binlog 近实时同步

centos7部署两个mysql_基于 Canal 和 Kafka 实现 MySQL 的 Binlog 近实时同步

使用canal同步mysql数据库信息到RabbitMQ1、canal简介2、工作原理3、环境准备4、数据同步测试5、总结

使用canal同步mysql数据库信息到RabbitMQ1、canal简介2、工作原理3、环境准备4、数据同步测试5、总结

Camus配置

docker-compose安装和启动Canaldocker-compose安装和启动Canal

docker-compose安装和启动Canaldocker-compose安装和启动Canal

数仓工具—Hive集成篇之Kafka(03)

数仓工具—Hive集成篇之Kafka(03)

Docker部署Canal并将消息推送到RabbitMQ1 Docker部署MySQL2 Docker部署RabbitMQ3 Docker部署Canal4 JAVA代码读取

Docker部署Canal并将消息推送到RabbitMQ1 Docker部署MySQL2 Docker部署RabbitMQ3 Docker部署Canal4 JAVA代码读取

单节点canal的介绍和搭建（对接mysql和rocketMQ）一、简介二、使用

单节点canal的介绍和搭建（对接mysql和rocketMQ）一、简介二、使用

Docker-compose部署flink

Docker-compose部署flink

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部