Spark Structured Streaming笔记一、流处理基础二、Structured Streaming基础三、Event time和有状态处理四、生产中的Structured Streaming
一、流处理基础1. 流处理是连续处理新到来的数据以更新计算结果的行为。在流处理中输入数据是无边界的,没有预定的开始或结束。它是一系列到达流处理系统的事件(例如信用卡交易、点击网站动作,或从物联网IoT传感器读取的数据),用户应用程序对此事件流可以执行各种查询操作(例如跟踪每种事件类型的发生次数,或将这些事件按照某时间窗口聚合)。应用程序在运行时将输出多个版本的结果,或者在某外部系统(如HBas...