一起学习Spark(五)结构化流Structured Streaming编程指南(1)-基本介绍
概述Structured Streaming是建立在SparkSQL引擎之上的可伸缩和高容错的流式处理引擎,我们可以像操作静态数据的批量计算一样来执行流式计算。当流式数据不断的到达的过程中Spark SQL的引擎会连续不断的执行计算并更新最终结果。DataSet/DataFrame的api也可以应用在Structured Streaming流式计算中,例如流式聚合,时间事件窗口,数据的join...