Spark定制班第29课:深入理解Spark 2.x中的Structured Streaming内幕
本期内容:1. 新型的Spark Streaming思维2. Structured Streaming内幕Spark 2.0 仍有bug,不适合于生成环境。只用于测试。Spark 2.X提出了continuous application(连续的应用程序)的概念,非常重大。如图例所示,数据通过Kafka流进来,经过ETL,SS把数据看成一张表。一张没有边际的表、