spark 结构化流,创建流式DataFrame和流式Datasets
创建流式DataFrame和流式DatasetsStreaming DataFrames可以通过SparkSession.readStream()返回的DataStreamReader接口(Scala / Java / Python文档)创建。Input Sources常见的内置SourcesFile source : 读取指定目录下的文件作为流数据,支持的文件格式有:text、csv、json、parquet、orc等Kafka source(常用): 从kafka读取数据Socket so