SparkStreaming自适应上游kafka topic partition数目变化
背景Spark Streaming 作业在运行过程中,上游 topic 增加 partition 数目从 A 增加到 B,会造成作业丢失数据,因为该作业只从 topic 中读取了原来的 A 个 partition 的数据,新增的 B-A 个 partition 的数据会被忽略掉。思考过程为了作业能够长时间的运行,一开始遇到这种情况的时候,想到两种方案:感知上游 to