单身电话

文章
6
资源
0
加入时间
3年1月13天

Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 | ApacheCN Spark Streaming 编程指南 概述 一个入门示例 基础概念 Performance Tuning (性能调优) Fault-tolerance Semantics (容错语义) 快速链接

Spark Streaming 是 Spark Core API 的扩展, 它支持弹性的, 高吞吐的, 容错的实时数据流的处理. 数据可以通过多种数据源获取, 例如 Kafka, Flume, Kinesis 以及 TCP sockets, 也可以通过例如 map, reduce, join, window 等的高级函数组成的复杂算法处理. 最终, 处理后的数据可以输出到文件系统, 数据库以及实时仪表盘中. 事实上, 你还可以在 data streams(数据流)上使用 机器学习 以及 图形处理