Spark 是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。Hadoop 是由 java 语言编写的,在分布式服务器集群上存储海量数据并运行分布式 分析应用的开源框架。Spark 是一种由 Scala 语言开发的快速、通用、可扩展的大数据分析引擎。主要功能主要是用于数据计算。Hadoop MapReduce 由于其设计初衷并不是为了满足循环迭代式数据流处理,因此在多 并行运行的数据可复用场景(如:机器学习、图挖掘算法、交互式数据挖掘算法)中存 在诸多计算效率等问题。所以 Spark 应运
大数据
2023-07-05
75 点赞
1 评论
113 浏览