和谐月饼

文章
5
资源
0
加入时间
2年10月21天

spark比hadoop快的原因

(1)spark大量使用内存(2)核心数据结构:RDD(弹性分布式数据集),在此基础上提供了许多计算函数,(3)在原先hadoop下一个map或reduce实现的功能,在spark下可以拆分成多个job.如果把hadoop看做罐子里的大石头,那么spark的job就是罐子里的碎石子,可以装的更多。()