Spark基础【介绍、入门WordCount案例】一 概述二 WordCount
HadoopSparkHadoopSpark由上面的信息可以获知,Spark出现的时间相对较晚,并且主要功能主要是用于数据计算,所以其实Spark一直被认为是Hadoop框架的升级版,但其实不是NameNode是单点的,容易出现单点故障,制约了集群的发展NameNode是单点的,受到了硬件的制约,制约了集群的发展MapReduce运行速度太慢,主要因为设计理念的问题,MR早期就是用于单一数据计算,在当前数据挖掘和数据迭代计算情景中不适用MR框架和Hadoop耦合性非常强,无法分离增加了一个资源调