SparkSQL
Hive on Spark 是一个 Hive 的发展计划,该计划将 Spark 作为 Hive 的底层引擎之一,也就是。但是,随着 Spark 的发展,对于野心勃勃的 Spark 团队来说,Shark 对于 Hive 的太多依。常快,所以实际工作中,基本上采用的就是 SparkSQL。中大量的中间磁盘落地过程消耗了大量的 I/O,降低的运行效率,为了提高 SQL-on-Hadoop。开发,团队将所有资源放 SparkSQL 项目上,至此,Shark 的发展画上了句话,但也因此发。