impala 与hive 简单对比Impala支持开窗函数select name,orderdate,cost,sum(cost) over(partition by month(orderdate)) from business;
impalaImpala的优缺点优点基于内存运算,不需要把中间结果写入磁盘,省掉了大量的I/O开销。 无需转换为Mapreduce,直接访问存储在HDFS,HBase中的数据进行作业调度,速度快。 使用了支持Data locality的I/O调度机制,尽可能地将数据和计算分配在同一台机器上进行,减少了网络开销。 支持各种文件格式,如TEXTFILE、SEQUENCEFILE 、RCFile、Parquet。缺点对内存的依赖大,且完全依赖于hive。 实践中,分区超过1万,性能严..