概述
hive操作时,
如果使用insert+values进行数据插入,会非常慢 可以插入数据 但是效率不高。
原因:底层hive会把插入语句编译成MapReduce程序来执行!
为什么用load?
-
含义:加载装载数据 也是hive推荐的插入表数据的方式。
-
本质:加载操作是将结构化的数据文件移动到与 Hive表对应的位置(位于hdfs上)的纯复制/移动操作。
-
注意:在加载的过程中 hive不会对数据进行任何修改 只是搬运移动复制的过程。(cp mv)
最后
以上就是温暖果汁为你收集整理的hive为什么不用mysql而用load的全部内容,希望文章能够帮你解决hive为什么不用mysql而用load所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复