Spark保存HDFS示例

142 阅读 0 评论 94 点赞

我是靠谱客的博主欣慰向日葵，最近开发中收集的这篇文章主要介绍Spark保存HDFS示例，觉得挺不错的，现在分享给大家，希望可以做个参考。

概述

2019独角兽企业重金招聘Python工程师标准>>>

def saveAsNewAPIHadoopFile(
path: String,
keyClass: Class[_],
valueClass: Class[_],
outputFormatClass: Class[_ <: NewOutputFormat[_, _]],
conf: Configuration = self.context.hadoopConfiguration): Unit = self.withScope {
// Rename this as hadoopConf internally to avoid shadowing (see SPARK-2038).
val hadoopConf = conf
val job = NewAPIHadoopJob.getInstance(hadoopConf)
job.setOutputKeyClass(keyClass)
job.setOutputValueClass(valueClass)
job.setOutputFormatClass(outputFormatClass)
val jobConfiguration = job.getConfiguration
jobConfiguration.set("mapreduce.output.fileoutputformat.outputdir", path)
saveAsNewAPIHadoopDataset(jobConfiguration)
}

转载于:https://my.oschina.net/u/778683/blog/2982869

最后

以上就是欣慰向日葵为你收集整理的Spark保存HDFS示例的全部内容，希望文章能够帮你解决Spark保存HDFS示例所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错，欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(94)

本文分类：大数据
浏览次数：142 次浏览
发布日期：2023-12-07 05:00:19
本文链接：https://www.kaopuke.com/article/k-p-k_13_u_23_o_6_fz_12__23__14_y.html

相关文章

Spark架构原理-Master源码分析一、重要属性二、两个重要配置三、核心方法

Spark架构原理-Master源码分析一、重要属性二、两个重要配置三、核心方法

Spark知识体系完整解读

Spark 把RDD数据保存到hdfs单个文件中，而不是目录

Spark 把RDD数据保存到hdfs单个文件中，而不是目录

spark程序读写protobuf格式数据（java语言）在spark上，用protobuf替代json格式作为数据序列化存储

spark程序读写protobuf格式数据（java语言）在spark上，用protobuf替代json格式作为数据序列化存储

Spark保存HDFS示例

大数据之spark_spark中的序列化问题详解Task序列化问题

大数据之spark_spark中的序列化问题详解Task序列化问题

spark消费protobuf序列化的kafka数据存到hbase

spark消费protobuf序列化的kafka数据存到hbase

Spark之【数据读取与保存】详细说明

Spark之【数据读取与保存】详细说明

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部