Spark递归读取文件夹删除HDFS文件

312 阅读 0 评论 206 点赞

我是靠谱客的博主英勇乐曲，这篇文章主要介绍Spark递归读取文件夹删除HDFS文件，现在分享给大家，希望可以做个参考。

在使用Spark 计算HDFS数据时会遇到整个文件夹文件读取，删除输出路径的需求，特此记录一次

递归读取文件：

sc
 .hadoopConfiguration
 .setBoolean("mapreduce.input.fileinputformat.input.dir.recursive", true)

删除已存在的路径：

def deleteOutPutPath(sc: SparkContext,outputPath: String):Unit={
    val path = new Path(outputPath)
    val hadoopConf = sc.hadoopConfiguration
    val hdfs = org.apache.hadoop.fs.FileSystem.get(hadoopConf)
    if(hdfs.exists(path)){
      hdfs.delete(path,true)
    }
  }

最后

以上就是英勇乐曲最近收集整理的关于Spark递归读取文件夹删除HDFS文件的全部内容，更多相关Spark递归读取文件夹内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(206)

本文分类：spark
浏览次数：312 次浏览
发布日期：2023-09-30 05:26:10

相关文章

windows安装es怎么在后台运行_Windows 环境下安装ES

windows安装es怎么在后台运行_Windows 环境下安装ES

spark在hdfs上自动寻找指定后缀的文件（使用层序遍历）———附带详细思路和代码0 背景1 代码原理2 代码

spark在hdfs上自动寻找指定后缀的文件（使用层序遍历）———附带详细思路和代码0 背景1 代码原理2 代码

spark读取hdfs文件的路径使用正则表达式

spark读取hdfs文件的路径使用正则表达式

SpringBoot 整合 elasticsearch 遇到的问题

SpringBoot 整合 elasticsearch 遇到的问题

Spark递归读取文件夹删除HDFS文件

Spark递归读取文件夹删除HDFS文件

安装elasticsearch碰到的坑

安装elasticsearch碰到的坑

ElasticSearch安装安装前提Windows环境安装Linux环境docke安装

ElasticSearch安装安装前提Windows环境安装Linux环境docke安装

ElasticSearch7安装过程以及遇到的坑

ElasticSearch7安装过程以及遇到的坑

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部