Spark读取HDFS文件

80 阅读 0 评论 53 点赞

我是靠谱客的博主凶狠电灯胆，最近开发中收集的这篇文章主要介绍Spark读取HDFS文件，觉得挺不错的，现在分享给大家，希望可以做个参考。

概述

import org.apache.spark._
import SparkContext._

object WordCount {
    def main(args: Array[String]){
      if(args.length != 3){
        println("usage: com.qiurc.test.WordCount <master> <input> <output>")
        return
      }
      val sc = new SparkContext(args(0), "WordCount",
          System.getenv("SPARK_HOME"), Seq(System.getenv("SPARK_QIUTEST_JAR")))
      val textFile  = sc.textFile(args(1))
      val result = textFile.flatMap(_.split(" "))
              .map(word => (word, 1)).reduceByKey(_ + _)
      result.saveAsTextFile(args(2))

    }
}

最后

以上就是凶狠电灯胆为你收集整理的Spark读取HDFS文件的全部内容，希望文章能够帮你解决Spark读取HDFS文件所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错，欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(53)

本文分类：spark
浏览次数：80 次浏览
发布日期：2023-09-30 04:30:40
本文链接：https://www.kaopuke.com/article/k-p-k_14_uzogfw_13_j_6_y.html

相关文章

spark中 hdfs文件路径检测是否存在、删除hdfs路径

spark中 hdfs文件路径检测是否存在、删除hdfs路径

如何在spark中删除hdfs的某个文件夹

如何在spark中删除hdfs的某个文件夹

[Spark][Python]对HDFS 上的文件，采用绝对路径，来读取获得 RDD

[Spark][Python]对HDFS 上的文件，采用绝对路径，来读取获得 RDD

spark读取hdfs路径下的数据_大数据实践解析（下）：Spark的读写流程分析

spark读取hdfs路径下的数据_大数据实践解析（下）：Spark的读写流程分析

Spark读取HDFS文件

spark 显示hdfs 路径_Hadoop基础HDFS介绍(一）

spark 显示hdfs 路径_Hadoop基础HDFS介绍(一）

spark读取hdfs路径下的数据_Spark读取HDFS数据分区参考

spark读取hdfs路径下的数据_Spark读取HDFS数据分区参考

Spark基础知识系列一（从hdfs获取文件）Spark获取文件

Spark基础知识系列一（从hdfs获取文件）Spark获取文件

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部