Hadoop文件系统— 通过FileSystem API 读取数据

221 阅读 0 评论 146 点赞

我是靠谱客的博主怕孤独毛巾，这篇文章主要介绍Hadoop文件系统— 通过FileSystem API 读取数据，现在分享给大家，希望可以做个参考。

通过FileSystem API 读取数据

Hadoop文件系统通过Hadoop Path对象（而非java.io.File对象表示，因为它的语义与本地文件系统联系太过紧密）来代表文件。

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;

import java.net.URI;

public class FileSystemDoubleCat{
    public static void main(String[] args) throws Exception{
        String uri=args[0];
        Configuration conf =new Configuration();
        FileSystem fs =FileSystem.get(URI.create(uri),conf);
        FSDataInputStream in =null;
        try{
             in=fs.open(new Path(uri));
             IOUtils.copyBytes(in,System.out,4096,false);
             in.seek(0);
            IOUtils.copyBytes(in,System.out,4096,false);
        }finally {
            IOUtils.closeStream(in);
        }
    }
}

FileSystem是一个通用的文件系统API，所以第一步是检测我们使用的系统实例，这里是HDFS。Configuration对象封装了客户端或者服务器的配置，通过设置配置文件路径来实现（如etc/hadoop/core-site.xml）。
在这里插入图片描述