我是
靠谱客的博主
鲜艳摩托,最近开发中收集的这篇文章主要介绍
hadoop的 pathfilter使用,觉得挺不错的,现在分享给大家,希望可以做个参考。
概述
Hadoop的PathFilter使用
源码接口定义:
- public interface PathFilter {
-
-
-
-
-
-
-
-
- boolean accept(Path path);
- }
用法:
- static class TextPathFilter extends Configured implements PathFilter {
- @Override
- public boolean accept(Path path) {
- FileSystem fs;
- try {
- fs = FileSystem.get(getConf());
- FileStatus fstatus = fs.getFileStatus(path);
- List<String> lstName = new ArrayList<String>();
- lstName.add("input1");
- lstName.add("input2");
- lstName.add("input3");
- lstName.add("input4");
- if(fstatus.isDirectory()) {
- return true;
- }
- if(fstatus.isFile() && lstName.contains(fstatus.getPath().getParent().getName())) {
- return true;
- }
- } catch (IOException e) {
- e.printStackTrace();
- }
-
- return false;
- }
-
- }
Driver类写的:
- FileInputFormat.addInputPath(job, new Path(otherArgs[0]));
- FileInputFormat.setInputDirRecursive(job, true);
- FileInputFormat.setInputPathFilter(job, TextPathFilter.class);
最后
以上就是鲜艳摩托为你收集整理的hadoop的 pathfilter使用的全部内容,希望文章能够帮你解决hadoop的 pathfilter使用所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复