基于mapreduce的两个简单例子

81 阅读 0 评论 54 点赞

我是靠谱客的博主聪明冰淇淋，最近开发中收集的这篇文章主要介绍基于mapreduce的两个简单例子，觉得挺不错的，现在分享给大家，希望可以做个参考。

概述

Mapreudce开发：

（对路由数据进行过滤，只保留想要的几项。只有map没有reduce）

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.conf.Configured;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.NullWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.*;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

import org.apache.hadoop.util.Tool;

import org.apache.hadoop.util.ToolRunner;

public class Map extends Configured implements Tool {

public static class Map1 extends Mapper<LongWritable,Text,NullWritable,Text>{

enum Couter{

LINESKIP,//计数器

}

public void map(LongWritable key,Text value,Context context)throws IOException,InterruptedException{

String line=value.toString();//读取源数据

try{

String [] linespilt=line.split(" ");

String m=linespilt[0];

String t=linespilt[1];

String mac=linespilt[4];

String str=m+" "+t+" "+" "+mac;

Text tout=new Text(str);

context.write(NullWritable.get(), tout); //key t value

}catch(java.lang.ArrayIndexOutOfBoundsException e)

{

context.getCounter(Couter.LINESKIP).increment(1);//出错行加1

return;

}

public int run(String[] args)throws Exception{

Configuration conf=getConf();

Job job=new Job(conf,"lala");//作业名

FileInputFormat.addInputPath(job,new Path("hdfs://192.168.146.130:9000/user/hadoop/input/mptrys"));

FileOutputFormat.setOutputPath(job,new Path("hdfs://192.168.146.130:9000/mptryd"));

job.setMapperClass(Map1.class);//map的class

job.setOutputFormatClass(TextOutputFormat.class);

job.setOutputKeyClass(NullWritable.class);//指定输出key

job.setOutputValueClass(Text.class);//指定输出的Value

job.waitForCompletion(true);

return job.isSuccessful()?1:0;

}

public static void main(String args[])throws Exception{

int res=ToolRunner.run(new Configuration(),new Map(), args);

System.exit(res);

}

倒排：

package trymr2;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.conf.Configured;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.NullWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.*;

import org.apache.hadoop.mapreduce.Mapper.Context;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

import org.apache.hadoop.util.Tool;

import org.apache.hadoop.util.ToolRunner;

public class test2 extends Configured implements Tool {

public static class Map1 extends Mapper<LongWritable,Text,Text,Text>{

enum Couter{

LINESKIP,

}

public void map(LongWritable key,Text value,Context context)throws IOException,InterruptedException{

String line=value.toString();

try{

String [] linespilt=line.split(" ");

String calf=linespilt[0];

String calt=linespilt[1];

Text tcalf=new Text(calf);

Text tcalt=new Text(calt);

context.write(tcalt, tcalf);

}catch(java.lang.ArrayIndexOutOfBoundsException e)

{

context.getCounter(Couter.LINESKIP).increment(1);

return;

}

public static class Reduce extends Reducer<Text,Text,Text,Text>{

enum Couter{

LINESKIP,

}

public void reduce(Text key,Iterable<Text> value,Context

context)throws IOException,InterruptedException{

String val;

String out="";

for(Text vale:value){

val=vale.toString();

out+=val+"|";

}

//Text a=new Text(out);

context.write(key, new Text(out));

}

public int run(String[] args) throws Exception{

Configuration conf=getConf();

Job job=new Job(conf,"lala1");

FileInputFormat.addInputPath(job,new Path

("hdfs://192.168.146.130:9000/user/hadoop/input/lilanmr2"));

FileOutputFormat.setOutputPath

(job,new Path("hdfs://192.168.146.130:9000/mptryd12"));

job.setMapperClass(Map1.class);

job.setReducerClass(Reduce.class);

job.setOutputFormatClass(TextOutputFormat.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(Text.class);

job.waitForCompletion(true);

return job.isSuccessful()?1:0;

}

public static void main(String args[])throws Exception{

int res=ToolRunner.run(new Configuration(),new test2(), args);

System.exit(res);

}

最后

以上就是聪明冰淇淋为你收集整理的基于mapreduce的两个简单例子的全部内容，希望文章能够帮你解决基于mapreduce的两个简单例子所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错，欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：Hadoop
浏览次数：81 次浏览
发布日期：2024-01-11 06:15:25
本文链接：https://www.kaopuke.com/article/k-p-k_13_u_23_ogf0_14__7__26_4.html

基于mapreduce的两个简单例子

概述

最后

评论列表共有 0 条评论

发表评论取消回复

基于mapreduce的两个简单例子

概述

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复