java—返回日期,但在ApacheHadoop中按名称和值排序

ql3eal8s  于 2021-06-01  发布在  Hadoop
关注(0)|答案(1)|浏览(264)

你好,我不知道我的头衔是不是最好的,但我有一张单子:

201505011000######PEN DRIVE01470
201505011000#######NOTEBOOK11470
201605011000#######NOTEBOOK21471
201705011000#######NOTEBOOK21472
201705011000###GAVETA DE HD01472
201703011000###GAVETA DE HD01473

其中,例如: 201505 代表年份和月份,在 # 签名我有产品名称,还有价格 01470 代表 14,70 .
我需要做的是得到每个产品的较低价格,并显示该价格的年份和月份。但我不知道该怎么做,我能展示的是更低的价格和产品。
这是我的程序:mapper

package pkg.produto;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

public class MinProdutoMapper
        extends Mapper<LongWritable, Text, Text, IntWritable> {
    @Override
    public void map(LongWritable key, Text value, Context context)
            throws IOException, InterruptedException {
        String line = value.toString();
        String ano = line.substring(0, 6);
        String produto = line.substring(13, 27);//Nome do produto
        produto = produto.substring(produto.lastIndexOf("#") + 1);
        //String produto_ano = ano+produto ;
        int valor = Integer.parseInt(line.substring(27, 32));//Valor do produto
        context.write(new Text(produto), new IntWritable(valor));
    }
}

减速机

package pkg.produto;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

public class MinProdutoReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
    @Override
    public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {
        int minValue = Integer.MAX_VALUE;
        for (IntWritable value : values) {
            minValue = Math.min(minValue, value.get());
        }
        context.write(key, new IntWritable(minValue));
    }
}

有人能帮忙吗?

k5hmc34c

k5hmc34c1#

您可以查看二次排序,然后修改您的解决方案。下面是一个代码示例链接,可以帮助您解决问题。二次排序

相关问题