使用MapReduce实现输入目录下图片的去重

Name: 使用MapReduce实现输入目录下图片的去重
Rating: 4.5 (36 reviews)
Author: debtor617

上传者：debtor617 2023-03-11 10:57:51上传 ZIP文件 35.44KB 热度 36次

下面是使用Java语言编写的MapReduce程序，可以将指定目录下的图片进行去重，输出去重后的结果到指定目录下。具体实现过程如下：

// 导入所需的包
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.*;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.IOException;

public class ImageDeduplication {
  public static class Map extends MapReduceBase implements Mapper<text, byteswritable="" byteswritable,="" text,=""> {
    private Text outputKey = new Text();

    public void map(Text key, BytesWritable value, OutputCollector""> output, Reporter reporter) throws IOException {
      // 将图片数据转换为Base64编码
      String imageBase64 = javax.xml.bind.DatatypeConverter.printBase64Binary(value.getBytes());

      // 将图片Base64编码作为key，图片数据作为value输出
      outputKey.set(imageBase64);
      output.collect(outputKey, value);
    }
  }

  public static class Reduce extends MapReduceBase implements Reducer<text, byteswritable="" byteswritable,="" text,=""> {
    public void reduce(Text key, Iterator values, OutputCollector""> output, Reporter reporter) throws IOException {
      // 只输出第一个key对应的图片数据
      output.collect(key, values.next());
    }
  }

  public static void main(String[] args) throws Exception {
    JobConf conf = new JobConf(ImageDeduplication.class);
    conf.setJobName("Image Deduplication");

    // 设置MapReduce的输入输出路径
    FileInputFormat.addInputPath(conf, new Path(args[0]));
    FileOutputFormat.setOutputPath(conf, new Path(args[1]));

    // 设置MapReduce的Mapper和Reducer
    conf.setMapperClass(Map.class);
    conf.setReducerClass(Reduce.class);

    // 设置MapReduce的输出格式
    conf.setOutputKeyClass(Text.class);
    conf.setOutputValueClass(BytesWritable.class);

    JobClient.runJob(conf);
  }
}
</text,>byteswritable></text,>text,></text,>

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

使用MapReduce实现输入目录下图片的去重

下面是使用Java语言编写的MapReduce程序，可以将指定目录下的图片进行去重，输出去重后的结果...

大小：35.44KB | 2023-03-11 10:57:51
使用python opencv对目录下图片进行去重的方法

今天小编就为大家分享一篇使用python opencv对目录下图片进行去重的方法,具有很好的参考价值...

大小：44KB | 2020-11-17 22:05:57
目录下图片转PDF

目录下图片转PDF，多种形式，PDF名称为文件夹名称，也可以合成单个图片对应一个PDF。还是很好用的...

大小：0B | 2019-08-17 17:35:15
批量修改编号递增目录下图片名称

进行大批量的修改指定路径下的图片的名称，方便快捷。

大小：0B | 2019-05-19 17:38:06
易语言随机显示目录下图片到图片框源码

易语言随机显示目录下图片到图片框源码,随机显示目录下图片到图片框

大小：3KB | 2020-08-22 07:28:33
e语言随机显示目录下图片到图片框源码

随机显示目录下图片到图片框易语言源码例程是读取指定目录下所有的JPG图片名称,随机显示其中一个图片。...

大小：2KB | 2020-08-20 19:11:07
Win10目录下图片搜索查询例程源码.rar

在视觉应用项目中,在一个Win10目录下,可能保存上万个中途拍照日志图片。如果在win10资源管理打...

大小：8.66MB | 2020-08-23 09:42:43
缩略图方式浏览某个目录下图片效果的列表框

1.QQ:513187410 2.保证无毒 3.简单,方便,实用 4.实例可以自行改用 5.如有非法...

大小：1.93MB | 2020-11-17 08:08:25
PHP实现随机显示目录下的图片

大小：0B | 2019-01-19 03:08:45
Authware指定目录下的图片循环显示

指定目录下的图片循环显示,点击后显示大图!

大小：16KB | 2021-04-29 12:06:25
读取目录下随机命名所有图片

读取指定目录下所有照片，照片可以是jpg，bmp等，可自己设定，读取图片名字可以是随机命名的，读图后...

大小：0B | 2019-05-05 05:38:37
将目录下文件读取去重后写入txt文档

将目录的一系列txt文件按行读取，去重之后写入到一个单独的txt文件中

大小：0B | 2019-09-07 15:25:01
android通过图片名称获取drawable目录下的图片

android通过图片名称获取drawable目录下的图片~~~~~~~~~~~~~~~~~

大小：0B | 2019-07-19 02:17:08
android查找指定目录下的视频或图片

本来一直想调用系统图库打开指定目录下的图片或者视频，到网上查看了很久，发现只能查看全部，而我需要打开...

大小：0B | 2019-07-06 17:12:33
Android查找指定目录下的视频或图片

大小：0B | 2018-12-08 12:23:15
nodejs读取目录下的图片并以json返回

大小：0B | 2019-01-11 04:05:18