1. 首页
  2. 考试认证
  3. 其它
  4. CommonCrawl MapReduce程序利用Common Crawl数据分析Google Ads指标

CommonCrawl MapReduce程序利用Common Crawl数据分析Google Ads指标

上传者: 2024-10-29 06:23:04上传 ZIP文件 16.46KB 热度 1次

CommonCrawl-MapReduce在Common Crawl数据集的WARC文件中提供了Google Ads的使用指标。通过Apache Hadoop的Map Reduce框架实现这一目标。项目设置中包含多个类,依赖于CommonCrawl-Common项目。要在此项目上成功构建Maven文件,需先完成CommonCrawl-Common项目的构建。具体步骤如下:

  1. 检查并克隆CommonCrawl-Common项目。

  2. 在项目目录下运行以下命令进行Maven构建:


$> cd commoncrawl-common 

$> mvn clean install 

用户评论