CommonCrawl-Spark:Google Ads Explorer程序使用来自Common Crawl的数据来创建...
CommonCrawl-Spark在Common Crawl Dataset的WARC文件中提供Google Ads的使用指标。使用Apache Spark来做到这一点。设置这个项目有几个类依赖于CommonCrawl-Common项目。在此项目上进行maven构建之前,您需要检查CommonCrawl-Common项目并运行“mvn clean install”。结帐项目:
$> cd commoncrawl-common
$> mvn clean install
下载地址
用户评论