大数据 : 互联网大规模数据挖掘与分布式处理

上传者：SuperVCD 2019-04-19 22:59:15上传 PDF文件 119.05MB 热度 30次

作者: Anand Rajaraman / Jeffrey David Ullman 出版社: 人民邮电出版社副标题: 互联网大规模数据挖掘与分布式处理原作名: Mining of Massive Datasets 译者: 王斌本书是在Anand Rajaraman和Jeff Ullman于斯坦福大学教授多年的一门季度课程的材料基础上总结而成的。该课程名为“Web挖掘”（编号CS345A），尽管它已经成为高年级本科生能接受并感兴趣的课程之一，但其原本是一门为高年级研究生设计的课程。本书内容简单来说，本书是关于数据挖掘的。但是，本书主要关注极大规模数据的挖掘，也就是说这些数据大到无法在内存中存放。由于重点强调数据的规模，所以本书的例子大都来自 Web本身或者Web上导出的数据。另外，本书从算法的角度来看待数据挖掘，即数据挖掘是将算法应用于数据，而不是使用数据来“训练”某种类型的机器学习引擎。本书的主要内容包括： (1) 分布式文件系统以及已成功应用于大规模数据集并行算法构建的Map-Reduce工具； (2) 相似性搜索，包括最小哈希和局部敏感哈希的关键技术； (3) 数据流处理以及面对快速到达、须立即处理、易丢失的数据的专用处理算法； (4) 搜索引擎技术，包括谷歌的PageRank、链接作弊检测及计算网页导航度（hub）和权威度（authority）的HITS方法； (5) 频繁项集挖掘，包括关联规则挖掘、购物篮分析、A-Priori及其改进算法； (6) 大规模高维数据集的聚类算法； (7) Web应用中的两个关键问题：广告管理及推荐系统。 Web本身或者Web上导出的数据。另外，本书从算法的角度来看待数据挖掘，即数据挖掘是将算法应用于数据，而不是使用数据来“训练”某种类型的机器学习引擎。本书的主要内容包括： (1) 分布式文件系统以及已成功应用于大规模数据集并行算法构建的Map-Reduce工具； (2) 相似性搜索，包括最小哈希和局部敏感哈希的关键技术； (3) 数据流处理以及面对快速到达、须立即处理、易丢失的数据的专用处理算法； (4) 搜索引擎技术，包括谷歌的PageRank、链接作弊检测及计算网页导航度（hub）和权威度（authority）的HITS方法； (5) 频繁项集挖掘，包括关联规则挖掘、购物篮分析、A-Priori及其改进算法； (6) 大规模高维数据集的聚类算法； (7) Web应用中的两个关键问题：广告管理及推荐系统。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

大数据互联网大规模数据挖掘与分布式处理

互联网大规模数据挖掘与分布式处理pdf，英文原版的翻译版

大小：0B | 2019-07-24 00:05:36
大数据互联网大规模数据挖掘与分布式处理

《大数据：互联网大规模数据挖掘与分布式处理》完整版《大数据：互联网大规模数据挖掘与分布式处理》

大小：0B | 2019-05-08 00:55:04
大数据：互联网大规模数据挖掘与分布式处理

大小：0B | 2019-04-11 05:29:14
大数据互联网大规模数据挖掘与分布式处理.pdf

大数据-互联网大规模数据挖掘与分布式处理由斯坦福大学“Web挖掘”课程的内容总结而成，主要关注极大规...

大小：0B | 2019-10-13 08:50:35
大数据加互联网大规模数据挖掘与分布式处理

大数据+互联网大规模数据挖掘与分布式处理

大小：0B | 2018-12-20 09:33:00
大数据互联网大规模数据挖掘与分布式处理中文

大数据：互联网大规模数据挖掘与分布式处理

大小：0B | 2019-05-20 01:52:49
《大数据：互联网大规模数据挖掘与分布式处理》迷你书

大小：0B | 2018-12-08 06:35:02
大数据互联网大规模数据挖掘与分布式处理2012.

大数据互联网大规模数据挖掘与分布式处理-2012.

大小：119.11MB | 2020-10-27 00:46:53
大数据互联网大规模数据挖掘

这是一本描述大数据的挖掘及分布式处理的书籍

大小：0B | 2019-09-25 17:14:56
大数据-互联网大规模数据挖掘与分布式处理第2版

大小：0B | 2019-01-07 23:07:47
大数据：互联网大规模数据挖掘与分布式处理，中文完整pdf

大小：0B | 2018-12-08 06:34:59
大数据互联网大规模数据挖掘与分布式处理第2版

大数据互联网大规模数据挖掘与分布式处理第2版2015.07

大小：0B | 2019-07-09 19:34:56
大数据-互联网大规模数据挖掘与分布式处理.part2

大小：0B | 2018-12-08 06:35:04
【高清版】大数据：互联网大规模数据挖掘与分布式处理.pdf

大小：0B | 2018-12-08 06:35:06
大数据_互联网大规模数据挖掘与分布式处理part2

大数据互联网大规模数据挖掘与分布式处理

大小：0B | 2019-05-31 18:24:59
大数据互联网大规模数据挖掘与分布式处理.part1

第1章数据挖掘基本概念...............................11.1数据挖掘...

大小：0B | 2019-09-03 07:09:23