1. 首页
  2. 大数据
  3. spark
  4. Spark高级数据分析(完整版)

Spark高级数据分析(完整版)

上传者: 2018-12-09 11:14:27上传 PDF文件 17.8MB 热度 51次
这是一本实用手册,四位作者均是Cloudera公司的数据科学家,他们联袂展示了利用Spark进行大规模数据分析的若干模式,而且每个模式都自成一体。他们将Spark、统计学方法和真实数据集结合起来,通过实例向读者讲述了怎样解决分析型问题。   本书首先介绍了Spark及其生态系统,接着详细介绍了将分类、协同过滤及异常检查等常用技术应用于基因学、安全和金融领域的若干模式。如果你对机器学习和统计学有基本的了解,并且会用Java、Python或Scala编程,这些模式将有助于你开发自己的数据应用。   本书介绍了以下模式:   音乐推荐和Audioscrobbler数据集   用决策树算法预测森林植被   基于K均值聚类进行网络流量的异常检测   基于潜在语义分析技术分析维基百科   用GraphX分析伴生网络   对纽约出租车轨迹进行空间和时间数据分析   通过蒙特卡罗模拟来评估金融风险   基因数据分析和BDG项目   用PySpark和Thunder分析神经图像数据
用户评论
码姐姐匿名网友 2018-12-09 11:14:27

好资源,值得好好学习