1. 首页
  2. 大数据
  3. spark
  4. 全栈数据之门.rar

全栈数据之门.rar

上传者: 2019-07-13 02:47:40上传 RAR文件 16.7MB 热度 26次
全栈数据很好的入门书籍,高清带书签。以数据分析领域最热的Python语言为主要线索,介绍了数据分析库numpy、Pandas与机器学习库scikit-learn,使用了可视化环境Orange3来理解算法的一些细节。对于机器学习,既有常用算法kNN与Kmeans的应用,决策树与随机森林的实战,还涉及常用特征工程与深度学习中的自动编程器。在大数据Hadoop与Hive环境的基础之上,使用Spark的ML/MLlib库集成了前面的各部分内容,让分布式机器学习更容易。大量的工具与技能实战的介绍将各部分融合成一个全栈的数据科学内容。
用户评论