Hadoop+Spark生态系统操作与实战指南
本书用于Hadoop+Spark快速上手,本书全面解析Hadoop和Spark生态系统,通过原理解说和实例操作每一个组件,让读者能够轻松跨入大数据分析与开发的大门。全书共12章,大致分为3个部分。第1部分(第1~7章)讲解了Hadoop的原生态组件,包括Hadoop、ZooKeeper、HBase、Hive环境搭建与安装,以及介绍MapReduce、HDFS、ZooKeeper、HBase、Hive原理和Apache版本环境下实战操作。第2部分(第8~11章)讲解Spark的原生态组件,包括SparkCore、SparkSQL、SparkStreaming、DataFrame,以及介绍Scala、SparkAPI、SparkSQL、Spark
用户评论
比较浅显易懂,适合大数据入门者
很清晰,还可以。
书不错,感谢分享。
还好 这书籍