离线和实时大数据开发实战.朱松岭(带详细书签).pdf
阿里巴巴大数据开发专家撰写,源于十余年工作实践,只讲实用有效的“招式”。庖丁解牛式讲解离线和实时开发平台架构、原理实现、开发示例,涵盖查询与优化、建模、数仓开发、流计算开发等核心技术。本书分为三部分。第一部分:从整体上给出数据大图和数据平台大图,主要介绍数据的主要流程、各个流程的关键技术、数据的主要从业者及他们的职责等;数据平台大图分离线和实时分别给出数据平台架构、关键数据概念和技术等;第二部分:离线数据技术是整个数据处理技术的根本和基础,介绍离线数据处理的主要技术,包含hadoop、hive、维度建模等,另外此部分还将综合上述各种离线技术给出离线数据处理实战;第三部分:集中介绍实时数据处理的各项技术,包含Storm、sparksteaming、Flin
用户评论
写的确实不错
还可以还可以