微软大数据分析方案交流
微软的大数据方案,思维挺新颖的,讲的也比较接地气。
传统数据仓库的那套方式,放到现在数据动辄 PB 级的时代,确实有点跟不上节奏了。微软这边的做法是把Hadoop、NoSQL、流式这些东西揉一块,用来搞实时,响应也快,非结构化数据也方便。
有意思的是它强调了“全量数据”的思维,不再是抽样那一套,而是直接怼整库去挖掘,数据量大也能玩。还有相关性这个点,和以前讲因果关系不太一样,挺值得一试的。
如果你也在做企业级的数据,或者正在研究如何把数据仓库和流数据整合起来,建议去看看它的逻辑,和现在的一些 BI 工具结合用还蛮香的。
顺手还整理了几个配套资源,像Hadoop 平台、NoSQL 与大数据,都是蛮实用的干货。
如果你平时搞Java大数据开发,或者偏向云端的数据,这些资料可以当手册看,省去你自己搜的时间。
下载地址
用户评论