1. 首页
  2. 数据库
  3. 其它
  4. 大数据计算平台Spark内核全面解读

大数据计算平台Spark内核全面解读

上传者: 2021-02-01 08:01:53上传 PDF文件 309.96KB 热度 9次
Spark是起源于美国加州大学伯克利分校AMPLab的大数据计算平台,在2010年开源,目前是Apache软件基金会的顶级项目。随着 Spark在大数据计算领域的暂露头角,越来越多的企业开始关注和使用。2014年11月,Spark在Daytona GraySort100TBBenchmark竞赛中打破了由HadoopMapReduce保持的排序记录。Spark利用1/10的节点数,把100TB数据的排序时间从72分钟提高到了23分钟。Spark在架构上包括内核部分和4个官
用户评论