基于成本的Spark SQL优化器框架 上传者:aleyz98406 2019-10-13 10:58:29上传 PDF文件 751.09KB 热度 31次 我们把基于成本的优化器框架贡献给社区版本Spark2.2。在我们的框架中,我们计算每个数据库操作符的基数和输出大小。通过可靠的统计和精确的估算,我们能够在这些领域做出好的决定:选择散列连接(hashjoin)操作的正确构建端(buildside),选择正确的连接算法(如broadcasthashjoin与shuffledhashjoin),调整连接的顺序等等。这个基于成本的优化器框架对SparkSQL查询的性能有很好的提升。在这次演讲中,我们将展示SparkSQL的新的基于成本的优化器框架及其对TPC-DS查询的性能影响。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论 aleyz98406 资源:17 粉丝:0 +关注 上传资源 免责说明 本站只是提供一个交换下载平台,下载的内容为本站的会员网络搜集上传分享交流使用,有完整的也有可能只有一分部,相关内容的使用请自行研究,主要是提供下载学习交流使用,一般不免费提供其它各种相关服务! 本站内容泄及的知识面非常广,请自行学习掌握,尽量自已动脑动手解决问题,实践是提高本领的途径,下载内容不代表本站的观点或立场!如本站不慎侵犯你的权益请联系我们,我们将马上处理撤下所有相关内容!联系邮箱:server@dude6.com