大规模并行查询引擎BlinkDB.zip
BlinkDB是一个用于在海量数据上运行交互式SQL查询的大规模并行查询引擎。它允许用户通过权衡数据精度来提升查询响应时间,其数据的精度被控制在允许的误差范围内。
为了达到这个目标,BlinkDB使用两个核心思想:
一个自适应优化框架,从原始数据随着时间的推移建立并维护一组多维样本;
一个动态样本选择策略,选择一个适当大小的示例基于查询的准确性和(或)响应时间需求。
我们已经使用了TPC-H基准测试来评估BlinkDB的性能,实际分析工作负载来自ConvivaInc.和在FacebookInc的部署。
在VLDB2012中,BlinkDB
下载地址
用户评论