1. 首页
  2. 大数据
  3. Hive
  4. Hive优化.docx

Hive优化.docx

上传者: 2019-07-18 00:52:28上传 DOCX文件 81.99KB 热度 41次
Join查找操作的基本原则:应该将条目少的表/子查询放在Join操作符的左边。原因是在Join操作的Reduce阶段,位于Join操作符左边的表的内容会被加载进内存,将条目少的表放在左边,可以有效减少发生内存溢出错误的几率。Join查找操作中如果存在多个join,且所有参与join的表中其参与join的key都相同,则会将所有的join合并到一个mapred程序中。
用户评论