1. 首页
  2. 数据库
  3. 其它
  4. 数据湖|ApacheHudi设计与架构最强解读

数据湖|ApacheHudi设计与架构最强解读

上传者: 2021-02-01 11:34:18上传 PDF文件 485.55KB 热度 15次
ApacheHudi(简称:Hudi)使得您能在hadoop兼容的存储之上存储大量数据,同时它还提供两种原语,使得除了经典的批处理之外,还可以在数据湖上进行流处理。 这两种原语分别是: Update/Delete记录:Hudi使用细粒度的文件/记录级别索引来支持Update/Delete记录,同时还提供写操作的事务保证。查询会处理最后一个提交的快照,并基于此输出结果。变更流:Hudi对获取数据变更提供了一流的支持:可以
用户评论