1. 首页
  2. 数据库
  3. 其它
  4. 腾讯TDW:大型Hadoop集群应用

腾讯TDW:大型Hadoop集群应用

上传者: 2021-02-01 10:08:33上传 PDF文件 333.28KB 热度 21次
TDW(Tencent distributedDataWarehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据量大、计算复杂等特定情况进行了大量优化和改造。TDW服务覆盖了腾讯绝大部分业务产品,单集群规模达到4400台,CPU总核数达到10万左右,存储容量达到100PB;每日作业数100多万,每日计算量4PB,作业并发数2000左右;实际存储数据量80PB,文件数和块数达到6亿多;存储利用率83%左右,CPU利用率85%左右。经过四年多的持续投
用户评论