1. 首页
  2. 数据库
  3. 其它
  4. 美团1万台 Hadoop 集群 YARN 的调优之路

美团1万台 Hadoop 集群 YARN 的调优之路

上传者: 2021-01-10 15:06:36上传 PDF文件 730.38KB 热度 17次
背景 YARN作为Hadoop的资源管理系统,负责Hadoop集群上计算资源的管理和作业调度。 美团的YARN以社区2.7.1版本为基础构建分支。目前在YARN上支撑离线业务、实时业务以及机器学习业务。 离线业务主要运行的是Hive on MapReduce, Spark SQL为主的数据仓库作业。 实时业务主要运行Spark Streaming,Flink为主的实时流计算作业。 机器学习业务主要运行TensorFlow,MXNet,MLX(美团点评自研的大规模机器学习系统)等计算作业。 YARN面临高可用、扩展性、稳定性的问题很多。其中扩展性上遇到最严重的是集群和业务规模增长带来的调度器性
用户评论