当前位置:网站首页 > R语言数据分析 > 正文

yarn队列配置(yarn配置多队列)



​ Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。

yarn主要由ResourceManagerNodeManagerApplicationMasterContainer等组件构成。

 

 

Hadoop作业调度器主要有三种:FIFO、Capacity Scheduler和Fair Scheduler。Hadoop3.1.3默认的资源调度器是Capacity Scheduler。

具体设置详见:yarn-default.xml文件

 

FIFO

先进先出,同一时间队列中只有一个任务在执行

容量调度器

多队列;每个队列内部先进先出, 同一时间队列中只有一个任务在执行, 队列的并行度为队列的个数。

公平调度器

多队列;每个队列内部按照缺额大小分配资源启动任务,同一时间队列中有多个任务执行。队列的并行度大于等于队列的个数

需求

Yarn默认调度器为Capacity Scheduler(容量调度器),且默认只有一个队列——default。该调度器单个队列内的调度策略为FIFO,故单个队列的任务并行度为1,即一个队列,同一时刻,只能有一个任务运行。

在实际使用中会出现单个任务阻塞整个队列的情况。同时,随着业务的增长,公司需要分业务限制集群使用率。这就需要我们按照业务种类配置多条任务队列。

1.案例:配置default、hive多队列

默认Yarn的配置下,容量调度器只有一条Default队列。在$HADOOP_HOME/etc/hadoop/capacity-schdualer.xml中可以配置多条队列,并降低default队列资源占比:

①增加队列,添加队列的属性配置
 
②分发配置文件到集群,重启Yarn
③测试,向default ,hive队列分别提交任务

提交到default队列:

 

提交到hive队列

 

查看yarn任务ui界面:http://hadoop103:8088/cluster/scheduler

提交就可以查看了,不然任务跑完就看不到了....

2.配置Hive的默认提交队列

方式一

当前hive的shell窗口有效,关闭就不行了

 

方式二

修改配置文件,永久生效

到此这篇yarn队列配置(yarn配置多队列)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!
                            

版权声明


相关文章:

  • 富文本编辑器上传word文档(富文本编辑器 word)2024-12-21 19:45:10
  • uchar是什么意思(uchar j什么意思)2024-12-21 19:45:10
  • Oracle查看锁表记录(oracle如何看锁表)2024-12-21 19:45:10
  • redhat操作系统(redhat操作系统安装步骤)2024-12-21 19:45:10
  • 华为ensp模拟器怎么使用(ensp模拟器hybrid)2024-12-21 19:45:10
  • chrony 手动同步(chrony不同步)2024-12-21 19:45:10
  • jrafyh是什么意思(jreg什么意思)2024-12-21 19:45:10
  • grid布局阮一峰(gridbagconstraints布局)2024-12-21 19:45:10
  • spark面试题及答案100道(spark面试题shuffle)2024-12-21 19:45:10
  • redhat认证多少钱(redhat报名)2024-12-21 19:45:10
  • 全屏图片