【Hadoop之Yarn】Yarn的搭建流程、概念和组成部分 以及 Yarn的历史日志jobHistory配置和三种调度器

文章目录

  • 一、Yarn的搭建
    • 1、修改mapred-site.xml
    • 2、修改yarn-site.xml
    • 3、检查hadoop-env.sh 中是否配置了权限
    • 4、分发mapred-site.xml & yarn-site.xml 到另外两台节点上
    • 5、启动和停止yarn平台:
    • 6、同时启动hdfs和yarn:
    • 7、启动后jps进程(包含hdfs):
  • 二、Yarn的概念
    • 三、Yarn的组成部分
    • 1、ResourceManager (BOSS): 1个
    • 2、NodeManager (各个机器上的主管) 多个
    • 3、Container(容器)
    • 4、AppMaster (项目经理)
  • 四、Yarn的历史日志jobHistory配置【可选项】
    • 1、mapred-site.xml
    • 2、yarn-site.xml
    • 3、将mapred-site.xml 和yarn-site.xml 分发到其他两台上
    • 4、启动历史日志服务:jps进程为 JobHistoryServer
  • 五、Yarn的三种调度器


一、Yarn的搭建

/opt/installs/hadoop/etc/hadoop 文件夹下:

1、修改mapred-site.xml

指定mapreduce运行平台为yarn:

<!--添加如下配置-->
<!--yarn的配置-->
<property><name>mapreduce.framework.name</name><value>yarn</value>
</property>

2、修改yarn-site.xml

 <!--添加如下配置-->
<!--yarn的配置-->
<!--指定resourceManager启动的主机为第一台服务器--><property><name>yarn.resourcemanager.hostname</name><value>node01</value></property><!--配置yarn的shuffle服务--><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value> </property><!--为了防止报AppMaster的错误,需要如下配置,可以用 hadoop classpath 来获取value的值--><property><name>yarn.application.classpath</name><value>使用hadoop classpath获取的值</value> </property>

3、检查hadoop-env.sh 中是否配置了权限

export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

4、分发mapred-site.xml & yarn-site.xml 到另外两台节点上

分发的脚本xsync可以看我的另一篇文章:
大数据中一些实用的脚本

cd /opt/installs/hadoop/etc/hadoop/xsync.sh mapred-site.xml yarn-site.xml

5、启动和停止yarn平台:

启动: start-yarn.sh
停止: stop-yarn.sh

6、同时启动hdfs和yarn:

start-all.sh

7、启动后jps进程(包含hdfs):

节点进程
node01NameNode,DataNode,ResourceManager,NodeManager
node02SecondaryNameNode,DataNode,NodeManager
node03DataNode,NodeManager

二、Yarn的概念

负责管理集群中的资源分配和任务调度
Yarn其实就是一个类似于操作系统一样的东西。
Yarn是MapReduce运行的环境,Yarn可以管理程序运行所需要的东西(内存,CPU,带宽等资源)

三、Yarn的组成部分

[图片]

1、ResourceManager (BOSS): 1个

他用来管理整个的Yarn平台,里面有一个资源调度器。

2、NodeManager (各个机器上的主管) 多个

听从我们的ResouceManager的调遣。是每一台电脑的管家。

3、Container(容器)

每一个NodeManager中,有一个或者多个这样的容器。是包含了一些资源的封装(CPU,内存,硬盘等),类似于我们熟悉的虚拟机。

4、AppMaster (项目经理)

每一个MapReduce任务启动提交后,会有一个对应的AppMaster。这个主要作用是负责整个job任务的运行。

四、Yarn的历史日志jobHistory配置【可选项】

1、mapred-site.xml

<!-- 添加如下配置 --><!--yarn的历史日志服务-->
<!-- 历史任务的内部通讯地址 -->
<property><name>MapReduce.jobhistory.address</name><value>node01:10020</value>
</property><!--历史任务的外部监听页面-->
<property><name>MapReduce.jobhistory.webapp.address</name><value>node01:19888</value>
</property><property><name>yarn.app.mapreduce.am.env</name><value>HADOOP_MAPRED_HOME=/opt/installs/hadoop</value>
</property>
<property><name>mapreduce.map.env</name><value>HADOOP_MAPRED_HOME=/opt/installs/hadoop</value>
</property>
<property><name>mapreduce.reduce.env</name><value>HADOOP_MAPRED_HOME=/opt/installs/hadoop</value>
</property>

2、yarn-site.xml

<!-- 添加如下配置 --><!--yarn的历史日志服务-->
<!-- 是否需要开启日志聚合 -->
<!-- 开启日志聚合后,将会将各个Container的日志保存在yarn.nodemanager.remote-app-log-dir的位置 -->
<!-- 默认保存在/tmp/logs -->
<property><name>yarn.log-aggregation-enable</name><value>true</value>
</property><!-- 历史日志在HDFS保存的时间,单位是秒 -->
<!-- 默认的是-1,表示永久保存 -->
<property><name>yarn.log-aggregation.retain-seconds</name><value>604800</value>
</property><property><name>yarn.log.server.url</name><value>http://node01:19888/jobhistory/logs</value>
</property>

3、将mapred-site.xml 和yarn-site.xml 分发到其他两台上

cd /opt/installs/hadoop/etc/hadoopxsync.sh mapred-site.xml yarn-site.xml

4、启动历史日志服务:jps进程为 JobHistoryServer

mapred --daemon start historyserver

五、Yarn的三种调度器

1、FIFO Scheduler(FIFO调度器)
2、Capacity Scheduler(容量调度器,apache版本默认使用的调度器)
3、Fair Scheduler(公平调度器,CDH版本的hadoop默认使用的调度器)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1559755.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【一文讲透(番外篇)】如何编译安装KWDB v2.0.4数据库

KaiwuDB 浪潮集团是中国领先的云计算、大数据服务商&#xff0c;拥有浪潮信息、浪潮软件、浪潮数字企业三家上市公司。主要业务涉及计算装备、软件、云计算服务、新一代通信、大数据及若干应用场景。已为全球一百二十多个国家和地区提供IT产品和服务。 KaiwuDB 是浪潮控股的数据…

【Power Compiler手册】13.UPF多电压设计实现(16)

Golden UPF流程 Golden UPF流程是维护设计中UPF多电压电源意图的可选方法。它在整个综合、物理实现和验证步骤中使用原始的“Golden”UPF文件,以及由Design Compiler和IC Compiler II工具生成的supplemental UPF文件。图122比较了传统的UPF流程与Golden UPF流程。 Golden UPF…

如何提高LabVIEW编程效率

提高LabVIEW编程效率对开发者来说非常重要&#xff0c;尤其是在处理复杂项目或紧迫的开发周期时。以下是一些可以显著提升LabVIEW编程效率的技巧&#xff0c;从代码结构、工具使用到团队协作的多个角度进行详细分析&#xff1a; 1. 模块化设计 模块化设计 是提高代码可维护性和…

KPaaS平台多系统权限统一管理的便利性

多系统权限管理的困境如同枷锁般束缚企业发展&#xff0c;导致管理效率低下、操作流程复杂且权限不一致&#xff0c;给员工和企业带来诸多不便与风险。 免费体验多系统权限管理系统 www.kpaas.net 多系统权限给企业带来的不便利 &#xff08;一&#xff09;繁琐的登录与操作流…

食堂订餐系统小程序的设计

管理员账户功能包括&#xff1a;系统首页&#xff0c;个人中心&#xff0c;管理员管理&#xff0c;商品管理&#xff0c;论坛管理&#xff0c;攻略信息管理&#xff0c;公告信息管理&#xff0c;基础数据管理 微信端账号功能包括&#xff1a;系统首页&#xff0c;商品&#xf…

windows端口被占用但是查不到进程的问题排查

在开发环境上经常遇到端口被占用&#xff0c;但是 netstat -ano|findstr 3306 查不到进程号&#xff0c;没法强杀解决。 这种情况&#xff0c;很有可能端口被排除了&#xff0c;可用命令&#xff1a; netsh interface ipv4 show excludedportrange protocoltcp 可以看到mysql的…

[Git] Git下载及使用 从入门到精通 详解(附下载链接)

前言 目录 Git概述 简介 下载 Git代码托管服务 Git常用命令 Git全局配置 获取Git仓库 在本地初始化一个Git仓库 从远程仓库克隆 基本概念 工作区文件状态 本地仓库操作 远程仓库操作 分支操作 标签操作 在IDEA中使用Git 在IDEA中配置Git 本地仓库操作 远程仓…

前端基础(三十九):撤消与重做

效果 源码 <button id"undo" onclick"onHistory(-1)">撤消</button> <button id"redo" onclick"onHistory(1)">重做</button><button onclick"operation(Operation 1)">操作1</button>…

蓝牙定位的MATLAB程序,四个锚点、三维空间

目录 程序描述 运行结果 程序描述 这段代码通过RSSI信号强度实现了在三维空间中的蓝牙定位&#xff0c;展示了如何使用锚点位置和测量的信号强度来估计未知点的位置。代码涉及信号衰减模型、距离计算和最小二乘法估计等基本概念&#xff0c;并通过三维可视化展示了真实位置与…

0.0.0.0 127.0.0.1等几个特殊的IP地址

0.0.0.0 127.0.0.1 localhost 255.255.255.0 255.255.255.255 这都是些什么地址&#xff0c;代表了什么意思。 网络为系统服务器&#xff0c;系统需要网络。 这些地址在系统和网络都存在&#xff0c;作用和意思甚至基本相同。 一、0.0.0.0 在路由中&#xff1a;0.0.0.0表…

用了这么久Java,您知道什么是装箱和拆箱吗?

Java中的装箱和拆箱 在Java中&#xff0c;装箱&#xff08;Boxing&#xff09;和拆箱&#xff08;Unboxing&#xff09;是自动类型转换过程&#xff0c;它们涉及到基本数据类型&#xff08;如int、double、char等&#xff09;和它们对应的包装类&#xff08;如Integer、Double…

2024年最新详解项目管理系统:让你从小白到高手的蜕变

一、项目管理系统的重要性 项目管理系统在当今企业中发挥着至关重要的作用。首先&#xff0c;在提高工作效率方面&#xff0c;它通过自动化任务分配、进度跟踪和文档管理等功能&#xff0c;大幅减少手动操作和沟通成本。例如&#xff0c;禅道提供了强大的任务管理功能&#xf…

Vue 脚手架学习

1.使用 Vue 脚手架 1.1 初始化脚手架 1.1.1 具体步骤 第一步&#xff08;仅第一次执行&#xff09;&#xff1a;全局安装vue/cli。 npm install -g vue/cli 第二步&#xff1a;切换到你要创建项目的目录&#xff0c;然后使用命令创建项目 vue create xxxx 第三步&#xff1a;启…

C盘一红就卡顿到不行?为什么呢?

前言 有小伙伴最近来咨询电脑卡顿问题&#xff0c;一开始小白还以为只是寻常的硬盘坏了&#xff0c;并没有多想。 直到我问清楚之后&#xff0c;才发现他的电脑卡顿是因为C盘快爆了…… 好家伙&#xff0c;一个100GB的C盘用到只剩下8GB左右的空闲空间&#xff0c;这电脑不卡…

【优选算法】(第三十二篇)

目录 ⼆进制求和&#xff08;easy&#xff09; 题目解析 讲解算法原理 编写代码 字符串相乘&#xff08;medium&#xff09; 题目解析 讲解算法原理 编写代码 ⼆进制求和&#xff08;easy&#xff09; 题目解析 1.题目链接&#xff1a;. - 力扣&#xff08;LeetCode&a…

大厂养不起大模型?

身处于观望期的大模型赛道&#xff0c;似乎任何风吹草动&#xff0c;都让市场有了不同以往的波动。 近日&#xff0c;摩根士丹利发布报告称&#xff0c;中国AI正在面临更大的变现问题&#xff0c;文中直接指出AI应用先行者业绩不及预期&#xff0c;金山办公和万兴科技在推出AI…

大数据存储计算平台EasyMR:多集群统一管理助力企业高效运维

随着全球企业进入数字化转型的快车道&#xff0c;数据已成为企业运营、决策和增长的核心驱动力。为了处理海量数据&#xff0c;同时应对数据处理的复杂性和确保系统的高可用性&#xff0c;企业往往选择部署多个Hadoop集群&#xff0c;这样的策略可以将生产环境、测试环境和灾备…

USB 概述及协议基础

文章目录 1 USB 是什么&#xff1f;2 USB 的特点3 USB 的拓扑结构4 电气特性5 USB 的线缆、插头及插座6 插入检测机制7 描述符8 枚举过程9 USB 的包结构与传输过程9.1 USB的包结构及包的分类9.2 令牌包9.3 数据包9.4 握手包9.5 特殊包9.6 如何处理数据包 10 USB 四种传输类型10…

「OC」NSArray的底层逻辑和遍历方法

「OC」NSArray的底层逻辑和遍历方法 文章目录 「OC」NSArray的底层逻辑和遍历方法前言NSArray的底层逻辑占位符init后的空NSArray只有单个元素的NSArray大于一个元素的NSArray可变数组NSMutableArray总结图片 遍历NSArray1. for循环2. 枚举3.for—in4. 多线程1.for 循环&fo…

AIGC产品经理面试,看这里!送你20道高频面试题及分析PDF文件!

作者简介 小6&#xff0c;世界五百强产品出身&#xff0c;从0到1搭建公司IT团队&#xff0c;现任深圳某互联网公司IT负责人&#xff0c;<极客时间>课程讲师。 愿景&#xff1a;希望可以让你在这里从对产品经理的一无所知到至少能找份相关工作&#xff01; 聊点AI面试的&a…