当前位置：首页 > news >正文

十六、YARN和MapReduce配置

news 2026/2/8 7:05:35

1、部署前提

（1）配置前提

已经配置好Hadoop集群。

配置内容：

（2）部署说明

（3）集群规划

2、修改配置文件

MapReduce

（1）修改mapred-env.sh配置文件

export JAVA_HOME=/export/server/jdk
export HADOOP_JOB_HISTORYSERVER_HEAPSIZE=1000
export HADOOP_MAPRED_ROOT_LOGGER=INFO,RFA

（2）修改mapred-site.xml配置文件

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value><description></description></property><property><name>mapreduce.jobhistory.address</name><value>node1:10020</value><description></description></property><property><name>mapreduce.jobhistory.webapp.address</name><value>node1:19888</value><description></description></property><property><name>mapreduce.jobhistory.intermediate-done-dir</name><value>/data/mr-history/tmp</value><description></description></property><property><name>mapreduce.jobhistory.done-dir</name><value>/data/mr-history/done</value><description></description></property><property><name>yarn.app.mapreduce.am.env</name><value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value></property><property><name>mapreduce.map.env</name><value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value></property><property><name>mapreduce.reduce.env</name><value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value></property>
</configuration>

yarn

（1）修改yarn-env.sh文件

export JAVA_HOME=/export/server/jdk
export HADOOP_HOME=/export/server/hadoop
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
# export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop
# export YARN_LOG_DIR=$HADOOP_HOME/logs/yarn
export HADOOP_LOG_DIR=$HADOOP_HOME/logs

（2）修改yarn-site.xml文件

<configuration><!-- Site specific YARN configuration properties -->
<property><name>yarn.log.server.url</name><value>http://node1:19888/jobhistory/logs</value><description></description>
</property><property><name>yarn.web-proxy.address</name><value>node1:8089</value><description>proxy server hostname and port</description></property><property><name>yarn.log-aggregation-enable</name><value>true</value><description>Configuration to enable or disable log aggregation</description></property><property><name>yarn.nodemanager.remote-app-log-dir</name><value>/tmp/logs</value><description>Configuration to enable or disable log aggregation</description></property><!-- Site specific YARN configuration properties --><property><name>yarn.resourcemanager.hostname</name><value>node1</value><description></description></property><property><name>yarn.resourcemanager.scheduler.class</name><value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value><description></description></property><property><name>yarn.nodemanager.local-dirs</name><value>/data/nm-local</value><description>Comma-separated list of paths on the local filesystem where intermediate data is written.</description></property><property><name>yarn.nodemanager.log-dirs</name><value>/data/nm-log</value><description>Comma-separated list of paths on the local filesystem where logs are written.</description></property><property><name>yarn.nodemanager.log.retain-seconds</name><value>10800</value><description>Default time (in seconds) to retain log files on the NodeManager Only applicable if log-aggregation is disabled.</description></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value><description>Shuffle service that needs to be set for Map Reduce applications.</description></property>
</configuration>

分发配置文件

3、开启YARN服务器集群

（1）node1节点，以Hadoop用户，执行如下语句：

//开启Hadoop集群
start-dfs.sh
//开启yarn集群
start-yarn.sh
//因为代理服务器已经在配置文件中配置完毕，但历史服务器需要手动开启
//开启历史服务器
mapred --daemon start historyserver

（2）执行结果展示、

（3）查看YARN的Web-UI页面

打开本地浏览器，输入node1:8088，即可打开本地YARN的Web-UI页面。

4、总结

十六、YARN和MapReduce配置

1、部署前提 （1）配置前提已经配置好Hadoop集群。配置内容： （2）部署说明 （3）集群规划 2、修改配置文件 MapReduce （1）修改mapred-env.sh配置文件 export JAVA_HOM…...

编程日记 2023/12/20 1:51:30

自己动手写编译器:语法解析的基本原理

在前面系列章节中我们完成了词法解析。词法解析的基本任务就是判断给定字符串是否符合特定规则，如果符合那么就给这个字符串分配一个标签(token)。词法解析完成后接下来的工作就要分配给语法解析，后者的任务就是判断一系列标签的组合是否符合特定规范。 …...

编程日记 2023/12/20 1:49:29

VS Code解决乱码

在上边搜索栏输入“>Change File Encoding”，更改编码格式，解决乱码格式。 VS Code会帮助确认编码格式，然后选择就好。最后完成如下：...

编程日记 2023/12/20 1:48:27

宝塔Linux：部署His医疗项目通过jar包的方式

📚📚 🏅我是默，一个在CSDN分享笔记的博主。📚📚 🌟在这里，我要推荐给大家我的专栏《Linux》。🎯🎯 🚀无论你是编程小白，还是有…...

编程日记 2023/12/20 1:43:21

Vim命令大全（超详细，适合反复阅读学习）

Vim命令大全 Vim简介Vim中的模式光标移动命令滚屏与跳转文本插入操作文本删除操作文本复制、剪切与粘贴文本的修改与替换文本的查找与替换撤销修改、重做与保存编辑多个文件标签页与折叠栏多窗口操作总结 Vim是一款文本编辑器，是Vi编辑器的增强版。Vim的特点是快速、…...

编程日记 2023/12/20 1:42:20

爬虫持久化保存

## open方法- 方法名称及参数markdown **open(file, moder, bufferingNone, encodingNone, errorsNone, newlineNone, closefdTrue)****file** 文件的路径，需要带上文件名包括文件后缀（c:\\1.txt）**mode** 打开的方式（r,w,a,x,b,t…...

编程日记 2023/12/20 1:40:17

统一大语言模型和知识图谱：如何解决医学大模型-问诊不充分、检查不准确、诊断不完整、治疗方案不全面？

统一大语言模型和知识图谱：如何解决医学大模型问诊不充分、检查不准确、诊断不完整、治疗方案不全面？ 医学大模型问题如何使用知识图谱加强和补足专业能力？大模型结构知识图谱增强大模型的方法医学大模型问题问诊。偏离主诉和没抓住核心。…...

编程日记 2023/12/20 1:39:16

读写分离之同步延迟测试

背景读写分离是快速提高数据库性能的手段，主库只负责写入，从库负责查询。但在性能得到提升的同时，编程的复杂度就会提升。由其碰到主从同步延迟的情况，在数据写入后，在从库无法读取到最新数据，会对业务逻…...

编程日记 2023/12/20 1:32:11

SpringBoot+OCR 实现PDF 内容识别

一、SpringBootOCR对pdf文件内容识别提取 1、在 Spring Boot 中，您可以结合 OCR（Optical Character Recognition）库来实现对 PDF 文件内容的识别和提取。一种常用的 OCR 库是 Tesseract，而 pdf2image 是一个用于将 PDF 转换为图…...

编程日记 2023/12/20 1:30:10

Go和Java实现抽象工厂模式

Go和Java实现抽象工厂模式本文通过简单数据库操作案例来说明抽象工厂模式的使用，使用Go语言和Java语言实现。 1、抽象工厂模式抽象工厂模式是围绕一个超级工厂创建其他工厂。该超级工厂又称为其他工厂的工厂。这种类型的设计模式属于创建型模式，它…...

编程日记 2023/12/20 1:29:09

深入理解Java虚拟机---内存分配

深入理解Java虚拟机---内存分配 GC日志内存分配与回收策略对象优先在Eden分配大对象直接进入老年代长期存活的对象将进入老年代动态对象年龄判定空间分配担保 GC日志以下两段典型的GC日志： 33.125: [GC [DefNew: 3324K->152K(3712K), 0.0025925 secs] 3324K-&…...

编程日记 2023/12/20 1:28:08

计算机网络2

OSI参考模型七层： 1.应用层 2.表示层 3.会话层 4.传输层 5.网络层 6.数据链路层 7.物理层 TCP/IP模型 5层参考模型...

编程日记 2023/12/20 1:23:05

jenkins-Generic Webhook Trigger指定分支构建

文章目录 1 需求分析1.1 关键词 : 2、webhooks 是什么？3、配置步骤3.1 github 里需要的仓库配置：3.2 jenkins 的主要配置3.3 option filter配置用于匹配目标分支实现指定分支构建 1 需求分析一个项目一般会开多个分支进行开发，测试&#x…...

编程日记 2023/12/20 1:21:03

源码解析8-QSS原理-案例-Qt的qss特殊设置多个子控件的颜色与伪状态

Qt源码解析索引源码解析8-QSS原理-案例-Qt的qss特殊设置多个子控件的颜色与伪状态有些时候我们想特殊设置QSS，比如某一类标题栏目，某一个窗口中的颜色。重要的是我们需要同时设置多个特殊的按钮等。统一设置所有单一按钮全局设置 QPushButton…...

编程日记 2023/12/20 1:20:02

Nginx+Tomcat实现负载均衡和动静分离

目录前瞻动静分离和负载均衡原理实现方法实验（七层代理） 部署Nginx负载均衡服务器(192.168.75.50:80) 部署第一台Tomcat应用服务器（192.168.75.60:8080） 多实例部署第二台Tomcat应用服务器（192.168.75.70:80…...

编程日记 2023/12/20 1:19:01

linux系统的u盘/mmc/sd卡等的支持热插拔和自动挂载行为

1.了解mdev mdev是busybox自带的一个简化版的udev。udev是从Linux 2.6 内核系列开始的设备文件系统（DevFS）的替代品，是 Linux 内核的设备管理器。总的来说，它取代了 devfs 和 hotplug，负责管理 /dev 中的设备节点。同时…...

编程日记 2023/12/20 1:18:00

使用Python将OSS文件免费下载到本地：项目分析和准备工作

大家好，我是水滴~~ 本文将介绍如何使用Python编程语言将OSS（对象存储服务）中的文件免费下载到本地计算机。我们先进行项目分析和准备工作，为后续的编码及实施提供基础。《Python入门核心技术》专栏总目录・点这里文章目录 1. 前…...

编程日记 2023/12/20 1:16:59

从Gitee克隆项目、启动方法

从gitee克隆VUE项目到本地后，不能直接运行，需要进行npm install安装node_modules文件夹里面的内容，因为在git上传的时候，一般都会过滤到node_modules中的依赖文件。安装依赖以后，启动通过npm run serve启动项目出错。…...

编程日记 2023/12/20 1:14:56

不用再找了，这是大模型实践最全的总结

随着ChatGPT的迅速出圈，加速了大模型时代的变革。对于以Transformer、MOE结构为代表的大模型来说，传统的单机单卡训练模式肯定不能满足上千（万）亿级参数的模型训练，这时候我们就需要解决内存墙和通信墙等一系列问题&am…...

编程日记 2023/12/20 1:08:52

qml 移动窗口会闪烁 int main(int argc, char *argv[]) {QCoreApplication::setAttribute(Qt::AA_UseOpenGLES);//orQCoreApplication::setAttribute(Qt::AA_UseSoftwareOpenGL); }window 拉取qml程序依赖文件打开QT自带的命令窗口，转到exe程序目录： …...

编程日记 2023/12/20 1:07:51

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板，载入页面后，会显示引导弹窗，适用于引导用户使用页面，点击完成后，会显示下一个引导弹窗，直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…...

编程新知 2026/2/8 4:37:29

[2025CVPR]DeepVideo-R1：基于难度感知回归GRPO的视频强化微调框架详解

突破视频大语言模型推理瓶颈，在多个视频基准上实现SOTA性能一、核心问题与创新亮点 1.1 GRPO在视频任务中的两大挑战安全措施依赖问题 GRPO使用min和clip函数限制策略更新幅度，导致：梯度抑制：当新旧策略差异过大时梯度消失收敛困难：策略无法充分优化# 传统GRPO的梯…...

编程新知 2025/8/19 23:46:57

三维GIS开发cesium智慧地铁教程（5）Cesium相机控制

一、环境搭建 <script src"../cesium1.99/Build/Cesium/Cesium.js"></script> <link rel"stylesheet" href"../cesium1.99/Build/Cesium/Widgets/widgets.css"> 关键配置点： 路径验证：确保相对路径.…...

编程新知 2025/12/1 19:23:04

（二）原型模式

原型的功能是将一个已经存在的对象作为源目标，其余对象都是通过这个源目标创建。发挥复制的作用就是原型模式的核心思想。一、源型模式的定义原型模式是指第二次创建对象可以通过复制已经存在的原型对象来实现，忽略对象创建过程中的其它细节。 📌 核心特点：避免重复初…...

编程新知 2026/2/7 10:59:04

ardupilot 开发环境eclipse 中import 缺少C++

目录文章目录目录摘要1.修复过程摘要本节主要解决ardupilot 开发环境eclipse 中import 缺少C++，无法导入ardupilot代码，会引起查看不方便的问题。如下图所示 1.修复过程 0.安装ubuntu 软件中自带的eclipse 1.打开eclipse—Help—install new software 2.在 Work with中…...

编程新知 2026/1/31 5:06:34

【JavaWeb】Docker项目部署

引言之前学习了Linux操作系统的常见命令，在Linux上安装软件，以及如何在Linux上部署一个单体项目，大多数同学都会有相同的感受，那就是麻烦。核心体现在三点： 命令太多了，记不住软件安装包名字复杂&…...

编程新知 2026/2/4 16:07:02

分布式增量爬虫实现方案

之前我们在讨论的是分布式爬虫如何实现增量爬取。增量爬虫的目标是只爬取新产生或发生变化的页面，避免重复抓取，以节省资源和时间。在分布式环境下，增量爬虫的实现需要考虑多个爬虫节点之间的协调和去重。另一种思路：将增量判…...

编程新知 2026/2/6 1:18:56

推荐 github 项目:GeminiImageApp(图片生成方向，可以做一定的素材)

推荐 github 项目:GeminiImageApp(图片生成方向，可以做一定的素材) 这个项目能干嘛? 使用 gemini 2.0 的 api 和 google 其他的 api 来做衍生处理简化和优化了文生图和图生图的行为(我的最主要) 并且有一些目标检测和切割(我用不到) 视频和 imagefx 因为没 a…...

编程新知 2026/1/25 10:41:07

GruntJS-前端自动化任务运行器从入门到实战

Grunt 完全指南：从入门到实战一、Grunt 是什么？ Grunt是一个基于 Node.js 的前端自动化任务运行器，主要用于自动化执行项目开发中重复性高的任务，例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...

编程新知 2026/1/25 11:52:39

CRMEB 中 PHP 短信扩展开发：涵盖一号通、阿里云、腾讯云、创蓝

目前已有一号通短信、阿里云短信、腾讯云短信扩展扩展入口文件文件目录 crmeb\services\sms\Sms.php 默认驱动类型为：一号通 namespace crmeb\services\sms;use crmeb\basic\BaseManager; use crmeb\services\AccessTokenServeService; use crmeb\services\sms\…...

编程新知 2025/10/5 5:38:24