点击关注上方“知了小巷”,

设为“置顶或星标”,第一时间送达干货。

Hadoop YARN日志查看方式

实验环境CDH6.3.2

Hadoop版本

$ hadoop version
Hadoop 3.0.0-cdh6.3.2
Source code repository http://github.com/cloudera/hadoop -r 9aff20de3b5ecccf3c19d57f71b214fb4d37ee89
Compiled by jenkins on 2019-11-08T13:49Z
Compiled with protoc 2.5.0
From source with checksum f539c87da37534aad732f2a7ddcc59
This command was run using /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/jars/hadoop-common-3.0.0-cdh6.3.2.jar

Hive版本

hive> select version();
OK
2.1.1-cdh6.3.2 rb3393cf499504df1d2a12d34b4285e5d0c02be11
Time taken: 0.877 seconds, Fetched: 1 row(s)

运行一个示例MapReduce任务-计算圆周率

$ sudo -u hdfs hadoop jar /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar pi 10 100
WARNING: Use "yarn jar" to launch YARN applications.
Number of Maps  = 10
Samples per Map = 100
Wrote input for Map #0
...
Wrote input for Map #9
Starting Job
...
Job Finished in 26.594 seconds
Estimated value of Pi is 3.14800000000000000000

YARN日志重要性

应用程序日志(以及关联的Container日志)在对可能出现异常的YARN应用程序进行调试上、性能优化上相当重要。YARN提供了一个良好的框架,通过日志聚合收集、存储以及界面查看应用程序日志。

YARN提供了两种查看日志的方式:ResourceManager Web UI查看日志和Job HistoryServer Web UI查看日志;一个是查看当前正在执行以及历史的所有任务,第二个是可以查看历史的所有任务。

764e071ca62f1c950a04c13158162631.png

ResourceManager Web UI

从CDH里面点击链接进行访问,默认是域名(hostname)和默认端口8088:
http://zlxx-test1-110:8088/cluster

  • zlxx-test1-110:YARN ResourceManager角色所在服务器的hostname。
  • 8088:yarn-site.xml中配置的yarn.resourcemanager.webapp.address默认值。

ResourceManager Web UI页面

544c9f8d8c4cf433732c04866a0e8ef2.png

25d552cab792381a8395e01bc918774e.png

如上图,最左边包含Cluster和Tools两个菜单。Cluster下面主要包括:About、Nodes、Node Labels和Applications、Scheduler。

查看已完成的YARN应用列表 

http://zlxx-test1-110:8088/cluster/apps/FINISHED

120bba83671b0417e122e59155ae1824.png

Scheduler
YARN调度器的相关信息,最主要的是Application Queues

fe38951181d5f0db4fca9abbfc8d837a.png

Tools

59fa7411d6a2ab122a9c48d1acbe7589.png

如果没有服务器登录或操作权限,则可以通过Tools下的Local Logs查看异常日志信息和Configuration服务器配置文件信息,比如搜索webapp.adress配置。
http://zlxx-test1-110:8088/conf

2950944ae97433d7483ae22ad29a7bf6.png

Job HistoryServer Web UI

JobHistory是JobHistory Server上收集到的日志,内容只包括历史存档的YARN应用。

  • zlxx-test1-110:JobHistory Server角色所在服务器的hostname。
  • 19888:yarn-site.xml中配置的mapreduce.jobhistory.webapp.address默认值。

http://zlxx-test1-110:19888/jobhistory

1d530bd3dcb32bcea59d6e34cfa514cb.png

b6a72defab882897956d8c2db1f58004.png

Retired Jobs下有13列信息:

  • Submit Time:MR Job的提交时间
  • Start Time:MR Job的运行开始时间
  • Finish Time:MR Job的运行结束时间
  • Job ID:MR Job运行时被分配的Job ID
  • Name:Job名称,一般不需要特别指定
  • User:提交Job的用户,一般是对应的服务器所在的Linux用户
  • Queue:提交Job的队列名称
  • State:Job运行结束后的最终状态,SUCCESSED、KILLED、FAILED
  • Maps Total:Job运行所分配的总的Map数量
  • Maps Completed:运行完成的Map数量
  • Reduces Total:Job运行所分配的总的Reduce数量
  • Reduces Completed:运行完成的Reduce数量
  • Elapsed Time:14:46:51-14:46:36=15sec,从Job运行开始到Job运行结束所消耗的时间(long)
  1. 图中Job提交时间是2020.12.11 14:46:27 CST,Job运行开始时间是2020.12.11 14:46:36 CST,从Job提交到Job运行开始,还会经历被YARN集群的调度队列Accept的过程,如果两个时间间隔比较长,则意味着YARN Scheduler的Queue资源利用紧张,需要注意集群队列的资源分配情况是否合理。
  2. Job运行时分配的Map数量和最终完成的Map数量,可能由于集群节点故障或者Map失败,使得两个的数量不一致。
  3. Reduce数量和Map是类似的。

猜你喜欢

  • ClouderaManager6.3.1+CDH6.3.2+PHOENIX-5.0.0集成部署

  • 大数据基础:Linux操作系统(下)

  • 大数据基础:Linux操作系统(上)

  • Apache Kafka客户端KafkaProducer

2797d0c23c68caaa8a7141e3f05c98a7.png

点一下,代码无 Bug

5680aae047ff078b83a218224942472a.gif
Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐