Spark笔记整理(十二):日志记录与监控
admin
2023-01-23 03:00:42
0

1 Standalone模式下

按照香飘叶子的文档部署好完全分布式集群后,提交任务到Spark集群中,查看hadoop01:8080,想点击查看某个已完成应用的历史情况,出现下面的提示:

Event logging is not enabled
No event logs were found for this application! To enable event logging, set spark.eventLog.enabled to true and spark.eventLog.dir to the directory to which your event logs are written.

显然需要按照提示进行相关的配置,先将Spark服务停掉,然后在conf目录下的spark-defaults.conf配置文件中添加如下配置:

spark.eventLog.enabled  true
spark.eventLog.dir      hdfs://ns1/logs/spark

不过需要提前在hdfs中创建好相关目录,将配置文件同步到各个节点上,然后重启Spark集群。

再提交任务:

./spark-submit-standalone.sh spark-process-1.0-SNAPSHOT.jar cn.xpleaf.spark.scala.core.p1._01SparkWordCountOps

然后就可以完成standalone模式下Spark日志的记录和查看了。

2 Yarn模式下

2.1 必知常识

当采用Spark on Yarn的方式来执行Spark应用程序时,只需要在节点上配置好Spark的环境即可,不需要启动Sparkmaster或者Worker节点,因为最终的程序是跑在Hadoop集群上,由Yarn进行调度的,这点需要明确。

在这种情况下,提交任务到Yarn上,是可以通过ResourceManager的地址来查看到执行的应用程序,比如RM是在hadoop02节点上启动,则默认可以通过hadoop02:8088来访问到其Application页面,但是如果这时希望查看到前面standalone模式下详细的Spark程序执行情况时,是没有办法的,即便启动了Hadoophistory-server,也仅仅只能查看到logs日志信息而已。

这时,就需要启动Spark本身的日志服务器,并通过其来查看执行的应用程序的Spark详细日志信息。

本文的描述都是基于Spark 1.6.2,后面新的Spark版本可能会有所不同。

2.2 日志(历史)服务器配置、启动与原理

在当前安装Spark的节点上,进入到conf目录,在配置文件spark-defaults.conf添加下面的配置:

spark.eventLog.enabled  true    # 开启日志记录
spark.eventLog.dir      hdfs://ns1/logs/spark   # 日志的保存位置
spark.history.fs.logDirectory   hdfs://ns1/logs/spark   # 历史日志保存的位置

前面两个的配置是保证,执行Spark程序时,完整的日志信息会保存下来,并保存到指定的位置上,最后一个配置则是说明,当启动Spark的应用程序历史服务器时,应该从哪里去读取相关的日志信息,并以与standalone模式相同的Web UI的形式将日志信息展示出来。
配置完成后,使用下面的命令来启动历史服务器:

./sbin/start-history-server.sh

该日志历史服务器默认以18080端口号来启动,因此,可以访问相关地址+端口号来进行访问,比如我是在hadoop01节点上配置并启动该历史服务器的,那么就可以通过下面的地址进行访问:

hadoop01:18080

访问之后看到的就跟standalone模式下的Web UI是一样的,更详细的配置说明可以参考官方文档:

http://spark.apache.org/docs/1.6.2/monitoring.html#viewing-after-the-fact

相关内容

热门资讯

德国总理:美国正在被伊朗羞辱 德国之声4月27日报道,德国总理默茨在访问一所学校时表示,在当前的持续冲突中,伊朗领导层正试图羞辱美...
理响中国|“长”歌以行,风云激... 光阴如梭,东方潮阔。这里是中国的长三角,世界的长三角。无论过去、现在还是未来,这片土地都因时代而生,...
白宫:特朗普及其国安团队开会讨... 新华社华盛顿4月27日电 美国白宫新闻秘书莱维特27日在记者会上证实,总统特朗普及其国家安全团队当天...
人民日报刊文:日本放开杀伤性武... 日本放开杀伤性武器出口推高地缘冲突风险(国际论坛)常思纯《人民日报》(2026年04月28日 第 0...
医疗保障法草案二审:明确生育保... 满足多样化健康保障需求本报记者 彭 波4月27日,医疗保障法草案二审稿提请十四届全国人大常委会第二十...
天津一景区发生自转旋翼机事故1... 澎湃新闻记者 吕新文中国民用航空华北地区管理局4月22日公布《豪客通航“10•1”天津长芦汉盐旅游区...
卡塔尔埃米尔与美国总统特朗普通... 当地时间24日,卡塔尔埃米尔塔米姆与美国总统特朗普通电话,重点就中东地区局势以及伊朗与美国谈判问题交...
男子30年前被扣押2859克黄... 澎湃新闻记者 王鑫家住辽宁省大连市的潘永嘉近日向澎湃新闻反映称,三十年前,他在大连周水子机场被盖州市...
商务部:取消反制欧盟两家金融机... 中华人民共和国商务部令二〇二六年 第1号鉴于欧盟已取消对中国两家金融机构的制裁措施,现公布《关于取消...
过去24小时共有5艘船只通过霍... 总台记者当地时间24日获悉,过去24小时内,共有5艘船只通过霍尔木兹海峡,其中包括一艘伊朗油轮。(总...