Java进程将CPU或负载拉高及快速定位脚本
admin
2023-03-05 15:22:35
0

可能同学经常会遇到生产环境下的某台跑Java的服务器,在刚发布时的时候一切都很正常,在运行一段时间后就出现CPU占用很高或负载飙高等现象,好一点的负载或CPU一天比一天高,差的情况,就是随机进行抖动,后又恢复正常,给运维及开发同学带来了不少困扰。当然,出现此问题时,后续要如何改进,诸如:代码上线前要进行review、相关强弱依赖服务隔离/降级等、单元测试、回归测试、SQL上线审核、基础及业务监控、相关流程制度等。

若CPU使用率或负载飙高,且持续时间较长,网上也有大量的排查步骤

方法一

1.使用top定位占用CPU高的进程PID

top

2.获取线程信息

ps -mp PID  -o THREAD,tid,time | sort -rn 

3.将需要的线程ID转换为16进制格式

printf "%x\n" tid

4.打印线程的堆栈信息

jstack pid  |grep  tid  #这里的tid就是步骤3生成的 十六进制格式的tid


方法二(推荐)

可快速定位thread及thread的cpu使用率

#!/bin/bash
# @Function
# Find out the most cpu consumed threads of java,and print the stack trace of these threads.
#
# @Usage
#   $./javacpu -h
#
PROG=`basename $0`
usage(){
cat < /dev/null; then
	[ -n "$JAVA_HOME" ] && [ -f "$JAVA_HOME/bin/jstack" ] && [ -x "$JAVA_HOME/bin/jstack" ] &&{
	export PATH="$JAVA_HOME/bin:$PATH"
	} || {
	redEcho "Error:jstack nof found on PATH and JAVA_HOME!"
	exit 1
	}
	fi
	
	uuid=`date +%s`_${RANDOM}_$$
	
	cleanupWhenExit(){
	rm /tmp/${uuid}_* &> /dev/null
	}
	trap "cleanupWhenExit" EXIT
	
	printStackOfThread(){
	while read threadLine ; do
	pid=`echo ${threadLine} | awk '{print $1}'`
		threadId=`echo ${threadLine} | awk '{print $2}'`
		threadId0x=`printf %x ${threadId}`
		user=`echo ${threadLine}  | awk '{print $3}'`
		pcpu=`echo ${threadLine}   | awk '{print $5}'`
		jstackFile=/tmp/${uuid}_${pid}
		[ ! -f "${jstackFile}"  ] && {
		jstack ${pid} > ${jstackFile} ||{
		redEcho "Fail to jstack java process ${pid}!"
			rm ${jstackFile}
			continue
		}
		}
		
		redEcho "The stack of busy(${pcpu}%) thread(${threadId}/0x${htreadId0x})
		of java process(${pid}) of user(${user}):"
		sed "/nid=0x${threadId0x}/,/^$/p" -n ${jstackFile}
		done
	}
	
	[ -z "${pid}" ] && {
	ps -Leo pid,lwp,user,comm,pcpu --no-headers|awk '$4=="java"{print $0}' |sort -k5 -r -n |head --lines "${count}" | printStackOfThread
	} || {
	ps -Leo pid,lwp,user,comm,pcpu --no-headers |awk -v "pid=${pid}" '$1==pid,$4=="java"{print $0}' | sort -k5 -r -n |head --lines "${count}" | printStackOfThread
	}	
	


方法三(针对Java服务器的load负载随机抖动情况)

#!/usr/bin/env python
import os
import time, datetime
import threading
# desc: when system loadavg 1 min load lt 10,then dump java jstack
def load_stat():
loadavg = {}
f = open("/proc/loadavg")
info = f.read().split()
f.close()
loadavg['lavg_1'] = info[0]
loadavg['lavg_5']= info[1]
loadavg['lavg_15']= info[2]
start_time = datetime.datetime.strptime(str(datetime.datetime.now().date()) + '00:00', '%Y-%m-%d%H:%M')
curr_time = datetime.datetime.now()
end_time = datetime.datetime.strptime(str(datetime.datetime.now().date() + datetime.timedelta(days=2)) + '23:59', '%Y-%m-%d%H:%M')
if (start_time <= curr_time  <= end_time ) :
if float(loadavg['lavg_1']) >= 11:
pid = os.popen("jps |grep -v Jps|awk '{print $1}'").read()
cmd = "jstack" + " " + pid
stack = os.popen(cmd).read()
tm = time.strftime("%Y-%m-%d_%H-%M-%S", time.localtime())
timeslog = 'java_stack_' + tm + r'.txt'
log_f = open(timeslog, 'w')
log_f.write(stack)
log_f.close()
cmd_2="ps -mp " + pid.strip('\n') + " -o THREAD,tid,time | sort -rn"
top_tid_info=os.popen(cmd_2).read()
cpu_tid_logs='tid_cpu_' + tm + r'.txt'
log_f2 = open(cpu_tid_logs,'w')
log_f2.write(top_tid_info)
log_f2.close()
threading.Timer(5, load_stat).start()
else:
threading.Timer(5, load_stat).start()
else:
exit
#return loadavg
load_stat()



相关内容

热门资讯

国乒男团3比0韩国,晋级世乒赛... 北京时间5月8日,2026伦敦世乒赛男团1/4决赛,国乒男团以总比分3比0战胜韩国队,晋级半决赛。本...
美国公布首批UFO相关政府文件... 美国国防部5月8日公布了首批“与外星人、地外生命、不明空中现象(UAP)以及不明飞行物(UFO)相关...
外交部:日本军国主义侵略罪行罄... 在东京审判开庭80周年之际,《远东国际军事法庭庭审记录·全译本》日前在中国首发。外交部发言人林剑5月...
“一顿海鲜餐被收1800元”游... 5月4日晚,一湖南游客在海南三亚海棠区椰某韵餐饮店吃海鲜餐时,两份海鲜菜品及酒水饮料等被收了1800...
28国组建“矿产北约”围堵中国... 美国拉起军事、安全之外的“新北约”——被称作“矿产版北约”,目标明确:构建排他性战略资源供应体系,刻...
这场圆桌对接会直击新能源车自燃... 5月7日,挪车机器人应用场景供需对接会在成都市民营经济发展促进中心举行。会议聚焦电动汽车自燃处置难题...
驻村工作队倾情帮扶,无人机、无... 极目新闻记者 吴昌华 4月29日,大别山脚下的青云村,一架四旋翼无人机悬停在村委会小院上空,一辆颜色...
从爆炸厂区到58公里外城区,浏... 2026年5月4日16时43分,湖南浏阳华盛烟花制造燃放有限公司生产车间发生爆炸。截至5月8日12时...
加满一箱油多花12.5元!今晚... 【大河财立方消息】 5月8日24时国内成品油调价窗口将开启。据国家发展改革委,4月21日国内成品油价...
“算力券”直达快享 崇川AI产... 转自:扬子晚报 在人工智能浪潮奔涌的当下,算力已成为驱动产业创新的重要生产力,更是AI企业技术研发...