vps cpu高占用卡死问题一列
spooking 归属分类: 运维 评论数: 0 个

情况说明

每隔几天,服务器就会cpu 100%,同时硬盘IO也占用超高,最终卡死。
虽然不清楚IO和CPU两者哪个是主因,但根据阿里云的监控显示,这两者是一步步总高的,于是做了个飞书的 webhook 报警通知,想当场看看是谁导致的。

不巧,今天正在睡午觉,结果报警了,上服务器一看。
systemd 高占用,头大,肯定不是它,肯定是给别人背锅,继续观察。
snapd 高占用,kill 之,disable 之(事实证明没用,重启之后还能起来)
重启之后,cpu继续一路走高,journalctl -u ssh -no-pager 继续高占用
使用 journalctl --disk-usage 查看,日志占用 2G 往上。
使用 journalctl --vacuum-size=100M 清除日志 cpu竟然降下来了。
虽然还是不确定原因,先治标吧。
修改 /etc/systemd/journald.conf
编辑 SystemMaxUse=100M
重启服务 systemctl restart systemd-journald

先这样,继续观察几天,看看问题是否会卷土重来。