排查 Linux 实例异常 CPU 使用率 100%

  • A+
所属分类:Linux
高性能企业级服务器首台5折

使用 ECS 实例的过程中,您可能碰到 CPU 使用率异常,CPU使用率高达 100% 的情况。而且无法通过

  1. top、htop

等命令查询到消耗 CPU 资源的具体进程。本文介绍了三个重点关注的 CPU 使用率异常的排查要素,根据查询异常时间节点和连接进而确定原因。

查看 ECS 实例监控数据

  1. 登录 ECS管理控制台
  2. 找到异常实例,并单击实例名称。在实例详情页面的 CPU 监控信息中查询实例 CPU 监控数据。
    Monitoring

    说明:查看监控数据时,关注以下 2 点。

    • 查看 CPU 使用率变成 100% 的起始点。
    • 查看 CPU 使用率突然为 100%,而且一直没有下降的时间点。

检查系统命令修改记录

  1. 远程连接并登录到 Linux 实例。
  2. 执行以下命令查看系统命令最近是否被修改过。
    1. stat /usr/bin/top
    2. stat /bin/ps
  3. 查看系统命令的更改时间,是否和 CPU 使用率出现 100% 的时间点吻合。
    CommandChanges
  4. 执行
    1. rpm

    验证是否修改过系统命令。正常情况下,您应该查看不到修改信息。

    1. rpm -Vf /bin/ps
    2. rpm -Vf /usr/bin/top

    CommandQuery

查看实例的对外连接

执行命令

  1. iftop -i eth1 -n -P

查看当前实例是否连接到异常域名,如示例中的 crypto-pool.fr。

Verification

后续操作

经过排查,当实例的 CPU 使用率异常到 100% 时,均符合以上三个特征,基本可以判断您的实例已经中毒,您需要:

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: