监控您的ECS实例是否健康非常重要,您需要确保用户始终可以快速打开您的网站和应用,或者快速完成数据处理和渲染等任务。阿里云提供了监控数据收集、可视化以及实时监控告警等服务,确保您的实例始终处于正常的运行状态。
背景信息
目前,您可以通过ECS自带监控服务和云监控服务监控实例。ECS自带监控服务提供vCPU使用率、网络流量和磁盘I/O监控。云监控提供更加精细化的监控粒度。以下是对部分监控信息的说明:
- vCPU:阿里云提供实例vCPU使用率监控数据,单位为百分比。百分比数值越高,实例vCPU负载越高。您可以通过ECS管理控制台、云监控管理控制台、调用ECS API或者远程连接实例后查询监控数据。以下是远程连接实例后查看vCPU使用率的方式:
- Windows实例:在任务管理器中查看vCPU使用情况,您可以按vCPU使用率排序,定位占用实例vCPU资源的进程。
- Linux实例:运行top命令查看vCPU使用情况。在键盘上按下Shift+P根据vCPU使用率排序,定位占用实例vCPU资源的进程。
说明 如果CPU持续保持高使用率,则会对系统稳定性和业务运行造成影响。您可以参见以下方法进行优化:- Linux实例请参见Linux系统CPU负载的查询和案例分析。
- Windows实例请参见Windows实例中CPU使用率较高问题的排查及解决方法。
- 网络流量:阿里云提供实例出方向和入方向的网络流量监控数据,单位为kbps。ECS自带监控服务一般提供公网流量监控,云监控可以获取公网和内网流量监控。例如,您的公网出网带宽为1 Mbps,当出网流量达到1024 kbps,表示您的公网带宽已经满负荷。
ECS自带监控服务
在ECS管理控制台上查看监控信息的步骤如下所示。
您也可以使用DescribeInstanceMonitorData、DescribeDiskMonitorData和DescribeEniMonitorData接口获取监控数据。
以下为ECS自带监控项的详细列表,指标采集粒度为1分钟。
监控项 | 描述及单位 |
---|---|
实例 | 实例ID |
vCPU | 实例vCPU的使用比例,单位:% |
内网入方向流量 | 实例在接收的内网数据流量,单位:kbits |
内网出方向流量 | 实例在发送的内网数据流量,单位:kbits |
内网带宽 | 实例内网带宽,单位时间内的网络流量,单位:kbits/s |
公网入方向流量 | 实例接收的公网数据流量,单位:kbits |
公网出方向流量 | 实例发送的公网数据流量,单位:kbits |
公网带宽 | 实例公网带宽,单位时间内的网络流量,单位:kbits/s |
系统盘读操作 | 系统盘每秒读取字节总数,单位:次/s |
系统盘写操作 | 系统盘每秒写入字节总数,单位:次/s |
系统盘读带宽 | 系统盘每秒读取次数,单位:Byte/s |
系统盘写带宽 | 系统盘每秒写入次数,单位:Byte/s |
说明
- Kb和KB的区别如下:
- 1 Byte=8 bits(1B=8b)。
- 使用大写K或小写k表示千时,Kb即为千位,KB即为千字节。
- ECS自带的网络流量监控中,ps指/s,即每秒。kbps指网络速度,即每秒传送多少千位信息。通常情况下,描述带宽时常省略bps。例如,4 M带宽的完整写法应为4 Mbps。
- 带宽不等于下载速度:以1 Mbps带宽为例,1 KB=8 Kb,1 Mbps=125 KB/s,1 kbps=1000 bps。1 Mbps带宽的下载速率,理论上为125 KB/s,而实例中一些应用程序会占用少量带宽,例如远程连接,因此实际下载速率常为100 KB/s~110 KB/s。
云监控
在云监控管理控制台上获取ECS实例监控数据的操作步骤如下所示。