本文介绍如何使用对象存储OSS的监控服务。
OSS监控服务入口
OSS监控服务处于云监控控制台中。可以通过如下两种方式进入。
OSS监控服务页面
OSS监控服务主页的主体由如下三部分组成。
- 用户概况
- Bucket列表
- 报警规则
该页面没有自动刷新功能,可以单击右上角的刷新按钮自动更新数据信息。
用户概况
用户概况页面从用户层级监控用户相关的信息。主要包括用户监控信息、当月计量统计和用户层级监控指标三大部分。
- 用户监控信息
该模块主要展示该账号所拥有的Bucket总数以及相关的报警规则情况。
-
- 单击Bucket数量的数字,链接到Bucket列表Tab页。
- 单击报警规则总数的数字,链接到报警规则Tab页。
- 单击处于报警状态的数字,链接到报警规则Tab页,并且此时该页展示的报警规则均处于告警状态。
- 单击已禁用规则数的数字,链接到报警规则Tab页,并且此时该页展示的报警规则均被禁用。
- 单击警铃图标下面的数字,链接到报警规则Tab页,并且此时该页展示的报警规则均处于告警状态。
-
- 当月计量统计
当月计量统计展示了从当月1号0点开始,到采集截止时间为止,这段时间内所使用的OSS服务的计费相关的资源信息,包括如下指标:
- 存储大小
- 公网流出流量
- Put类请求数
- Get类请求数
各个计量框中展示的数据根据量级自动调整单位,鼠标停留在数字上方会显示精确的数值。
- 用户层级监控指标
该模块主要展示具体的用户层级的监控图表,主要包括服务监控总览和请求状态详情两部分,下面会详细介绍。
图表展现提供了快速时间范围选择按钮和自定义时间框。- 快速时间范围选择按钮提供1小时、6小时、12小时、1天和7天的时间范围选择,默认为1小时。
- 自定义时间框可以自定义起始时间和结束时间,精确到分钟级别。注意,不支持查询8天以前的数据。
图表展示还支持以下功能:- 单击相关图例可以将该指标曲线隐去,如下图:
- 单击图形右上图标可以将图形放大展示。注意,表格不支持放大展示。
- 单击图形右上图标可以对该图中展示的指标项设置相关报警规则。详见报警服务使用指南。注意,表格和计量参考指标不支持报警设置。
- 鼠标按住图形曲线区域拖放,可以进行时间范围快速调整放大,单击恢复缩放回归到拖放之前的时间范围。
- 服务监控总览
服务监控总览页面主要包括下面监控指标图:
- 用户层级可用性/有效请求率: 包括可用性和有效请求率两项指标。
- 用户层级总请求数/有效请求数: 包括总请求数和有效请求数两项指标。
- 用户层级流量: 包括公网流出流量、公网流入流量、内网流出流量、内网流入流量、CDN流出流量、CDN流入流量、跨区域复制流出流量和跨区域复制流入流量八项指标。
- 用户层级请求状态分布: 该表格中展示选定时间范围内各个请求类型的个数以及占比。
- 请求状态详情
请求状态详情是对请求状态分布统计的一个具体监控,主要包括下面的监控指标图:
- 用户层级服务端错误请求数。
- 用户层级服务端错误请求占比。
- 用户层级网络错误请求数。
- 用户层级网络错误请求占比。
- 用户层级客户端错误请求数:包括资源不存在错误请求数、授权错误请求数、客户端超时错误请求数和客户端其他错误请求数四项指标。
- 用户层级客户端错误请求占比:包括资源不存在错误请求占比、授权错误请求占比、客户端超时错误请求占比和客户端其他错误请求占比四项指标。
- 用户层级有效请求数: 包括成功请求数和重定向请求数两项指标。
- 用户层级有效请求占比: 包括成功请求占比和重定向请求占比两项指标。
Bucket列表
- Bucket列表信息
列表展现该账号所拥有的Bucket的名称、所属地域、创建时间、当月计量数据统计信息以及相关操作。
- 当月计量统计包括每个Bucket的存储量、公网流出流量、Put类请求数和Get类请求数。
- 单击监控图表或者对应的Bucket名称,能够进入具体的Bucket监控视图页。
- 单击报警规则,进入报警规则Tab页,并且展现所有属于该Bucket的报警规则。
- 通过上面的搜索框能够模糊匹配快速找到具体的Bucket。
- 选中Bucket复选框,并单击设置报警规则可以批量设置报警规则,详见报警服务使用指南。
- Bucket层级监控视图
单击Bucket列表中具体的Bucket行中的监控图表,就能进入对应的Bucket的监控视图页,如下图:
Bucket监控视图页按指标分组进行展示监控图,主要包含六个指标分组:- 服务监控总览
- 请求状态详情
- 计量参考
- 平均延时
- 最大延时
- 成功请求操作分类
除了计量参考,所有的指标项都是分钟级别聚合展示的。不同于用户层级默认时间展现为最近1小时,Bucket层级的监控展示默认为6小时。单击上方的返回Bucket列表能够回到Bucket列表Tab页。
- 服务监控总览
该指标分组同用户层级的服务监控总览,只是从具体的Bucket进行监控,主要包括下面监控指标图:
- 可用性/有效请求率: 包括可用性和有效请求率两项指标。
- 总请求数/有效请求数: 包括总请求数和有效请求数两项指标。
- 流量: 包括公网流出流量、公网流入流量、内网流出流量、内网流入流量、cdn流出流量、cdn流入流量、跨区域复制流出流量和跨区域复制流入流量八项指标。
- 请求状态分布: 该表格中展示选定时间范围内各个请求类型的个数以及占比。
- 请求状态详情
该指标分组同用户层级的请求状态详情,只是从具体的Bucket进行监控,主要包括下面监控指标图:
- 服务端错误请求数
- 服务端错误请求占比
- 网络错误请求数
- 网络错误请求占比
- 客户端错误请求数: 包括资源不存在错误请求数、授权错误请求数、客户端超时错误请求数和客户端其他错误请求数四项指标。
- 客户端错误请求占比: 包括资源不存在错误请求占比、授权错误请求占比、客户端超时错误请求占比和客户端其他错误请求占比四项指标。
- 有效请求数: 包括成功请求数和重定向请求数两项指标。
- 有效请求占比: 包括成功请求占比和重定向请求占比两项指标。
- 计量参考
计量参考分组展示各个计量相关的指标信息,以小时粒度收集展现,如下图所示:
包含以下计量指标监控图:
- 存储大小
- 公网流出流量
- 计费请求数:包括Get类请求数和Put类请求数两项指标项。
如果新建Bucket,需要到当前时间点的下一个整小时点才会采集到新数据,然后在半个小时内展示出来。
- 平均延时
该分组包含分API类型监控的各项平均延时指标,包含如下几个指标图:
- GetObject请求平均延时
- HeadObject请求平均延时
- PutObject请求平均延时
- PostObject请求平均延时
- AppendObject请求平均延时
- UploadPart请求平均延时
- UploadPartCopy请求平均延时
每个指标图中都包含对应的平均E2E延时和平均服务器延时,如下图所示:
- 最大延时
该分组包含分API类型监控的各项最大延时指标,包含如下几个指标图:
- GetObject请求最大延时
- HeadObject请求最大延时
- PutObject请求最大延时
- PostObject请求最大延时
- AppendObject请求最大延时
- UploadPart请求最大延时
- UploadPartCopy请求最大延时
每个指标图中都包含对应的最大E2E延时和最大服务器延时,如下图所示:
- 成功请求操作分类
该分组包含分API类型监控的各项成功请求数指标,包含如下几个指标图:
- GetObject成功请求
- HeadObject成功请求
- PutObject成功请求
- PostObject成功请求
- AppendObject成功请求
- UploadPart成功请求
- UploadPartCopy成功请求
- DeleteObject成功请求
- DeleteObjects成功请求
如下图所示:
报警规则
报警规则Tab页能够展示和管理报警规则,如下图所示:
报警规则页的使用和相关说明请参见使用报警服务。
监控关注事项以及使用指导
监控关注点以及使用指南请参见监视诊断和故障排除。