本文介绍如何使用对象存储OSS的监控服务。

OSS监控服务入口

OSS监控服务处于云监控控制台中。可以通过如下两种方式进入。

OSS监控服务页面

OSS监控服务主页的主体由如下三部分组成。

  • 用户概况
  • Bucket列表
  • 报警规则

该页面没有自动刷新功能,可以单击右上角的刷新按钮自动更新数据信息。

单击 前往对象存储OSS控制台可以直接进入OSS控制台界面。

用户概况

用户概况页面从用户层级监控用户相关的信息。主要包括用户监控信息、当月计量统计和用户层级监控指标三大部分。

  • 用户监控信息

    该模块主要展示该账号所拥有的Bucket总数以及相关的报警规则情况。

      • 单击Bucket数量的数字,链接到Bucket列表Tab页。
      • 单击报警规则总数的数字,链接到报警规则Tab页。
      • 单击处于报警状态的数字,链接到报警规则Tab页,并且此时该页展示的报警规则均处于告警状态。
      • 单击已禁用规则数的数字,链接到报警规则Tab页,并且此时该页展示的报警规则均被禁用。
      • 单击警铃图标下面的数字,链接到报警规则Tab页,并且此时该页展示的报警规则均处于告警状态。
  • 当月计量统计

    当月计量统计展示了从当月1号0点开始,到采集截止时间为止,这段时间内所使用的OSS服务的计费相关的资源信息,包括如下指标:

    • 存储大小
    • 公网流出流量
    • Put类请求数
    • Get类请求数

    各个计量框中展示的数据根据量级自动调整单位,鼠标停留在数字上方会显示精确的数值。

  • 用户层级监控指标

    该模块主要展示具体的用户层级的监控图表,主要包括服务监控总览请求状态详情两部分,下面会详细介绍。

    图表展现提供了快速时间范围选择按钮和自定义时间框。
    • 快速时间范围选择按钮提供1小时、6小时、12小时、1天和7天的时间范围选择,默认为1小时。
    • 自定义时间框可以自定义起始时间和结束时间,精确到分钟级别。注意,不支持查询8天以前的数据。
    图表展示还支持以下功能:
    • 单击相关图例可以将该指标曲线隐去,如下图:
    • 单击图形右上图标可以将图形放大展示。注意,表格不支持放大展示。
    • 单击图形右上图标可以对该图中展示的指标项设置相关报警规则。详见报警服务使用指南。注意,表格和计量参考指标不支持报警设置。
    • 鼠标按住图形曲线区域拖放,可以进行时间范围快速调整放大,单击恢复缩放回归到拖放之前的时间范围。
  • 服务监控总览

    服务监控总览页面主要包括下面监控指标图:

    • 用户层级可用性/有效请求率: 包括可用性和有效请求率两项指标。
    • 用户层级总请求数/有效请求数: 包括总请求数和有效请求数两项指标。
    • 用户层级流量: 包括公网流出流量、公网流入流量、内网流出流量、内网流入流量、CDN流出流量、CDN流入流量、跨区域复制流出流量和跨区域复制流入流量八项指标。
    • 用户层级请求状态分布: 该表格中展示选定时间范围内各个请求类型的个数以及占比。
  • 请求状态详情

    请求状态详情是对请求状态分布统计的一个具体监控,主要包括下面的监控指标图:

    • 用户层级服务端错误请求数。
    • 用户层级服务端错误请求占比。
    • 用户层级网络错误请求数。
    • 用户层级网络错误请求占比。
    • 用户层级客户端错误请求数:包括资源不存在错误请求数、授权错误请求数、客户端超时错误请求数和客户端其他错误请求数四项指标。
    • 用户层级客户端错误请求占比:包括资源不存在错误请求占比、授权错误请求占比、客户端超时错误请求占比和客户端其他错误请求占比四项指标。
    • 用户层级有效请求数: 包括成功请求数和重定向请求数两项指标。
    • 用户层级有效请求占比: 包括成功请求占比和重定向请求占比两项指标。

Bucket列表

  • Bucket列表信息
    列表展现该账号所拥有的Bucket的名称、所属地域、创建时间、当月计量数据统计信息以及相关操作。
    • 当月计量统计包括每个Bucket的存储量、公网流出流量、Put类请求数和Get类请求数。
    • 单击监控图表或者对应的Bucket名称,能够进入具体的Bucket监控视图页。
    • 单击报警规则,进入报警规则Tab页,并且展现所有属于该Bucket的报警规则。
    • 通过上面的搜索框能够模糊匹配快速找到具体的Bucket。
    • 选中Bucket复选框,并单击设置报警规则可以批量设置报警规则,详见报警服务使用指南
  • Bucket层级监控视图

    单击Bucket列表中具体的Bucket行中的监控图表,就能进入对应的Bucket的监控视图页,如下图:

    Bucket监控视图页按指标分组进行展示监控图,主要包含六个指标分组:
    • 服务监控总览
    • 请求状态详情
    • 计量参考
    • 平均延时
    • 最大延时
    • 成功请求操作分类

    除了计量参考,所有的指标项都是分钟级别聚合展示的。不同于用户层级默认时间展现为最近1小时,Bucket层级的监控展示默认为6小时。单击上方的返回Bucket列表能够回到Bucket列表Tab页。

    • 服务监控总览

      该指标分组同用户层级的服务监控总览,只是从具体的Bucket进行监控,主要包括下面监控指标图:

      • 可用性/有效请求率: 包括可用性和有效请求率两项指标。
      • 总请求数/有效请求数: 包括总请求数和有效请求数两项指标。
      • 流量: 包括公网流出流量、公网流入流量、内网流出流量、内网流入流量、cdn流出流量、cdn流入流量、跨区域复制流出流量和跨区域复制流入流量八项指标。
      • 请求状态分布: 该表格中展示选定时间范围内各个请求类型的个数以及占比。
    • 请求状态详情

      该指标分组同用户层级的请求状态详情,只是从具体的Bucket进行监控,主要包括下面监控指标图:

      • 服务端错误请求数
      • 服务端错误请求占比
      • 网络错误请求数
      • 网络错误请求占比
      • 客户端错误请求数: 包括资源不存在错误请求数、授权错误请求数、客户端超时错误请求数和客户端其他错误请求数四项指标。
      • 客户端错误请求占比: 包括资源不存在错误请求占比、授权错误请求占比、客户端超时错误请求占比和客户端其他错误请求占比四项指标。
      • 有效请求数: 包括成功请求数和重定向请求数两项指标。
      • 有效请求占比: 包括成功请求占比和重定向请求占比两项指标。
    • 计量参考

      计量参考分组展示各个计量相关的指标信息,以小时粒度收集展现,如下图所示:

      包含以下计量指标监控图:

      • 存储大小
      • 公网流出流量
      • 计费请求数:包括Get类请求数和Put类请求数两项指标项。

      如果新建Bucket,需要到当前时间点的下一个整小时点才会采集到新数据,然后在半个小时内展示出来。

    • 平均延时

      该分组包含分API类型监控的各项平均延时指标,包含如下几个指标图:

      • GetObject请求平均延时
      • HeadObject请求平均延时
      • PutObject请求平均延时
      • PostObject请求平均延时
      • AppendObject请求平均延时
      • UploadPart请求平均延时
      • UploadPartCopy请求平均延时

      每个指标图中都包含对应的平均E2E延时和平均服务器延时,如下图所示:

    • 最大延时

      该分组包含分API类型监控的各项最大延时指标,包含如下几个指标图:

      • GetObject请求最大延时
      • HeadObject请求最大延时
      • PutObject请求最大延时
      • PostObject请求最大延时
      • AppendObject请求最大延时
      • UploadPart请求最大延时
      • UploadPartCopy请求最大延时

      每个指标图中都包含对应的最大E2E延时和最大服务器延时,如下图所示:

    • 成功请求操作分类

      该分组包含分API类型监控的各项成功请求数指标,包含如下几个指标图:

      • GetObject成功请求
      • HeadObject成功请求
      • PutObject成功请求
      • PostObject成功请求
      • AppendObject成功请求
      • UploadPart成功请求
      • UploadPartCopy成功请求
      • DeleteObject成功请求
      • DeleteObjects成功请求

      如下图所示:

报警规则

报警规则Tab页能够展示和管理报警规则,如下图所示:

报警规则页的使用和相关说明请参见使用报警服务

监控关注事项以及使用指导

监控关注点以及使用指南请参见监视诊断和故障排除