事件监控、事件告警 都需要依赖集群组件“节点问题探查”,需要在运维中心安装。
1. 组件安装;
2. 开通事件告警;
3. 配置应用和集群。
为集群安装组件:运维中心-插件管理。
组件资源占用:该组件主要是一个守护进程集,每个ECS上有且一个组件Pod,单个Pod占用资源:0.1vCPU 100M。
为集群开通告警:运维中心-集群管理-辅助功能管理。
云应用:应用告警-实例事件告警。
说明:
1)对应用环境进行配置,可以指定多个环境;
2)事件类型,目前种类暂时是固定的,可多选。通用Warning是指POD上的所有Waring事件(感兴趣的可以了解下K8S Event);其他的类型,表示某一类特定的事件(不一定是Warning),比如容器重启(可能因为OOM导致健康检查失败,从而重启,会伴随有存活探针失败等异常事件)。
3)告警联系人角色,指定告警的角色,包含了角色下的用户;
4)告警联系人,指定单独告警的用户;
5)消息推送:可选,勾选后消息会发送至TMC;
6)启用/禁用:新建的配置默认启用,禁用后,该条配置不生效(即当前应用不再告警).
集群:资源告警-集群告警。