监控记录列表主要是对监控报警记录的一个列表展示,提供了对任务名、接收人、接收时间、报警原因、发送状态、接收方式、创建时间等条件的过滤,来帮助您筛选出您关心的记录,如下图所示:
注意:接收时间查询的规则为:接收时间到当前时间的区间。
展示规则如下所示:
① 接收人默认展示当前用户。
② 接收时间默认设置选择当天。
如上图所示,有完成、未完成和出错三种报警原因的筛选。
如上图所示,有已发送和发送失败两种发送状态的筛选。
注意:
发送失败时,接收方式为邮件的任务列,单击该列中的发送失败字样,会弹出发送失败的邮件内容,如下图所示:
如上图所示,有短信和邮件两种接收方式的筛选。
如上图所示,报警时间可以将任务以升序/降序重新排列。
监控报警模块是调度任务节点的监控保障系统,当任务出现错误的时候,系统会通过预定义的方式告知您任务失败,您可以按照自己定义的规则来配置告警规则。
接收报警信息以下规则:
① 若接收人设置的是子账号,但是子账号没有在数加控制台中设置手机号,那么将会把报警信息发送给主账号。
② 若主账号在数加控制台中也没有设置手机号,则会读取个人信息中的联系方式,发送短信。
在监控设置中,您可新建报警,来对任务进行监控。若任务没有运行成功或者没有按时运行,都会有报警信息通知,监控设置页面如下所示:
新建报警单击新建报警会弹出如下提示框:
新建报警时需要设置:任务名、报警原因、报警方式、接收人等。
设置项 |
说明 |
任务名 |
支持模糊查询,支持多选(若选择了多个任务,则会一次性建立多个报警)。 |
报警原因 |
只支持选择一种原因(如果某个任务很重要,需要监控两种原因,那可以针对这个任务,多建一个报警,用来监控另一种原因)。 |
报警方式 |
支持多选,可以选择邮件和短信同时通知(需要在数加控制台中的个人信息中设置自己的邮箱/手机号才会收到报警)。 |
接收人 |
只支持单选(其他人包含:该项目中的其他成员,非本项目的子账号,无法选择)。 |
未完成 |
设置未完成报警时,需要指定一个时间点,若超过该时间点,任务还未运行完毕,则会报警提示。 |
在配置监控报警时,请注意以下规则:
① 监控报警属于准实时监控,会有几分钟的延迟。
② 所有类型的监控报警默认都有3次提醒,每次间隔半个小时。例如以下情况:
i)假如配置了一个任务A在03:00的未完成提醒:
a. 若任务A在03:00未成功,则03:00左右会发送第一次报警。
b. 若之后任务一直都是未成功状态,则会在03:30和04:00左右继续发送报警。
c. 若任务在报警间隔中达到了成功的状态,未完成报警将不再发送。
ii)假如配置了任务A的出错提醒:
a. 出错报警会在任务出错后发出第一次报警,若一直没有处理这个出错任务,则会在之后的一个小时内每隔30分钟发出出错报警。
b. 接收到报警后,进行相关的处理并重跑了任务,再次出错的话,会被重新记次,故不必担心任务出错的次数用完的问题。
③ 如果只配置了未完成报警,任务出错将不会提醒。比如您接到任务未完成的提醒,查看任务状态,是还在运行中,若运行中的状态持续到三次未完成提醒之后出错了,那这个出错的状态不会被报警出来,除非您配置了任务的出错提醒。
④ 监控报警的监控范围目前只限制在当前业务日期的日常调度任务,如果是补数据任务出错,或是任务跨天出错了(比如今天是2月11日,那么今天就只监控业务日期是2月10日的日常任务实例),都会监控不到,此时即使配置了任务出错提醒也会收不到报警。
⑤ 如果没有在数加平台里完善个人的联系信息,会导致在报警列表中看到报警发送的状态是发送失败,此时请进入个人信息页面确认个人联系信息是否完善。
以列表的形式,对任务的报警设置进行展示,在列表里可以对报警进行筛选、操作等。监控列表如图所示:
设置项 |
说明 |
筛选功能 |
如上图中的模块①,为您提供了任务名查询、报警原因过滤、接收方式过滤。 |
操作 |
如上图中的模块②,您可对当前报警进行修改(只可修改报警原因、报警方式、接收人)、删除、报警关闭等。 注意:报警关闭:关闭当前设置的报警,关闭后的报警设置,即使任务失败,也不会有任何报警提示。 |
批量关闭 |
如上图中的模块③,只能对报警设置进行批量删除。 注意:若想查看被监控任务的报警记录,请参见监控记录。 |