图治离线运维基线诊断
名称 | 类型 | 是否必须 | 示例值 | 更多限制 | 描述 |
---|---|---|---|---|---|
param0 | String | 必须 | ODPS-0010000:System internal error - fuxi job failed, Uncaught exception when handling event T_SCHEDULE on Task task_1_0001_1_07_001888, error=null | logview中错误的信息 | |
param1 | String | 必须 | xxxx | 秘钥,请先找客行申请 |
名称 | 类型 | 示例值 | 描述 |
---|---|---|---|
trace_id | String | 2150883017423913156625036d2c2b | 唯一码,用于定位问题 |
data | TaskRisk | 数据 | |
|
1 2 3 4 5 6 | TaobaoClient client = new DefaultTaobaoClient(url, appkey, secret); AlibabaDtdataopsErrorDiagnosticCreateRequest req = new AlibabaDtdataopsErrorDiagnosticCreateRequest(); req.setParam0( "ODPS-0010000:System internal error - fuxi job failed, Uncaught exception when handling event T_SCHEDULE on Task task_1_0001_1_07_001888, error=null" ); req.setParam1( "xxxx" ); AlibabaDtdataopsErrorDiagnosticCreateResponse rsp = client.execute(req); System.out.println(rsp.getBody()); |
1 2 3 4 5 6 7 8 9 10 | < alibaba_dtdataops_error_diagnostic_create_response > < trace_id >2150883017423913156625036d2c2b</ trace_id > < data > < is_rerun >false</ is_rerun > < suggestion >原因:在odps作业的运行过程当中,任务的某个worker实际使用的资源超过了申请资源导致被kill。 建议如下: 1. 可[参考文档](https://aliyuque.antfin.com/wufang.wq/vp0u4m/qnv85fmxdhcc384p?singleDoc# )定位OOM的worker及解决办法。</ suggestion > < name >任务出错</ name > < is_auto >false</ is_auto > < desc >出现模块:common模块的错误,错误码:ODPS-0010000, 部分错误信息:System internal error - fuxi job failed, caused by: kWorkerOutOfMemory(errCode:256) at Odps/sec_aeapp_20250216195027297gaz80w4vjo7_SQL_0_1_0_job_0/R6_5@bd-odps033056071142.sg113#205. Detail error msg: KILL_NAKILL_NA: plan</ desc > </ data > </ alibaba_dtdataops_error_diagnostic_create_response > |
1 2 3 4 5 6 | < error_response > < code >50</ code > < msg >Remote service error</ msg > < sub_code >isv.invalid-parameter</ sub_code > < sub_msg >非法参数</ sub_msg > </ error_response > |
错误码 | 错误描述 | 解决方案 |
---|