系统监控

实时监控中
健康

系统状态

QPS
1,247

每秒请求

P99
245ms

响应延迟

良好
0.03%

错误率

高负载
87%

GPU使用率

实时任务队列

Web端
插件端
23

Web端队列

处理中: 8 个任务

平均等待: 2.3 分钟

104

插件端队列

处理中: 15 个任务

平均等待: 5.7 分钟

任务成功率

成功 96.2%
失败 2.8%
超时 1.0%

系统负载

CPU 45%
内存 68%
磁盘 32%

GPU集群状态

总计: 8 节点 | 在线: 7 节点 | 离线: 1 节点

GPU-01

显存使用 18.2GB / 24GB
计算利用率 89%
温度 72°C

GPU-02

显存使用 21.5GB / 24GB
计算利用率 94%
温度 78°C

GPU-03

显存使用 12.8GB / 24GB
计算利用率 67%
温度 69°C

GPU-04

状态 离线
节点离线,正在重启...

API响应时间分布

错误率趋势