BackupX/deploy/grafana/README.md

# BackupX Grafana Dashboard

对接 BackupX v2.1+ 暴露的 Prometheus `/metrics` 端点。

## 导入步骤

1. 在 Grafana 配置 Prometheus 数据源指向你的 Prometheus（例如 `http://prometheus:9090`）
2. 在 Prometheus 配置抓取 BackupX：

```yaml
scrape_configs:
  - job_name: 'backupx'
    scrape_interval: 30s
    static_configs:
      - targets: ['backupx-master:8340']
```

3. Grafana → Dashboards → Import → 上传 `backupx-dashboard.json` → 选 Prometheus 数据源 → Import

## 面板内容

- 当前运行任务数 / SLA 违约数 / 在线节点 / 24h 成功率 / 应用版本
- 任务执行速率（按 success/failed 堆叠）
- 任务耗时 P50/P95/P99（按任务类型）
- 任务产出字节速率
- 存储目标用量 TopN 柱状图
- 节点在线状态表（红/绿标色）
- 验证 / 恢复 / 复制的成功率时间线

## 自定义建议

- 将 `backupx_sla_breach_tasks > 0` 配为 AlertManager 告警
- `sum(backupx_node_online) < N` 触发集群容量告警（N 为你集群的最少节点数）
- P99 任务耗时突变可用于发现慢任务和资源压力