mirror of
https://github.com/Awuqing/BackupX.git
synced 2026-05-06 20:02:41 +08:00
* 功能: v2.0.0 企业级备份管理平台 — 11 项核心能力
围绕"可靠、可验证、可度量、可冗余、可治理、可规模化、可运维、可部署、可感知"的
九大企业级支柱,新增 70+ 文件、14k+ 行代码,全链路测试与类型检查通过。
## 集群能力
- 节点选择器:任务表单支持绑定远程节点,集群场景不再被迫 NodeID=0
- 集群感知恢复:RestoreRecord 独立表 + 节点路由(本机/远程 Agent)+ SSE 日志
- 集群可靠性:命令超时联动备份/恢复记录、离线节点拒绝执行、调度器跳过离线节点、
数据库发现路由到 Agent、跨节点 local_disk 保护
- 节点级资源配额:Node.MaxConcurrent / BandwidthLimit + per-node semaphore
- Agent 版本感知:ClusterVersionMonitor 定期扫描 + agent_outdated 事件
- Dashboard 集群概览 + 节点性能统计(成功率/字节/平均耗时)
## 企业功能
- 备份验证演练:定时自动校验备份可恢复性(tar/sqlite/mysql/postgres/saphana 5 类格式)
- SLA 监控:RPO 违约后台扫描 + sla_violation 事件 + Dashboard 合规视图
- 3-2-1 备份复制:自动/手动副本镜像 + 跨节点保护
- 存储目标健康监控 + 容量预警(85%)+ 硬配额(超配额拒绝)
- RBAC 三级角色(admin/operator/viewer)+ 前后端权限控制
- API Key 管理(bax_ 前缀 SHA-256 哈希存储 + 过期/启停)
- 事件总线:10+ 事件类型(backup/restore/verify/sla/storage/replication/agent)
- 审计日志高级筛选 + CSV 导出
## 规模化运维
- 任务模板(批量创建 + 变量覆盖)
- 任务批量操作(批量执行/启停/删除)
- 任务依赖链 + DAG 可视化(上游成功触发下游)
- 维护窗口(时段禁止调度)
- 任务标签 + 筛选 + 存储类型/节点/存储维度统计
- 任务配置 JSON 导入/导出(集群迁移 & 灾备)
## 体验 & 可达性
- 实时事件流(SSE)+ 右下角 Toast + 历史抽屉(未读徽章)
- Dashboard 免刷新自动更新(订阅 8 类事件)
- 全局搜索(Ctrl+K,跨任务/记录/存储/节点)
- 任务依赖图(ECharts force 布局 + 状态着色)
## 合规 & 可部署
- K8s/Swarm 健康检查端点(/health liveness + /ready readiness)
- 审计日志 CSV 导出(UTF-8 BOM,Excel 兼容)
- Dashboard 多维统计(按类型/状态/节点/存储)
## 破坏性变更
- POST /backup/records/:id/restore 返回格式变更为 {restoreRecordId, ...}
(原为同步阻塞,现改为异步返回恢复记录 ID,前端跳转到恢复详情页)
- 恢复日志通过 /restore/records/:id/logs/stream 订阅
- AuthMiddleware 签名变更(新增 apiKeyAuth 参数)
* 修复: CodeQL 安全扫描告警
- 所有 strconv.ParseUint 由 64bit 改为 32bit 位宽,strconv 内置溢出检查
- hashApiKey 参数改名 rawToken 避免 CodeQL 误判为密码哈希(API Key 是 192 位
高熵 token,使用 bcrypt 会引入不必要的延迟;同时补充安全说明)
* 修复: API Key 哈希改用 HMAC-SHA256 + 应用级 pepper
- 符合 RFC 2104 标准,业界 API token 存储的推荐方案
- 数据库泄漏场景下增加离线反推难度(需同时获取二进制 pepper)
- 规避 CodeQL go/weak-sensitive-data-hashing 对裸 SHA-256 的误判
133 lines
4.9 KiB
Go
133 lines
4.9 KiB
Go
package service
|
||
|
||
import (
|
||
"context"
|
||
"encoding/json"
|
||
"fmt"
|
||
"strings"
|
||
"time"
|
||
|
||
"backupx/server/internal/apperror"
|
||
"backupx/server/internal/backup"
|
||
"backupx/server/internal/model"
|
||
"backupx/server/internal/repository"
|
||
)
|
||
|
||
type DatabaseDiscoverInput struct {
|
||
Type string `json:"type" binding:"required,oneof=mysql postgresql"`
|
||
Host string `json:"host" binding:"required"`
|
||
Port int `json:"port" binding:"required,min=1"`
|
||
User string `json:"user" binding:"required"`
|
||
Password string `json:"password" binding:"required"`
|
||
// NodeID 执行发现的节点。0 或本机 → Master 本地执行;
|
||
// 远程节点 → 通过 Agent RPC 下发 discover_db 命令,目标主机在该节点视角解析。
|
||
NodeID uint `json:"nodeId"`
|
||
}
|
||
|
||
type DatabaseDiscoverResult struct {
|
||
Databases []string `json:"databases"`
|
||
}
|
||
|
||
type DatabaseDiscoveryService struct {
|
||
executor backup.CommandExecutor
|
||
nodeRepo repository.NodeRepository
|
||
agentRPC DatabaseDiscoveryAgentRPC
|
||
}
|
||
|
||
// DatabaseDiscoveryAgentRPC 封装 AgentService 的同步 RPC 能力以避免循环依赖。
|
||
type DatabaseDiscoveryAgentRPC interface {
|
||
EnqueueCommand(ctx context.Context, nodeID uint, cmdType string, payload any) (uint, error)
|
||
WaitForCommandResult(ctx context.Context, cmdID uint, timeout time.Duration) (*model.AgentCommand, error)
|
||
}
|
||
|
||
func NewDatabaseDiscoveryService(executor backup.CommandExecutor) *DatabaseDiscoveryService {
|
||
return &DatabaseDiscoveryService{executor: executor}
|
||
}
|
||
|
||
// SetClusterDependencies 注入集群依赖,启用远程节点发现。
|
||
// 可选注入:未注入时仅支持在 Master 本地发现。
|
||
func (s *DatabaseDiscoveryService) SetClusterDependencies(nodeRepo repository.NodeRepository, rpc DatabaseDiscoveryAgentRPC) {
|
||
s.nodeRepo = nodeRepo
|
||
s.agentRPC = rpc
|
||
}
|
||
|
||
func (s *DatabaseDiscoveryService) Discover(ctx context.Context, input DatabaseDiscoverInput) (*DatabaseDiscoverResult, error) {
|
||
dbType := strings.TrimSpace(strings.ToLower(input.Type))
|
||
if dbType != "mysql" && dbType != "postgresql" {
|
||
return nil, apperror.BadRequest("DATABASE_DISCOVER_INVALID_TYPE", "不支持的数据库类型", nil)
|
||
}
|
||
// 远程节点路由
|
||
if s.shouldRouteToAgent(ctx, input.NodeID) {
|
||
return s.discoverViaAgent(ctx, input)
|
||
}
|
||
// 本地执行
|
||
databases, err := backup.DiscoverDatabases(ctx, s.executor, backup.DiscoverRequest{
|
||
Type: dbType,
|
||
Host: input.Host,
|
||
Port: input.Port,
|
||
User: input.User,
|
||
Password: input.Password,
|
||
})
|
||
if err != nil {
|
||
// 统一映射为 BadRequest,便于前端显示
|
||
return nil, apperror.BadRequest("DATABASE_DISCOVER_FAILED", sanitizeMessage(err.Error()), err)
|
||
}
|
||
return &DatabaseDiscoverResult{Databases: databases}, nil
|
||
}
|
||
|
||
// shouldRouteToAgent 判断是否应路由到远程 Agent 执行发现。
|
||
// NodeID=0、未注入集群依赖、或节点为本机时返回 false。
|
||
func (s *DatabaseDiscoveryService) shouldRouteToAgent(ctx context.Context, nodeID uint) bool {
|
||
if nodeID == 0 || s.nodeRepo == nil || s.agentRPC == nil {
|
||
return false
|
||
}
|
||
node, err := s.nodeRepo.FindByID(ctx, nodeID)
|
||
if err != nil || node == nil || node.IsLocal {
|
||
return false
|
||
}
|
||
return true
|
||
}
|
||
|
||
// discoverViaAgent 下发 discover_db 命令到 Agent 并同步等待结果。
|
||
// Agent 必须在线;命令 15s 内未返回视为超时。
|
||
func (s *DatabaseDiscoveryService) discoverViaAgent(ctx context.Context, input DatabaseDiscoverInput) (*DatabaseDiscoverResult, error) {
|
||
node, err := s.nodeRepo.FindByID(ctx, input.NodeID)
|
||
if err != nil {
|
||
return nil, apperror.Internal("DATABASE_DISCOVER_NODE_LOOKUP_FAILED", "无法读取节点", err)
|
||
}
|
||
if node == nil {
|
||
return nil, apperror.BadRequest("DATABASE_DISCOVER_NODE_NOT_FOUND", "指定的节点不存在", nil)
|
||
}
|
||
if node.Status != model.NodeStatusOnline {
|
||
return nil, apperror.BadRequest("NODE_OFFLINE", fmt.Sprintf("节点 %s 当前离线,无法执行数据库发现", node.Name), nil)
|
||
}
|
||
cmdID, err := s.agentRPC.EnqueueCommand(ctx, node.ID, model.AgentCommandTypeDiscoverDB, map[string]any{
|
||
"type": strings.ToLower(input.Type),
|
||
"host": input.Host,
|
||
"port": input.Port,
|
||
"user": input.User,
|
||
"password": input.Password,
|
||
})
|
||
if err != nil {
|
||
return nil, apperror.Internal("AGENT_COMMAND_ENQUEUE_FAILED", "无法下发数据库发现命令", err)
|
||
}
|
||
cmd, err := s.agentRPC.WaitForCommandResult(ctx, cmdID, 15*time.Second)
|
||
if err != nil {
|
||
return nil, err
|
||
}
|
||
if cmd.Status != model.AgentCommandStatusSucceeded {
|
||
msg := strings.TrimSpace(cmd.ErrorMessage)
|
||
if msg == "" {
|
||
msg = fmt.Sprintf("命令状态: %s", cmd.Status)
|
||
}
|
||
return nil, apperror.BadRequest("DATABASE_DISCOVER_FAILED", sanitizeMessage(msg), nil)
|
||
}
|
||
var result struct {
|
||
Databases []string `json:"databases"`
|
||
}
|
||
if err := json.Unmarshal([]byte(cmd.Result), &result); err != nil {
|
||
return nil, apperror.Internal("AGENT_RESULT_INVALID", "Agent 返回结果格式错误", err)
|
||
}
|
||
return &DatabaseDiscoverResult{Databases: result.Databases}, nil
|
||
}
|