API网关自愈架构解析:Correctover全链路监控方案
2026年6月 · Correctover可瑞沃 架构白皮书
一、传统API网关的"自愈"幻觉
市面上大多数LLM网关声称"自愈",实际只做了两件事:检测HTTP错误 + 重试或切换provider。这不是自愈,这是传输级故障切换。
真正的自愈需要回答一个核心问题:切换后的输出,和期望的输出一致吗?
核心区别:传统Failover = 换一条路走;Verified Failover = 换一条路走 + 验证走到了正确的地方。Failover ≠ Correctover。
二、Correctover自愈架构全景
Client Request
↓
[Correctover Gateway]
├→ Route → Provider A (Primary)
│ ↓
│ [6-Dimension Contract Validation]
│ ├ Status ✓/✗
│ ├ Schema ✓/✗
│ ├ Completeness ✓/✗
│ ├ Latency ✓/✗
│ ├ Cost ✓/✗
│ └ Drift ✓/✗
│ ↓
│ [All Pass] → Return to Client
│ [Any Fail] → Verified Failover →
├→ Route → Provider B (Backup)
│ ↓
│ [Contract Validation on B's output]
│ ├ Pass → Confirm Switch → Return to Client
│ └ Fail → Rollback to A + Alert
三、6维合约验证详解
| 维度 | 验证逻辑 | 违约触发条件 | 性能开销 |
| Status | HTTP状态码 + error对象解析 | 非2xx或含error字段 | <1µs |
| Schema | JSON Schema校验输出结构 | 字段缺失/类型不匹配 | <5µs |
| Completeness | finish_reason + 长度阈值 | 截断/不完整输出 | <1µs |
| Latency | 响应时间合约比对 | 超出SLA阈值 | <1µs |
| Cost | Token消耗量比对 | 异常飙升超出基线 | <2µs |
| Drift | 语义相似度基准对比 | 偏离历史基线 | <15µs |
6维全量验证P50 = 22µs,P99 < 100µs。
四、Verified Failover流程
Phase 1: 检测(Detect)
6维合约验证实时运行,任何一维违约立即触发failover评估。
Phase 2: 验证级切换(Verified Switch)
- 选择备用provider(按优先级/延迟/成本排序)
- 发送相同请求到备用provider
- 对备用provider的输出执行6维合约验证
Phase 3: 确认或回滚(Confirm or Rollback)
- ✅ 备用输出合约验证通过 → 确认切换,返回结果给客户端
- ❌ 备用输出合约验证不通过 → 回滚原provider,记录告警,触发人工介入
五、BYOK直连架构
Correctover不中转任何API流量。企业自带API Key,请求直接发送到模型provider:
Your App → Correctover Gateway → Direct to Provider
↑
Your API Key
(never stored or relayed)
对比传统托管模式:
| 特性 | 传统托管API | Correctover BYOK |
| 数据路径 | 你的服务器→网关→provider | 你的服务器→直连provider |
| 价格 | 加价转售 | 零加价 |
| 数据安全 | 数据经过第三方 | 零中转 |
| 合规风险 | 第三方可能存储数据 | 完全合规 |
| Vendor锁定 | 高 | 零锁定 |
六、性能实测
| 指标 | 数值 |
| 合约验证P50延迟 | 22µs |
| 合约验证P99延迟 | <100µs |
| Verified Failover完成时间 | 取决于备用provider响应 |
| 验证开销占请求总时间 | <0.5% |
| 支持的provider | OpenAI / Claude / 通义 / Gemini / DeepSeek / 任意OpenAI兼容API |
pip install correctover
# 快速接入
from correctover import Gateway
gw = Gateway(
providers=[
{"name": "openai", "api_key": "sk-...", "model": "gpt-4"},
{"name": "claude", "api_key": "sk-ant-...", "model": "claude-3-opus"},
],
contract={
"schema": {"type": "object", "properties": {...}},
"max_latency_ms": 5000,
"max_tokens": 2000,
}
)
result = gw.chat("分析这份报告")
# 自动6维验证 + 验证级故障切换
© 2026 Correctover可瑞沃 — Protocol-level contract validation with automatic verified failover.