智能体安全治理操作系统

TLA+ 形式化验证 · 零信任架构 · OWASP Agentic 安全

$ pip install maref
决策树

四级治理决策树

每个智能体动作流经四级决策节点 — 97% 自动判定,3% 人工升级

40%20%37%3%ENTER智能体动作请求身份认证零信任身份验证权限范围检查权限边界执行策略引擎97% 自动,3% 人工升级人工升级高风险边缘案例升级BLOCK
问题

智能体安全在每一层都失效

多智能体系统正在爆发式增长,但现有框架将安全性视为事后补救。

91%

的生产环境智能体存在工具链漏洞

Stanford/MIT 合作 AI 研究, 2026

327%

多智能体系统采用率 4 个月内增长

Databricks Data + AI Summit, 2026

$4.2M

智能体安全事故平均损失

IBM 数据泄露成本报告 2026

Known Incidents

Claude Code 提示注入越狱

对抗性提示绕过安全过滤器,执行未授权文件操作。

Gemini 3.5 数据库删除事故

工具链对齐失败导致不可逆的生产数据丢失。

AutoGPT 沙箱逃逸

未经验证的 API 调用导致容器逃逸至内部基础设施。

现有框架修补症状。MAREF 重建根基。

纵深防御

8 层纵深防御架构

红色攻击箭头从左进入,逐层穿透 — 在第 5 层安全门控被拦截

PROTECTED01输入净化02工具调用审计03权限检查04沙箱隔离05安全门控06策略决策树07威胁检测08遥测审计
架构

六层架构,治理优先

1

应用层

/ Application

多智能体框架集成层,兼容任何智能体框架。

2

编排层

/ Orchestration

任务分解与跨智能体分布式事务协调。

3

治理层

/ Governance

治理优先门控。所有智能体动作执行前必经此层。

4

安全层

/ Safety

截图脱敏、输入过滤、文件沙箱、剪贴板清洗。

5

可观测层

/ Observability

完整遥测、不可变操作记录和实时监控。

6

基础设施层

/ Infrastructure

部署基座。Sidecar 注入、K8s 原生、Serverless 就绪。

治理状态机

Gray Code 有限状态机

每步跳转汉明距离 = 1,数学可验证的治理状态转换

初始000000引导000001加载000011校验000010认证000110运行000111监控000101演进000100检查点001100终止100000Current: 000000当前状态跳转路径汉明距离 = 1吸收态 HALT
竞品对比

为什么选择 MAREF?

7 个关键维度 × 6 个框架的全面对比

维度
MAREF
MAREF v0.30.0
LangGraph
LangGraph
CrewAI
CrewAI
AutoGen
Microsoft AutoGen
OpenAI
OpenAI Agents SDK
Anthropic
Anthropic Tool Use
Manual
Manual Governance
形式化验证
TLA+/Coq 正确性证明
10 4 3 5 3 3 2
纵深防御
多层安全架构
10 5 4 5 4 4 3
零信任架构
智能体间无隐式信任
9 3 2 3 4 4 5
Gray Code 状态机
汉明距离=1 治理
10 1 1 1 1 1 1
自演进
Lyapunov 收敛证明
10 2 3 4 1 1 1
国密算法
SM2/SM3/SM4 合规
9 1 1 1 2 2 3
全链路可观测
OpenTelemetry + 不可变审计
9 6 5 6 5 4 2
收敛性

Lyapunov 收敛性证明

FNR -60%,200 轮自演进后的数学可证收敛

V(x)=xᵀPx, V̇(x)≤-α‖x‖² Lyapunov 函数保证指数级收敛
4300+
测试用例
82%
覆盖率
97%
自动化决策率
100%
红线阻止率