当前位置: 首页 > news >正文

Agent 系列(19):Harness 完整体系——8 层防护框架全景

从五要素到八层框架

第 17 篇介绍了 Harness 的五个要素:动作空间、人工检查点、执行边界、审计日志、回滚。五要素是骨架,能处理大多数场景。

但生产级 Agent 面对的威胁更复杂:

  • LLM 被提示注入操控,绕过工具白名单用合法工具实现非法意图
  • 多步推理耗尽 Token 预算,系统雪崩
  • 审计日志被事后篡改,合规失效
  • 模型报告"已执行",但实际状态已被回滚——谁的话算数?

完整的 8 层框架在五要素基础上增加了三层主动防御:

Layer 1 Minimal Footprint 最小权限:任务只暴露必要工具 Layer 2 Action Space Registry 动作注册表:PermissionLevel 枚举,每个动作有 budget_cost Layer 3 Permission Budget 权限预算:spend() / BudgetExhaustedError Layer 4 Execution Sandbox 执行沙箱:输入净化 + 子进程隔离 Layer 5 Human Checkpoint 人工检查点:LangGraph interrupt(第 17 篇详述) Layer 6 Immutable Audit Log 不可篡改审计日志:哈希链 JSONL + 完整性验证 Layer 7 Rollback Coordinator 回滚协调器:事务 context manager Layer 8 Threat Model 威胁模型:对抗场景测试

本文用实测数据覆盖全部 8 层,附三个反直觉结论。


Layer 1:最小权限——任务决定工具范围

核心思路:不同任务类型只暴露必要工具,LLM 连其他工具的存在都不知道。

TASK_TOOL_MAP:dict[str,list]={"read_only":[read_data],"reporting":[read_data,send_report],"data_entry":[read_data,write_data],"admin":[read_data,write_data,send_report,delete_record],}defget_tools_for_task(task_type:str)->list:returnTASK_TOOL_MAP.get(task_type,[read_data])

每种任务类型的工具子集:

Task type → Available tools read_only → ['read_data'] reporting → ['read_data', 'send_report'] data_entry → ['read_data', 'write_data'] admin → ['read_data', 'write_data', 'send_report', 'delete_record']

read_only任务下,模型完全不知道write_datadelete_record的存在——bind_tools()只传入该任务的工具子集。

实测read_onlyAgent 查询sales_q1,预算消耗 1(一次read_data),没有任何越权行为。


Layer 2 & 3:注册表 + 权限预算

注册表设计:每个动作声明权限等级和预算成本。

classPermissionLevel(Enum):READ=1WRITE=2ADMIN=3IRREVERSIBLE=4@dataclassclassRegisteredAction:name:strlevel:PermissionLevel budget_cost:intdescription:strhandler:Any ACTION_REGISTRY:dict[str,RegisteredAction]={"read_data":RegisteredAction("read_data",READ,1,"Read a record",read_data),"write_data":RegisteredAction("write_data",WRITE,3,"Write/update a record",write_data),"send_report":RegisteredAction("send_report",WRITE
http://www.zskr.cn/news/1514399.html

相关文章:

  • 摆脱论文困扰!盘点2026年人气爆表的的降AI率平台
  • Okbiye AI 写作:毕业论文一站式智能创作工具,抚平毕业生论文撰写全流程压力
  • 用三菱GXWorks2的SFC功能,手把手教你做个玩具分拣产线模拟程序(附完整源码)
  • 从高铁选座到密码加密:用Python解决8个意想不到的生活小问题
  • 2026年德力斯手套箱行业精选厂家分析:技术、服务与案例全景解读 - 优质品牌商家
  • 用三菱PLC GXWorks2的SFC功能,搞定玩具分拣产线编程(附完整程序下载)
  • 5分钟快速上手:Locale-Emulator终极指南,彻底解决日文游戏乱码问题
  • 2026年齿轮加工厂分布全解析:从华北到西南的产业格局与实力厂商对比 - 优质品牌商家
  • 终极yuzu模拟器指南:3小时从零到精通,免费畅玩Switch游戏
  • 【鸿蒙原生应用开发实战】第二篇:首页开发——宠物卡片+快捷入口+动态信息流
  • 2026年6月德州企业车拖车服务贴心推荐指南:如何构建高效的车辆应急保障体系 - 品牌鉴赏官2026
  • 2026年中济南地区值得信赖的氨基磺酸实力生产供应商深度解析 - 品牌鉴赏官2026
  • SpaceX 750 亿美元 IPO 估值达 1.77 万亿美元,马斯克距万亿身家仅一步之遥
  • 告别Windows思维:在EAIDK-610的Linux上用Vim和GDB调试你的第一个C++程序
  • OpenAI营销权一分为二,B2B老将Fleming上任,能否破局企业市场混战?
  • 2026年四川变压器回收公司服务能力对比:哪些企业值得关注? - 优质品牌商家
  • 2026靠谱降AI率平台怎么选?实测15款后这几个最实用
  • SPSS多因素方差分析保姆级教程:从数据导入到交互作用图,手把手搞定广告效果评估案例
  • SQL 查询终极高阶通鉴:从零基础拆解到工业级多表联查、窗口函数与索引优化
  • NSK W4509SA-1Z-C5Z10 滚珠丝杠详解
  • I3C总线端口扩展利器:P3S0200高速开关的设计与应用
  • 2026实力厂家:聊城六角钢管品牌与精密工艺全览 - 企业推荐官【官方】
  • 办公提效神器 OpenClaw 2.7.9 Windows 端完整安装配置教程(含安装包)
  • 告别臃肿日志!用CANoe/CANalyzer的CFB插件精准过滤ASC/BLF文件(附手动/自动保存技巧)
  • Java计算机毕设之基于 SpringBoot 的社区公益助老管理服务系统的设计与实现(完整前后端代码+说明文档+LW,调试定制等)
  • 微程序控制器设计避坑指南:从零构建单总线CPU控制信号(以MIPS指令为例)
  • 避开Simulink通信仿真那些坑:以BASK为例,详解带通滤波器与比较器参数调试
  • LabVIEW属性节点实战:5分钟教你实现控件‘动态皮肤’与交互逻辑
  • MATLAB小白也能搞定的2DPSK通信仿真:从生成随机码到误码率曲线全流程解析
  • Android扫码权限总被拒?手把手教你用HMS ScanKit搞定相机和存储权限申请的最佳实践