当前位置: 首页 > news >正文

智能体的记忆管理机制及其潜在风险 | 直播预约

主题

智能体的记忆管理机制及其潜在风险

时间

2025.12.30 周一 11:00 北京时间
2025.12.29 周日 22:00 美东时间
2025.12.29 周日 19:00 美西时间

直播平台

微信视频号:

b站直播间:

Youtube直播间:

https://www.youtube.com/live/U0rDRX7ZkYM

内容介绍

分享简介:大语言模型(LLM)智能体的兴起标志着人工智能从静态模型向具备感知、推理与行动能力的自主系统的根本性转变。记忆机制是此类智能体的核心组成部分,使其能够保留过往经验并适应新的任务需求。本次报告将探讨记忆管理如何从根本上影响大语言模型智能体的性能,并揭示记忆机制所伴随的潜在风险。

通过系统性的实证研究,我将展示合理的记忆管理策略如何有效缓解智能体记忆中的两大关键挑战:错误传播(error propagation)与经验回放失配(misaligned experience replay)。此外,我将介绍两种新近涌现的攻击范式:记忆窃取(memory extraction)与记忆注入(memory injection),揭示攻击者如何仅通过标准用户交互即可窃取或操纵智能体中存储的信息。这些攻击暴露了当前记忆架构中存在的根本性安全漏洞。

总体而言,在下一代大语言模型智能体的设计中,记忆既是一项强大的能力,也可能成为潜在的系统性风险,亟需重新审视与系统化建模。

论文:
How Memory Management Impacts LLM Agents: An Empirical Study of Experience-Following Behavior, 2025.
Unveiling Privacy Risks in LLM Agent Memory, ACL 2025.
Memory Injection Attacks on LLM Agents via Query-Only Interaction, NeurIPS 2025.

论文地址:
https://arxiv.org/abs/2505.16067
https://aclanthology.org/2025.acl-long.1227/
https://arxiv.org/abs/2503.03704v4

嘉宾

向臻,现任佐治亚大学(University of Georgia)计算学院助理教授,并同时隶属于人工智能研究所(Institute for Artificial Intelligence)以及网络安全与隐私研究所(Institute for Cybersecurity and Privacy)。他的研究方向包括可信机器学习、人工智能安全、大语言模型及智能体,以及统计信号处理。他担任多项重要机器学习会议的程序委员会委员,并任职于 IEEE TCSVT副编辑。
个人主页:
https://zhenxianglance.github.io/

入群

欢迎加入NICE每周分享交流群,可与NICEer唠嗑,以及第一时间收到后续NICE分享报告的通知。加群通过小助手认证,群内无广告。

备注【昵称-单位-方向-NICE入群】

NICE介绍

NICE(Nexus forIntelligenCE)是一个由全球50+位一线青年学者共同发起的顶尖AI前沿交流平台。 成立以来,我们汇聚海内外300+嘉宾,通过百余场线上深度分享与线下高规格活动(北京/上海/苏州等),全网积累超13万关注。目前,NICE已构建起覆盖中、美、欧的国际化团队,正加速在硅谷、纽约、香港等地落地,致力于打造连接学术、产业与未来的全球化AI前沿社区。
NICE主页
https://nice-nlp.github.io
NICE海外
https://nice-intl.github.io
b站
https://space.bilibili.com/507524288
Youtube
https://www.youtube.com/@NLPAcademicExchangePlatform

编辑:冯可蘅 华盛顿大学
http://www.zskr.cn/news/171940.html

相关文章:

  • PyTorch-CUDA-v2.6镜像结合Dify平台实现低代码AI应用开发
  • PyTorch-CUDA-v2.6镜像助力自然语言处理任务提速
  • 计组速成5.指令系统
  • PyTorch-CUDA-v2.6镜像端口映射设置指南(Jupyter/SSH)
  • PyTorch-CUDA-v2.6镜像体积优化技巧:减少存储占用提升加载速度
  • 【开题答辩全过程】以 基于微信小程序的医院自助挂号系统为例,包含答辩的问题和答案
  • 深度解读.NET 中 Span:零拷贝内存操作的核心利器
  • PyTorch张量广播机制Broadcasting规则详解
  • C++课后习题训练记录Day59
  • 快速理解USB-Blaster在FPGA烧录中的作用与驱动需求
  • 从零开始搭建AI训练环境:PyTorch-CUDA-v2.6镜像使用指南
  • 新手教程:如何使用示波器验证高速pcb信号质量
  • vivado2021.1安装教程:解决Windows常见报错方法
  • SSH X11转发实现PyTorch图形化调试界面显示
  • vscode 是盈利的吗?微软为什么要持续投入开发资源?
  • PyTorch-CUDA-v2.6镜像 vs 手动安装:效率差距有多大?
  • Linux平台USB转串口驱动安装与设备树配置指南
  • Keil5汉化入门教程:简单三步完成设置
  • 2026年AI 编程软件推荐:从入门到精通的完整解决方案
  • usb_burning_tool烧录超时日志分析:深度剖析可能原因
  • 清华镜像站同步脚本定时更新最新PyTorch发行版
  • 清华镜像站离线备份方案应对突发网络中断风险
  • Jupyter Notebook导出PDF含中文字体缺失解决方案
  • 通俗解释proteus8.17下载及安装常见教学问题与解决
  • 主流的激活函数有哪些?
  • SSH免密码sudo执行PyTorch系统管理命令配置
  • 基于OpenMV识别物体的智能门禁系统设计:完整指南
  • 零基础学习UDS诊断协议:诊断会话模式详解
  • ARM64异常返回指令eret工作机制手把手教程
  • 告别繁琐配置!PyTorch-CUDA-v2.6镜像助你秒级启动深度学习项目