当前位置: 首页 > news >正文

LangChain 实践4 7-3 缓存系统搭建

阶段目标

新增语义缓存(会话缓存已落地,可见阶段 2 多轮对话记忆能力),降低模型调用成本、提升响应速度。


后端任务

  1. 统一使用内存缓存:简易版复用 LangChain 内置缓存,进阶版自研内存缓存 ✅️
  2. 实现两类缓存逻辑:精确匹配(LangChain 内置缓存)、语义相似匹配(自研内存缓存)改为 精确匹配和语义相似匹配(自研内存缓存) ✅️
  3. 配置缓存过期规则,支持自动 / 手动清理 ✅️

LangChain 内置缓存 ❌️

本节使用内存缓存(InMemoryCache),使用方式可见LangChain 缓存

问题

当前项目开启流式输出后,LangChain 内置缓存无法生效,因其仅支持非流式调用

若要同时保留流式能力、实现精确匹配与语义相似两类缓存,并配置过期及清理规则,需放弃框架自带缓存,在接口层自研内存缓存方案。


自研内存缓存

精确匹配

通过全局字典按 session_id 分组,将用户问题与对应回答一一存储,提问时先判断问题是否完全一致,一致则直接返回缓存答案,否则调用模型并缓存新问答。


语义相似匹配

关键:向量相似度匹配

向量计算可见embeddings

缓存过期与清理

本方案采用惰性清理机制管理缓存过期逻辑,为每一条缓存数据统一设置固定有效时长,数据写入时自动计算并记录过期时间;每次查询缓存时,会先校验所有条目是否超时,自动过滤并移除已过期数据,无需额外开启定时任务,减少系统资源消耗。

同时配套手动清理能力,在聊天界面提供入口,可一键清空当前会话下的全部缓存内容,满足用户重置对话的使用需求。


阶段交付

✅ 可展示缓存命中状态
✅ 接口响应提速
✅ 模型 Token 消耗降低


运行效果

精确匹配

首次提问

页面:明显的流式输出,打字机效果

耗时

再次提问完全相同的问题,系统会直接命中本地缓存,无需调用大模型,几乎瞬时返回结果。


耗时

若提问内容发生变化,系统将无法匹配到有效缓存,会自动重新调用大模型生成全新答案,耗时与首次提问保持一致。


语义相似匹配

用 BGE 向量模型计算出的相似度约为0.803,这个值触发了语义缓存阈值,因此第二次请求直接返回了缓存答案,耗时从 5 秒多降到了 0.3 秒,性能提升非常明显。


缓存过期与清理

缓存过期

缓存有效期设为1分钟。

当用户提问超过 1 分钟后再次输入相同问题时,由于原缓存数据已过期,系统会判定为未命中缓存,转而调用大模型重新生成回答,因此接口耗时与首次提问时的响应时间相近。


缓存清理

点击缓存清理按钮

即使第三次提问发生在首次提问后的 1 分钟有效期内,但此时缓存已被用户手动清除,系统同样无法命中缓存,需重新调用大模型生成回答,因此耗时仍与首次提问相近。

http://www.zskr.cn/news/1439667.html

相关文章:

  • 2026年5月武汉奢侈品回收行业深度解读——市场风向标与六强态势 - 薛定谔的梨花猫
  • 绍兴黄金回收避坑:核心商圈常见套路与六家正规机构 - 上门黄金回收
  • 别再傻傻轮询了!STM32F103串口+DMA双缓存实战,让你的CPU占用率降下来
  • 泉州除甲醛公司哪家好?前五名口碑排行榜深度测评 - 绿舒环保母婴除甲醛
  • 2026年5月邯郸黄金变现全攻略:余生黄金回收984元/克领跑,6家正规门店实力排行无死角覆盖 - 余生黄金回收
  • 2026杭州萧山黄金回收推荐,黄金回收商,金丝回收,黄金保管,劳力士回收,范思哲包回收优选指南! - 品牌鉴赏师
  • 【字节跳动】豆包的系统对用户各类隐私数据的全面抓取方案,涉及八大核心领域:1.物流信息(实名收寄件、驿站记录、包裹内容);2.健康数据(诊疗记录、用药信息、体检报告);3.职场隐私(薪资、求职意向、同
  • 解决USB断连终极指南
  • 2026年Q2口碑好的合肥防水补漏公司推荐|最新专业防水补漏公司排名官方权威发布 - 安互工业信息
  • 【大模型对话】大模型对话送审核心知识点
  • FreePBX不止是内部电话:用它低成本搭建一个小型呼叫中心需要几步?
  • AI教材写作新突破!高效工具助力低查重教材编写,轻松搞定长篇内容!
  • 浏览器市场与用户画像分析-数据加工
  • 跨学科共情AI:多模态感知与情感推理的架构设计与工程实践
  • Gemini 英文论文(SCI/EI)写作:从“中式英语”到顶刊表达的实战重构
  • # 2026年国内莱赛尔牛仔布公司排行榜:广东佛山等地,五大推荐榜单 - 十大品牌榜
  • 如何高效使用RePKG:Wallpaper Engine资源提取与TEX转换完整指南
  • 基于分数阶傅里叶变换与LSTM的AI音乐生成系统:原理、实现与调优
  • 怎么寄快递更划算?普通人的经验与注意事项
  • 2026年5月荆州黄金回收哪家靠谱?余生黄金回收领衔六大正规门店星级排行,沙市荆州纪南全域实测干货 - 余生黄金回收
  • Hermes Agent Docker 离线部署完整指南
  • 从数据洞察短视频创作者的秘密
  • htc 国家超算中心 高性能计算 环境配置 , 计算节点 不能访问外网的,环境配置要在登录节点
  • 从陀螺仪噪声到Kalman滤波:Allan方差参数的实际工程应用指南
  • 【C++】vector的模拟实现
  • 2026 山东大学软件学院项目实训博客 (六):历史人物轨迹系统 DeepSeek 智能查询与坐标校对全流程实现
  • 无感通关 智守国门 黎阳之光赋能海关口岸监管升级
  • 怎么选择一款合适的电磁冷热量表?哪些厂家值得信赖? - 仪表人小余
  • 2026年最新三明市金银首饰回收+金条金币+铂金K金 高价回收;实体老店回收黄金 多年口碑 交易放心;TOP5实力权威排行榜推荐+联系方式 - 亦辰小黄鸭
  • 群面系统中五维能力评估的实现