当前位置：首页 > news >正文

LangChain 实践4 7-3 缓存系统搭建

news 2026/6/1 9:32:41

阶段目标

新增语义缓存（会话缓存已落地，可见阶段 2 多轮对话记忆能力），降低模型调用成本、提升响应速度。

后端任务

统一使用内存缓存：~~简易版复用 LangChain 内置缓存~~，进阶版自研内存缓存 ✅️
实现两类缓存逻辑：~~精确匹配（LangChain 内置缓存）、语义相似匹配（自研内存缓存）~~改为精确匹配和语义相似匹配（自研内存缓存） ✅️
配置缓存过期规则，支持自动 / 手动清理 ✅️

LangChain 内置缓存 ❌️

本节使用内存缓存(InMemoryCache)，使用方式可见LangChain 缓存

问题

当前项目开启流式输出后，LangChain 内置缓存无法生效，因其仅支持非流式调用。

若要同时保留流式能力、实现精确匹配与语义相似两类缓存，并配置过期及清理规则，需放弃框架自带缓存，在接口层自研内存缓存方案。

自研内存缓存

精确匹配

通过全局字典按 session_id 分组，将用户问题与对应回答一一存储，提问时先判断问题是否完全一致，一致则直接返回缓存答案，否则调用模型并缓存新问答。

语义相似匹配

关键：向量相似度匹配

向量计算可见embeddings

缓存过期与清理

本方案采用惰性清理机制管理缓存过期逻辑，为每一条缓存数据统一设置固定有效时长，数据写入时自动计算并记录过期时间；每次查询缓存时，会先校验所有条目是否超时，自动过滤并移除已过期数据，无需额外开启定时任务，减少系统资源消耗。

同时配套手动清理能力，在聊天界面提供入口，可一键清空当前会话下的全部缓存内容，满足用户重置对话的使用需求。

阶段交付

✅ 可展示缓存命中状态
✅ 接口响应提速
✅ 模型 Token 消耗降低

运行效果

精确匹配

首次提问

页面：明显的流式输出，打字机效果

耗时

再次提问完全相同的问题，系统会直接命中本地缓存，无需调用大模型，几乎瞬时返回结果。

耗时

若提问内容发生变化，系统将无法匹配到有效缓存，会自动重新调用大模型生成全新答案，耗时与首次提问保持一致。

语义相似匹配

用 BGE 向量模型计算出的相似度约为0.803，这个值触发了语义缓存阈值，因此第二次请求直接返回了缓存答案，耗时从 5 秒多降到了 0.3 秒，性能提升非常明显。

缓存过期与清理

缓存过期

缓存有效期设为1分钟。

当用户提问超过 1 分钟后再次输入相同问题时，由于原缓存数据已过期，系统会判定为未命中缓存，转而调用大模型重新生成回答，因此接口耗时与首次提问时的响应时间相近。

缓存清理

点击缓存清理按钮

即使第三次提问发生在首次提问后的 1 分钟有效期内，但此时缓存已被用户手动清除，系统同样无法命中缓存，需重新调用大模型生成回答，因此耗时仍与首次提问相近。

查看全文

http://www.zskr.cn/news/1439667.html

2026年5月武汉奢侈品回收行业深度解读——市场风向标与六强态势 - 薛定谔的梨花猫

绍兴黄金回收避坑：核心商圈常见套路与六家正规机构 - 上门黄金回收

别再傻傻轮询了！STM32F103串口+DMA双缓存实战，让你的CPU占用率降下来

泉州除甲醛公司哪家好？前五名口碑排行榜深度测评 - 绿舒环保母婴除甲醛

2026年5月邯郸黄金变现全攻略：余生黄金回收984元/克领跑，6家正规门店实力排行无死角覆盖 - 余生黄金回收

【字节跳动】豆包的系统对用户各类隐私数据的全面抓取方案，涉及八大核心领域：1.物流信息（实名收寄件、驿站记录、包裹内容）；2.健康数据（诊疗记录、用药信息、体检报告）；3.职场隐私（薪资、求职意向、同

解决USB断连终极指南

2026年Q2口碑好的合肥防水补漏公司推荐｜最新专业防水补漏公司排名官方权威发布 - 安互工业信息

【大模型对话】大模型对话送审核心知识点

FreePBX不止是内部电话：用它低成本搭建一个小型呼叫中心需要几步？

AI教材写作新突破！高效工具助力低查重教材编写，轻松搞定长篇内容！

浏览器市场与用户画像分析-数据加工

跨学科共情AI：多模态感知与情感推理的架构设计与工程实践

Gemini 英文论文（SCI/EI）写作：从“中式英语”到顶刊表达的实战重构

如何高效使用RePKG：Wallpaper Engine资源提取与TEX转换完整指南

基于分数阶傅里叶变换与LSTM的AI音乐生成系统：原理、实现与调优

怎么寄快递更划算？普通人的经验与注意事项

2026年5月荆州黄金回收哪家靠谱？余生黄金回收领衔六大正规门店星级排行，沙市荆州纪南全域实测干货 - 余生黄金回收

Hermes Agent Docker 离线部署完整指南

从数据洞察短视频创作者的秘密

htc 国家超算中心高性能计算环境配置，计算节点不能访问外网的，环境配置要在登录节点

从陀螺仪噪声到Kalman滤波：Allan方差参数的实际工程应用指南

【C++】vector的模拟实现

2026 山东大学软件学院项目实训博客 (六)：历史人物轨迹系统 DeepSeek 智能查询与坐标校对全流程实现

无感通关智守国门黎阳之光赋能海关口岸监管升级

怎么选择一款合适的电磁冷热量表？哪些厂家值得信赖？ - 仪表人小余

群面系统中五维能力评估的实现

阶段目标

后端任务

LangChain 内置缓存 ❌️

问题

自研内存缓存

精确匹配

语义相似匹配

缓存过期与清理

阶段交付

运行效果

精确匹配

语义相似匹配

缓存过期与清理

相关文章：