为什么现在 RAG 越来越少被提及?

为什么现在 RAG 越来越少被提及?

RAG 不再是热词,但你的搜索栏离不开它。不是它没用,而是早期过度承诺和工程瑕疵让人失望。

RAG 没有过时,它只是从聚光灯下沉到基础设施。

热度的冰与火

RAG 从爆火到降温,2023年Q4顶峰后2024年平缓下降。但RAG 并未消失,只是进入理性期,生产中频频翻车的原因集中在检索质量、延迟、维护成本。

检索:阿克琉斯之踵

大多数 RAG 系统只用简单的向量相似度搜索,忽略语义匹配和排序,缺少Query Rewriting、混合检索、Reranker等环节,效果打折扣。理想 RAG 检索准确,现实却是检索到无关片段,回答胡编

延迟成本:工程代价

每次推理增加200-500ms延迟,维护知识库的持续清洗和向量重计算成本甚至超过模型推理。很多团队低估了这些资源消耗。

新范式分流

长上下文模型和 Agent 方案分流了 RAG 的热度。但RAG 在需要外部知识库低频更新的场景仍有优势,不再是唯一选择。

正确用法:场景匹配

RAG 最适合知识库频繁更新、需要精确引用、数据可分割的场景,必须做检索质量工程。可复用实践:

python

# 先用 BM25 粗排,再向量精排from rank_bm25 import BM25Okapifrom sentence_transformers import SentenceTransformerbm25 = BM25Okapi(tokenized_corpus)model = SentenceTransformer('all-MiniLM-L6-v2')# 粗排 top 50bm25_scores = bm25.get_scores(query_tokens)top_bm25 = np.argsort(bm25_scores)[-50:]# 精排 top 3embeddings = model.encode([corpus[i] for i in top_bm25])query_emb = model.encode([query])scores = util.cos_sim(query_emb, embeddings)[0]top_indices = np.argsort(scores)[-3:]

设置可信度阈值,缓存高频查询可降低延迟。

检索质量是 RAG 的阿克琉斯之踵。

技术的关键不是追新,而是匹配问题。

RAG 没有过时,它只是从聚光灯下沉到基础设施。别被热度左右,回到业务场景做选择——慢慢来,技术是一步一步走出来的

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费