为什么现在 RAG 越来越少被提及？-尧图网络科技

RAG 不再是热词，但你的搜索栏离不开它。不是它没用，而是早期过度承诺和工程瑕疵让人失望。

RAG 没有过时，它只是从聚光灯下沉到基础设施。

热度的冰与火

RAG 从爆火到降温，2023年Q4顶峰后2024年平缓下降。但RAG 并未消失，只是进入理性期，生产中频频翻车的原因集中在检索质量、延迟、维护成本。

检索：阿克琉斯之踵

大多数 RAG 系统只用简单的向量相似度搜索，忽略语义匹配和排序，缺少Query Rewriting、混合检索、Reranker等环节，效果打折扣。理想 RAG 检索准确，现实却是检索到无关片段，回答胡编。

延迟成本：工程代价

每次推理增加200-500ms延迟，维护知识库的持续清洗和向量重计算成本甚至超过模型推理。很多团队低估了这些资源消耗。

新范式分流

长上下文模型和 Agent 方案分流了 RAG 的热度。但RAG 在需要外部知识库低频更新的场景仍有优势，不再是唯一选择。

正确用法：场景匹配

RAG 最适合知识库频繁更新、需要精确引用、数据可分割的场景，必须做检索质量工程。可复用实践：

python

# 先用 BM25 粗排，再向量精排from rank_bm25 import BM25Okapifrom sentence_transformers import SentenceTransformerbm25 = BM25Okapi(tokenized_corpus)model = SentenceTransformer('all-MiniLM-L6-v2')# 粗排 top 50bm25_scores = bm25.get_scores(query_tokens)top_bm25 = np.argsort(bm25_scores)[-50:]# 精排 top 3embeddings = model.encode([corpus[i] for i in top_bm25])query_emb = model.encode([query])scores = util.cos_sim(query_emb, embeddings)[0]top_indices = np.argsort(scores)[-3:]

设置可信度阈值，缓存高频查询可降低延迟。

检索质量是 RAG 的阿克琉斯之踵。

技术的关键不是追新，而是匹配问题。

RAG 没有过时，它只是从聚光灯下沉到基础设施。别被热度左右，回到业务场景做选择——慢慢来，技术是一步一步走出来的。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

资讯详情

为什么现在 RAG 越来越少被提及？

热度的冰与火

检索：阿克琉斯之踵

延迟成本：工程代价

新范式分流

正确用法：场景匹配

学AI大模型的正确顺序，千万不要搞错了

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

资讯详情

热度的冰与火

检索：阿克琉斯之踵

延迟成本：工程代价

新范式分流

正确用法：场景匹配

学AI大模型的正确顺序，千万不要搞错了

相关新闻