当前位置: 首页 > news >正文

RAG应用的八种技术架构

RAG(Retrieval-Augmented Generation,检索增强生成)是一种通过整合外部知识检索来增强大语言模型(LLM)能力的技术,简而言之就是给LLM加了知识外挂,这个知识外挂可以是传统关系型数据库、向量数据库或图数据库。RAG的另外一个核心内容是提示词模板Prompt Template,最终是要将检索到的知识结合提示词一起发送给LLM来增强生成。

那么为什么需要RAG,因为大语言模型有几个现实问题:

  1. 受训练资料时间的影响,它的知识能力停止资料截止的时间,也就是说无法获取最新的知识;
  2. 对于无法回答的问题大语言模型会一本正经的胡说八道,俗称“幻觉”;
  3. 对于一些较专业的场景,如医疗、法律等比较严谨的领域,大语言模型只是一般性知识的回答,无法应对专业问题,微调的成本太高。

总结来说就是知识截止时间和专业领域知识欠缺。

RAG使用外部知识来增强LLM的能力,知识库可以做到数据的实时更新,针对特定领域,构建对应的知识库,相比较模型微调,大大降低了开发成本,只需要用通用的LLM对接知识库。

先不聊特别深入的话题,我们就用大白话,聊聊RAG的几种架构,这些架构既是AI时代的不断探索,也是针对不同场景的选择,总有一款适合你。

▍一、Naive RAG 基础RAG

基础RAG是最简单的RAG架构,一般做快速验证可以使用,流程比较清晰:

用户查询->查询内容嵌入->检索知识库->LLM生成返回

▍二、Multimodal RAG 多模态RAG

多模态RAG和Naive RAG流程相同,唯一的不同是数据源使用了多类型数据,如音视频、文本等。它的好处是对于支持多模态的模型来说,可以查询图片或者视频。

▍三、Graph RAG 图RAG

前面提到知识库可以是关系型数据库,也可以是图数据库。图数据库是以实体为节点,关联关系为边,能沿着关系链遍历,从而天然具备可解释性且推理路径可视化,精准找到长链问题的答案,Graph RAG就是通过知识图谱增强检索知识的能力,适用于合规、医疗等强监管场景。

▍四、Corrective RAG 纠正式RAG

Corrective RAG是在查询分析之前加入了查询分析以及网络搜索模块,例如通过查询分析对query进行改写再检索向量库,利用web检索可置信内容等。目的就是为了进一步提高检索准确度,降低幻觉。适用于企业知识库、开放领域问答等。

质检->修正->网络兜底

▍五、HyDE 假设文档嵌入

HyDE(Hypothetical Document Embeddings)假设文档嵌入顾名思义是用假设性的文档来改进LLM生成答案的方法。它的做法很简单,就是先用LLM生成假设性的答案,然后再将假设性答案嵌入查询,那么嵌入查询就有可能查询到更可靠的答案。相当于用答案来搜索答案,有点达文西的感觉了!它的目的是捕捉问题隐藏的意图,丰富查询语句,解决查询语句细节不充分的搜索。

▍六、Hybrid RAG 混合RAG

Hybrid RAG是混合多种数据库进行查询的技术,解决单一数据库的劣势,列入结合图数据库和向量数据量,充分利用它们的优势,提升检索能力。

▍七、Adaptive RAG 自适应RAG

Adaptive RAG体现在“自适应”上,核心是动态路由和策略自适应,根据问题复杂程度,动态选择检索路径,对于简单问题直接LLM回答,复杂问题多步迭代,提升检索效率,降低成本。有点“看人下菜碟”的意思。适用于智能客服场景。

▍八、Agentic RAG 代理式RAG

Agentic RAG引入代理的概念,使用AI智能体协同工作,自主查询,面对复杂任务也是游刃有余。因为智能体能拥有记忆组件、规划以及调用工具的能力,那么在检索式就能利用LLM的推理能力自主规划查询步骤,解决了传统RAG固定流水线的问题。例如多智能体可以实现一个智能体查询邮件、一个智能体查询数据库,一个智能体查询网络,显著增加了检索内容以及效率,但同时带来的问题是成本也会提高。

▍🤗总结

以上的八种RAG架构各有千秋,智能的不一定是最好的,简单的未必是最差的,根据自己的所需场景选择才是最重要的!

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.zskr.cn/news/1515100.html

相关文章:

  • 2026年 广东五金配件厂家推荐榜单:门窗家具/箱包灯饰/卫浴手袋/户外运动/精密五金配件加工实力工厂深度解析 - 品牌发掘
  • 2026年四川交通杆件行业口碑观察:哪些企业值得关注? - 优质品牌商家
  • 告别单调报表!用ABAP ALV颜色打造智能数据看板:条件格式化与业务逻辑结合
  • VB.NET 2010 可直接运行的TCP双向通信演示(含客户端+服务端完整工程)
  • MLOps工程实践:构建可复现、可监控、可协作的机器学习生产流水线
  • 潜水砌墙公司电话,口碑好的尚基建设工程专业 - mypinpai
  • 终极暗黑2存档编辑器完整指南:3分钟学会免费修改你的角色存档
  • AutoDL云服务器租用避坑指南:从选卡到关机,帮你省下每一分钱
  • 开源CAE实战系列(十一):Code_Aster应用实例之混凝土大坝的结构抗震分析
  • 终极DMA内存修改:CheatEngine-DMA插件完全指南
  • 2026年6月广州回收红酒商家推荐榜单:专业估价、诚信服务、高价变现口碑之选 - 企业推荐官【官方】
  • 终极AMD处理器调试实战指南:解锁Ryzen平台的隐藏性能
  • GPS-SDR-SIM:如何用开源软件定义无线电技术突破GPS信号模拟的三大技术瓶颈
  • 大模型Prompt工程实战:金融与政务场景本地化应用
  • windows国内安装claude code,模型配置
  • 多Agent代码理解系统:让AI像资深工程师一样自主协作
  • 基于PLC全自动铆接机控制系统设计31(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_可以扫码或者私信
  • 多维聚合实战:从GROUP BY到参数化DSL的数据操作范式
  • 可靠性:MSTP + VRRP 配置试验
  • 2026年评价高的eps构件/成都eps构件/eps雕塑/四川eps构件横向对比厂家推荐 - 行业平台推荐
  • 经典管理效应-淬火效应
  • 2026年口碑好的成都eps线条/eps雕塑/eps构件口碑好的厂家推荐 - 品牌宣传支持者
  • 3步解锁QQ音乐加密音频:qmc-decoder终极解密方案完全指南
  • 2026年6月广州回收洋酒厂家推荐榜单:专业估价、诚信交易与快速上门回收服务公司精选 - 企业推荐官【官方】
  • 2026年江苏蒸发器厂家推荐榜:MVR/多效/刮板薄膜/降膜/母液干化/三效/废水/含盐废水/工业废水蒸发器实力工厂与高效节能技术精选 - 品牌发掘
  • 2026年移动伸缩喷漆房行业实力厂家深度观察:技术路线与工程能力对比分析 - 优质品牌商家
  • 经典管理效应-习得性无助效应
  • FTP存储容量监控容量规划全流程方案-001篇
  • 告别eval_pr_curve.py!MMdetection 3.X版本PR曲线绘制保姆级教程(附完整配置文件修改)
  • 2026年硫酸亚铁行业格局与企业实力纵览 - 品牌发掘