AI Agent-尧图网络科技

LLM——大语言模型

核心基础是Transformer 架构。

能力：根据文本生成提示词，理解上下文语境，能够实现翻译，问答，代码编写和推理。

Transformer

RAG——检索增强生成。

RAG就是讲信息检索和大语言模型生成相结合的技术架构。

解决了LLM本身存在的一些固有局限，如幻觉问题，知识过时（训练数据有时间截止点，无法回答之后发生的新事件），领域知识不足（对企业内部文档、私有数据等缺乏了解）。

把企业的知识库直接在输入框中丢给AI(会有上下文窗口的限制,成本非常高,响应速度很慢)

RAG的本质就是在大模型回答之前,先检索资料,在基于资料生成答案.

RAG核心流程:

数据准备

将知识库切分成多个小块,每一个小块尽量表达一个完整的语义.(不切分整篇文档去做处理会导致语义混乱,检索不准确)

将文本块转化成向量,每个块都会对应一个向量,然会将文本内容和它对应的向量存到向量数据库中

用户提问

会用户的问题给向量化,然后用这个向量分别和数据库中的每个向量去计算相似度(计算相似度的方法有余弦相似度和欧式距离等)返回与其最相近的top-k个块(召回K个块,这一步只是粗筛,只能判断和问题像不像,不能保证这几个块到底有没有回答用户提问的问题),然后我们会在进行rerank(重排序)就是进行进一步的筛选(选择最可以回答用户问题的文本块),最后我们将用户的原始问题和检索到资料一起组成增强后的提示词,发送给LLM,生成答案.

卡点及优化技巧

企业私有文档,有pdf,表格,图片等解析起来非常复杂,数据清洗(会结合一些版面模型,或者一些OCR的识别技术)

切块:太大会导致内容太杂包含很多内容,切的太小会导致语义断裂.

所以切分粒度要刚好,做到每个块尽可能的都语义相对完整

用户的问题可能口语化(需要进行问题重写,主要是补充一些隐含信息)

检索用的最多的是混合检索(关键字检索和向量相似度检索)