当前位置: 首页 > news >正文

php本地搭建知识库实现rag遇到的一些问题解决方式

1、向量化的问题,中文的话,使用尽量使用国内的嵌入模型,国外的虽然支持中文,但是还是比不上国内专门针对中文的优化

本地使用ollama 搭建的话 ,我使用的是   quentinz/bge-large-zh-v1.5:latest

 

2、不规则的pdf文件,无法使用pdf插件读取内容问题,我是php 使用 smalot/pdfparser 包的

遇到不规则pdf文件时  使用 Imagick 将pdf 文件  转为图片,再使用多模态模型,读取图片内容

多模态模型使用的是ollama里面的 qwen2.5vl:7b,识别率非常高

 

3、文件的内容主题不突出问题,比如有一份文件叫QQ飞车攻略,但是内容全篇都没有QQ飞车  攻略 这几个字,当用户提问 QQ飞车有什么攻略,向量化搜索完全匹配不上

我是先将整个文件内容 包括文件标题  扔给大模型  让大模型大概总结一下 文本内容,然后作为一个文件块进行向量化 保存

 

4、搜索结果 权重排序不理想问题,往往不相关的文件排在前面

将搜索返回的内容,扔给大模型,让大模型针对问题 和 内容进行 打分排序,分数低的可以过滤排除掉

 

5、用户上下文提问关联问题

让大模型根据用户的历史提问,生成一个完整的新的问题,比如用户第一次提问 介绍一下xxx系统,第二次提问 重点介绍一下财务功能模块

那么让大模型重写后的提问就变成了,重点介绍一下xxx系统的财务功能模块,这样这个问题就能命中xxx系统的文件块

 

6、计算类的问题,这个完全无解

比如用户把很多excel文件都上传知识库,但是每个excel里面的数据,结构都不同,此时用户提问  今年公司的订单数有多少

这个完全无解啊,哦尼酱

http://www.zskr.cn/news/7868.html

相关文章:

  • 2025 ~ 2026 游击 - gfoi
  • docker操作包括使用docker制作为接口
  • Trae AI IDE与Gitee MCP深度整合:开启智能协作开发新时代
  • cpu wa
  • Gitee崛起:国产代码托管平台如何接棒CODING成为开发者新宠
  • flask下的MySQL增查配置
  • AT_agc056_c [AGC056C] 01 Balanced
  • 高效智能(到家服务)管理平台解决方案
  • 从MMoE到PLE:读懂多任务学习架构的渐进式演化
  • 在VSCode中设置Qt编写环境
  • MES系统核心组件
  • AI 视频模型大比拼(2025年7月版):价格、效果与分辨率
  • git常见冲突场景及解决办法 - 指南
  • 有关字节的基础知识
  • strip去符号前后对比
  • 基于Python+Vue开发的健身房管理系统源码+运行步骤
  • 技术圈的“绯闻女孩”:Gossip是如何把八卦秘密传遍全网的?
  • Python中使用列表、map和filter函数配合lambda表达式来操作集合
  • 深入解析:SSM商品导向型模特管理系统-计算机毕业设计源码01876
  • 文件安全外发平台用哪个,最佳选择是什么?
  • 纷享销客CRM系统自定义APL代码破解企业深度定制难题
  • el-date-picker时间选择器限制时间跨度为3天 - 详解
  • Android--资料
  • 直播录制神器!一款多平台直播流自动录制客户端!
  • 101.计组--二章
  • 【maven01】依赖管理的工具 - 教程
  • 运动控制教学——5分钟学会机器人运动学! - 实践
  • 深入解析:linux基本知识
  • 鸿蒙应用开发从入门到实战(九):ArkTS渲染控制
  • 一个基于 .NET 开源、简易、轻量级的进销存管理系统