当前位置: 首页 > news >正文

全模型支持的第一个例子 给察元AI挂上Ollama的下午

很多人对察元AI 桌面单机版的第一个误解是默认要联网用 OpenAI 的钥匙才能跑。其实并不。chayuan-desktop 的网关层在设计时就把本地推理放在和厂商云一样的位置这一篇用 Ollama 做演示说一下完整的接入过程让本地离线知识库 加 本地大模型 的组合在一台普通电脑上跑通。为什么先选 Ollama。它把模型权重的下载、运行、API 暴露这三件事都打包了不用自己折腾 llama.cpp 命令行也不用自己装 CUDA 工具链。安装包在 ollama.com 拿一路下一步。装完后命令行运行 ollama pull qwen2.5:7b 把一个国产模型权重拉下来再运行 ollama serve 起服务本地的 11434 端口会暴露一个 OpenAI 兼容的接口。接到 chayuan-desktop。打开主界面右上的设置进 模型供应商新建一个 OpenAI 兼容路由的供应商。地址填 http://127.0.0.1:11434/v1钥匙随便填一个非空字符串因为 Ollama 默认不校验。点保存察元AI 会去探测 /v1/models把 qwen2.5:7b 这条记录拉回来。在对话切换器里就能选到这个本地模型。第一句对话试一下。问一句日常问题看看流式输出是否正常、tokens/s 大致多少。我那台 i5 加 16G 的电脑上 7B 模型 CPU 跑大概 6-8 tokens/s不快但是能用。如果你有显卡Ollama 会自动用 GPU。接知识库这一段更值得讲。把一份 PDF 拖进对话窗口触发一次文档 RAG 入库。chayuan-desktop 默认用的是内嵌的 bge-m3-onnx 嵌入模型跑在 CPU 上做嵌入计算。重排可以选择跳过或者也走本地。整个 RAG 链路在 sidecar 进程内闭环模型推理走 Ollama嵌入走 ONNX向量库是 sqlite-vec。整套链路里一次外网调用都没有发生。接下来是想象一下整套组合的好处。第一模型钥匙不再是必需品单机版可以彻底不联外网第二私有文档完全不出本机第三跟 chayuan-wps WPS AI 插件 共用同一份 KB 和模型配置加载项调起来的对话也走 Ollama体验一致第四等你有了显卡把模型规模升到 14B 或 32B整个流程不需要重新走只需要重新拉一份权重并在 Ollama 里切换。需要注意几个细节。Ollama 默认会启动后台服务重启 chayuan-desktop 不会重启它端口冲突的可能性要排查Ollama 的模型路径默认在 ~/.ollama磁盘空间要预留Ollama 的并发窗口默认有限一次问答里多 Tab 同时跑会排队体感上像变慢Ollama 不支持函数调用 tools 的所有模型遇到工具调用的对话场景要选合适的模型权重。如果你已经熟悉 LM Studio、vLLM、Xinference这套接入方式同样可用OpenAI 兼容路由是 chayuan-desktop 网关层的统一接入点。差别只在于模型规模和性能链路本身一致。免费开源的AI软件 加上本地推理凑成一台真正完全自己掌控的 AI 工作站最大障碍其实是模型权重的下载而不是 chayuan-desktop 这一边。下午搞定剩下的就是拿来用。
http://www.zskr.cn/news/1378637.html

相关文章:

  • Zotero-Style插件完整指南:高效文献管理的终极解决方案
  • 技术指南:qobuz-dl无损音乐下载器架构解析与实战应用
  • 番茄小说下载器:三步打造你的离线阅读自由王国
  • 告别Windows多显示器缩放烦恼:SetDPI命令行工具深度指南
  • 3分钟掌握USBCopyer:Windows平台智能U盘文件自动备份工具终极指南
  • UE5里3D Widget播放动态UI总“拖影”?一个材质参数就能搞定
  • UnityWebRequest遇到SSL证书错误别慌!手把手教你用CertificateHandler绕过验证(附完整C#代码)
  • 告别网盘限速的烦恼:LinkSwift网盘直链下载助手全面评测与使用指南
  • 如何用ImageGlass实现专业图像管理:90+格式支持的完整解决方案
  • 江苏省溧阳寄快递省钱指南!4 款本土好用寄件渠道,寄全国省心又划算 - 时讯资讯
  • 如何用FanControl实现Windows风扇智能控制:3个专业技巧终极指南
  • AutoCAD字体缺失问题如何通过智能插件彻底解决?
  • ChartGPT深度解析:基于AI的自然语言图表生成架构设计与企业级应用
  • 3分钟掌握PUBG罗技鼠标宏:新手也能轻松压枪的完整指南
  • 终极多语言字体解决方案:Noto字体彻底告别“豆腐块“时代
  • 轻量化内容中台如何破解企业矩阵运营困局?以星链引擎为例的技术解析
  • Unity里也能搞CAD?手把手教你用免费插件读取DXF文件(附避坑指南)
  • 江苏省常熟寄件省钱攻略|发往全国高性价比寄件渠道汇总,日常寄货轻松省下开销 - 时讯资讯
  • 基于74HC595与树莓派PICO的精密可编程电流源设计与实现
  • 猫抓浏览器资源嗅探扩展:你的网页视频下载终极解决方案
  • docker架构
  • 鸣潮工具箱WaveTools:3大核心功能帮你轻松优化游戏体验
  • Office RibbonX Editor:5分钟学会定制你的Office功能区界面
  • 告别AssetBundle手动管理:Unity Addressables保姆级配置与本地服务器搭建实战
  • 别再死记硬背了!用‘重复局面’这道CSP真题,带你彻底搞懂C++中map容器的使用场景与底层逻辑
  • DeepSeek代码审查功能深度解析:如何在30分钟内发现90%潜在漏洞?
  • Windows 设置开启或禁用 Ping - Higurashi
  • 江苏省新沂市寄件省钱干货|本地人私藏 4 个靠谱寄件渠道,全国寄送省心又省钱 - 时讯资讯
  • 如何快速掌握参数化建模:OpenVSP飞机设计工具的完整指南 [特殊字符]
  • 2026 南宁本地 GEO 优化公司精选|实体商家 AI 获客实战指南 - 兔兔不是荼荼