当前位置: 首页 > news >正文

MiniCPM5-1B - 随身AI智能助手 擅长工具使用和复杂推理,长上下文处理能力强 一键整合包下载

MiniCPM5-1B 是一款由 OpenBMB 团队开发的1B参数(约10亿)小型语言模型,属于 MiniCPM5 系列的第一个版本。外号“面壁小钢炮”,简单说,它就是一个体积小、能力强、适合本地运行的 AI 助手。
MiniCPM5-1B 就是目前最强的小模型之一,专为“本地跑、不想依赖云端”的人设计,在体积和能力之间找到了很好的平衡,特别适合个人开发者、隐私场景和资源受限的环境。

主要特点

超级小巧,省资源:只有1B参数,能轻松跑在手机、笔记本、边缘设备甚至普通电脑上,不需要高端显卡。
1B级别最强(SOTA):在同等大小的开源模型里,整体能力最优秀,尤其在工具调用(Agent)、代码生成、复杂推理上表现突出。
混合思考模式:同一个模型可以“快速回答”或“慢慢思考”。通过 enable_thinking 开关切换,想快就快,想严谨就让它一步步推理(类似 <think> 标签)。
超长上下文:支持 131072 tokens(约10万+字),能一次性处理很长的文档、代码库或对话历史。
好部署:基于标准 Llama 架构,兼容 vLLM、SGLang、Ollama、llama.cpp、LM Studio 等主流工具,还有 GGUF、MLX 等量化版本,手机/电脑本地跑都很方便。
支持工具调用:能很好地调用外部工具、函数,适合做智能 Agent。



应用领域

本地私人助手:手机、电脑上跑的离线 AI 聊天、问答(隐私好、不联网)。
代码助手 / 编程 Agent:写代码、调试、理解代码仓库,特别适合开发者本地使用。
工具使用场景:能调用 API、操作工具的多步任务(比如自动处理工作流)。
长文档处理:分析长 PDF、报告、书籍,或做长上下文推理。
边缘计算 / 设备端 AI:资源有限的设备上运行智能功能(如机器人、IoT、智能硬件)。
桌面宠物 / 趣味应用:官方还做了用它驱动的本地桌面小宠物,交互很有趣。



使用教程:(建议N卡,显存4G起,支持50系显卡)

支持思考/非思考两种模式,输入问题或需求,提交即可。
支持消费级笔记本流畅运行,实测4G显存+8G运存流畅运行。


支持WebUI和GUI两种运行模式,支持api,可对接三方Agent使用
启动后 API 地址为:`http://localhost:8000`
兼容open-ai 格式api,请求参数

{ "model": "minicpm5-1b", "messages": [ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "你好"} ], "temperature": 0.9, "top_p": 0.95, "max_tokens": 4096, "stream": false, "thinking_mode": true }

crul格式

curl http://localhost:8000/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "minicpm5-1b", "messages": [ {"role": "user", "content": "用Python写一个计算器"} ], "temperature": 0.7, "stream": false }'

下载地址:点此下载

http://www.zskr.cn/news/1441405.html

相关文章:

  • 茶叶目标检测实战工程包:YOLOv5训练+多格式数据集适配+模型导出与API预留
  • ESP8266通过Whatabot实现WhatsApp消息收发:从环境搭建到智能家居应用
  • 056、多 GPU 分布式训练实战:DDP 配置、通信后端选型与加速比优化
  • DC-DC升压模块改造LED头灯:原理、实践与续航性能实测
  • 2026杭州装修设计公司推荐::杭州足浴会所/KTV装修设计公司推荐+绍兴运动馆/台球会所装修设计公司推荐合集 - 栗子测评
  • 如何在Unity游戏调试中快速定位和修改任意对象:UnityExplorer终极指南
  • 基于Qwen3.5-9B与YOLOv5的安全帽检测系统实践
  • 2026教育类软文推广怎么做有效?新手零踩坑实操方法分享 - 代码非世界
  • 终极指南:如何5分钟打造完美暗黑2角色?d2s-editor存档编辑器全解析
  • 安装claudecode并接入deepseek
  • Hitboxer:解决键盘冲突的终极方案,让游戏操作不再“打架“
  • 【Python系列课程】Python异常处理:try/except让你的程序不再崩溃
  • League-Toolkit:如何通过智能工具集提升英雄联盟游戏体验?
  • OnmyojiAutoScript终极指南:阴阳师自动化脚本的完整配置与问题解决
  • Visual C++运行库缺失终极解决方案:一键修复所有DLL错误
  • 基于Tinkercad Circuits的在线Arduino教学:零硬件成本实现电路仿真与编程入门
  • 2026最新版网络安全全岗位详解,入行择业一看就懂
  • 2026年6月东莞合同纠纷专业律师余建导|深耕商事争议处置,全力保障当事人回款权益 - 十大排行榜推荐
  • 解锁MacBook Touch Bar在Windows的完整显示功能:DFRDisplayKm驱动深度指南
  • 2026最权威AI论文平台榜单:这些被高校和导师悄悄推荐的工具你还不知道?
  • VisualCppRedist AIO:Windows系统依赖问题的终极解决方案
  • DriverStore Explorer终极指南:专业Windows驱动管理工具
  • 2026软文批量自助发表平台怎么选?靠谱低价的自助发稿平台实测推荐 - 代码非世界
  • macOS笔记本 Intel x64设备 Codex界面显示异常的解决方法
  • 惠州GEO推广同城获客好用吗 - 舒雯文化
  • 3分钟掌握BiRefNet AI抠图:ComfyUI插件实现图片视频背景透明处理终极指南
  • 深圳黄金回收去哪靠谱?实测5家正规店,全城免费上门(附报价对比 - 行行星
  • 2026年连云港各区黄金回收推荐,金福楼黄金回收安全免费上门 - 余生黄金回收
  • 3分钟搞定B站缓存难题:m4s转MP4的终极免费方案
  • PDF转Word怎么保留原排版?2026方法+软件推荐保姆级教程 - AI测评专家