当前位置: 首页 > news >正文

MiMo Vision Router:让纯文本模型秒变多模态

MiMo Vision Router:让纯文本模型秒变多模态

  • MiMo Vision Router:让纯文本模型秒变多模态
    • 背景
    • 架构
    • 安装
      • 前置条件
      • OpenCode
      • Claude Code
    • 技术实现
      • OpenAI 路径 (OpenCode)
      • Anthropic 路径 (Claude Code)
    • 配置
    • 故障排除
    • 项目结构
    • 链接
    • 总结

MiMo Vision Router:让纯文本模型秒变多模态

背景

小米 MiMo 模型有两个版本:

  • MiMo V2.5:支持多模态(图片+文本)
  • MiMo V2.5 Pro:纯文本,不支持图片

问题:使用 Pro 模型时无法直接发送图片。

方案:本地代理自动将图片转为文字描述,Pro 模型也能"看懂"图片。


架构

消息+图片

检测图片

替换为文字

返回

AI 助手

本地代理
localhost:3456

V2.5 提取描述

V2.5 Pro

支持的 AI 助手

AI 助手API 格式安装命令
OpenCodeOpenAI.\setup.ps1
Claude CodeAnthropic.\setup-claude.ps1

安装

前置条件

  • Node.js v18+
  • 小米 MiMo API Key

OpenCode

git clone https://github.com/JoJohanse/mimo-vision-router.git cd mimo-vision-router.\setup.ps1# 重启 OpenCode,选择 "MiMo V2.5 Pro (Auto Vision)" 模型

Claude Code

.\setup-claude.ps1# 使用启动器.\start-claude.ps1# 或手动$env:ANTHROPIC_BASE_URL ="http://127.0.0.1:3456"claude

技术实现

OpenAI 路径 (OpenCode)

// 检测图片functionopenaiHasImages(content){returnArray.isArray(content)&&content.some(p=>p.type==='image_url');}// 用 V2.5 描述图片asyncfunctionopenaiDescribeImages(textParts,imageUrls,apiKey){constvisionContent=[{type:'text',text:`Context:${textParts.join('\n')}\n\nDescribe the image(s)...`},...imageUrls.map(url=>({type:'image_url',image_url:{url}}))];constresult=awaithttpsRequest('/chat/completions',{model:'mimo-v2.5',messages:[{role:'user',content:visionContent}],max_tokens:4096,},apiKey);returnJSON.parse(result.body).choices?.[0]?.message?.content||'';}// 替换图片为文字asyncfunctionopenaiProcessMessage(msg,apiKey){if(!openaiHasImages(msg.content))returnmsg;// ... 提取图片,调用 describeImages,替换为 [Image: 描述]}

Anthropic 路径 (Claude Code)

// 检测图片functionanthropicHasImages(content){returnArray.isArray(content)&&content.some(p=>p.type==='image');}// Anthropic base64 → data URLfunctionanthropicImageToDataUrl(img){return`data:${img.source.media_type};base64,${img.source.data}`;}// 格式转换:Anthropic → OpenAIfunctionanthropicToOpenAI(body){constmessages=[];if(body.system)messages.push({role:'system',content:body.system});// ... 转换 messages 格式return{model:body.model,messages,max_tokens:body.max_tokens||4096};}

两条路径完全独立,不共用图片处理逻辑。


配置

编辑proxy/server.js

constPORT=3456;// 代理端口constUPSTREAM_HOST='token-plan-cn.xiaomimimo.com';// 小米 APIconstVISION_MODEL='mimo-v2.5';// 多模态模型

安装脚本会自动修改 OpenCode 配置文件。


故障排除

# 检查代理状态curl http://127.0.0.1:3456/health# 检查端口占用netstat-ano|findstr :3456# 手动启动node proxy/server.js

图片未处理?

  • OpenCode:确认选择 “MiMo V2.5 Pro (Auto Vision)”
  • Claude Code:确认环境变量ANTHROPIC_BASE_URL已设置

项目结构

mimo-vision-router/ ├── setup.ps1 # OpenCode 安装 ├── setup-claude.ps1 # Claude Code 安装 ├── README.md / CLAUDE.md # 文档 └── proxy/ ├── server.js # 代理服务器 ├── mcp-launcher.js # MCP 生命周期管理 └── start.ps1 # 手动管理

链接

  • GitHub: https://github.com/JoJohanse/mimo-vision-router (如果帮到您,麻烦给个star)
  • 小米 MiMo: https://xiaomimimo.com

总结

mimo-vision-router 通过本地代理解决了 MiMo V2.5 Pro 不支持图片的问题。

✅ 一键安装
✅ 支持 OpenCode + Claude Code
✅ 完全透明,用户无感知
✅ 开源免费


转载请注明出处。

http://www.zskr.cn/news/1437533.html

相关文章:

  • 【Android】手机屏幕劫持防护
  • Keil C51编译器Makefile选项解析与替代方案
  • 量子计算冗余架构:双星设计提升容错与并行能力
  • 【元器件专题】MOS管内部结构
  • LEGO框架:空间加速器设计的动态数据流优化
  • 2026年Q2炉渣钢渣供应商评测:上阳建材适配性分析 - 优质品牌商家
  • 乐高wedo《套圈游戏》
  • Codex+Vscode+Remote ssh+ 服务器自定义第三方API配置保姆级教程
  • 最新Python爬虫实战(多线程爬虫篇)——案例26:多线程爬取斗罗大陆3龙王传说小说批量保存到txt(附上完整爬虫代码)
  • 2026年5月秦皇岛酒店之选:为何万怡酒店脱颖而出 - 2026年企业资讯
  • 基于MATLAB的simulink汽车防抱死仿真模型,汽车制动防抱死模型ABS仿真模型
  • RTOS学习笔记,二、多任务管理
  • Spark中Hbase的伪分布式模式配置
  • 2026年Q2长春K金回收选择推荐:避坑实操要点 - 优质品牌商家
  • 别再只调OpenCV参数了!从AD、Census到SGM,手把手教你用Python实现双目立体匹配核心算法
  • 今日开源[第2期]Project N.O.M.A.D. - zhang
  • 汽车行业:从4S店到充电桩,电子合同正在重构汽车服务签约体验
  • OpCore Simplify:终极黑苹果配置工具,3步完成复杂EFI配置
  • 第一篇:uniapp+Django 互动功能全流程(登录缓存→点赞 / 收藏 / 评论列表显示)
  • 3分钟完成GTNH中文汉化:新手完整安装指南
  • 容器之间ros2可发现topic没有数据
  • 小学期第三周
  • 云成本治理框架:优化云计算成本
  • 避坑指南:高通SA8255P平台Nor Flash烧录全流程与‘先擦后写’的血泪教训
  • Masa Mods中文汉化包:为你的Minecraft 1.21模组体验注入母语力量!
  • 2026年苏州本地防水补漏行业三家合规经营服务机构信息梳理分析 专业防水公司排名推荐(2026年5月防水补漏最新TOP权威排名) - 鼎壹万修缮说
  • 2026年5月新消息:寻找行业内比较好的铠装通信电缆品牌,这几家值得关注 - 2026年企业资讯
  • 仅限头部客户启用的Gemini深度监测模块(含暗网论坛追踪+小红书种草溯源)
  • 源站 IP 暴露被直接打穿?这套 AWS 纵深防御方案你一定用得上
  • 达梦 DMHS/DRS 数据同步技术解析