申请量超6.6万！小米MiMo-V2.5-Pro-UltraSpeed模型延长体验期，输出速度远超GPT-5.5

📅 发布时间：2026/6/25 17:34:44 👁 浏览次数：

申请量超6.6万！小米MiMo-V2.5-Pro-UltraSpeed模型延长体验期，输出速度远超GPT-5.5

6月23日，小米MiMo开放平台宣布延长MiMo-V2.5-Pro-UltraSpeed模型的体验期限，因申请量远超预期。该模型输出速度超1000 tokens/s，价格有优势。

体验延期原因

MiMo-V2.5-Pro-UltraSpeed模型6月9日上线，原体验窗口到6月23日。但截至该日，收到超6.6万个使用申请，涵盖多领域，申请者有世界500强、行业头部企业和个人开发者，所以团队决定延长开放时间。

模型突出优势

这一模型由小米MiMo与AI推理系统团队TileRT联合推出，首次在万亿参数旗舰模型上突破1000 tokens/s输出速度，峰值约1200 tokens/s，还支持100万token超长上下文。实现路径不依赖专用硬件，通过模型和系统侧协同优化达成。

优化实现路径

模型侧采用FP4混合量化，降低模型体积和访存压力，引入DFlash投机解码提升效率。系统侧TileRT定制编译引擎与计算核，减少算子启动和同步开销。底层模型已在Hugging Face开源，许可证为MIT。

定价极具竞争力

UltraSpeed API限时体验价是标准版MiMo-V2.5-Pro的3倍，却有近10倍输出速度提升。其输出定价约18元/百万tokens，远低于Anthropic的Claude Opus。

行业影响与反响

在行业中，1000 tokens/s的速度冲击力大，远超GPT-5.5等。在海外开发者社区引发强烈反响，不过也有人对“万亿参数”可比性存疑。

编辑观点：小米MiMo模型的速度和价格优势显著，有望在大模型领域占据一席之地，后续发展值得关注。