申请量超6.6万!小米MiMo-V2.5-Pro-UltraSpeed模型延长体验期,输出速度远超GPT-5.5

申请量超6.6万!小米MiMo-V2.5-Pro-UltraSpeed模型延长体验期,输出速度远超GPT-5.5

6月23日,小米MiMo开放平台宣布延长MiMo-V2.5-Pro-UltraSpeed模型的体验期限,因申请量远超预期。该模型输出速度超1000 tokens/s,价格有优势。

体验延期原因

MiMo-V2.5-Pro-UltraSpeed模型6月9日上线,原体验窗口到6月23日。但截至该日,收到超6.6万个使用申请,涵盖多领域,申请者有世界500强、行业头部企业和个人开发者,所以团队决定延长开放时间。

模型突出优势

这一模型由小米MiMo与AI推理系统团队TileRT联合推出,首次在万亿参数旗舰模型上突破1000 tokens/s输出速度,峰值约1200 tokens/s,还支持100万token超长上下文。实现路径不依赖专用硬件,通过模型和系统侧协同优化达成。

优化实现路径

模型侧采用FP4混合量化,降低模型体积和访存压力,引入DFlash投机解码提升效率。系统侧TileRT定制编译引擎与计算核,减少算子启动和同步开销。底层模型已在Hugging Face开源,许可证为MIT。

定价极具竞争力

UltraSpeed API限时体验价是标准版MiMo-V2.5-Pro的3倍,却有近10倍输出速度提升。其输出定价约18元/百万tokens,远低于Anthropic的Claude Opus。

行业影响与反响

在行业中,1000 tokens/s的速度冲击力大,远超GPT-5.5等。在海外开发者社区引发强烈反响,不过也有人对“万亿参数”可比性存疑。

编辑观点:小米MiMo模型的速度和价格优势显著,有望在大模型领域占据一席之地,后续发展值得关注。