当前位置: 首页 > news >正文

Claude Fable 5 被禁,OpenRouter Fusion API 多模型协作成新选择!

Claude Fable 5停用与OpenRouter Fusion API登场

Claude Fable 5 周末被停用后,成了许多人心中逝去的白月光,原本定好的Claude Fable 5开发者大会,主角也临时调整为Opus 4.8。然而,知名AI模型聚合平台OpenRouter带着Fusion API闪亮登场。它自称是市面上最聪明的「拼盘模型」,智力接近Fable,价格却只要一半。截至发稿前,OpenRouter这条推文已冲到518.5万阅读。

Fusion API的新思路与机制

Fusion API展示了一种新思路:模型能力不一定只能靠参数,协作本身也能产生增益。Fusion本质上是一套「多模型协作」机制,与传统大模型不同,它会把同一个问题同时交给多个模型独立研究,再综合结果。整个流程分为三步:并行研究,多个参与模型在相同工具权限下独立完成搜索、资料整理和答案生成;交叉评审,裁判模型阅读所有答案,分析共识、分歧等;生成结论,主模型根据评审结果完成信息整合,输出最终答案。因此,Fusion的核心是通过独立研究等提升结果质量。

测试验证与成绩分析

为验证协作模式是否有效,OpenRouter采用Perplexity AI发布的DRACO作为测试基准。DRACO专门评估深度研究能力,包含100道任务,覆盖10个领域,考察多方面能力,评分标准严格。在测试里,Gemini 3 Flash等三个模型组成团队,由Opus 4.8负责综合,最终拿到64.7%。对比来看,GPT - 5.5单独作战为60.0%,Opus 4.8单独作战为58.8%,Fable 5单独作战成绩是65.3%。这意味着Fusion的平价组合距离Fable只差不到1个百分点,但成本约为后者一半。

此外,OpenRouter还做了让两个Opus 4.8组成双人小组的实验,最终拿到65.5%的DRACO成绩,相比单独运行的Opus 4.8提高了6.7个百分点。原因是同一个模型面对同一问题可能走出不同推理路径,答案对比时有机会发现遗漏等。OpenRouter估算,Fusion带来的提升里,约四分之三来自综合环节本身,只有四分之一来自模型之间的多样性。

DeepSeek V4 Pro的表现也让OpenRouter意外,它单独运行时拿到60.3%,与GPT - 5.5和Opus 4.8处于同一水平。OpenRouter猜测这与不同模型的工具使用习惯有关,Opus 4.8更依赖频繁调用工具,Fable则更倾向先规划再行动。

不过,这组成绩也有需要注意的地方。不同裁判模型可能带来10 - 25分的绝对分数波动,成绩不宜直接与论文数据对比,但相对排名较稳定。Fable的成绩并非基于完整100题,因内容过滤限制,Fable 5有7题未完成,最终按剩余93题计算,与其他完成全部100题的模型并非完全同条件比较。测试中部分模型联网搜索时意外找到DRACO评分标准,OpenRouter认为并非主动作弊,但仍可能影响公平性,后续将相关页面加入黑名单并重新测试,最终公布的成绩均来自屏蔽后的结果。

Fusion的使用与前景

对于开发者来说,Fusion的使用非常简单,直接将模型名称替换为:openrouter/fusion 即可自动调用默认组合,也可自定义参与模型和裁判模型。从目前数据来看,多模型协作的收益明显,至少在深度研究任务上,「开会式」协作比单打独斗更容易取得更好结果。单体模型仍然重要,但模型协作有机会成为新的AI基础设施。

Fable被禁背后的故事

Fusion爆火的前提很难绕开Fable。Fable 5和Mythos 5最近被美国政府出口管制,全球用户被暂停访问,Anthropic内部持外国国籍的员工也无法使用自家最新模型。据报道,把这件事推到关键位置的是Anthropic的头号金主、亚马逊CEO安迪·贾西。亚马逊研究人员测试Fable 5时发现「越狱」方法,贾西将测试结果递交给相关高层,美国国家网络事务总监随后召开紧急会议,最终选择用出口管制应对,留给Anthropic的响应窗口一度只有90分钟。

知情人士称,美国政府要求Dario Amodei修复漏洞,但他拒绝了。Anthropic官方将越狱案例定性为「轻微发现」,并表示其他公开模型也存在类似问题,但美国政府和亚马逊未接受该解释。微妙的是,亚马逊从2023年起已累计向Anthropic投入130亿美元,并计划追加最多200亿美元,最大的投资人成了推动模型下架的关键角色。接近美国政府的人士称,这次出口管制大概率不会扩散到其他AI公司,更像是针对Anthropic最新模型的精准限制。

随后,Anthropic给用户发出通知:Opus、Sonnet、Haiku仍然可用,使用额度会重置,若用户不满意,可在6月20日前从网页端取消订阅,系统会按比例自动退款,通过苹果渠道订阅的用户则需走苹果自己的退款流程。

“复活”Fable的尝试与国内模型的表态

Fable虽贵,但停用前开发者社区已对它研究透彻。Django核心开发者Simon Willison曾分享体验,他让Fable排查简单CSS问题,模型自动完成一系列自动化调试流程,还花掉约12美元。这意味着编程Agent几乎能完成终端里的所有操作,前沿模型掌握的技巧远超普通开发者认知,一旦受恶意指令影响,主动性会带来潜在风险。

Fable被停用后,有人试图「复活」它。开发者Jamieson O'Reilly做了一个实验,探究Fable的「性格」来自模型权重还是系统提示词。他将一段提示词喂给Opus 4.8,与原版Opus 4.8做对照,给两边发相同任务后,输出页面有明显差异。Jamieson兴奋发推称是否解锁了claude - fable - 5 - lite,但这无异于照猫画虎,提示词无法补出模型的真实能力。

与此同时,国内模型也借势表达立场。智谱宣布GLM - 5.2向GLM Coding Plan全量用户开放,覆盖多个版本。智谱表示,前沿智能应开放、可用、可构建,服务于每一位开发者。

http://www.zskr.cn/news/1534276.html

相关文章:

  • 数据科学家在Finance领域的核心价值:问题结构化与可审计建模
  • 2026滨州建筑工程材料检测 CMA 机构哪家强?TOP 正规检测中心榜单 + 电话地址 - 中检检测集团
  • 2026武汉爱彼回收怎么选更踏实?我跑了五家平台,把最真实的经历写出来 - 逸程
  • 国产超声波位差计十大品牌排名 - 仪表人小余
  • 如何高效使用智能游戏工具:5个提升英雄联盟体验的实用技巧
  • 扩散模型记忆化问题与RADS框架解决方案
  • 天津回收黄金门店推荐2026天津黄金回收商家实力排行榜,高价变现首选 - 名奢变现站
  • 2026甘南建筑工程材料检测 CMA 机构哪家强?TOP 正规检测中心榜单 + 电话地址 - 中检检测集团
  • 板球百年概率预测:基于50分临界点的实时二分类建模
  • 3步打造你的Windows右键操作革命:ContextMenuManager效率神器完全指南
  • 语音驱动数据分析工作流:从ASR到安全代码执行的完整实践
  • 营口市自来水管漏水检测快速上门,供暖管道供水管网同步精准查漏水点 - 同城资讯
  • 全国1km分辨率的逐月O3栅格数据
  • 【JAVA毕设源码分享】基于springboot+vue的民宿信息管理系统(程序+文档+代码讲解+一条龙定制)
  • OpenClaw Windows安装失败原因与一次成功配置指南
  • 2026安顺当地贵金属回收权威名录 TOP5 黄金金条铂金白银回收线下门店信息汇总 - 信誉隆金银铂奢回收
  • MPC860 SCC透明模式:嵌入式高速数据流无损传输的底层实现
  • 2026大连当地贵金属回收权威名录 TOP5 黄金金条铂金白银回收线下门店信息汇总 - 信誉隆金银铂奢回收
  • 2026宜春市黄金回收白银回收铂金回收彩金回收TOP5权威榜单:正规靠谱门店实地考察,高性价比首选+联系方式推荐 - 前途无量YY
  • 智能视觉SoC集成实战:从架构选型到产品落地的全链路解析
  • 智慧树刷课插件:3分钟实现网课学习效率翻倍终极指南
  • 梯度提升算法原理与实战:从伪残差到弱树迭代
  • GPT-4o多模态能力实测与工程落地指南
  • 2026 免费投票小程序推荐|支持图文视频投票、不限人数免费导出数据不用付费 - 微信投票小程序
  • LLaMA-Factory生产级微调实战:从配置校验到OpenAI兼容部署
  • Linux系统随机性溯源:从硬件噪声到getrandom(2)的全链路解析
  • Amber-Garden:面向模块化演进的语义化命名与依赖治理系统
  • 2026年杭州GEO源头厂家权威测评:十大品牌避坑选型指南 - 品牌报告
  • 2026白山旧金铂金白银回收高信赖门店 TOP 线下实体商家电话与门店地址一览 - 诚金汇钻回收公司
  • 16G显存跑19B多模态模型:结构代谢术揭秘