当前位置：首页 > news >正文

Anthropic发布Claude Fable 5和Mythos 5：分层发售，能力与价格匹配几何？

news 2026/6/11 13:15:10

突发：Anthropic新模型公开

Anthropic终于把Mythos推向公开市场，不过采用分层发售。凌晨，Anthropic正式发布Claude Fable 5和Claude Mythos 5。前者面向普通用户开放，后者则限制在“受信任的安全合作伙伴”范围内。

模型命名：文学艺术概念分层

新模型的命名符合Claude一贯风格。从Haiku到Sonnet再到Opus，Anthropic一直用文学和艺术概念给模型分层，到了Mythos，名字膨胀到“神话”本身。Fable来自拉丁语fabula，意思是“被讲述之物”，和希腊语mythos同源，直译一般称为“寓言”，正如新模型定位，是一个“公开的神话”。

模型特点：底层相同，应用有别

按照Anthropic描述，Fable 5和Mythos 5共享同一个底层模型，只是Fable 5被装进更适合公开分发的安全壳里。在官方模型能力上，二者处于同一位置。但如果表现完全一样，或许也不用分成两个名字。

被改写的“神话”

神话被改写、压缩、加上训诫后变成寓言。Fable 5是公开版本，面向普通用户和开发者，但在网络安全、生物、化学以及模型蒸馏等高风险领域，会有额外安全分类器介入。一旦系统判断请求涉及敏感方向，回答将回退到Claude Opus 4.8。Mythos 5基于同样底层模型，但在部分领域解除了Fable 5的护栏。Project Glasswing里的网络安全合作伙伴可使用“满血版”Mythos 5；未来，部分生命科学研究者也可能通过受信任访问计划，使用解除生物和化学限制的版本。

定价情况：价格高昂，订阅需注意

首先是定价，Fable 5输入10美元/百万token，输出50美元/百万token ，开发者可通过Claude API调用claude - fable - 5。这个价格是Opus 4.8的两倍，和Opus 4.8的fast mode相同，Anthropic把它放在更高价格层级。不过Anthropic称，这一价格不到此前Claude Mythos Preview的一半，但因Mythos Preview并非公开API模型，官方未给出公众标准价，此说法无从验证。订阅用户要注意，Fable 5不一定长期直接包含在基础订阅包里。6月23日以后，即使用户已订阅Claude，Fable 5也可能根据算力情况按量提供。官方留了余地，如果6月23日以后算力资源足够，Anthropic会尽量把Fable 5继续包含在Pro、Max等订阅服务里。定价高可以理解，但它最好保证能力配得上价格。

跑分表现：公开表里最强一档

从跑分看，Fable 5/Mythos 5基本是Anthropic目前公开表里最强的一档。不过官方表格显示，Claude Fable 5和Claude Mythos 5的分数一般只差1–3个百分点（除带星号的网络安全、生物相关测试），表格显示的是两者更高的分数，这让人想吐槽。

重点方向：多领域表现突出

Anthropic把Fable 5的重点放在软件工程、知识工作、视觉、长上下文记忆和生命科学研究。软件工程方面，Fable/Mythos 5在SWE - Bench Pro上达到80.3%，高于Opus 4.8的69.2%；在FrontierCode Diamond上拿到29.3%，而Opus 4.8只有13.4%，GPT - 5.5只有5.7%。知识工作和视觉任务上，有标准化benchmark和早期客户测试两类证据。标准化benchmark方面，Fable/Mythos 5在GDPval - AA上得分1932，高于Opus 4.8、GPT - 5.5和Gemini 3.1 Pro；在GDP.pdf带视觉理解的文档任务上达到29.8%，超过其他主要模型。早期客户测试方面，Fable 5在Hebbia的高级金融推理基准上取得最高分，优势集中在文档推理、图表和表格理解、问题求解；IMC反馈，它在交易分析评估中几乎全面通过。为展示Fable 5的视觉能力，Anthropic举例，此前Claude模型需复杂辅助工具才能玩《宝可梦火红》，而Fable 5只靠视觉输入就可通关。长任务和记忆能力上，Fable 5可在数百万token的长期任务中保持专注，并利用笔记改进输出。在《杀戮尖塔》游戏里，给Fable 5接入持久文件记忆，其表现明显提升，提升幅度是Opus 4.8的三倍，到达最终关卡的次数也提高了三倍。网络安全能力方面，Fable/Mythos 5在ExploitBench Cap%上达到78.0%，超过Claude Mythos Preview的69.0%，接近Opus 4.8的两倍，这里用的应该是Mythos 5的得分，因为Fable 5在高风险请求上会回退到Opus 4.8。

强大的模型必须分层

Anthropic把模型能力直观展示放在类似”作品集“的滑页里，每个demo只给一小段注释。比如，Fable 5写了太阳系模拟，推导行星轨道运动并预测日食；能自主玩《异星工厂》，说明它可在开放环境制定策略，推进复杂系统建设；还做了基于浏览器的CAD编辑器，用其设计3D打印完整模型，编辑器内置AI copilot辅助建模，完成了创造工具、使用工具、完成实体设计任务的闭环；展示了流体模拟，运动节奏与古典音乐EDM remix同步，音乐也是Fable 5用代码生成的。这些案例表明Fable 5擅长把代码、视觉、物理、设计和长期规划混在一起做任务。后面部分说的是Mythos 5在研究者手里的作用，以及Anthropic分开Fable和Mythos的原因。Anthropic称，在内部蛋白设计专家评估中，Mythos 5把药物设计流程部分环节加速约10倍。一个案例中，Mythos 5接入蛋白设计和生物信息学工具，无人类帮助，可匹配甚至超过熟练人类操作员，完成一整套科学工作流。在14个蛋白靶点中，有9个产生强候选分子，正在进一步研究。Mythos 5能稳定提出新颖、有吸引力的分子生物学假设，内部科学家约80%的时候更偏好Mythos提出的假设，部分已进入实验评估。Mythos 5关于大肠杆菌蛋白新机制的假设，在另一家独立实验室研究中得到证实。它还完成了一项基因组学研究，在一周多时间里，几乎自主完成，整理单细胞数据，设计、训练定制机器学习模型，识别不同物种中执行相同角色的细胞。训练出的模型性能超过近期发表在《Science》上的模型，规模只有后者的百分之一。Anthropic计划未来几个月发表这些结果。当然，这部分还需等待论文和外部复核。但从Anthropic官方信息看，Mythos 5在生命科学里的能力接近科研Agent。生命科学部分是Mythos 5的能力上限展示，说明Anthropic的底层模型强到必须通过受信任访问分发。过去模型发布更像技术产品的事，而到了Mythos，事情变复杂。同一个底层模型分为两个版本，普通用户拿到Fable 5，安全研究者和部分生命科学研究者拿到Mythos 5；前者护栏更严格，后者需受信任访问。模型能力开始有权限、场景和责任之分，可看作前沿模型商业化进入新阶段的信号，越强的模型越不会直接给所有人，会拆成不同版本，放进不同安全边界，交给不同用户。Anthropic先这么做了，未来其他公司或许也会效仿。大家要关注这些模型的发展，谨慎选择使用，避免潜在风险。

查看全文

http://www.zskr.cn/news/1504080.html