当前位置: 首页 > news >正文

Anthropic发布Claude Fable 5和Mythos 5:分层发售,能力与价格匹配几何?

突发:Anthropic新模型公开

Anthropic终于把Mythos推向公开市场,不过采用分层发售。凌晨,Anthropic正式发布Claude Fable 5和Claude Mythos 5。前者面向普通用户开放,后者则限制在“受信任的安全合作伙伴”范围内。

模型命名:文学艺术概念分层

新模型的命名符合Claude一贯风格。从Haiku到Sonnet再到Opus,Anthropic一直用文学和艺术概念给模型分层,到了Mythos,名字膨胀到“神话”本身。Fable来自拉丁语fabula,意思是“被讲述之物”,和希腊语mythos同源,直译一般称为“寓言”,正如新模型定位,是一个“公开的神话”。

模型特点:底层相同,应用有别

按照Anthropic描述,Fable 5和Mythos 5共享同一个底层模型,只是Fable 5被装进更适合公开分发的安全壳里。在官方模型能力上,二者处于同一位置。但如果表现完全一样,或许也不用分成两个名字。

被改写的“神话”

神话被改写、压缩、加上训诫后变成寓言。Fable 5是公开版本,面向普通用户和开发者,但在网络安全、生物、化学以及模型蒸馏等高风险领域,会有额外安全分类器介入。一旦系统判断请求涉及敏感方向,回答将回退到Claude Opus 4.8。Mythos 5基于同样底层模型,但在部分领域解除了Fable 5的护栏。Project Glasswing里的网络安全合作伙伴可使用“满血版”Mythos 5;未来,部分生命科学研究者也可能通过受信任访问计划,使用解除生物和化学限制的版本。

定价情况:价格高昂,订阅需注意

首先是定价,Fable 5输入10美元/百万token,输出50美元/百万token ,开发者可通过Claude API调用claude - fable - 5。这个价格是Opus 4.8的两倍,和Opus 4.8的fast mode相同,Anthropic把它放在更高价格层级。不过Anthropic称,这一价格不到此前Claude Mythos Preview的一半,但因Mythos Preview并非公开API模型,官方未给出公众标准价,此说法无从验证。订阅用户要注意,Fable 5不一定长期直接包含在基础订阅包里。6月23日以后,即使用户已订阅Claude,Fable 5也可能根据算力情况按量提供。官方留了余地,如果6月23日以后算力资源足够,Anthropic会尽量把Fable 5继续包含在Pro、Max等订阅服务里。定价高可以理解,但它最好保证能力配得上价格。

跑分表现:公开表里最强一档

从跑分看,Fable 5/Mythos 5基本是Anthropic目前公开表里最强的一档。不过官方表格显示,Claude Fable 5和Claude Mythos 5的分数一般只差1–3个百分点(除带星号的网络安全、生物相关测试),表格显示的是两者更高的分数,这让人想吐槽。

重点方向:多领域表现突出

Anthropic把Fable 5的重点放在软件工程、知识工作、视觉、长上下文记忆和生命科学研究。软件工程方面,Fable/Mythos 5在SWE - Bench Pro上达到80.3%,高于Opus 4.8的69.2%;在FrontierCode Diamond上拿到29.3%,而Opus 4.8只有13.4%,GPT - 5.5只有5.7%。知识工作和视觉任务上,有标准化benchmark和早期客户测试两类证据。标准化benchmark方面,Fable/Mythos 5在GDPval - AA上得分1932,高于Opus 4.8、GPT - 5.5和Gemini 3.1 Pro;在GDP.pdf带视觉理解的文档任务上达到29.8%,超过其他主要模型。早期客户测试方面,Fable 5在Hebbia的高级金融推理基准上取得最高分,优势集中在文档推理、图表和表格理解、问题求解;IMC反馈,它在交易分析评估中几乎全面通过。为展示Fable 5的视觉能力,Anthropic举例,此前Claude模型需复杂辅助工具才能玩《宝可梦 火红》,而Fable 5只靠视觉输入就可通关。长任务和记忆能力上,Fable 5可在数百万token的长期任务中保持专注,并利用笔记改进输出。在《杀戮尖塔》游戏里,给Fable 5接入持久文件记忆,其表现明显提升,提升幅度是Opus 4.8的三倍,到达最终关卡的次数也提高了三倍。网络安全能力方面,Fable/Mythos 5在ExploitBench Cap%上达到78.0%,超过Claude Mythos Preview的69.0%,接近Opus 4.8的两倍,这里用的应该是Mythos 5的得分,因为Fable 5在高风险请求上会回退到Opus 4.8。

强大的模型必须分层

Anthropic把模型能力直观展示放在类似”作品集“的滑页里,每个demo只给一小段注释。比如,Fable 5写了太阳系模拟,推导行星轨道运动并预测日食;能自主玩《异星工厂》,说明它可在开放环境制定策略,推进复杂系统建设;还做了基于浏览器的CAD编辑器,用其设计3D打印完整模型,编辑器内置AI copilot辅助建模,完成了创造工具、使用工具、完成实体设计任务的闭环;展示了流体模拟,运动节奏与古典音乐EDM remix同步,音乐也是Fable 5用代码生成的。这些案例表明Fable 5擅长把代码、视觉、物理、设计和长期规划混在一起做任务。后面部分说的是Mythos 5在研究者手里的作用,以及Anthropic分开Fable和Mythos的原因。Anthropic称,在内部蛋白设计专家评估中,Mythos 5把药物设计流程部分环节加速约10倍。一个案例中,Mythos 5接入蛋白设计和生物信息学工具,无人类帮助,可匹配甚至超过熟练人类操作员,完成一整套科学工作流。在14个蛋白靶点中,有9个产生强候选分子,正在进一步研究。Mythos 5能稳定提出新颖、有吸引力的分子生物学假设,内部科学家约80%的时候更偏好Mythos提出的假设,部分已进入实验评估。Mythos 5关于大肠杆菌蛋白新机制的假设,在另一家独立实验室研究中得到证实。它还完成了一项基因组学研究,在一周多时间里,几乎自主完成,整理单细胞数据,设计、训练定制机器学习模型,识别不同物种中执行相同角色的细胞。训练出的模型性能超过近期发表在《Science》上的模型,规模只有后者的百分之一。Anthropic计划未来几个月发表这些结果。当然,这部分还需等待论文和外部复核。但从Anthropic官方信息看,Mythos 5在生命科学里的能力接近科研Agent。生命科学部分是Mythos 5的能力上限展示,说明Anthropic的底层模型强到必须通过受信任访问分发。过去模型发布更像技术产品的事,而到了Mythos,事情变复杂。同一个底层模型分为两个版本,普通用户拿到Fable 5,安全研究者和部分生命科学研究者拿到Mythos 5;前者护栏更严格,后者需受信任访问。模型能力开始有权限、场景和责任之分,可看作前沿模型商业化进入新阶段的信号,越强的模型越不会直接给所有人,会拆成不同版本,放进不同安全边界,交给不同用户。Anthropic先这么做了,未来其他公司或许也会效仿。大家要关注这些模型的发展,谨慎选择使用,避免潜在风险。

http://www.zskr.cn/news/1504080.html

相关文章:

  • 医药企业花千万建系统,却卡在了这件最基础的事上
  • 免费开源网络速度测试工具OpenSpeedTest™:3分钟搭建专属测速站
  • 【MATLAB】飞行器姿态快速收敛控制算法实现
  • 虚幻引擎资产深度编辑终极指南:UAssetGUI 5大核心特性解析
  • 沈阳苏家屯区防水补漏哪家靠谱?2026正规修缮公司排名实测 - 苏易房屋修缮
  • 影刀RPA新手教程_输入文本与模拟输入的区别
  • DDrawCompat完整指南:5分钟让经典游戏在现代Windows上流畅运行
  • 拯救者 Y70 隐藏用法!一键快速查看当日运动数据
  • 【C/C++】深入解析uint8_t、uint16_t、uint32_t之间的数据转换与字节序处理
  • 2026年6月10日科技热点新闻
  • 2026深圳黄金回收 TOP 榜,11家实体实测,这几家最值得选 - 奢侈品回收测评
  • 2026企业架构实战:ERP单据异常智能排查与日志联动分析,如何靠实在Agent破解集成僵局?
  • 30张实拍共享单车图像+VOC标准XML标注,适配YOLO/Faster R-CNN训练
  • Adobe-GenP 3.0:突破性自动化破解方案,全面解锁Adobe全家桶专业功能
  • Windows系统文件d3dpmesh.dll文件丢失找不到问题解决
  • Word文档导出为图片的4种实用方法:2026保姆级教程(Windows/Mac/WPS通用)
  • 免费终极暗黑2存档编辑器:d2s-editor完全指南
  • 揭秘115网盘在Kodi中的智能流媒体引擎:3大核心技术解析
  • STM8S硬件I2C驱动AT24C02的完整读写工程(含串口调试与多模式验证)
  • 2026年京东云OpenClaw/Hermes Agent配置Token Plan集成完整指南
  • DDrawCompat深度技术解析:Windows 11老游戏DirectDraw兼容性性能优化完整方案
  • 深入解析NXP PCA9620 LCD驱动器:I2C通信、RAM映射与双缓冲显示实战
  • 革命性暗黑3自动化助手:D3keyHelper智能化游戏解放方案
  • SpringBoot项目里,如何优雅地用poi-tl生成带动态图表的Word文档?
  • 过来人实测|去新疆旅行怎么选本地导游?分享2位优质本土向导 - 旅行分享
  • 杭州定制游旅行社排行:基于服务与行程的客观对比 - 互联网科技品牌测评
  • 沈阳法库县防水补漏哪家靠谱?2026正规修缮公司排名实测 - 苏易房屋修缮
  • 9.2 长短期记忆网络(LSTM):从遗忘门到记忆元的深度解析
  • 数据的加密与解密(12:48)
  • Java毕设选题推荐:基于WEB的家具网购平台系统设计与实现基于springboot技术的家具网站【附源码、mysql、文档、调试+代码讲解+全bao等】