AI 每日新闻要点 — 2026年6月19日
本期关键词:G7峰会AI三巨头同台、Claude Fable 5 横扫榜单、GPT-5.6 蓄势待发、DeepSeek 500亿首轮融资、MiniMax M3 三项全能、智谱 GLM-5.2 开源、小米 MiMo Code 正面硬刚 Claude Code、字节豆包任务模式上线、阿里 Qwen3.7-Max 登顶国产第一
一、🔥 本周头条:G7 峰会 AI 三巨头历史性同台
6月16日,法国 Évian-les-Bains,G7 峰会迎来前所未有的嘉宾阵容——Sam Altman(OpenAI)、Dario Amodei(Anthropic)、Demis Hassabis(Google DeepMind)三位 AI 掌门人首次在世界七大经济体领导人面前同台亮相。
这是 G7 近 50 年来首次邀请 AI 公司 CEO 参与领导人级别的对话。Altman 的座位被安排在印度总理、巴西总统和韩国总统旁边——一个掌舵数千亿美元估值 AI 公司的创始人,首次获得与国家元首平起平坐的外交待遇。
更值得关注的是,三位平时互为死对头的 CEO,近期罕见地联合致信美国国会,呼吁对合成 DNA 和 AI 生物威胁实施更严格监管。竞争对手在同一张桌子上讨论监管,这本身就说明了 AI 的地缘政治分量已经超出了行业竞争的范畴。
峰会核心议题包括:AI 模型出口管制(Fable 5/Mythos 5 事件后的国际协调)、AI 安全标准(前沿模型能力阈值定义)、AI 与就业(劳动力市场转型应对)、以及国际 AI 治理框架建设。
一句话总结:AI 治理从行业自律正式进入「大国协调」阶段。
二、🏆 模型战场:谁在登顶,谁在追赶
Claude Fable 5 — 横扫所有榜单
6月10日,Anthropic 正式发布Claude Fable 5 和 Claude Mythos 5。这是 Anthropic 首次将「Mythos-class」(神话级)能力带给更广泛用户。
Fable 5 的战绩令人窒息:
- SWE-bench Pro 得分 80.3%,而 GPT-5.5 只有 58.6%,差了整整 22 个百分点
- Artificial Analysis 综合智能指数64.9 分,所有模型第一
- 10 个单项评测拿下 5 个冠军
这也直接导致Anthropic 估值超越 OpenAI:9650 亿美元 vs 8520 亿美元。这是 Anthropic 第一次坐上头把交椅。
Claude 系列模型现在分为四个系列:Haiku → Sonnet → Opus → Mythos,能力逐步增强。Fable 5 属于 Opus 级,Mythos 5 则面向特定专业领域。
GPT-5.6 — OpenAI 的绝地反击
被逼急了的 OpenAI,正在加速 GPT-5.6 的发布。首席科学家 Jakub Pachocki 告诉团队,GPT-5.6 相比 GPT-5.5 有「实质性提升」。
内部代号iris-alpha的模型已在 Codex 后端日志中被开发者发现,上下文窗口约150 万 token(GPT-5.5 是 100 万),直接提升 50%。
与此同时,OpenAI 正在考虑大幅降低 token 定价,准备在 Anthropic 降价之前先出手。Sam Altman 在近期活动上表示算力成本「已经是个大问题」,会想办法让用户「花更少的钱,获得更大的价值」。
但问题是:OpenAI 2025 年营收 130.7 亿美元,净亏损却高达385.3 亿美元。在 IPO 前打价格战,等于主动压缩利润空间。
另外,OpenAI 正在谈判租赁俄亥俄州一座10GW的数据中心园区,软银旗下 SB Energy 开发,英伟达参与投资担保。整个园区建成成本至少5000 亿美元,租期 20 年,预计 2028 年开始运营。
Gemini 3.5 Pro — 谷歌在路上
Google Gemini 3.5 Pro 预计本月正式发布:200 万 token 上下文,配合 Deep Think 深度推理模式。5 月 Google I/O 大会上已经亮相,目前只在谷歌内部和少量企业客户中使用。
2026 年 6 月,Claude Fable 5、GPT-5.6、Gemini 3.5 Pro 三个模型扎堆发布。神仙打架。
三、国内厂商:集体爆发的一周
DeepSeek — 500 亿首轮融资 + V4.1 灰度测试
6月16日,DeepSeek 完成首轮融资超 500 亿元人民币(约 74 亿美元),刷新国产大模型单轮融资最高纪录。
投资方阵容豪华:创始人梁文锋个人出资 200 亿(占比 40%),腾讯 100 亿,宁德时代 50 亿,网易、京东各 30 亿,IDG Capital 30 亿。
交易架构极其特殊:外部投资方资金注入由梁文锋管理的有限合伙企业,不享有投票权,确保团队绝对控制权;外部股权设有 5 年锁定期;同时要求严格核查出资基金背后的 LP 真实身份。
产品方面,DeepSeekV4.1 Flash已进入灰度测试阶段。据 Linux.do 社区用户反馈,知识水平从 2025 年 5 月更新至 2026 年 1 月,代码生成能力相比前代有「天差地别」的进步。
腾讯云已宣布 DeepSeek-V3.2 将于 7 月 16 日正式下线,推荐用户迁移至 V4 系列。
MiniMax — M3 旗舰 + M1 推理模型双箭齐发
6月1日,MiniMax 上线MiniMax M3 模型,宣称是首个「Frontier Coding & Agentic · 百万上下文 · 原生多模态」三项能力兼备的国产旗舰。
几个关键数据:
- 基于自研 MiniMax Sparse Attention(MSA)架构,API 最高支持1M tokens 上下文
- BrowseComp 智能体评测83.5 分,超越 Claude Opus 4.7(79.3)
- 独立复现 ICLR 2025 杰出论文,连续运行近 12 小时,自主产出 18 次 commit 与 23 张实验图表
- 给四个 Base 模型要求在 12 小时内自主完成数据合成、训练、评测、迭代全流程,最终得分 37.1,位列第三(仅次于 Opus 4.7 和 GPT-5.5)
价格方面,上下文 ≤ 512K 限时五折:输入 2.1 元/百万 tokens,输出 8.4 元/百万 tokens。
此前(2025年6月17日),MiniMax 还开源了MiniMax-M1——全球首个开源大规模混合架构推理模型,4560 亿参数,每个 token 激活 459 亿参数,支持 100 万 token 上下文。
智谱 AI — GLM-5.2 开源,Code Arena 全球第二
6月17日,智谱 AI 正式上线并开源GLM-5.2 模型。核心亮点:
- 1M 无损上下文,通过扩展 Coding Agent 训练环境解决长文本劣化
- Code Arena 盲测中位列全球可用模型第二、开源模型第一
- FrontierSWE 等长程任务基准中,性能介于 Claude Opus 4.7 与 4.8 之间
- 能单次处理高达 88 万 tokens,自主跑完 Web、移动端及小程序的全端全链路开发
- 基于MIT 开源协议,首日完成华为昇腾、平头哥、摩尔线程等国产算力平台适配
底层架构上,GLM-5.2 通过 IndexShare 架构将 1M 上下文下的单位 token FLOPs 降低至 2.9 倍,并改进了 MTP 层以提升投机解码效率。
阿里巴巴 — Qwen3.7-Max 登顶国产第一
5月20日,2026 阿里云峰会上,阿里发布全新一代千问旗舰模型Qwen3.7-Max。
核心数据:
- Arena 全球大模型盲测总榜中国产模型第一
- GPQA 推理得分92.4,SWE-bench 编程得分80.4
- 面向 Agentic 时代的全能基座,实现从「说得好」到「做得到」的范式跃迁
- 支持双模式推理,可 35 小时全自主芯片优化
Qwen 系列三个月迭代三个版本(3.5 → 3.6 → 3.7),迭代速度惊人。
字节跳动 — 豆包任务模式 + 豆包股涨价
6月15日,豆包正式推出「任务模式」(Task Mode),从单一文本交互工具进化为能处理复杂工作流的 AI Agent。核心能力包括:多轮搜索、深度推理、浏览器自动化、PPT 自动生成。
与此同时,字节跳动 Seed 部门将「豆包股」价格从 13.08 美元上调至14.85 美元,涨幅 13.5%。而字节整体期权涨幅仅 2.63%——AI 业务的估值增速远超公司整体水平。
视频生成方面,Seedance 系列已迭代至 2.0 版本,支持文本、图像、音频和视频多模态输入,统一音视频联合生成架构。
小米 — MiMo Code 正面硬刚 Claude Code
6月10日,小米 MiMo AI 团队正式开源终端原生 AI 编程助手MiMo Code V0.1.0。官方数据显示,在200 步以上的长周期、多步骤任务中,该工具表现优于 Anthropic 的 Claude Code。
同步提供限时免费的MiMo-V2.5模型访问权限,旗舰多模态模型拥有百万级 Token 上下文。MiMo-V2.5-Pro 还推出了 UltraSpeed 模式,输出速度提升约 10 倍。
6月12日,小米宣布 MiMo-V2 系列部分模型将于 6 月 30 日正式下线,推动开发者向 V2.5 系列迁移。
腾讯 — 混元强化学习新突破 + 具身智能
6月17日,腾讯混元团队发布强化学习新方法,核心思路是让 AI 学习时「先想后行」,避免越学越偏。
6月15日,腾讯 Robotics X、福田实验室与混元团队联合发布面向真实世界机器人操作任务的端到端具身智能模型HyVLA-0.5,基于自研亚毫米级高精度指套式 UMI 数据采集系统。
6月11日,腾讯混元 AI Infra 团队宣布其开源高性能推理核心算子库HPC-Ops全面升级,包含五大关键算子。
快手 — 可灵 AI 年收入破亿美元
快手可灵 AI 上线一周年(截至 2025 年 6 月 6 日),已实现年化收入运行率破 1 亿美元,4 月和 5 月月度付费均超 1 亿元人民币。P 端付费订阅会员贡献了近 70% 的营收。
6月27日,可灵 AI 上线「视频音效」功能,基于自研多模态视频生音效模型 Kling-Foley,可在生成视频时同步生成高质量立体声音效。
四、💬 AI 大人物发声
Sam Altman(OpenAI CEO)
- 在 G7 峰会上与各国领导人讨论 AI 治理和出口管制
- 表示算力成本「已经是个大问题」,将推动降价
- 内部信透露 OpenAI 正在租赁 10GW 数据中心,布局远超外界预期
- 表示如果递归自我改进(RSI)速度起来了,IPO 可以推迟
- 员工股权回购定价 687.69 美元/股
Dario Amodei(Anthropic CEO)
- 携 Claude Fable 5 横扫榜单后首次在 G7 峰会上直面各国领导人
- 与 Altman、Hassabis 联合致信美国国会呼吁 AI 生物威胁监管
- 公司估值 9650 亿美元,首次超越 OpenAI
Demis Hassabis(Google DeepMind CEO)
- G7 峰会上代表 Google 参与 AI 治理讨论
- Gemini 3.5 Pro 即将发布,200 万上下文 + Deep Think 深度推理
微软 — Copilot Cowork 全球上线
- 6月17日,微软面向全球正式上线 Copilot Cowork 智能体 AI
- 超半数财富 500 强企业已在预览期使用
- 正考虑将 DeepSeek V4 微调版本作为更低成本模型选项
- Fable 5 输出定价 50 美元/百万 token,DeepSeek V4 Pro 仅 0.87 美元——实际价差约 57 倍
五、📄 本周值得关注的 AI 论文
| 论文 | 核心贡献 |
|---|---|
| No Resource, No Benchmarks, No Problem? | 提出无资源编程语言代码生成新基准和预训练/微调方法 |
| SIMMER: Benchmarking Latent Failures in LLM Planning | 发现高达 56% 的 LLM 计划包含潜在失败,多数导致不可逆后果 |
| ClinHallu: Diagnosing Hallucinations in Medical MLLM | 7031 实例的医学多模态幻觉诊断基准,精确定位幻觉来源 |
| RL-Index: Reinforcement Learning for Retrieval Index Reasoning | 用强化学习将复杂检索推理从查询时转移到索引阶段 |
| Decoupling Search from Reasoning (DSG) | 将搜索与推理解耦,SimpleQA 准确率接近原生水平但搜索成本降低 91% |
| CORA: Consistency-Oriented Reasoning Alignment | 解决多模态 RLVR 中思考-答案不一致问题,提升推理忠实度 |
六、📊 价格战与市场格局
| 厂商 | 模型 | 输入价格(元/百万token) | 输出价格(元/百万token) |
|---|---|---|---|
| DeepSeek | V4 Pro | ~0.44(永久25折后) | ~5.95 |
| MiniMax | M3(限时五折) | 2.1 | 8.4 |
| OpenAI | GPT-5.5 | 约 10.5 | 约 42 |
| Anthropic | Claude Fable 5 | 约 21 | 约 350(50美元) |
注:美元价格按 1:7 折算,实际汇率以官方为准
价格战已经白热化。DeepSeek 的价格优势让 Anthropic 和 OpenAI 承受巨大压力,微软已经开始认真考虑将 DeepSeek V4 作为 Copilot Cowork 的低成本方案。
七、🔮 趋势观察
- AI 治理进入 G7 级别:三大 AI CEO 同时出席 G7 峰会,标志着 AI 已从技术问题升级为地缘政治核心议题
- 编程能力成为主战场:Claude Fable 5 SWE-bench 80.3%、智谱 GLM-5.2 Code Arena 全球第二、小米 MiMo Code 正面硬刚 Claude Code——编程能力已成为衡量模型前沿性的首要指标
- 百万上下文成标配:MiniMax M3、智谱 GLM-5.2、小米 MiMo-V2.5 全部支持 1M 上下文,GPT-5.6 传闻 150 万,Gemini 3.5 Pro 直接 200 万
- 开源阵营强势崛起:智谱 GLM-5.2 MIT 开源、MiniMax M3 即将开源、DeepSeek V4 系列持续开源——国产开源模型的竞争力正在快速逼近闭源旗舰
- Agent 化是下一站:字节豆包任务模式、MiniMax Agent、阿里 Qwen3.7-Max 面向 Agentic 设计、微软 Copilot Cowork——所有厂商都在把模型从「聊天工具」升级为「能干活的人」
- 价格战不可避免:OpenAI 考虑降价、DeepSeek 极致低价、微软引入低价方案——token 价格持续下行是确定性趋势
下期预告:关注 GPT-5.6 和 Gemini 3.5 Pro 的正式发布时间。