当前位置: 首页 > news >正文

给大模型做“微创手术”:只动 1.59% 的脑回路,数学却更清醒了

在大语言模型(LLM)的世界里,最令人抓狂的失败往往不是“不会”,而是“明明会,却走神”。一道小学应用题,模型能把人数算对、减法写对,却在关键一步突然把“有 6 个男生缺席”读成“没说男生缺席”,然后一本正经地给出错误答案——仿佛一个聪明的学生在考场上被窗外的鸟叫拐跑了注意力。

论文《Constructive Circuit Amplification: Improving Math Reasoning in LLMs via Targeted Sub-Network Updates》(Prakash 等,2025)要做的事情,听起来像科幻外科:不对整台模型做大规模“再训练”,而是先找出它推理时“第一次跑偏”的那个词,再定位出是哪些注意力头和 MLP 神经元在“把它往正确路上推”,最后只更新这极小一撮组件(最低只占 0.17%,最高也就 1.59%),就能让数学推理准确率提升最高 +11.4%,而且对 MMLU、TriviaQA、TruthfulQA 等通用能力影响很小。

本文精读将严格围绕你指定的重点:DCM 掩码(Desiderata-based Component Masking)稀疏更新(targeted sub-network updates),把它讲清楚:它到底怎么找“该动哪几根神经”,为什么只动一点点会有效,实验结果说明了什么,以及它的边界在哪里。


🧭 一、为什么“只动一点点”可能比“全身按摩”更有效?

论文建立在两条来自机制可解释性(mechanistic interpretability)的经验事实上

http://www.zskr.cn/news/168827.html

相关文章:

  • YOLO镜像适配国产芯片,推动AI自主可控进程
  • 总结:程序员的成长之路,始于足下
  • Vivo出品,干趴付费!
  • 2025年无锡刑事辩护律师团队推荐,无锡李治辰律师团队规模、实力深度解析 - mypinpai
  • SM4加密存储与html5大文件分片上传结合方案
  • 2025年口碑好的技术学校推荐:专业的技术学校全解析 - 工业推荐榜
  • 第一次公开演讲
  • 2025年靠谱特种设备资质办理排行榜,起重机修理资质办理找哪家? - myqiye
  • YOLO目标检测线上服务高可用架构设计
  • arm64开发板反编译的DTS不能直接使用
  • 数据库索引:为什么重要以及如何使用
  • springboot_ssm智能高端家具家居行业门户网站
  • 程序员的副业选择:结合技术提升收入
  • YOLO在港口集装箱识别中的成功落地案例
  • YOLO目标检测输出格式解析(坐标、类别、置信度)
  • YOLO目标检测项目交付标准与验收清单
  • Thinkphp_Laravel框架开发的vue旅游景区门票分享推荐网站
  • YOLO目标检测性能评估指标详解(mAP, IoU, FPS)
  • Thinkphp_Laravel框架开发的vue空巢老人网上药店购药系统_9h2k5
  • Java中的double和float到底有啥区别?一篇讲透精度与选择
  • 2025新疆知名咖啡培训企业TOP5推荐:甄选合作商助力咖啡人才成长 - 工业推荐榜
  • Canvas烟雾效果咋实现?手把手教你性能和优化
  • 5.2 自抗扰控制 (ADRC)
  • 2025年太原职业技能培训学校排行榜,太原万通轨道学校新测评推荐 - 工业品牌热点
  • 无需GPU专家!一键部署YOLO目标检测服务
  • YOLO模型推理支持边缘-云端协同推理模式
  • 2025年质量好的钢木课桌椅/学生课桌椅厂家推荐及采购指南 - 品牌宣传支持者
  • 以规范筑基,让代码拥有生命力
  • 索尼L39h固件升级、刷机指南与风险全解析
  • JavaEE进阶——Spring Bean与Java Bean的核心区别