当前位置: 首页 > news >正文

Transformer 作者与辛顿门徒联手:Cohere 开源旗舰 Command A+,企业 AI 降本增效新突破

Transformer作者联手辛顿门徒Cohere开源旗舰模型Command A5月20日《Attention Is All You Need》论文的共同作者Aidan Gomez在X上宣布推出首个完全开源的Apache 2.0许可的模型Cohere Command A。Gomez是前谷歌研究员也是Cohere的联合创始人兼CEO。Command A是Command A家族的最后一个模型也是Cohere的第一个MoE混合专家模型拥有218B总参数25B激活参数能一次性整合视觉输入、推理、翻译和AI智能体能力。MoE架构与量化技术省算力又提性能Command A采用MoE架构将问题路由给最擅长处理的“专家”神经网络其余部分休眠运行时算力和能耗接近小模型。此外Cohere还叠加了量化技术提供BF16、FP8和W4A4三种版本W4A4是技术核心。Cohere称W4A4量化方案接近无损W4A4版本在低并发下每秒达375个token首token延迟仅113毫秒。Apache 2.0许可真正的开源模型在AI圈“开源”常有名无实很多公司虽开放权重但商用受限。Cohere此前的Command R、Command R采用CC - BY - NC 4.0许可严禁商用。而Command A采用Apache 2.0许可任何人都可使用、修改、分发并商业化无需授权费和竞业条款这一转变由联合创始人Nick Frosst力主推动。原生引用生成提升模型可信度一个模型要进入金融、医疗、法律等生产环境可信是关键。Command A做了原生引用生成设计检索信息时会生成“grounding spans溯源标记”将事实声明链接到引用文档或数据库记录降低幻觉风险对受监管行业尤为重要。智能体与多模态能力应用场景广泛Command A支持标准chat template下的对话式工具调用可对接内部API、搜索引擎或SQL数据库。它还是全多模态的能在128K输入上下文里处理文本和图像适合分析扫描发票、图表和技术手册。据Cohere数据在多项测试中Command A表现提升显著但在深度智能体编码和综合智能广度上仍落后于部分中国头部开源模型。降本增效重写企业AI成本账Command A降低了企业使用AI的成本。一是部署门槛降低过去千亿级模型需GPU集群现在最低1张B200或2张H100即可二是推理开销降低W4A4版本输出速度较前代最高提升63%延迟降低17%三是多语言成本降低新分词器让非欧洲语言更省token。近期Cohere还宣布与德国AI公司Aleph Alpha合并开源大模型竞争进入下半场比拼谁能让企业把模型搬进自家机房。
http://www.zskr.cn/news/1354887.html

相关文章:

  • Zot与CI/CD集成:自动化构建与推送镜像的完整指南
  • Beyond Compare 5 密钥生成技术深度解析:从二进制逆向到自动化授权实战指南
  • 2026乾县黄金回收避坑指南;闲置黄金变现;认准铭润金银回收,诚信靠谱 - 亦辰小黄鸭
  • AI浪潮下财富版图重构:上游芯片厂商吃肉,中下游玩家盈利难
  • 三步搞定知网文献批量下载:告别繁琐检索,开启高效科研新体验
  • 终极指南:如何用trackerslist项目让BT下载速度提升300%
  • Folcolor:用色彩革命终结Windows文件夹的“视觉混乱症“
  • 暗黑破坏神2终极现代化指南:用d2dx实现宽屏、高帧率与画质提升
  • XZ1813 外置MOS,工作电压范围:9V-120V,异步降压芯片
  • openpilot终极指南:5步快速实现300+车型自动驾驶辅助
  • PinLockView社区贡献指南:如何参与开源项目开发与维护
  • Balena Etcher完整使用指南:3分钟掌握安全烧录系统镜像
  • MobaXterm中文版终极指南:一站式解决远程管理的5大核心痛点
  • D3plus国际化支持:多语言数据可视化的实现方法
  • 双栈实现方法实例分析
  • 2026南宁黄金回收TOP榜单,添价收稳坐头把交椅 - 薛定谔的梨花猫
  • 中壹鑫上海建设:上海工装公司电话 - LYL仔仔
  • 登上Nature正刊!阿里达摩院AI新突破
  • 2026年天津正规公墓服务机构推荐:合规资源・透明服务・人文安葬选择指南 - 海棠依旧大
  • Ryzen SDT调试工具深度解析:掌握AMD处理器底层调优的三大技术支柱
  • 为什么你的ChatGPT文章永远不进前10?资深SEO总监拆解4类高跳出率文案的语义断层真相
  • Taotoken 的 Token Plan 套餐如何让我的项目用模成本更可控
  • 添价收领衔:2026南宁黄金回收全方位测评 - 薛定谔的梨花猫
  • 如何快速部署原神Grasscutter工具:终极配置与使用指南
  • 3步实现容器镜像国内加速:DaoCloud镜像同步项目实战指南
  • 抖音下载神器:免费批量下载无水印视频的终极指南
  • Keil µVision中查看Object-HEX转换器命令行参数的方法
  • 抖音视频下载终极指南:专业高效的无水印批量下载解决方案
  • 免费音乐整合神器:3步打造你的专属音乐中心
  • Vue Antd Admin企业级后台架构深度解析:如何构建现代化中台管理系统解决方案