当前位置: 首页 > news >正文

智博会上的国产芯:重新定义 Token 价值链路

AI 时代,算力是核心引擎,Token 是信息处理的最小单元,两者都是智能化产线上的「硬通货」。然而,近年来算力新基建持续提速,Token 调用量爆发式增长,真实业务场景中的价值产出却未能有效同步,业界情绪开始从「算力不足恐惧症」转向「Token 焦虑」。

天津智博会上,海光信息总裁助理兼智能计算产品部总经理杜夏威指出,「过去大家谈算力,比的是单卡峰值;现在谈 Token,比的是单位产出。」在他身后,海光展台上全系 CPU 和 DCU 产品一字排开,从通用计算到 AI 加速,从数据中心到边缘工控,几乎覆盖了 Token 效益产出的每一个环节。


Token 焦虑,本质是算力到生产力的转化效率问题

「Token 焦虑未必是坏事。如果大家对算力和大模型没有感知,自然不会焦虑。焦虑说明产业在快速流动。」杜夏威对 Token 热的判断有些出人意料。

他认为,Token 的出现本身就是一个进步——它把算力和算法之间的度量衡统一了。「以前你说算力有多强,用户听不懂。现在你说一个 Token 多少钱、响应多快,所有人都能算账。」

但这个统一的度量衡也暴露了问题:算力指标和 Token 吞吐力之间,存在一条不小的鸿沟。杜夏威打了个比方:「芯片算力是物理天花板,决定了上限;Token 吞吐力是转化效率,决定了用户实际能用到多少。」

海光过去几年做的事,可以理解为逐级搭建价值转化阶梯:算力性能-适配效率-模型效率-Token 效率。每一步都有具体动作——400 多款主流大模型做到了 Day0 适配,自研 DTK 软件栈让 CUDA 代码平滑迁移,DCU 在多个模型推理场景下的首 Token 延迟做到低于 NVIDIA H20。

杜夏威指出,「训练看集群效率,推理看单位成本」正在成为行业共识。在计算集群方面,算力精度不足导致的应用能效下降,甚至场景覆盖不足等问题颇为显见,超智融合成为提升 Token 效益的重要途径。

为此,海光基于 DCU 全精度计算能力,已支撑多个万卡级超智融合智算集群成功落地,并且广泛覆盖了万亿参数模型训练、AI4S、AI4E 等前沿场景需求。

除此之外,海光 DCU 在推理场景的优化已经深入到算子层——Attention 算子融合、KV Cache 压缩管理、FP8/INT4 低精度支持,目的是让客户「训得起,也推得起」。


CPU 被低估了:它是 Token 经济的「中枢大脑」

智博会现场,另一个被反复讨论的话题是 CPU 在 AI 时代的新角色。

「过去在 AI 训练阶段,Token 或者说 CPU 的性能并没有充分体现。」海光信息总裁助理、创新产品线总经理李成指出,随着 OpenClaw 等智能体(Agent)爆发,CPU 的重要性正在回归。因为 Agent 不是简单问答,而是「长在线、高交互」——持续运行、调用工具、访问记忆、执行任务。

有研究显示,在智能体工作负载中,CPU 端的处理延迟占比最高可达 90% 以上。GPU 负责「算得快」,CPU 负责「跑得久、调度稳」。如果 CPU 扛不住,GPU 再强也只能空转。这是 Token 价值产出的又一个关键环节。

「大模型参数量越来越大,MoE(混合专家)成为主流结构,我们不得不将 KV Cache 和部分算力 offload 到 CPU 端。」杜夏威补充道,「这导致即便在数据中心内部,CPU 和 GPU 的耦合也越来越紧,CPU 的作用只会越来越大」。

海光 C86 系列 CPU 恰好卡位在这个趋势上。其原生兼容 x86 生态,端侧和边缘场景表现出色,同时从指令集层面内置了国密算法和可信计算能力,对熔断、幽灵等漏洞原生免疫。用杜夏威的话说:「算力底座稳了,上层 Token 产出才稳得住、跑得快。」


端侧算力崛起:AI 落地的「最后一公里」

AI 的下一步,不能只靠数据中心。尤其在现实生产场景中,Token 不会永远飘在云端,工厂产线、变配电站、交通路口,数据实时处理必须在现场完成,端侧算力成为快速响应的关键。

光合组织嵌入式产品专家张考华在采访中指出,「AI 这场大戏,数据中心训练只是开场。未来能发展多深、影响多广,要看边端。」他判断,边端算力需求必将迎来爆发式增长。

端侧场景已经铺开。从智能制造、能源电力到机器人,边缘侧对高可靠、低延迟 AI 算力的需求正在激增。张考华特别提到一个趋势:「算力上天」——星际探索中很多算力不需要传回地面,「边缘侧算力和 Token 引流的意义,远超大多数人想象」。

海光与光合组织的打法是「云边协同」:通过云上算力网络服务中小企业和个人开发者,同时提供私有化算力方案,让对数据安全敏感的行业用户可以在本地完成 AI 转型。

「云端提供便捷 Token 服务,私域沉淀数据资产、做深度业务整合。」张考华说,两种模式互为补充,共同覆盖了从消费端到产业端的全场景算力需求。

在双芯产品阵列中,海光这次专门展出了工控和嵌入式芯片解决方案。据介绍,这款芯片继承了 C86 架构的技术积累,宽温支持、工业可靠性、内生安全等方面均做了针对性设计,在很多边端实测场景中打破了国产工控芯片「能用但不好用」的印象。

从数据中心到边缘节点,国产芯片展现的能力版图已经清晰:不止是在单一维度上比拼参数,而是用一套覆盖「端、边、云」的算力协同体系,系统性解决 Token 从生产到变现的堵点。


我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。

关注「AI信息Gap」,让 AI 成为你的外挂。


http://www.zskr.cn/news/1427269.html

相关文章:

  • 从Dropout到残差连接:实战中如何为你的基因预测模型选择正则化与防梯度消失策略
  • 其利天下圆满完成第二十届深圳国际金融博览会参展之行
  • EliSpot 技术:疫苗研发不可或缺的核心工具
  • 基于边缘计算与Bun运行时构建高性能新闻聚合系统架构实践
  • 北京金发钹祥金属材料贸易:靠谱的北京不锈钢焊接公司 - LYL仔仔
  • Kubernetes 控制器(Controller)详解【20260530】001篇
  • 2026年4月中封袋生产商推荐,聚酯尼龙袋/包装袋/中封袋/八边封包装袋/三边封包装袋,中封袋订做厂家口碑推荐 - 品牌推荐师
  • Python小红书数据采集终极指南:xhs库完整使用教程与实战应用
  • OEXN平台:信息披露与运营规范性的评测参考
  • 如何高效抓取抖音直播间弹幕数据:DouyinLiveWebFetcher完整解析
  • Kubernetes 控制器(Controller)详解【20260530】002篇
  • 2026 西安黄金回收全解析:行情、避坑与正规渠道 - 奢侈品回收测评
  • 基于Arduino与MLX90614的红外测温仪DIY全攻略
  • 蒙城悦洁家政服务经营部:专业的亳州房屋渗水公司 - LYL仔仔
  • 2026年东莞市CPPM报名十大核心问题全流程答疑 - 众智商学院课程中心
  • 人工智能专业推荐四川哪些学校?2026 报考指南 - 品牌2025
  • 长春洪科家电维修:专业长春TCL空调安装公司 - LYL仔仔
  • 泉州鼎盛拆除:专业的泉州水泥黄沙出售哪家好 - LYL仔仔
  • Warcraft Helper:终极开源兼容性优化方案,让经典魔兽争霸3在现代系统重生
  • 2026年深圳市龙岗区龙城街道废旧电缆再生资源回收有哪些甄选要点?客满天回收行业参考指南 - 资讯快报
  • ESP32-S3深度休眠模式下的数据守护神:RTC内存实战配置与避坑指南
  • 马斯克AI项目:技术权力、政治叙事与未来治理的交叉点
  • 情绪分析:从数据到洞察,驱动精准营销决策的实战指南
  • ncmdump终极指南:3分钟解锁网易云音乐加密格式,实现音乐自由播放
  • 山东一卡通回收指南:如何轻松处理闲置卡片? - 团团收购物卡回收
  • HMI设计别再卷3D了!聊聊ISA-101标准下的‘信息驱动’与未来自动化生成
  • HR考中级经济师人力资源管理怎么备考? - 众智商学院职业教育
  • 2026年长春GEO优化服务全景评测:不同场景下的优选指南 - 资讯快报
  • 3步实现跨设备游戏串流:Sunshine开源游戏流媒体服务器完整指南
  • 如何3步永久备份微信聊天记录:WeChatExporter完整指南