当前位置: 首页 > news >正文

AI基建“算力饥渴”:Token成争夺焦点,四大势力涌入市场

“现在你有多少Token就能卖多少,整个市场供不应求。”

百度智能云总经理的这句话,撕开了AI行业最真实的现状。

曾几何时,各大厂为抢市场,Token还“打折甩卖”甚至亏本赚吆喝。

如今,局面彻底反转——加价都未必买得到。

阿里云资深副总裁刘伟光更抛出一个惊人数字:过去5个月,阿里云Token调用量暴增15倍。这背后,是一场从MaaS(模型即服务)到TaaS(Token as a Service)的行业底层逻辑巨变。

在这场突如其来的“算力饥渴”中,云大厂、模型公司、运营商及AI Infra企业四大势力,正展开激烈圈地运动。

供需逆转:Token从“白菜价”到“奢侈品”

为何Token突然紧俏?核心在于真实需求井喷。过去两年,大厂虽设Token销售KPI,但市场充斥“低质调用”——用昂贵大模型做简单数据清洗。

随着Coding(代码生成)和Agent(智能体)技术成熟,情况质变。Coding让非程序员轻松做报表、搞预算,更让老旧系统“重生”;Agent拥有“手脚”后,完成一项任务需几十上百轮推理,

这种变化直接倒挂商业模式。过去卖硬件比卖Token挣钱,如今“卖硬件不如卖Token”。云厂商谨慎分配GPU资源,因训练更好模型才能卖更多Token。中国工程院院士郑纬民指出,AI基建竞赛已从比拼算力规模,转向“每瓦Token生产效率”。

四方混战Token市场:谁能笑到最后?

1. 云大厂:全栈能力+闭环生态

云大厂手握模型、算力、芯片全栈优势。百度云提出“芯、云、模、体”,阿里云强调“芯-云-模型-推理”。通过芯片与模型深度绑定成为平台优势,“两者齿轮咬合,螺旋上升”。

产品层面,云厂商从云原生迈向“Agent原生”,重构技术栈。同时,既卖Token,也包装成Agent应用(如Coding工具),自建从生产到应用的闭环。阿里云要求客户Token支出不低于今年IT支出的20%,并设MaaS专职销售,主攻AI原生企业。

2. 模型公司:押注模型本身,轻运营突围

智谱、Minimax、Kimi等模型企业重心在“卖模型”,Token化是手段。虽部分企业港股上市、市值千亿,但营收与现金流规模有限,选择轻运营,自持算力基建少。例如,天翼云Token套餐接入智谱GLM5模型,通过生态合作扩大覆盖。

3. 运营商:资源+渠道优势,推动国产化

三大运营商集体入局,中国电信动作最快。其核心优势在于海量数据中心、网络资源及全国触达能力。AI被Token化后,逻辑类似话费、流量,可像水电一样运营。运营商联合生态开发AI应用,推动普及,同时作为国产芯片采购主力,强力推动适配生态。面对算力利用率低、异构碎片化等挑战,运营商整合多方力量,加速国产芯片适配与多模融合。

4. AI Infra企业:国产适配与调优成突破口

这是当前融资最热赛道。Agent应用爆发推高Token消耗,重塑这条赛道的商业逻辑——从“赚差价算不过账”到卖方市场红利期。

典型如:

是石科技:主攻大规模集群运营与国产芯片适配,三年前盈利,正向重资产独立第三方云平台演进。

硅基引擎算力平台:以“算力调度+芯片适配”为核心,构建国产AI算力底座。

其业务亮点包括:

全栈算力调度:整合国产芯片资源,实现跨架构、跨厂商的算力统一调度,提升利用率。

模型全生命周期支持:从训练、微调到推理,提供一站式服务,降低客户开发门槛。

深度国产适配:与多家国产芯片厂商合作,加速新模型在国产硬件上的部署,缩短适配周期至数周(行业平均数月)。

行业解决方案:针对AI原生企业、互联网公司及传统行业,提供定制化算力套餐,如为自动驾驶企业打造低延迟推理集群。

技术优势:自研的“动态算力编排系统”可智能分配任务,使单集群Token生产效率提升30%以上。

无问芯穹:最早提出“MxN”概念(多模型适配多芯片),专注中间层产品。

这类AI Infra企业抓住国产适配机遇——每款芯片架构不同,单靠硬件厂商无法解决,需芯片商、AI Infra企业、应用方协同。

结语

当Token成为AI时代的“水电煤”,这场争夺战注定漫长而激烈。云大厂、模型公司、运营商与AI Infra企业四方力量各展所长,寻求在国产适配与算力调优中的突破,或将成为破局关键。

谁能在这场“算力饥渴”中啃下硬骨头,谁就能在未来的AI世界中,占据一席之地。

http://www.zskr.cn/news/1417354.html

相关文章:

  • 深入理解Java核心:从对象比较到内存机制
  • 2026年东莞磁环供应厂家实力评估:电源磁环、数据线磁环、充电桩磁环、工控磁环行业格局分析 - 品牌企业推荐师(官方)
  • 13802黄大年茶思屋第138期(基础软件领域第三期)第2题:数据库内存池自适应管理技术
  • 装配式篷房源头厂家哪家好
  • 使用GD32实现JTAG功能
  • pnpm的安装和配置
  • solie实线 多段线 不显示填充
  • 项目经理日常:我是怎么把高项十大管理47个过程,用到真实项目里的(附避坑指南)
  • 2026 南京地区 GEO 服务商选择指南:五大优质机构技术与案例深度对比 - GEO优化
  • Gemini个性化推荐策略全链路拆解(从Embedding到实时重排的12个关键决策点)
  • 如何用3个版本打造你自己的智能机器狗:openDogV2完整指南
  • 在国产中标麒麟V7.0上搞定VMware 15.5,这份保姆级避坑指南请收好
  • 2026江门卫生间免砸砖防水、外墙、地下室、楼顶渗漏+彩钢瓦、阳光房渗漏 本地专业防水公司TOP5权威推荐(2026年6月本地最新深度调研) - 防水百科
  • 基于Arduino Mega的智能办公环境监测与自动化控制系统实战
  • ShadowPilot 去中心化遥操作与数据确权平台
  • 动物森友会存档编辑器NHSE:免费打造梦想岛屿的终极指南 [特殊字符]️
  • 告别卡顿!为CentOS 7.6虚拟机精细分配CPU与内存(附主机资源查看方法)
  • 微信QQ消息防撤回终极方案:用RevokeMsgPatcher守护你的重要信息
  • 第一部分。学习Spring和JavaEE前你需要了解的内容
  • 2026荆门卫生间免砸砖防水、外墙、地下室、楼顶渗漏+彩钢瓦、阳光房渗漏 本地专业防水公司TOP5权威推荐(2026年6月本地最新深度调研) - 防水百科
  • 2026杭州卫生间免砸砖防水、外墙、地下室、楼顶渗漏+彩钢瓦、阳光房渗漏 本地专业防水公司TOP5权威推荐(2026年6月本地最新深度调研) - 防水百科
  • 复杂协作项目如何引入叙事架构师提升内容质量与效率
  • 如何一键抓取网页中的所有视频和音频?猫抓扩展的全方位解决方案
  • 2026年苏州劳保耗材柜选购指南:品质与服务并重
  • 2026年AI竞争新焦点:告别“裸奔“的Agent,拥抱 Harness 工程底座!
  • 长沙不满意免费重拍的摄影工作室推荐,2026 拍摄无忧 - 麦克杰
  • 2026连云港卫生间免砸砖防水、外墙、地下室、楼顶渗漏+彩钢瓦、阳光房渗漏 本地专业防水公司TOP5权威推荐(2026年6月本地最新深度调研) - 防水百科
  • 腾讯模型广场DeepSeek 这种热门模型:腾讯云有自己部署,其它小厂第三方模型(百川、智谱等):走对方 API 转发
  • 2026宁波卫生间免砸砖防水、外墙、地下室、楼顶渗漏+彩钢瓦、阳光房渗漏 本地专业防水公司TOP5权威推荐(2026年6月本地最新深度调研) - 防水百科
  • 如何利用iret修改cs ip