6 月 30 日,北京硅基流动科技股份有限公司向港交所递交上市申请,拟按第 18C 章"特专科技公司"规则在主板挂牌,华泰国际和海通国际担任联席保荐人。这家 2023 年 8 月才成立的公司,把自己定位成 AI 时代的"Token 工厂"——不训练大模型,也不直接做上层应用,而是把异构算力和多种开源模型打包成可计价的词元服务,按量卖给开发者和企业。
招股书给出的故事很性感:按 2025 年词元年吞吐量计算,它是中国最大的"独立生态"词元供应商,在所有词元供应商中位列前五;截至 2026 年 4 月,平台注册用户超过 1000 万,服务 1.3 万多家企业客户,支持 170 多个模型,日均词元吞吐量约 5785 亿次,单日峰值突破 1 万亿。
但另一组数字同样刺眼:2025 年收入 5533 万元,同比增长 653%,净亏损却扩大到 3.45 亿元,是 2024 年的 4 倍多;综合毛利率从 2024 年的 39.4% 跌到 -24%,相当于每收入 1 元,要倒贴 0.24 元。在 B+ 轮后估值来到约 77 亿元的背景下,这一"高增长、高亏损"的财务结构,让市场不得不追问:Token 工厂到底是不是一门好生意?
业务结构:一条线拉估值,一条线养毛利
硅基流动的收入主要来自两块:公有云 MaaS 服务和本地部署解决方案。
公有云 MaaS:规模迅速做大,但严重亏钱
公有云业务包括无服务器词元服务和专属实例,客户按 Token 用量或固定费用付费,是"Token 工厂"定位最直接的体现。2025 年,这块业务贡献收入 2926 万元,占比 52.9%,首次超过本地部署,成为第一大收入来源。
运营数据同样夸张:
无服务器词元服务的客户数从 2024 年的 2455 个,暴涨到 2025 年的 71.6 万个,增长近 290 倍;
2026 年 4 月日均词元吞吐量 5785 亿次,单日峰值约 1.07 万亿次。
问题在于,这笔账算不过来。公有云业务的毛利率约为 -119%,即每收入 1 元,要额外贴 1.19 元。背后的核心原因是:
算力租赁成本高度刚性:2025 年销售成本中,算力租赁接近 6000 万元,占比约 87%;
为拉规模大量发放代金券:2025 年用于免费用户的代金券对应算力成本超过 5400 万元,全部计入费用,不产生收入。
换句话说,MaaS 这条线目前更像是"用真金白银换规模",用来支撑"中国最大独立 Token 工厂"的估值叙事,但短期内很难自我造血。
本地部署:客户变少、客单价飙升,利润集中度高
本地部署解决方案则是另一幅图景:客户自备算力,硅基流动把 SiliconLLM 推理引擎和算力编排系统部署到对方数据中心,收取软件许可、实施和维保费用。2025 年这块业务收入 2607 万元,占比 47.1%,毛利率高达 82.5%,是名副其实的"利润奶牛"。
但细节同样值得警惕:
客户数量从 2024 年的 28 家减少到 2025 年的 20 家,下降 28.6%;
单客户平均收入从 22.4 万元飙到 130.3 万元,涨幅 481%。
这意味着本地部署业务正在从"走量"转向"做超大单",收入越来越依赖少数高合约价值客户。一旦某个大客户预算收缩或项目延期,对整体营收的冲击会被显著放大。同时,本地部署本质上是项目制,交付周期长、复用率有限,规模化天花板明显。
从收入结构变化看,2024 年本地部署收入 627.7 万元,公有云仅 106.9 万元,本地部署是绝对主力;到 2025 年,公有云收入反超至 2926 万元,两者才趋于平衡。也就是说,"Token 工厂"的故事,主要是在 2025 年这一年集中讲出来的,时间窗口并不长,而亏损扩大也主要发生在公有云快速扩张的过程中。
为什么 Token 工厂"越卖越亏"?
MaaS 业务收入增速 653%,亏损却同步放大,根源在于成本结构和产业位置。
1)研发和算力成本双重挤压
2025 年,硅基流动研发费用达到 2.09 亿元,是当年收入的近 4 倍,研发投入合计三年约 2.84 亿元。这些钱主要投向 SiliconLLM 引擎迭代、多芯片适配、调度系统优化等,属于 AI Infra 的典型"重研发"特征。
更关键的是算力成本:
2025 年销售成本 6863 万元,其中算力租赁接近 6000 万元,占比约 87%;
为承接推理需求爆发,公司提前锁定了英伟达、昇腾、壁仞、沐曦、摩尔线程等多品牌 GPU,但 Token 产量是变量,租卡费却是固定成本。
当调用量不如预期时,单位 Token 成本会被显著拉高;为填满产能,只能继续"烧钱换客户",形成"规模越大、亏损越重"的短期悖论。
2)生态位劣势:没有云、没有模型,只剩"中间层"
和火山方舟、阿里百炼、百度千帆不同,硅基流动没有自研大模型,也没有云生态可以交叉补贴。大厂可以把 MaaS 当成引流入口,用云存储、数据库、老客户合同来"补贴"亏损;而硅基流动的代金券和低价策略,更多是纯成本,很难通过其他业务回收。
供应链上,它又是纯粹的"租卡方"。2025 年阿里和华为哈勃分别向其供应算力,采购金额分别为 1970 万元和 1262 万元,合计占采购总额近 20%;而阿里百炼、华为云 MaaS 又恰恰是其在公有云 MaaS 市场的直接竞争对手。这意味着:
一部分"烧钱换量"的租卡成本,直接流进了竞对的口袋;
在价格战中,硅基流动既没有模型定价权,也没有芯片定价权,只能被动跟随开源模型和云厂商的节奏。
向下看,它没有自研模型,只能依赖开源模型生态;一旦某个模型方或芯片厂商推出足够便宜、好用的官方 MaaS,客户完全可以直接对接,"独立第三方中立"这一卖点就会被部分绕开。
77 亿估值,市场在赌什么?
在 B+ 轮后,硅基流动估值约 77 亿元,对应 2025 年收入的 PS 高达 140 倍,远高于海外同类 MaaS 玩家(如 Fireworks AI、Together AI 的 PS 大致在 30–50 倍区间)。如此高的溢价,本质上是在押注两个"时间差"。
1)国产算力需要一个通用中间层
昇腾、壁仞、沐曦、摩尔线程等国产 AI 芯片出货量快速增长,但各家软件接口、编译器、驱动并不统一;大厂云通常只深度适配自家芯片,模型方若想跨多品牌芯片部署,成本很高。
硅基流动的 SiliconLLM 引擎,试图充当这个"通用中间层":
屏蔽不同芯片的差异,提供统一推理接口;
通过任务拆分、缓存复用、预测解码等技术提升单卡效率;
让模型方和应用方不必逐一对接每家芯片厂商。
如果这套中间层真正跑通,硅基流动的价值就不只是一家 MaaS 公司,而是嵌入国产算力生态的关键环节,这构成了估值溢价中最具想象空间的部分。
风险在于:
国产芯片厂商完全可能自己补齐这一层,推出成熟的统一软件栈;
一旦昇腾、壁仞等把"芯片 + 软件栈 + MaaS"打包好,硅基流动的中间层价值可能被直接替代。
2)"中立"带来的短期窗口
在大模型竞争激烈的环境下,一些模型方不愿把推理放在有自研模型的大厂云上,担心调用数据被用于训练竞品。硅基流动强调"模型中立、不训练自有大模型",在一定程度上缓解了这种顾虑,吸引了一部分对数据安全敏感的客户提供推理需求。
但这一优势同样面临挑战:
没有自研模型,就没有"模型即流量"的入口效应,只能被动接受开源模型的价格带;
一旦国产芯片厂商或头部模型方推出足够便宜、稳定的官方 MaaS,"中立第三方"的差异化会被削弱。
从股东结构看,硅基流动的资本阵容几乎是一张"Token 产业链地图":阿里、华为哈勃、美团、创新工场、商汤、智谱、壁仞等,既有算力/芯片方,也有模型/应用方,还有云和产业资本。对部分股东而言,即便"独立中间层"最终不是最优形态,只要 Token 生产这个环节跑起来,也能通过股权分享收益。
财务与治理:高研发投入下的"未商业化"上市
硅基流动 2023 年 8 月成立,2023 年 8 月至 12 月收入仅 6000 元,2024 年和 2025 年收入分别为 734.6 万元和 5533 万元。同期净亏损分别为 1222.3 万元、8191.5 万元和 3.45 亿元,亏损持续扩大。
研发开支增速明显快于收入:
2023 年 8 月至 12 月:1084.1 万元;
2024 年:6447.5 万元;
2025 年:2.09 亿元。
截至 2025 年末,公司拥有 100 名全职员工,其中研发人员 67 人,占比 67%;在中国拥有 11 项注册专利、34 项专利申请及 17 项软件著作权。
股权结构上,创始人袁进辉直接持股 14.35%,并通过四个员工激励平台合计控制约 44.48% 投票权。外部机构股东中,阿里系持股 7.42%,为最大外部股东;华为哈勃、创新工场分别持股 4.07% 和 4.01%。2025 年关键管理层薪酬总额 5795.4 万元,大幅增加主要受股份支付影响。
由于尚未达到港交所第 18C 章"商业化公司"的收入门槛,硅基流动此次以"未商业化特专科技公司"身份申请上市,发行规模、发行价及拟募资金额尚未披露。
真正的问题:在时间差耗尽前,把产能利用率拉起来
硅基流动当前的打法可以概括为:用公有云 MaaS 拉规模和估值,用本地部署养毛利和现金流。但长期看,MaaS 才是估值的核心,如果这条线始终无法扭亏,整个商业模式的可持续性都会被打上问号。
招股书显示,截至 2025 年末,公司账面现金及等价物为 1.72 亿元,再加上 2026 年 6 月完成的超 20 亿元 B 轮融资,短期资金压力不大。真正关键的,是在国产芯片自研软件栈成熟、竞争对手补齐"中立 MaaS"能力之前,把已有算力的利用率拉起来,让 70 多万付费客户中足够多的部分转化为高频、持续调用,从而摊薄单位 Token 成本。
Token 工厂不是不能做,而是难在三点:
1)如何在没有云和模型生态的情况下,构建真正的成本优势;
2)如何把"免费 + 代金券"拉来的规模,转化为可持续的付费和活跃;
3)如何在国产芯片和大厂云的双重挤压下,守住"通用中间层 + 中立"的窗口期。
硅基流动此次递表,等于把这道题摆到了公开市场面前:在时间差耗尽之前,它能否证明"独立 Token 工厂"不是一门"越卖越亏"的生意,而是一条可以持续盈利的 AI 基础设施赛道。