Token 出海经济学:40 倍价差能持续多久
中国 AI 公司正在把一种过去几乎不存在的东西,变成新的出口品类:推理 Token。问题不在于这个趋势是否存在,而在于它到底是一次可持续的成本重构,还是一场被资本和价格战短期放大的繁荣。
如果只看表面,这件事的叙事非常诱人:中国模型在 OpenRouter 上的周 Token 消耗量已连续超过美国模型,全球前五最常用模型里四个来自中国,推理价格甚至被认为比美国竞品低最多 40 倍。但真正值得追问的是,为什么会这么便宜,以及这种便宜能维持多久。
先看现象:低价不是点状竞争,而是结构性压力
中国模型在海外市场形成价格冲击,并不是某一家公司补贴换增长,而是多重因素叠加后形成的整体结果。对海外开发者、尤其是东南亚和更广泛价格敏感市场来说,这种差异已经不是“更划算”,而是“是否能大规模使用 AI”的分水岭。
这也是为什么“Token 出海”值得被单独看待。它不是传统意义上的软件出口,也不是单纯卖模型,而是在卖一种可按需调用、可按量结算的 AI 基础能力。换句话说,出口的不是模型权属,而是推理能力本身。
第一层成本优势:模型效率
最根本的一层优势来自模型架构。中国 AI 实验室对 Mixture-of-Experts(MoE)的投入非常激进,这并不是风格选择,而更像是一种现实约束下的优化路径。MoE 的核心价值在于:它允许模型在保持大体量的同时,每次推理只激活部分参数,从而显著降低单次调用成本。
在美国出口管制持续限制高端算力获取的背景下,中国厂商被迫把一部分竞争力转移到算法效率上。这种被动约束,反而催生了更强的成本敏感度。站在商业角度看,这是一种非常重要的能力:不是先拥有无穷算力,再去追求极致性能,而是在算力相对有限的条件下,把每一次推理压得更便宜。
因此,中国模型价格低,不完全是补贴,更不是简单倾销,而是效率路线在商业化阶段的体现。
第二层成本优势:能源与基础设施
推理不是纯算法问题,也是重资产运营问题。电力、机房、散热、调度效率,都会决定单位 Token 的边际成本。中国在这一层的优势并不神秘:电力供应更充足、部分地区成本更低,数据中心基础设施扩展速度也更快。
这类优势平时不显眼,但一旦进入大规模推理阶段,就会持续反映到报价里。尤其当不同厂商都在打 API 价格战时,哪怕只是每单位成本低一点,放大到万亿级 Token 消耗,也会变成明显的竞争力。
第三层成本优势:极端竞争本身
真正把价格打穿的,是中国市场内部的竞争烈度。阿里巴巴、字节跳动、百度、腾讯、MiniMax、DeepSeek 等玩家几乎同时下注,既做模型,也做云,也做 API。在这种结构下,模型不一定是利润中心,它更像获客入口。
很多公司愿意把旗舰模型开源,或者以极低价格提供调用服务,本质上是在赌后端更大的生意:企业云、工作流平台、行业解决方案、私有化部署,乃至更长期的生态锁定。阿里巴巴联合创始人蔡崇信所说的“我们不从 AI 上赚钱”,如果放在这个框架里就不难理解:不是不考虑商业回报,而是把利润实现位置后移。
所以,40 倍价差不是孤立定价,而是三件事叠加的结果:效率路线降低底层成本,基础设施压低运行成本,激烈竞争把价格进一步推向边际。
但低价不是全部,问题在于它能不能持续
任何价格优势都要回答两个问题:供给能否持续,能力是否足够。Token 出海现在最脆弱的地方,就在这里。
第一,低价建立在持续供给之上。如果中国 AI 芯片供给受限,或者昇腾等替代路线在软件层面无法稳定释放性能,那么看上去便宜的推理服务,可能会因为资源紧张而迅速失去成本优势。也就是说,Token 出海表面上是商业问题,底层其实仍由芯片与设备供给决定。
第二,低价只有在模型能力差距可控时才真正有意义。Reuters Breakingviews 提出的怀疑很重要:如果没有新的美国高端芯片,中国模型长期在能力层面落后于最强西方模型,那么价格优势未必足以弥补性能落差。AI 不是所有场景都高度价格敏感,在高价值任务上,能力差距依然可能决定市场份额。
第三,消耗量不等于收入。OpenRouter 上的高调用量说明中国模型正在扩大使用面,但这不自动意味着高质量收入。开源可以快速获客,也可能延缓付费转化;低价可以打开市场,也可能把行业拖进一场长期低利润竞争。
为什么它和前两篇文章其实是一回事
Token 出海看起来是最靠近市场的一端,但它并不是独立命题。前两篇文章讨论的光刻机限制与昇腾迁移,最终都会落到这里。MATCH Act 收紧的是制造路径,DeepSeek × 昇腾测试的是替代路径,而 Token 出海检验的是商业化路径。
如果制造被收紧、替代又不够顺利,那么低价推理的故事就会先在供给端失速;反过来,如果芯片供给和软件迁移都能稳住,那么中国 AI 的低价优势就可能从短期策略,演变成长期结构性优势。
总结和推断
中国“Token 出海”最值得重视的地方,不是价格低本身,而是它第一次把算法效率、能源条件和市场竞争三种优势,叠加成了一个能够在全球市场产生冲击的商业结果。
但它的天花板也同样清楚:不在需求端,而在供给端。只要芯片、设备和软件栈的稳定性仍受约束,低价优势就还不是不可逆的护城河。未来真正决定这条路线能否成立的,不是价格打到多低,而是供给体系能否跟上增长速度。
可信度:事实与推断结合 · 一级源+二级源

