多年来,多数人工智能公司在代币使用上采取宽松策略。代币作为模型读取和生成文本的基本单位,长期被打包进订阅服务、隐藏在较高的使用上限之后,或以极低价格提供,使用户几乎无需关注消耗量。
随着模型运行成本不断侵蚀收入,加之芯片供应紧张、氦气供应中断及数据中心建设受限,算力扩张遇到瓶颈,主要模型开发商开始主动收紧访问权限和补贴力度。业内人士指出,所谓“无限制”的AI服务正在快速减少,各家公司在谁能更久承受补贴压力的竞争中博弈,最后一个被迫收紧条件的参与者,可能在市场中占据更大优势。
本周,Meta下线了内部使用的“Claudenomics”排行榜。该排行榜以粗略指标统计员工过去一个月使用的AI代币数量。数据显示,员工单月代币使用量超过60万亿个,相当于约8000万本《战争与和平》,或约1万座完整图书馆的内容规模。
研究机构GovAI高级研究员Sam Manning表示,前沿模型开发者正面临如何分配有限计算资源的关键抉择。“领先的前沿模型开发者将面临如何使用计算资源的权衡。这是这些公司必须做出的极其重要的决策。”他说。
当前,全球AI芯片短缺问题仍在持续,且可能因中东战争影响GPU生产关键原料氦气的供应而进一步加剧。同时,数据中心建设进度滞后,限制了可用于训练和运行模型的硬件规模。在这种情况下,压缩训练预算可能导致新一代模型发布节奏落后于竞争对手,而削减推理能力——即响应客户请求的速度和规模——则可能直接影响用户体验。
在具体策略上,不同公司选择各异。本月早些时候,OpenAI宣布将其Codex应用的计费方式由“按消息计费”调整为“按代币计费”,不再与单次查询条数简单挂钩。这一调整可能有利于执行小规模任务的用户,但对于高频或大规模调用者而言,代币额度消耗速度也可能明显加快。与此同时,该公司在四月初结束了此前持续数月的Codex代币额度翻倍优惠活动。
Anthropic则在同一时期调整了订阅使用规则,禁止用户通过Claude订阅为OpenClaw代理类AI工具提供算力,并要求此类使用场景改为通过API接入。业内普遍认为,此举与需求过快增长有关。Claude Code执行官Boris Cherny在宣布这一调整时表示:“我们一直在努力满足Claude需求的增长,而我们的订阅服务并非为这些第三方工具的使用模式设计。容量是一种我们谨慎管理的资源,我们优先保障使用我们产品和API的客户。”

成本压力在财务数据中有所体现。据《华尔街日报》获得的内部数据,AI模型服务成本在OpenAI和Anthropic收入中占比均超过一半。Manning指出,当前用户获得的“消费者剩余”仍然很大,“最初定价的动机很多是为了建立市场份额并吸引用户进入平台。也许我们正处于某种拐点。”
价格与性能之间的权衡并不限于美国市场,中国AI企业也在调整策略。GLM模型开发方智谱AI在开放平台API上的代币价格自2026年初以来已累计上调83%,本周又宣布对最新模型再涨价8%。
摩根大通研究认为,价格上调反映出需求加速增长。报告显示,用户在编码和代理相关等高价值工作负载上,愿意接受更高价格。价格上涨叠加持续的需求,使中国部分AI厂商的单位经济结构发生变化:智谱AI的API毛利率从2024年的3%提升至2025年的19%。
与之形成对比的是阿里巴巴的做法。该公司通过OpenRouter(一种编码支持系统)向用户免费开放其Qwen-3.6模型。据披露,用户在一天内即消耗了近1.5万亿个代币。
在行业整体趋紧的背景下,这一举措显得尤为突出。市场观察人士认为,其逻辑在于阿里巴巴希望借此吸引开发者和工作负载,进而争取长期云计算客户。与OpenAI和Anthropic通过收紧访问来保护稀缺算力、改善单位经济不同,阿里巴巴选择在短期内承担成本,以期在未来竞争更为激烈时锁定用户基础。
Manning指出,阿里巴巴的策略还建立在一个现实判断之上:多数公司在短期内难以在价格上大幅妥协,甚至可能长期如此。“如果计算资源依然稀缺,价格压力将不可避免。我们应该预期在可预见的未来,计算资源将持续稀缺。”他说。
在算力供给受限、成本压力上升和需求持续扩张的多重作用下,AI代币的使用与定价正成为行业竞争的核心变量之一。各家公司在补贴、限额与价格之间的取舍,正在重塑全球AI服务市场的格局。
