全球AI公司收紧代币使用与定价　算力稀缺重塑行业竞争

商业 2026-06-01 商业现场人工智能, 代币经济, 算力与芯片, 企业策略, 成本与定价 2 次浏览

多年来，多数人工智能公司在代币使用上采取宽松策略。代币作为模型读取和生成文本的基本单位，长期被打包进订阅服务、隐藏在较高的使用上限之后，或以极低价格提供，使用户几乎无需关注消耗量。

随着模型运行成本不断侵蚀收入，加之芯片供应紧张、氦气供应中断及数据中心建设受限，算力扩张遇到瓶颈，主要模型开发商开始主动收紧访问权限和补贴力度。业内人士指出，所谓“无限制”的AI服务正在快速减少，各家公司在谁能更久承受补贴压力的竞争中博弈，最后一个被迫收紧条件的参与者，可能在市场中占据更大优势。

本周，Meta下线了内部使用的“Claudenomics”排行榜。该排行榜以粗略指标统计员工过去一个月使用的AI代币数量。数据显示，员工单月代币使用量超过60万亿个，相当于约8000万本《战争与和平》，或约1万座完整图书馆的内容规模。

研究机构GovAI高级研究员Sam Manning表示，前沿模型开发者正面临如何分配有限计算资源的关键抉择。“领先的前沿模型开发者将面临如何使用计算资源的权衡。这是这些公司必须做出的极其重要的决策。”他说。

当前，全球AI芯片短缺问题仍在持续，且可能因中东战争影响GPU生产关键原料氦气的供应而进一步加剧。同时，数据中心建设进度滞后，限制了可用于训练和运行模型的硬件规模。在这种情况下，压缩训练预算可能导致新一代模型发布节奏落后于竞争对手，而削减推理能力——即响应客户请求的速度和规模——则可能直接影响用户体验。

在具体策略上，不同公司选择各异。本月早些时候，OpenAI宣布将其Codex应用的计费方式由“按消息计费”调整为“按代币计费”，不再与单次查询条数简单挂钩。这一调整可能有利于执行小规模任务的用户，但对于高频或大规模调用者而言，代币额度消耗速度也可能明显加快。与此同时，该公司在四月初结束了此前持续数月的Codex代币额度翻倍优惠活动。

Anthropic则在同一时期调整了订阅使用规则，禁止用户通过Claude订阅为OpenClaw代理类AI工具提供算力，并要求此类使用场景改为通过API接入。业内普遍认为，此举与需求过快增长有关。Claude Code执行官Boris Cherny在宣布这一调整时表示：“我们一直在努力满足Claude需求的增长，而我们的订阅服务并非为这些第三方工具的使用模式设计。容量是一种我们谨慎管理的资源，我们优先保障使用我们产品和API的客户。”

成本压力在财务数据中有所体现。据《华尔街日报》获得的内部数据，AI模型服务成本在OpenAI和Anthropic收入中占比均超过一半。Manning指出，当前用户获得的“消费者剩余”仍然很大，“最初定价的动机很多是为了建立市场份额并吸引用户进入平台。也许我们正处于某种拐点。”

价格与性能之间的权衡并不限于美国市场，中国AI企业也在调整策略。GLM模型开发方智谱AI在开放平台API上的代币价格自2026年初以来已累计上调83%，本周又宣布对最新模型再涨价8%。

摩根大通研究认为，价格上调反映出需求加速增长。报告显示，用户在编码和代理相关等高价值工作负载上，愿意接受更高价格。价格上涨叠加持续的需求，使中国部分AI厂商的单位经济结构发生变化：智谱AI的API毛利率从2024年的3%提升至2025年的19%。

与之形成对比的是阿里巴巴的做法。该公司通过OpenRouter（一种编码支持系统）向用户免费开放其Qwen-3.6模型。据披露，用户在一天内即消耗了近1.5万亿个代币。

在行业整体趋紧的背景下，这一举措显得尤为突出。市场观察人士认为，其逻辑在于阿里巴巴希望借此吸引开发者和工作负载，进而争取长期云计算客户。与OpenAI和Anthropic通过收紧访问来保护稀缺算力、改善单位经济不同，阿里巴巴选择在短期内承担成本，以期在未来竞争更为激烈时锁定用户基础。

Manning指出，阿里巴巴的策略还建立在一个现实判断之上：多数公司在短期内难以在价格上大幅妥协，甚至可能长期如此。“如果计算资源依然稀缺，价格压力将不可避免。我们应该预期在可预见的未来，计算资源将持续稀缺。”他说。

在算力供给受限、成本压力上升和需求持续扩张的多重作用下，AI代币的使用与定价正成为行业竞争的核心变量之一。各家公司在补贴、限额与价格之间的取舍，正在重塑全球AI服务市场的格局。

发表评论

登录后才可评论。去登录