
2026年5月,AI行业上演了一出荒诞剧。
一边是全球市值最高的科技公司之一微软,因为无法承受高昂的Token费用,加速推进自研MAI模型,试图摆脱对OpenAI的依赖;另一边是国产大模型DeepSeek和小米MiMo,在短短一周内相继宣布API永久降价,最高降幅达99%,把Token价格打到了0.025元/百万的”白菜价”。
与此同时,普通用户要么对AI付费望而却步,要么热衷于倒卖API key做”二道贩子”赚钱。这种撕裂的景象引出了一个核心问题:Token最终会变成像水电一样让人无感使用的基础设施,还是沦为少数人的专属奢侈品?
一、巨头的困境:微软也付不起Token账单
微软与OpenAI的关系,堪称科技史上最复杂的”婚姻”。
微软累计向OpenAI投资超过130亿美元,将GPT系列深度集成进Copilot、Bing、Microsoft 365等核心产品。但2025年双方重新谈判合作协议时,微软悄悄移除了一个关键条款——禁止微软开发广泛能力的自主AI模型。
为什么?因为Token账单太贵了。
据业内估算,微软每年向OpenAI支付的API费用高达数十亿美元。随着Copilot用户量激增,这笔费用还在指数级增长。微软CEO纳德拉开始在内部用”毛利率”重新定义AI战略:与其把利润拱手让给OpenAI,不如自己造模型。
2026年4月,微软MAI超级智能团队连发三款自研模型——MAI-Transcribe-1、MAI-Voice-1、MAI-Image-2。其中MAI-Image-2-Efficient定价比旗舰版低41%,在NVIDIA H100上吞吐量提升4倍。
这不是技术探索,而是生存必需。当微软这样的巨头都觉得Token费用难以承受时,中小企业和普通开发者的处境可想而知。
二、骨折式降价:DeepSeek和小米的”价格屠夫”逻辑
与微软的”节流”策略形成鲜明对比的,是国产大模型的”开源”攻势。
DeepSeek:技术驱动的成本革命
2026年5月22日,DeepSeek宣布V4-Pro API永久降价75%,输入缓存命中价格低至0.025元/百万Tokens,创下全球新低。
这绝非简单的烧钱补贴,而是底层技术重构的结果:
- 架构创新:自研稀疏注意力机制与混合专家模型,使V4系列处理百万级Token长上下文时,算力消耗仅为上代产品的27%
- 算力自主:深度适配昇腾等国产算力,摆脱对海外高端GPU的依赖
- 工程优化:KV Cache占用降至10%,推理侧极致优化
DeepSeek证明了一点:当技术效率提升到一定程度,降价不是亏损,而是可持续的商业模式。
小米MiMo:跟进”价格锚定”
仅仅5天后,5月27日,小米宣布MiMo-V2.5系列API永久降价,最高降幅达99%。
耐人寻味的是,小米Pro版调价后的三项核心价格——输入缓存命中0.025元、未命中3元、输出6元——与DeepSeek完全一致。这不是跟风,而是赤裸裸的价格对标。
小米的逻辑更激进:取消上下文窗口分档计价,Token Plan用量提升5-8倍。雷军宣布未来三年在AI领域投入600亿元,目标很明确——用规模效应摊薄成本,用低价抢占生态。
三、普通人的两难:用不起 vs 不想用
Token价格的两极分化,折射出普通用户的真实困境。
场景一:用不起
尽管DeepSeek和小米把价格打到了地板价,但对于高频使用者来说,成本依然可观。
以一个日均调用100万Token的个人开发者为例:
- 按OpenAI GPT-5.5 Pro定价(输入30美元/百万Token),日成本约2100元人民币
- 按DeepSeek V4-Pro缓存命中价(0.025元/百万Token),日成本仅2.5元
差距高达840倍。但问题在于,缓存命中率并非100%。对于没有重复上下文的单次查询,价格可能相差数十倍。很多用户发现,实际账单比预期高出不少。
场景二:不想用
更普遍的情况是,普通用户对AI付费的意愿极低。
ChatGPT Plus 20美元/月的订阅费,在国内用户中渗透率不足5%。大多数人宁愿使用免费版,或者寻找各种”平替”。当AI还没有成为像水电一样不可或缺的基础设施时,付费习惯难以养成。
四、代理经济:Token倒卖背后的灰色江湖
价格撕裂催生了一个奇特的现象——Token代理经济。
在闲鱼、淘宝、各种开发者社群,充斥着大量倒卖API key的”二道贩子”。他们通过批量采购、利用地区差价、甚至盗刷信用卡获取低价Token,再加价转卖给终端用户。
这个灰色市场的逻辑很简单:
- 官方渠道价格高,普通用户望而却步
- 代理渠道价格低,但存在封号、跑路风险
- 用户为了省钱,甘愿承担风险
这种现象在DeepSeek和小米降价后有所缓解,但并未消失。因为代理的核心价值不只是低价,还有”绕过限制”——比如帮助没有海外信用卡的用户使用OpenAI API。
Token代理经济的存在,本身就是市场割裂的证明。
五、终极追问:Token会变成水电,还是奢侈品?
回到文章开头的问题。基于目前的种种迹象,我们可以做出以下推测:
短期(1-3年):价格分层加剧
Token市场将呈现明显的K型分化:
- 基础层:DeepSeek、小米等国产模型继续降价,甚至逼近免费,以换取生态和用户数据
- 高端层:OpenAI、Anthropic等顶尖模型维持高价,面向企业级客户和高端开发者
- 中间层:大量中小模型被迫跟随降价,利润空间被压缩,行业洗牌加速
对于普通用户,基础AI能力将越来越便宜,但顶尖AI能力依然昂贵。
中期(3-5年):Agent时代重构成本结构
真正的转折点在于AI Agent的普及。
当前Token消耗主要集中在单次对话,成本相对可控。但Agent时代,一个任务可能包含:
- 长上下文(系统提示词、历史对话、知识库)
- 多轮推理(规划、执行、反思)
- 工具调用(搜索、代码执行、API请求)
- 多Agent协作(分工、通信、结果整合)
单次任务的Token消耗可能从几百暴涨到几万甚至几十万。缓存命中率将成为决定成本的关键——这也是为什么DeepSeek和小米把最低价放在”缓存命中”场景。
如果Agent成为主流工作方式,Token成本将重新成为瓶颈。届时可能出现两种走向:
- 乐观情景:技术效率继续提升,单位Token成本持续下降,Agent使用成本可控
- 悲观情景:Agent复杂度增长快于成本下降,普通用户用不起,企业级市场成为主战场
长期(5-10年):走向”水电化”还是”奢侈品化”?
最终答案取决于三个变量:
变量一:技术效率能否持续提升?
如果稀疏注意力、模型压缩、专用芯片等技术继续突破,单位Token成本有望持续下降。但如果遇到物理极限(如量子隧穿效应在芯片层面的限制),成本下降将停滞。
变量二:商业模式如何演变?
目前Token计费是按使用量付费,类似于水电的”用多少付多少”。但未来可能出现:
- 订阅制:固定月费,无限使用(类似Netflix)
- 广告 subsidized:免费使用,但看广告或贡献数据
- 硬件捆绑:买手机/电脑送AI服务(类似苹果生态)
不同的商业模式,将决定AI是”水电”还是”奢侈品”。
变量三:监管与地缘政治
AI已成为大国博弈的焦点。出口管制、数据本地化、算力自主等趋势,可能导致全球AI市场分裂为多个”孤岛”。在每个孤岛内部,AI可能相对便宜;但跨岛使用,成本将飙升。
六、结论:两条路,两种未来
综合以上分析,Token的未来大概率不是单一的”水电化”或”奢侈品化”,而是分层化:
- 基础AI能力(文本生成、简单问答、标准图像生成):走向”水电化”,价格低廉甚至免费,成为数字基础设施的一部分
- 高端AI能力(复杂推理、多模态理解、专业领域Agent):保持”奢侈品”定价,面向企业和高净值用户
- 中间层:激烈的价格战和生态竞争,最终由少数巨头瓜分市场
对于普通用户,好消息是基础AI将越来越便宜;坏消息是真正强大的AI可能依然遥不可及。
对于开发者,现在正是押注生态的关键窗口期——选择哪个模型、哪个平台,将决定未来几年的成本结构和竞争壁垒。
对于整个社会,Token价格的演变将深刻影响AI的普惠程度。如果只有企业和富人用得起顶尖AI,数字鸿沟将进一步扩大;如果AI真正变成水电,那么人类社会的生产力将迎来新一轮爆发。
微软的自研之路、DeepSeek的技术革命、小米的价格屠夫策略,都是这场宏大叙事的不同侧面。最终答案,将由技术、商业和政策的复杂博弈共同书写。
