
2026年7月,AI大模型的定价体系已经复杂到让人头秃。OpenAI从$0到$200分了五档订阅,Anthropic的Max套餐刚上线就卖到$200/月,DeepSeek搞出了峰谷定价,Google Gemini API免费额度慷慨到离谱,国内各家更是花样百出——阿里云百炼送7000万token,豆包推68元月卡,智谱GLM-4-Flash直接永久免费。
这篇文章帮你做一次全面梳理:免费部分盘点各家的免费额度和试用政策,付费部分拆解订阅计划和API定价。最后给出不同场景下的选择建议。
第一部分:免费套餐——白嫖指南
先看结论:如果你只是想体验AI对话、做一些轻量任务,2026年7月完全不需要花一分钱。以下各家都有不同程度的免费额度。
国内免费额度排行
| 平台 | 免费额度 | 有效期 | 特色 |
|---|---|---|---|
| 阿里云百炼(Qwen) | 新用户最高7000万token | 90天 | 覆盖Qwen3.7全系模型,业界最慷慨 |
| 智谱GLM-4-Flash | 永久免费,无限量 | 永久 | 128K上下文,无需注册即可使用 |
| 腾讯混元lite | 永久免费,无限量 | 永久 | 128K上下文,基础对话能力 |
| 豆包(字节跳动) | 每日限量免费使用 | 持续 | 支持文件上传、网页浏览 |
| Kimi(月之暗面) | 每日限量消息 | 持续 | 20K上下文,支持文件解析 |
| MiniMax | 100万token | 180天 | 通过百炼平台领取 |
| DeepSeek | 网页版免费使用V3/R1 | 持续 | 无免费API额度 |
薅羊毛建议:如果你是开发者,阿里云百炼的新用户7000万token是目前最划算的起步方式。如果只是日常对话,智谱GLM-4-Flash和腾讯混元lite的永久免费策略最省心——不用担心额度用完。
海外免费额度排行
| 平台 | 免费内容 | 限制 |
|---|---|---|
| Google Gemini API | 全系模型免费调用 | Gemini 3 Flash:15 RPM / 250K TPM;Gemini 2.5 Flash-Lite:15 RPM / 500K TPM |
| ChatGPT | GPT-5.3 + mini模型 | 约10条消息/5小时,之后降级 |
| Claude | Sonnet 5基础访问 | 每日限量消息 |
| Meta Llama | Llama 4全系开源免费 | 自部署无限制;Meta AI应用每日限量 |
| Grok | Grok 3基础版 | 约10条文本/2小时 |
| Microsoft Copilot | Edge/Bing内免费对话 | 基础功能,有限图片生成 |
| Mistral Le Chat | 消费端免费对话 | 每日限量 |
开发者首选:Google Gemini API的免费额度在所有海外平台中最慷慨——不限每日总量(只有速率限制),且覆盖最新的Gemini 3系列模型。对于个人项目和学习来说,完全够用。
7月限时优惠
- 阿里云百炼:Qwen3.7-Max 限时5折、Qwen3.7-Plus 限时8折、Batch Chat API 限时5折
- 智谱 GLM-5.2:7月开源,免费商用
- 豆包:火山引擎新用户1000万token仅19.9元
第二部分:付费套餐——按需选择
一、消费端订阅计划(个人用户)
如果你不是开发者而是普通用户,以下是各家面向个人的订阅方案:
海外订阅计划对比
| 平台 | 入门档 | 标准档 | 高级档 | 旗舰档 |
|---|---|---|---|---|
| OpenAI | Go $8/月 | Plus $20/月 | Pro $100/月 | Pro $200/月 |
| Anthropic | — | Pro $20/月 | Max $100/月 | Max $200/月 |
| — | Advanced $19.99/月 | — | — | |
| xAI | Lite $10/月 | Standard $30/月 | — | Heavy $300/月 |
| Microsoft | Copilot Pro $20/月 | M365 Copilot $30/用户/月 | — | — |
OpenAI $20 Plus依然是最全面的选择:无限GPT-5.3 Instant + GPT-5.5 Thinking、160条消息/3小时、约3000条思考消息/周、128K-400K上下文、高级语音、Canvas、Deep Research全包含。
Google Advanced $19.99的性价比最高——不仅包含无限Gemini 2.5 Ultra和Deep Research,还附赠2TB Google One云存储和Workspace AI集成。
Anthropic Pro $20是长文写作和编程的最佳选择:无限Sonnet 5 + Opus、Extended Thinking、Artifacts全解锁。
xAI SuperGrok Standard $30特色鲜明:Grok 4 + 3.5双模型、128K上下文、DeepSearch深度搜索、Big Brain推理、720P视频生成。重度用户可以选Heavy $300/月,支持16个并行AI Agent。
国内订阅计划对比
| 平台 | 入门档 | 标准档 | 高级档 |
|---|---|---|---|
| 豆包 | 标准版 68元/月 | 增强版 200元/月 | 高级版 500元/月 |
| Kimi | 会员 49元/月(399/年) | Pro 89元/月 | Coding Allegro 699元/月 |
| 文心一言 | 会员 49.9元/月(599/年) | Pro会员 99.9元/月 | — |
| 智谱GLM | Lite 49元/月 | Pro 149元/月 | Max 469元/月 |
豆包68元/月是目前国内功能最丰富的消费端订阅:豆包2.1 Pro模型、5倍免费额度、专家+办公任务、本地电脑控制、网页浏览、技能调用、定时自动化、内置Office套件、媒体生成。
Kimi 49元/月适合学生和轻度用户:无限对话、200K上下文、优先排队、高级文件处理。编程用户可以选择专属Coding套餐(49-699元/月)。
二、API定价——开发者必看
对于开发者来说,API定价才是核心关注点。以下按”旗舰模型”和”高性价比模型”两个维度进行对比。
旗舰模型API定价(美元/百万token)
| 模型 | 输入 | 输出 | 缓存输入 | 上下文 |
|---|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | $0.50 | 128K+ |
| GPT-5.5 Pro | $30.00 | $180.00 | — | 128K+ |
| Claude Opus 4.8 | $5.00 | $25.00 | $0.50 | 200K |
| Claude Sonnet 4.6 | $3.00 | $15.00 | $0.30 | 200K |
| Gemini 3 Pro Preview | $2.00 | $12.00 | $0.20 | 1M |
| Grok 4.3 | $1.25 | $2.50 | $0.31 | 1M |
| o3-pro | $20.00 | $80.00 | — | 128K |
高性价比模型API定价(美元/百万token)
| 模型 | 输入 | 输出 | 上下文 |
|---|---|---|---|
| GPT-5 Nano | $0.05 | $0.40 | 128K |
| GPT-5 Mini | $0.25 | $2.00 | 128K |
| Claude Haiku 4.5 | $1.00 | $5.00 | 200K |
| Gemini 2.5 Flash | $0.30 | $2.50 | 1M |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | 1M |
| Mistral Small 4 | $0.10 | $0.30 | 128K |
| o3-mini | $1.10 | $4.40 | 128K |
国内模型API定价(人民币/百万token)
| 模型 | 输入 | 输出 | 缓存输入 | 上下文 |
|---|---|---|---|---|
| Qwen3.7-Max(限时5折) | 6元 | 18元 | 0.6元 | 252K |
| Qwen3.7-Plus(限时8折) | 1.6元 | 6.4元 | 0.32元 | 1M |
| Qwen-Turbo | 0.3元 | 0.6元 | — | 1M |
| DeepSeek V4-Pro(谷时) | 3元 | 6元 | 0.025元 | 128K |
| DeepSeek V4-Pro(峰时*) | 6元 | 12元 | 0.05元 | 128K |
| DeepSeek V4-Flash(谷时) | 1元 | 2元 | 0.02元 | 128K |
| DeepSeek V4-Flash(峰时*) | 2元 | 4元 | 0.04元 | 128K |
| Seed-2.1-Pro(豆包) | 6元 | 30元 | 1.5元 | 128K |
| Seed-2.0-Lite | 0.6元 | 3.66元 | 0.15元 | 64K |
| Kimi k2.6 | 6.5元(未命中) | 27元 | 1.1元(命中) | 256K |
| MiniMax M2.7 | 2.1元 | 8.4元 | 0.42元 | 197K+ |
| GLM-5.1 | ~10元 | ~32元 | — | 128K |
| GLM-4-Flash | 免费 | 免费 | — | 128K |
| 混元lite | 免费 | 免费 | — | 128K |
*DeepSeek峰时为北京时间9:00-12:00和14:00-18:00,价格翻倍。谷时(其余时段)价格不变。
三、不同场景怎么选?
场景一:个人日常对话
如果只是想日常聊天、查资料、翻译、写邮件:ChatGPT Plus $20/月是最全面的选择。如果偏好国产,Kimi 49元/月或豆包68元/月都够用。预算为零的话,ChatGPT免费版或智谱GLM-4-Flash免费用就行。
场景二:编程开发
编程场景的最优解已经非常清晰:Claude Code在企业编程市场拿下42-54%份额不是没有原因的。如果预算有限,DeepSeek V4-Flash + Reasonix的组合在谷时仅需1元/百万token输入,缓存命中后成本再降80%。
场景三:大规模API调用
如果你的项目需要大量调用AI API,成本控制是关键:
- 极致低价:DeepSeek V4-Flash谷时($0.14/$0.28每百万token)——全球最便宜的商业API
- 免费起步:Google Gemini 2.5 Flash(免费API,速率限制内无限量)或GLM-4-Flash(永久免费)
- 性价比:Qwen-Turbo(0.3/0.6元每百万token)+ 百炼新用户7000万token免费额度
- 旗舰但省钱:Grok 4.3($1.25/$2.50)比GPT-5.5便宜75%
场景四:企业团队
团队使用的关键是管理能力和合规性。OpenAI Business($20-30/用户/月)和Anthropic Team($25/用户/月)提供团队管理、用量控制和合规功能。国内企业可以关注阿里云百炼的企业方案和火山引擎的企业API折扣。
场景五:重度推理用户
如果你需要深度推理(数学证明、科学计算、复杂编程),这些”思考型”模型是刚需:
- 最强但最贵:OpenAI o3-pro($20/$80每百万token)
- 性价比推理:OpenAI o3-mini($1.10/$4.40)或Claude Extended Thinking(Pro $20/月订阅包含)
- 订阅制:ChatGPT Plus已包含GPT-5.5 Thinking模式,无需额外API费用
四、省钱技巧汇总
- 善用缓存:DeepSeek V4缓存输入价格仅0.02元/百万token,搭配Reasonix可达99%+命中率
- 错峰调用:DeepSeek V4谷时(18:00-次日9:00)价格仅为峰时一半
- Batch API:阿里云百炼Batch Chat API限时5折,适合非实时任务
- 选对模型:不是所有任务都需要旗舰模型。GPT-5 Nano($0.05/$0.40)和Gemini Flash-Lite($0.10/$0.40)足以处理简单任务
- 免费额度叠加:百炼7000万token + Gemini API免费额度 + GLM-4-Flash免费 = 几乎零成本起步
- 订阅 vs API:高频使用场景下,$20/月订阅(无限对话)通常比按量API更划算
结语
2026年7月的AI定价格局可以用一句话概括:免费额度在变多,付费选项在分层,价格战在加剧。
对于普通用户,$20/月是一个关键分水岭——在这个价位上你可以解锁几乎所有主流平台的标准套餐。对于开发者,成本优化的空间比以往任何时候都大——从免费API到缓存命中到错峰调用,组合策略可以把API费用压到原来的1/10甚至更低。
最重要的一条建议:不要只用一家。2026年的AI生态已经足够丰富,不同模型在不同场景下各有优势。编程用Claude Code或DeepSeek,通用对话用ChatGPT,轻量任务用免费模型——组合使用才是最优解。
相关阅读:
