Appearance
国内外主流大模型资费、订阅与性能对比(2026-04)
归类:开发工具 / 大模型选型 / 成本分析 发生时间:2026-04-22 状态:✅ 已整理
一、背景
产研团队在做大模型选型时,最容易踩的坑不是“看漏了某一家模型”,而是把不同口径的数据直接放在一张表里比较:
- 价格看的是官方 API 定价
- 订阅看的是官网消费者套餐
- 性能看的是厂商自测 benchmark
- 延迟看的是某个第三方代理或某次本地压测
这样得到的结论通常并不稳。
这份对比的目标不是做“全网最全厂商目录”,而是先为产研团队提供一份可执行的一版口径:
- API 价格:优先看官方价格页
- 订阅方案:优先看官方价格页或官方帮助中心
- 延迟与性能:统一参考第三方基准 Artificial Analysis Leaderboard
二、对比口径说明
1. 价格口径
- 默认看文本模型的 每百万 tokens 标准价
- 优先记录输入 / 输出价格;如官方区分缓存命中、长上下文阶梯、Batch/Flex/Priority,则在备注中补充
- 国内平台很多直接用人民币计价,本文保留官方原币种,不强制换汇
2. 订阅口径
- 只收录今天能从官方页面或官方帮助中心明确提取到的方案
- API 充值与限速分级,不等同于包月订阅;如果某平台主要是充值制,会单独标注
3. 性能口径
- 本文“性能”采用 Artificial Analysis 的 Intelligence Index
- “延迟”采用其 Latency First Chunk (TTFT),即首个回答 token 到达的时间
- “速度”采用其 Median Tokens/s
- 这套数据适合横向筛选,但不等同于厂商 SLA,也不等同于你自家业务的真实响应时间
三、国外厂商:官方 API 资费
| 厂商 | 代表模型 | 输入价格 | 输出价格 | 备注 |
|---|---|---|---|---|
| OpenAI | GPT-5 | $1.25 / 1M | $10.00 / 1M | 缓存输入 $0.125 / 1M;同页也给出 gpt-5-mini 为 $0.25 / $2.00,gpt-4.1 为 $2.00 / $8.00。官方价格页 |
| Anthropic | Claude Sonnet 4.6 | $3 / MTok | $15 / MTok | 同页显示 Haiku 4.5 为 $1 / $5;Sonnet 系列缓存读取价格为 $0.30 / MTok。官方价格页 |
| Gemini 2.5 Pro(Standard) | $1.25 / 1M(<=200k) $2.50 / 1M(>200k) | $10 / 1M(<=200k) $15 / 1M(>200k) | 区分 Standard / Batch / Flex / Priority;缓存存储另计。官方价格页 | |
| Gemini 2.5 Flash(Standard) | $0.30 / 1M | $2.50 / 1M | 偏高性价比与较快响应;Batch/Flex 价格更低。官方价格页 | |
| Gemini 2.5 Flash-Lite(Standard) | $0.10 / 1M | $0.40 / 1M | 适合大规模低成本场景。官方价格页 |
四、国内厂商:官方 API 资费
| 厂商 | 代表模型 | 输入价格 | 输出价格 | 备注 |
|---|---|---|---|---|
| DeepSeek | deepseek-chat(DeepSeek-V3.2) | ¥0.2 / 1M(缓存命中) ¥2 / 1M(缓存未命中) | ¥3 / 1M | 官方中文价格页明确标注 deepseek-chat 对应 DeepSeek-V3.2(128K)。官方价格页 |
| 阿里云百炼(Qwen) | qwen-max | $0.345 / 1M | $1.377 / 1M | 非思考模式,无阶梯计价。官方价格页 |
| 阿里云百炼(Qwen) | qwen-plus-latest | $0.115 / 1M(<=128k) $0.345 / 1M(128k-256k) $0.689 / 1M(256k-1M) | $1.147 / 1M(<=128k) $3.441 / 1M(128k-256k) $9.175 / 1M(256k-1M) | 中档通用模型,按上下文长度阶梯计费。官方价格页 |
| 阿里云百炼(Qwen) | qwen-turbo | $0.044 / 1M | $0.087 / 1M(非思考) $0.431 / 1M(思考) | 低价大规模调用更有优势。官方价格页 |
| Moonshot / Kimi | Kimi K2.6 | ¥1.10 / 1M(缓存命中) ¥6.50 / 1M(缓存未命中) | ¥27.00 / 1M | 官方首页搜索结果已直接展示 K2.6 定价;文档页说明其为最新最强模型。官方首页 |
| Moonshot / Kimi | Kimi K2.5 | ¥0.70 / 1M(缓存命中) ¥4.00 / 1M(缓存未命中) | ¥21.00 / 1M | 官方文档搜索结果直接给出定价与 256k 上下文。官方价格页 |
五、订阅方案补充
1. 海外通用办公 / 编码订阅
| 厂商 | 方案 | 当前公开价 | 说明 |
|---|---|---|---|
| OpenAI | ChatGPT Plus | $20 / 月 | 面向个人增强使用。官方价格页 |
| OpenAI | ChatGPT Pro | $200 / 月 | 高强度用户套餐。官方价格页 |
| OpenAI | ChatGPT Business | $20 / 用户 / 月起 | 2026-04-02 起 seat 价格下调;公开 business 定价页显示年付起价 $20 / 用户 / 月。Business 价格页 |
| Anthropic | Claude Pro | $20 / 月 | 个人订阅。官方帮助中心 |
| Anthropic | Claude Max 5x / 20x | $100 / 月 / $200 / 月 | 高使用量套餐。官方帮助中心 |
| Anthropic | Team | $25 / 用户 / 月(年付) $30 / 用户 / 月(月付) | 另有 Premium seat:$150 / 用户 / 月(年付)。官方帮助中心 |
| Google AI Pro | $19.99 / 月 | 含 Gemini、NotebookLM、2TB 存储等;部分地区首月免费。Google One 计划页 | |
| Google AI Ultra | $249.99 / 月列表价 | 当前公开页展示 3 个月促销价 $124.99 / 月。Google One 计划页 |
2. 国内平台当前更常见的不是“包月聊天”,而是“充值 / 限速 / 编码套餐”
| 厂商 | 类型 | 当前公开信号 | 说明 |
|---|---|---|---|
| 阿里云百炼 | Coding Plan | 官方文档明确是“Monthly subscription for AI coding tools” | 更像面向 Claude Code / OpenClaw 一类工具的固定月费计划,但方案与续费规则近期变化较快,建议下单前直接看控制台页。官方文档 |
| Moonshot / Kimi API | 预充值 + 限速分级 | Tier1 从 ¥50 累计充值开始 | 官方主要是充值制而不是传统包月;随累计充值额提升并发、RPM、TPM。官方限速页 |
| DeepSeek API | 预充值余额扣费 | 官方价格页说明按 token 扣减充值余额 | 今天未看到标准个人月费套餐页,更接近纯 API 按量计费。官方价格页 |
六、代表模型的延迟与性能(统一口径)
下表全部来自 Artificial Analysis Leaderboard,口径统一,但不保证与各厂商自家 benchmark 或你自己的生产环境完全一致。
| 厂商 | 代表模型 | Intelligence Index | 中位输出速度(tokens/s) | 首包延迟 TTFT(s) | 总响应时间(s) | 观察 |
|---|---|---|---|---|---|---|
| OpenAI | GPT-5.4(Non-reasoning) | 35 | 58 | 0.88 | 9.48 | 首包很快,整体更像“均衡型旗舰” |
| Anthropic | Claude Sonnet 4.6(Low Effort) | 43 | 46 | 1.72 | 12.66 | 编码与 agent 能力仍强,但输出 token 价格偏高 |
| Gemini 2.5 Pro | 35 | 128 | 24.29 | 28.20 | 吞吐高,但 TTFT 很长,适合复杂研究而不是秒回聊天 | |
| DeepSeek | DeepSeek V3.2 | 32 | 28 | 2.16 | 19.89 | 价格极低,但长回答场景整体完成时间偏长 |
| 阿里系 | Qwen3.6 35B A3B | 32 | 192 | 2.45 | 5.05 | 速度很亮眼,适合高吞吐与成本敏感应用 |
| Moonshot / Kimi | Kimi K2.6 | 54 | 134 | 1.04 | 37.97 | 智能指数高、首包快,但长程推理 / 长输出会拉长总时长 |
七、对产研团队的直接建议
1. 如果你最关心“每次调用成本”
- 首先看
DeepSeek V3.2、Qwen Turbo / Plus、Gemini 2.5 Flash / Flash-Lite - 这几类模型更适合:
- 内部工具
- 大规模分类 / 摘要
- 高并发轻推理任务
2. 如果你最关心“复杂推理和研究”
- 首先看
Gemini 2.5 Pro、Kimi K2.6、Claude Sonnet 4.6 - 这几类模型更适合:
- 深度研究
- 长上下文分析
- 多轮 agent 任务
3. 如果你最关心“编码 / agent 落地”
- Claude Sonnet、Kimi K2.6、OpenAI GPT-5 / GPT-4.1 仍然值得优先试
- 但在实际采购时,不要只看 benchmark 分数,要一起看:
- 工具调用稳定性
- 上下文窗口
- 首包延迟
- 企业侧数据合规
- 是否支持你们现有 IDE / 代理框架
4. 如果你需要给老板一个更稳的结论
推荐先做“三层筛选”:
- 先用官方价格页筛掉明显不合预算的模型
- 再用统一 benchmark 口径筛掉性能 / 延迟不满足场景的模型
- 最后只拿 2-3 个候选,在你们真实业务流量上做 A/B 测试
八、这份表怎么看才不容易踩坑
- 不要把 API 价格和订阅价格混为一谈。 ChatGPT / Claude / Google AI 的订阅更适合人类交互式使用;后端应用仍应以 API 资费计算。
- 不要把 TTFT 当成总响应时间。 有的模型首包快,但长回答慢;有的模型首包慢,但整体吞吐高。
- 不要把厂商自测 benchmark 直接用于采购。 厂商 benchmark 更适合看方向,不适合直接算 ROI。
- 国内外模型价格页更新很快。 这份文档适合作为“2026-04-22 快照”,真正采购前仍要再核一次官网。
九、参考来源
- OpenAI API 价格页:Pricing | OpenAI API
- OpenAI ChatGPT 价格页:ChatGPT Pricing | OpenAI
- Anthropic API 价格页:Pricing - Claude API Docs
- Anthropic 帮助中心:
- Google Gemini API 价格页:Gemini Developer API pricing
- Google AI 订阅页:
- DeepSeek 官方价格页:模型 & 价格 | DeepSeek API Docs
- 阿里云百炼官方价格页:阿里云百炼模型价格
- Moonshot / Kimi:
- 第三方统一 benchmark:Artificial Analysis Leaderboard