国内外主流大模型资费、订阅与性能对比（2026-04）

归类：开发工具 / 大模型选型 / 成本分析 发生时间：2026-04-22 状态：✅ 已整理

一、背景

产研团队在做大模型选型时，最容易踩的坑不是“看漏了某一家模型”，而是把不同口径的数据直接放在一张表里比较：

价格看的是官方 API 定价
订阅看的是官网消费者套餐
性能看的是厂商自测 benchmark
延迟看的是某个第三方代理或某次本地压测

这样得到的结论通常并不稳。

这份对比的目标不是做“全网最全厂商目录”，而是先为产研团队提供一份可执行的一版口径：

API 价格：优先看官方价格页
订阅方案：优先看官方价格页或官方帮助中心
延迟与性能：统一参考第三方基准 Artificial Analysis Leaderboard

二、对比口径说明

1. 价格口径

默认看文本模型的 每百万 tokens 标准价
优先记录输入 / 输出价格；如官方区分缓存命中、长上下文阶梯、Batch/Flex/Priority，则在备注中补充
国内平台很多直接用人民币计价，本文保留官方原币种，不强制换汇

2. 订阅口径

只收录今天能从官方页面或官方帮助中心明确提取到的方案
API 充值与限速分级，不等同于包月订阅；如果某平台主要是充值制，会单独标注

3. 性能口径

本文“性能”采用 Artificial Analysis 的 Intelligence Index
“延迟”采用其 Latency First Chunk (TTFT)，即首个回答 token 到达的时间
“速度”采用其 Median Tokens/s
这套数据适合横向筛选，但不等同于厂商 SLA，也不等同于你自家业务的真实响应时间

三、国外厂商：官方 API 资费

厂商	代表模型	输入价格	输出价格	备注
OpenAI	GPT-5	$1.25 / 1M	$10.00 / 1M	缓存输入 $0.125 / 1M；同页也给出 `gpt-5-mini` 为 $0.25 / $2.00，`gpt-4.1` 为 $2.00 / $8.00。官方价格页
Anthropic	Claude Sonnet 4.6	$3 / MTok	$15 / MTok	同页显示 Haiku 4.5 为 $1 / $5；Sonnet 系列缓存读取价格为 $0.30 / MTok。官方价格页
Google	Gemini 2.5 Pro（Standard）	$1.25 / 1M（<=200k） $2.50 / 1M（>200k）	$10 / 1M（<=200k） $15 / 1M（>200k）	区分 Standard / Batch / Flex / Priority；缓存存储另计。官方价格页
Google	Gemini 2.5 Flash（Standard）	$0.30 / 1M	$2.50 / 1M	偏高性价比与较快响应；Batch/Flex 价格更低。官方价格页
Google	Gemini 2.5 Flash-Lite（Standard）	$0.10 / 1M	$0.40 / 1M	适合大规模低成本场景。官方价格页

四、国内厂商：官方 API 资费

厂商	代表模型	输入价格	输出价格	备注
DeepSeek	deepseek-chat（DeepSeek-V3.2）	¥0.2 / 1M（缓存命中） ¥2 / 1M（缓存未命中）	¥3 / 1M	官方中文价格页明确标注 `deepseek-chat` 对应 DeepSeek-V3.2（128K）。官方价格页
阿里云百炼（Qwen）	qwen-max	$0.345 / 1M	$1.377 / 1M	非思考模式，无阶梯计价。官方价格页
阿里云百炼（Qwen）	qwen-plus-latest	$0.115 / 1M（<=128k） $0.345 / 1M（128k-256k） $0.689 / 1M（256k-1M）	$1.147 / 1M（<=128k） $3.441 / 1M（128k-256k） $9.175 / 1M（256k-1M）	中档通用模型，按上下文长度阶梯计费。官方价格页
阿里云百炼（Qwen）	qwen-turbo	$0.044 / 1M	$0.087 / 1M（非思考） $0.431 / 1M（思考）	低价大规模调用更有优势。官方价格页
Moonshot / Kimi	Kimi K2.6	¥1.10 / 1M（缓存命中） ¥6.50 / 1M（缓存未命中）	¥27.00 / 1M	官方首页搜索结果已直接展示 K2.6 定价；文档页说明其为最新最强模型。官方首页
Moonshot / Kimi	Kimi K2.5	¥0.70 / 1M（缓存命中） ¥4.00 / 1M（缓存未命中）	¥21.00 / 1M	官方文档搜索结果直接给出定价与 256k 上下文。官方价格页

五、订阅方案补充

1. 海外通用办公 / 编码订阅

厂商	方案	当前公开价	说明
OpenAI	ChatGPT Plus	$20 / 月	面向个人增强使用。官方价格页
OpenAI	ChatGPT Pro	$200 / 月	高强度用户套餐。官方价格页
OpenAI	ChatGPT Business	$20 / 用户 / 月起	2026-04-02 起 seat 价格下调；公开 business 定价页显示年付起价 $20 / 用户 / 月。Business 价格页
Anthropic	Claude Pro	$20 / 月	个人订阅。官方帮助中心
Anthropic	Claude Max 5x / 20x	$100 / 月 / $200 / 月	高使用量套餐。官方帮助中心
Anthropic	Team	$25 / 用户 / 月（年付） $30 / 用户 / 月（月付）	另有 Premium seat：$150 / 用户 / 月（年付）。官方帮助中心
Google	Google AI Pro	$19.99 / 月	含 Gemini、NotebookLM、2TB 存储等；部分地区首月免费。Google One 计划页
Google	Google AI Ultra	$249.99 / 月列表价	当前公开页展示 3 个月促销价 $124.99 / 月。Google One 计划页

2. 国内平台当前更常见的不是“包月聊天”，而是“充值 / 限速 / 编码套餐”

厂商	类型	当前公开信号	说明
阿里云百炼	Coding Plan	官方文档明确是“Monthly subscription for AI coding tools”	更像面向 Claude Code / OpenClaw 一类工具的固定月费计划，但方案与续费规则近期变化较快，建议下单前直接看控制台页。官方文档
Moonshot / Kimi API	预充值 + 限速分级	Tier1 从 ¥50 累计充值开始	官方主要是充值制而不是传统包月；随累计充值额提升并发、RPM、TPM。官方限速页
DeepSeek API	预充值余额扣费	官方价格页说明按 token 扣减充值余额	今天未看到标准个人月费套餐页，更接近纯 API 按量计费。官方价格页

六、代表模型的延迟与性能（统一口径）

下表全部来自 Artificial Analysis Leaderboard，口径统一，但不保证与各厂商自家 benchmark 或你自己的生产环境完全一致。

厂商	代表模型	Intelligence Index	中位输出速度（tokens/s）	首包延迟 TTFT（s）	总响应时间（s）	观察
OpenAI	GPT-5.4（Non-reasoning）	35	58	0.88	9.48	首包很快，整体更像“均衡型旗舰”
Anthropic	Claude Sonnet 4.6（Low Effort）	43	46	1.72	12.66	编码与 agent 能力仍强，但输出 token 价格偏高
Google	Gemini 2.5 Pro	35	128	24.29	28.20	吞吐高，但 TTFT 很长，适合复杂研究而不是秒回聊天
DeepSeek	DeepSeek V3.2	32	28	2.16	19.89	价格极低，但长回答场景整体完成时间偏长
阿里系	Qwen3.6 35B A3B	32	192	2.45	5.05	速度很亮眼，适合高吞吐与成本敏感应用
Moonshot / Kimi	Kimi K2.6	54	134	1.04	37.97	智能指数高、首包快，但长程推理 / 长输出会拉长总时长

七、对产研团队的直接建议

1. 如果你最关心“每次调用成本”

首先看 DeepSeek V3.2、Qwen Turbo / Plus、Gemini 2.5 Flash / Flash-Lite
这几类模型更适合：
- 内部工具
- 大规模分类 / 摘要
- 高并发轻推理任务

2. 如果你最关心“复杂推理和研究”

首先看 Gemini 2.5 Pro、Kimi K2.6、Claude Sonnet 4.6
这几类模型更适合：
- 深度研究
- 长上下文分析
- 多轮 agent 任务

3. 如果你最关心“编码 / agent 落地”

Claude Sonnet、Kimi K2.6、OpenAI GPT-5 / GPT-4.1 仍然值得优先试
但在实际采购时，不要只看 benchmark 分数，要一起看：
- 工具调用稳定性
- 上下文窗口
- 首包延迟
- 企业侧数据合规
- 是否支持你们现有 IDE / 代理框架

4. 如果你需要给老板一个更稳的结论

推荐先做“三层筛选”：

先用官方价格页筛掉明显不合预算的模型
再用统一 benchmark 口径筛掉性能 / 延迟不满足场景的模型
最后只拿 2-3 个候选，在你们真实业务流量上做 A/B 测试

八、这份表怎么看才不容易踩坑

不要把 API 价格和订阅价格混为一谈。 ChatGPT / Claude / Google AI 的订阅更适合人类交互式使用；后端应用仍应以 API 资费计算。
不要把 TTFT 当成总响应时间。 有的模型首包快，但长回答慢；有的模型首包慢，但整体吞吐高。
不要把厂商自测 benchmark 直接用于采购。 厂商 benchmark 更适合看方向，不适合直接算 ROI。
国内外模型价格页更新很快。 这份文档适合作为“2026-04-22 快照”，真正采购前仍要再核一次官网。

九、参考来源

OpenAI API 价格页：Pricing | OpenAI API
OpenAI ChatGPT 价格页：ChatGPT Pricing | OpenAI
Anthropic API 价格页：Pricing - Claude API Docs
Anthropic 帮助中心：
Google Gemini API 价格页：Gemini Developer API pricing
Google AI 订阅页：
- Google AI Pro / Ultra
- Google One Plans
DeepSeek 官方价格页：模型 & 价格 | DeepSeek API Docs
阿里云百炼官方价格页：阿里云百炼模型价格
Moonshot / Kimi：
第三方统一 benchmark：Artificial Analysis Leaderboard

国内外主流大模型资费、订阅与性能对比（2026-04） ​

一、背景 ​

二、对比口径说明 ​

1. 价格口径 ​

2. 订阅口径 ​

3. 性能口径 ​

三、国外厂商：官方 API 资费 ​

四、国内厂商：官方 API 资费 ​

五、订阅方案补充 ​

1. 海外通用办公 / 编码订阅 ​

2. 国内平台当前更常见的不是“包月聊天”，而是“充值 / 限速 / 编码套餐” ​

六、代表模型的延迟与性能（统一口径） ​

七、对产研团队的直接建议 ​

1. 如果你最关心“每次调用成本” ​

2. 如果你最关心“复杂推理和研究” ​

3. 如果你最关心“编码 / agent 落地” ​

4. 如果你需要给老板一个更稳的结论 ​

八、这份表怎么看才不容易踩坑 ​

九、参考来源 ​

国内外主流大模型资费、订阅与性能对比（2026-04）

一、背景

二、对比口径说明

1. 价格口径

2. 订阅口径

3. 性能口径

三、国外厂商：官方 API 资费

四、国内厂商：官方 API 资费

五、订阅方案补充

1. 海外通用办公 / 编码订阅

2. 国内平台当前更常见的不是“包月聊天”，而是“充值 / 限速 / 编码套餐”

六、代表模型的延迟与性能（统一口径）

七、对产研团队的直接建议

1. 如果你最关心“每次调用成本”

2. 如果你最关心“复杂推理和研究”

3. 如果你最关心“编码 / agent 落地”

4. 如果你需要给老板一个更稳的结论

八、这份表怎么看才不容易踩坑

九、参考来源