Skip to content

国内外主流大模型资费、订阅与性能对比(2026-04)

归类:开发工具 / 大模型选型 / 成本分析 发生时间:2026-04-22 状态:✅ 已整理


一、背景

产研团队在做大模型选型时,最容易踩的坑不是“看漏了某一家模型”,而是把不同口径的数据直接放在一张表里比较:

  1. 价格看的是官方 API 定价
  2. 订阅看的是官网消费者套餐
  3. 性能看的是厂商自测 benchmark
  4. 延迟看的是某个第三方代理或某次本地压测

这样得到的结论通常并不稳。

这份对比的目标不是做“全网最全厂商目录”,而是先为产研团队提供一份可执行的一版口径

  • API 价格:优先看官方价格页
  • 订阅方案:优先看官方价格页或官方帮助中心
  • 延迟与性能:统一参考第三方基准 Artificial Analysis Leaderboard

二、对比口径说明

1. 价格口径

  • 默认看文本模型的 每百万 tokens 标准价
  • 优先记录输入 / 输出价格;如官方区分缓存命中、长上下文阶梯、Batch/Flex/Priority,则在备注中补充
  • 国内平台很多直接用人民币计价,本文保留官方原币种,不强制换汇

2. 订阅口径

  • 只收录今天能从官方页面或官方帮助中心明确提取到的方案
  • API 充值与限速分级,不等同于包月订阅;如果某平台主要是充值制,会单独标注

3. 性能口径

  • 本文“性能”采用 Artificial AnalysisIntelligence Index
  • “延迟”采用其 Latency First Chunk (TTFT),即首个回答 token 到达的时间
  • “速度”采用其 Median Tokens/s
  • 这套数据适合横向筛选,但不等同于厂商 SLA,也不等同于你自家业务的真实响应时间

三、国外厂商:官方 API 资费

厂商代表模型输入价格输出价格备注
OpenAIGPT-5$1.25 / 1M$10.00 / 1M缓存输入 $0.125 / 1M;同页也给出 gpt-5-mini 为 $0.25 / $2.00,gpt-4.1 为 $2.00 / $8.00。官方价格页
AnthropicClaude Sonnet 4.6$3 / MTok$15 / MTok同页显示 Haiku 4.5 为 $1 / $5;Sonnet 系列缓存读取价格为 $0.30 / MTok。官方价格页
GoogleGemini 2.5 Pro(Standard)$1.25 / 1M(<=200k)
$2.50 / 1M(>200k)
$10 / 1M(<=200k)
$15 / 1M(>200k)
区分 Standard / Batch / Flex / Priority;缓存存储另计。官方价格页
GoogleGemini 2.5 Flash(Standard)$0.30 / 1M$2.50 / 1M偏高性价比与较快响应;Batch/Flex 价格更低。官方价格页
GoogleGemini 2.5 Flash-Lite(Standard)$0.10 / 1M$0.40 / 1M适合大规模低成本场景。官方价格页

四、国内厂商:官方 API 资费

厂商代表模型输入价格输出价格备注
DeepSeekdeepseek-chat(DeepSeek-V3.2)¥0.2 / 1M(缓存命中)
¥2 / 1M(缓存未命中)
¥3 / 1M官方中文价格页明确标注 deepseek-chat 对应 DeepSeek-V3.2(128K)。官方价格页
阿里云百炼(Qwen)qwen-max$0.345 / 1M$1.377 / 1M非思考模式,无阶梯计价。官方价格页
阿里云百炼(Qwen)qwen-plus-latest$0.115 / 1M(<=128k)
$0.345 / 1M(128k-256k)
$0.689 / 1M(256k-1M)
$1.147 / 1M(<=128k)
$3.441 / 1M(128k-256k)
$9.175 / 1M(256k-1M)
中档通用模型,按上下文长度阶梯计费。官方价格页
阿里云百炼(Qwen)qwen-turbo$0.044 / 1M$0.087 / 1M(非思考)
$0.431 / 1M(思考)
低价大规模调用更有优势。官方价格页
Moonshot / KimiKimi K2.6¥1.10 / 1M(缓存命中)
¥6.50 / 1M(缓存未命中)
¥27.00 / 1M官方首页搜索结果已直接展示 K2.6 定价;文档页说明其为最新最强模型。官方首页
Moonshot / KimiKimi K2.5¥0.70 / 1M(缓存命中)
¥4.00 / 1M(缓存未命中)
¥21.00 / 1M官方文档搜索结果直接给出定价与 256k 上下文。官方价格页

五、订阅方案补充

1. 海外通用办公 / 编码订阅

厂商方案当前公开价说明
OpenAIChatGPT Plus$20 / 月面向个人增强使用。官方价格页
OpenAIChatGPT Pro$200 / 月高强度用户套餐。官方价格页
OpenAIChatGPT Business$20 / 用户 / 月起2026-04-02 起 seat 价格下调;公开 business 定价页显示年付起价 $20 / 用户 / 月。Business 价格页
AnthropicClaude Pro$20 / 月个人订阅。官方帮助中心
AnthropicClaude Max 5x / 20x$100 / 月 / $200 / 月高使用量套餐。官方帮助中心
AnthropicTeam$25 / 用户 / 月(年付)
$30 / 用户 / 月(月付)
另有 Premium seat:$150 / 用户 / 月(年付)。官方帮助中心
GoogleGoogle AI Pro$19.99 / 月含 Gemini、NotebookLM、2TB 存储等;部分地区首月免费。Google One 计划页
GoogleGoogle AI Ultra$249.99 / 月列表价当前公开页展示 3 个月促销价 $124.99 / 月。Google One 计划页

2. 国内平台当前更常见的不是“包月聊天”,而是“充值 / 限速 / 编码套餐”

厂商类型当前公开信号说明
阿里云百炼Coding Plan官方文档明确是“Monthly subscription for AI coding tools”更像面向 Claude Code / OpenClaw 一类工具的固定月费计划,但方案与续费规则近期变化较快,建议下单前直接看控制台页。官方文档
Moonshot / Kimi API预充值 + 限速分级Tier1 从 ¥50 累计充值开始官方主要是充值制而不是传统包月;随累计充值额提升并发、RPM、TPM。官方限速页
DeepSeek API预充值余额扣费官方价格页说明按 token 扣减充值余额今天未看到标准个人月费套餐页,更接近纯 API 按量计费。官方价格页

六、代表模型的延迟与性能(统一口径)

下表全部来自 Artificial Analysis Leaderboard,口径统一,但不保证与各厂商自家 benchmark 或你自己的生产环境完全一致。

厂商代表模型Intelligence Index中位输出速度(tokens/s)首包延迟 TTFT(s)总响应时间(s)观察
OpenAIGPT-5.4(Non-reasoning)35580.889.48首包很快,整体更像“均衡型旗舰”
AnthropicClaude Sonnet 4.6(Low Effort)43461.7212.66编码与 agent 能力仍强,但输出 token 价格偏高
GoogleGemini 2.5 Pro3512824.2928.20吞吐高,但 TTFT 很长,适合复杂研究而不是秒回聊天
DeepSeekDeepSeek V3.232282.1619.89价格极低,但长回答场景整体完成时间偏长
阿里系Qwen3.6 35B A3B321922.455.05速度很亮眼,适合高吞吐与成本敏感应用
Moonshot / KimiKimi K2.6541341.0437.97智能指数高、首包快,但长程推理 / 长输出会拉长总时长

七、对产研团队的直接建议

1. 如果你最关心“每次调用成本”

  • 首先看 DeepSeek V3.2Qwen Turbo / PlusGemini 2.5 Flash / Flash-Lite
  • 这几类模型更适合:
    • 内部工具
    • 大规模分类 / 摘要
    • 高并发轻推理任务

2. 如果你最关心“复杂推理和研究”

  • 首先看 Gemini 2.5 ProKimi K2.6Claude Sonnet 4.6
  • 这几类模型更适合:
    • 深度研究
    • 长上下文分析
    • 多轮 agent 任务

3. 如果你最关心“编码 / agent 落地”

  • Claude Sonnet、Kimi K2.6、OpenAI GPT-5 / GPT-4.1 仍然值得优先试
  • 但在实际采购时,不要只看 benchmark 分数,要一起看:
    • 工具调用稳定性
    • 上下文窗口
    • 首包延迟
    • 企业侧数据合规
    • 是否支持你们现有 IDE / 代理框架

4. 如果你需要给老板一个更稳的结论

推荐先做“三层筛选”:

  1. 先用官方价格页筛掉明显不合预算的模型
  2. 再用统一 benchmark 口径筛掉性能 / 延迟不满足场景的模型
  3. 最后只拿 2-3 个候选,在你们真实业务流量上做 A/B 测试

八、这份表怎么看才不容易踩坑

  1. 不要把 API 价格和订阅价格混为一谈。 ChatGPT / Claude / Google AI 的订阅更适合人类交互式使用;后端应用仍应以 API 资费计算。
  2. 不要把 TTFT 当成总响应时间。 有的模型首包快,但长回答慢;有的模型首包慢,但整体吞吐高。
  3. 不要把厂商自测 benchmark 直接用于采购。 厂商 benchmark 更适合看方向,不适合直接算 ROI。
  4. 国内外模型价格页更新很快。 这份文档适合作为“2026-04-22 快照”,真正采购前仍要再核一次官网。

九、参考来源