新闻正文:
日前,深度求索(DeepSeek)官方宣布,DeepSeek-V4-Pro模型API价格将于2026年5月31日结束2.5折优惠活动后,正式调整为原定价的1/4,即:每百万tokens输入(缓存命中)0.025元,输入(缓存未命中)3元,输出6元。此次降价永久有效。
----中国银行保险报

凭借着自研稀疏注意力&MoE机制,DeepSeek推理成本降至前代 27%;再加上适配昇腾 NPU,使得边际成本极低。这就是DeepSeek降价的底气。本质上是DeepSeek 用技术成本优势重新定义了行业底价,把行业竞争趋势从 “烧钱拼参数” 改为 “技术拼效率”。

附上主流大模型 API 定价 & 缓存规则总表(单位:元 / 百万 tokens)
模型名称
区分输入
输入-缓存未命中
输入-缓存命中
输出
说明
DeepSeek-V4-Pro
是
3.00
0.025
6.00
5 月 31 日后永久执行该价格,缓存成本极低
GPT-4o
是
18.00
9.00
72.00
自动缓存,缓存有效期 5–10 分钟,命中享 5 折
GPT-5.5 Pro
是
36.00
18.00
216.00
同系列缓存规则,命中 5 折
Claude Sonnet 4.6
是
21.60
2.16
108.00
支持自定义缓存时长,缓存命中仅 1 折
Gemini 1.5 Pro
是
9.00
2.25
45.00
上下文缓存,命中约 2.5 折
文心一言 4.0
否
12.00
—
24.00
内部有缓存优化,对外统一计价
Qwen3-Max
否
14.40
—
43.20
无缓存分级定价
GLM-5.1
否
6.00
—
24.00
无缓存分级定价
Kimi K2.6
否
6.80
—
13.60
无缓存分级定价
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110882