> 自媒体 > (AI)人工智能 > DeepSeek API又降价了,输入缓存价格仅为GPT-5.5的七百分之一
DeepSeek API又降价了,输入缓存价格仅为GPT-5.5的七百分之一
来源:创业家
2026-04-30 10:35:43
179
管理

4月26日晚间,DeepSeek官网宣布全系API服务输入缓存命中价格降至原有价格的十分之一。Pro模型在2026年5月5日前叠加2.5折限时优惠。

这是DeepSeek连续第二日调整API价格,前一日该平台刚刚宣布V4-Pro模型API限时2.5折降价。

最新调价后,面向高速与低成本场景的DeepSeek-V4-Flash每百万tokens输入缓存命中价格为0.02元。

面向企业级用户的DeepSeek-V4-Pro输入缓存命中价格为0.1元/百万Tokens,叠加2.5折限时特惠后实际降至0.025元/百万Tokens,缓存未命中输入从12元降至3元,输出从24元降至6元。

对比调价前后,高频调用、长文本处理场景成本降幅超过90%。RAG知识库、智能客服、文档分析等缓存命中率高的应用,可直接实现商用成本断崖式下跌。

DeepSeek-V4预览版于4月24日正式发布并同步开源,号称在Agent能力、世界知识与推理性能三大维度达到国内及开源领域领先水平。发布次日调用量已有明显增长。

数据显示,4月25日DeepSeek V4-Pro在OpenRouter上的调用量达到136亿Token,较前一日增长近四倍。

新模型两款版本均支持100万token超长上下文,Pro版单token算力仅为V3.2的27%,KV缓存降至10%,从底层实现成本优化。

一个值得关注的时间点是,4月23日OpenAI刚刚发布新一代旗舰模型GPT-5.5 Pro,API定价为每百万Token输入30美元、输出180美元,批量处理和弹性定价享受半价优惠。

26日消息显示,DeepSeek-V4-Pro叠加限时优惠后的缓存输入价仅为GPT-5.5Pro的七百分之一。

降价公告发布的同时,DeepSeek-V4完成了对华为昇腾NPU的正式适配,成为首个在官方技术文档中明确认证支持国产AI芯片的万亿参数级大模型。

DeepSeek-V4的技术报告将细粒度专家并行(EP)方案同时在英伟达GPU和华为昇腾NPU上完成验证。

价格下调和昇腾950超节点批量上市同步,业内认为这显示出DeepSeek-V4或与国产算力芯片做针对性的深度联动适配。

上海财经大学特聘教授胡延平表示,DeepSeek此举意在延揽更多用户,尤其是企业用户、开发者和各类Agent用户。

近几个月国际国内主要模型服务的资费都有较大幅度上涨,DeepSeek在资费方面再次压低行业价格预期。

在OpenAI涨价、Anthropic转向按算力计费、谷歌推出多档位按需定价的行业背景下,DeepSeek选择了另一条路。

不过,DeepSeek方面此前已在V4发布时以注释小字说明:受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,价格还会继续下探。

这意味着,0.025元/百万Tokens未必是这条降价曲线的终点。

[本文作者i黑马,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
秋叶无痕(普通会员)
文章
2009
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105985

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索