> 自媒体 > (AI)人工智能 > DeepSeek 和小米同时宣布永久降价,API白菜价时代已经来了
DeepSeek 和小米同时宣布永久降价,API白菜价时代已经来了
来源:智能体实验室
2026-05-28 09:17:02
125
管理

这两天AI圈最大的新闻,可能就是Deepseek和Mimo降价。

5月24号,DeepSeek 官宣:V4-Pro 之前的 2.5 折限时优惠,直接转为永久定价。也就是说,原定5月31号到期的折扣,以后还是这个价。

紧接着,5月27号凌晨,小米MiMo也跟着降价:V2.5全系API永久降价,最高降幅 99%。

DeepSeek V4-Pro:从限时折扣到永久白菜价

DeepSeek V4-Pro 可以说当前国内文本处理的顶级模型,在今年4月24号发布。1.6 万亿总参数,490 亿激活参数,MoE 架构,原生支持 100 万 Token 上下文。MIT 开源协议。

架构层面有几个关键改进:混合注意力机制(CSA HCA)让 V4-Pro 相比 V3 的单 Token 推理 FLOPs 降低了 73%,KV 缓存减少了 90%。简单说,同等性能下,推理成本大幅缩减,这也是它为什么敢降价的底气。

跑分方面,V4-Pro 在 SWE-bench Verified 等编码基准上已经能跟 Claude Opus 4.7 和 GPT-5.5 正面交锋。实际使用差距肯有,但整体还算不错了。

调整后的价格如下:

计费类型

价格(元/百万 Tokens)

说明

输入(缓存命中)

¥0.025

几乎可以忽略不计

输入(未命中)

¥3

首次请求价格

输出

¥6

永久价格,不再限时

缓存命中 0.025 元/百万 Token 是什么概念?相当于你调用一百万个 Token 的输入,花两分钱。

对比 GPT-5.5 和 Claude Opus 4.7 的定价,DeepSeek V4-Pro 便宜了大约 5 到 10 倍。而且这次是永久价。

MiMo V2.5:降价 99%

小米的MiMo V2.5是今年4月22号发的,和Deepseek前后脚,同样是 MoE 架构,总参 1.02 万亿,活跃参数 420 亿。支持原生全模态(文本、图像、视频、音频),100 万 Token 上下文。

定位明确:Agent 场景优先。擅长长程任务规划、复杂软件工程、多轮工具调用。在 Artificial Analysis 的评测中,MiMo-V2.5-Pro 在开源大模型综合智能指数并列第一,Agent 专项指数也是开源榜首。

至少比MiniMax要好用。

这次降价有三个方面:

第一,全线永久降价:最高降幅 99%,直接把 API 价格打到地板。

第二,取消长度区分:以前 1M 长上下文和短文本的计费不一样,现在统一了。不再因为你用了长上下文就额外收费。

第三,Token Plan 升级:价格不变,可用额度提升 5 到 8 倍。而且所有活跃订阅用户的已用额度全部重置为零,刷一波好感。

MiMo-V2.5-Pro 调整后的定价:

计费类型

价格(元/百万 Tokens)

说明

输入(缓存命中)

¥0.025

与 DeepSeek V4-Pro 持平

输入(未命中)

¥3

不再区分上下文长度

输出

¥6

永久价格

价格和DeepSeek V4-Pro一样。

降价背后:推理成本开始下降

降这么多,不会亏钱吗?

DeepSeek V4 的架构改进让单 Token 推理成本相比 V3 降了 73%,KV 缓存砍掉 90%。这意味着同样的 GPU 集群,能服务的用户量翻了好几倍。技术红利直接让利到定价上。

小米这边的路径也类似。MiMo V2.5 全面部署了基于 SGLang HiCache 的三级缓存体系(GPU 显存→主机内存→分布式存储),配合混合注意力机制中的滑动窗口注意力(SWA),KV Cache 传输量降到原来的 1/7,可缓存 Token 量提升了 5 倍。

简单说:推理效率提上去了,每个 Token 的边际成本就下来了。降价是技术进步的自然结果,不是纯粹靠补贴烧钱。

相较于 2024 年初,目前同等智能水平的模型 API 成本已下降了 90%-97%。

Deepseek v4 Pro 对比 Mimo v2.5 Pro

产品差异如下:

维度

DeepSeek V4-Pro

MiMo V2.5-Pro

总参数

1.6 万亿

1.02 万亿

激活参数

490 亿

420 亿

上下文

100 万 Token

100 万 Token

多模态

文本为主

原生全模态(文/图/视频/音频)

开源

MIT 协议

开源

核心优势

文本处理、编码推理、性价比极致

Agent 场景、多模态、人车家生态

输出价格

¥6/百万 Token

¥6/百万 Token

简单来说:

写代码、龙虾工具,用MiMo V2.5 Pro,支持多模态,工具调用能力更强;

写汇报、业务材料,用Deepseek V4 Pro,文字处理能力强,长上下文处理有优势。

API只会越来越便宜

有一个反直觉的事实:Token 价格越来越便宜,但很多企业的AI账单反而越来越贵。

这就是杰文斯悖论,单价降了,但企业所需要的Token消耗量是几何级增长的。一个AI编程任务动辄上百万Token,一个复杂的Agent工作流可能消耗几千万的Token。便宜了之后大家用得更多。

另外市场正在分化,DeepSeek和小米在疯狂降价的同时,也有厂商在悄悄涨价或者取消优惠。比如阿里云、智谱、腾讯云等;相信不久也会降的。

对开发者和企业来说,肯定是好事。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
努比亚Z80Ultra接入DeepSeekV4大模型,星云AIOS2.0机型免更新即可使用..
【太平洋科技快讯】努比亚官方宣布,努比亚Z80 Ultra现已正式接入DeepSee..
DeepSeek 的「反直觉」突围:当 AI 告别暴力美学
当整个AI行业沉迷于参数规模的军备竞赛时,DeepSeek反其道而行之,通过En..
DeepSeek掀桌子了,永久2.5折,彻底掀翻美国定价霸权!..
DeepSeek掀桌子!永久2.5折,AI价格战彻底打穿。刚刚,DeepSeek扔出重磅..
2026 DeepSeek V4专家模式:12条暴力指令,榨干满血推理力..
多数人用DeepSeek V4仅停留在基础对话,却不知**专家模式(Pro Mode)**..
0.025元起,DeepSeek V4和MiMo V2.5为何走上不同路?
2026年4月,DeepSeek V4和小米MiMo V2.5前后脚进场,把开源大模型的竞争..
DeepSeek永久降价,其实是瞄准了10万亿美元?
(本文作者为 字母AI,钛媒体经授权发布)文 | 字母AI业内一直有这么一个..
DeepSeek 5个“暗黑指令”,第4个专治AI废话,90%人不敢用..
DeepSeek有一些鲜为人知的高压用法,能把它逼出极限性能。这些指令不是常..
1/4 价突袭,DeepSeek 硬刚 OpenAI,美国金融绑定路线遇劫..
调整定价的背后有哪些玄机?很多人不禁好奇,这是否是一次商业战术?从梁..
DeepSeek V4完全使用指南:国产最强模型从入门到精通(30个模板)..
一、痛点导入:你用的AI可能正在浪费你的时间很多人每天都在用AI:写文案..
关于作者
经典好看视频..(普通会员)
文章
1988
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110892

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索