同行都在涨价,DeepSeek 把价格砍到脚底板
2026 年 5 月 22 日,DeepSeek 发了一条公告。
字数不多,但整个 AI 行业都愣了一下——V4-Pro 的 2.5 折优惠,不再是限时活动了。
变成永久定价。
也就是说,从这天开始,DeepSeek V4-Pro 的 API 价格永远定格在输入(缓存命中)0.025 元/百万 Tokens,输出 6 元/百万 Tokens。
而同行们在干什么?
智谱今年已经涨了三次价,腾讯混元最高涨了 463%,阿里云和百度智能云也刚刚完成了一轮涨价。
DeepSeek 是这波涨价潮里唯一的那个例外。
故事一:0.025 元是怎么来的
0.025 元/百万 Tokens 是什么概念?
这么说吧,同一天,OpenAI 的 GPT-5.5 输入价格是 30 美元/百万 Tokens。按 7.2 的汇率算,那是大约 216 元。
差了将近 9000 倍。
当然,拿缓存命中价对比正价不太公平。DeepSeek V4-Pro 的缓存未命中输入价是 3 元,输出价 6 元。即便如此,和 OpenAI 的差距也在 34 倍以上。
有人问:DeepSeek 疯了吗?这么定价不亏死?
答案是:它还真亏不了。
DeepSeek V4 用了一种叫 DSA 稀疏注意力的架构,Pro 版单 token 算力只有 V3.2 的 27%,KV 缓存降到了 10%。
更关键的是,DeepSeek 是华为昇腾的大客户。昇腾 950 超节点下半年批量上市后,V4-Pro 的成本还会继续往下掉。
别人涨价是因为算力不够用,DeepSeek 降价是因为它的算力根本用不完。
梁文锋的逻辑很简单:成本低了就降价,在成本之上稍微有点利润就行。
这听起来不像一个 CEO 说的话,倒更像一个程序员在写代码——既然资源的边际成本趋近于零,那价格就应该趋近于零。
于是五家中国大模型厂商的 API 价格变成了这样:DeepSeek 输出 0.87 美元,小米 MiMo 3 美元,阿里 Qwen3 Max 3.9 美元,智谱 GLM-5 3.2 美元,月之暗面 Kimi K2.6 约 2.5 美元。
而 OpenAI GPT-5.5 的输出价是 30 美元。
差了一个数量级。
故事二:一个涨价,一个降价,谁对谁错
但故事的另一面,是智谱今年连续三次涨价。
2 月 12 日,GLM-5 发布,Coding Plan 套餐涨价 30%。3 月 16 日,GLM-5-Turbo 发布,再涨 20%。4 月 8 日,GLM-5.1 发布,又在 5 的基础上涨了 10%。
三次调价之后,智谱的股价反而涨了 14%。
为什么涨价还涨出了个利好?
因为需求太旺盛了。2026 年春节,AI Agent 应用集中爆发,阿里的百炼平台在 1 到 3 月创下了历史最高增速。腾讯云说 CPU 等基础设施的产能早已被预订一空,供应商优先服务大客户,小公司想买都买不到。
算力成了稀缺资源,涨价是市场规律。
但 DeepSeek 走出了另一条路。
它用算法优化和国产芯片适配,把推理成本压缩到了同行看不懂的程度。华为昇腾一直同步支持 DeepSeek 系列模型,昇腾超节点全系列产品都跑得了 V4。
换句话说,DeepSeek 不是在打价格战,而是在用技术换成本。
这背后的逻辑差异,直接决定了两种完全不同的商业模式。智谱站在金字塔中间,向上够不到 OpenAI 的溢价能力,向下卷不过 DeepSeek 的成本结构。
智谱 CEO 张鹏说了一句话:现在 AI 的能力已经从"可用"走向"解决越来越复杂的问题"。Token 的 API 调用正在转化为真正的经济价值。
但问题是——如果 DeepSeek 能用同样的性能、十分之一的价格解决问题,那用户为什么要选贵的那个?
故事三:这把火烧到了硅谷
这场价格战的影响,不只是中国市场。
DeepSeek V4-Pro 宣布永久降价的那天,OpenRouter 上 DeepSeek-V4-Flash 直接登顶全球调用量榜,处理了 3.43 万亿 Tokens。
摩根士丹利发了一份报告,题目叫《China's AI Path: More Bang For The Buck》。报告里有一组数字:中国模型的推理成本只有美国同行的 15% 到 20%,但性能差距已经缩小到 3 到 6 个月。
高盛的报告更直接:DeepSeek 正在以 3000 亿人民币的估值寻求首轮外部融资。
3000 亿是什么概念?智谱的市值是大约 530 亿美元。MiniMax 是 310 亿美元。DeepSeek 到现在还没拿过一分钱外部投资。
一个一直靠自己造血、用技术换成本的公司,现在要下场拿钱了。
美国的反应也很真实。OpenAI 在亚太地区悄悄下调了企业级定价。Anthropic 开始评估多区域价格调整。Google Cloud 加速了区域模型适配器的推出。
但问题是,中国模型在性能上已经不差了。阿里的 Qwen3-Max 在 Arena-Hard 基准上跑到了 90.5,领先大多数西方模型。DeepSeek V4-Pro 的 1.6T 参数是目前全球最大的开源权重模型。
硅谷一直说:美国模型更安全、更可靠、性能更好。但当中国模型把价格打到十分之一,而性能只差 3 个月的时候,这个理由还能撑多久?
一位在两家公司都工作过的工程师说了一段话:中国模型的"性价比"优势,不是一个促销策略,而是一种结构性红利。当算力成本可以持续压缩,当国产芯片逐步补齐短板,价格差只会越来越大。
所以现在这个市场的格局很有意思。
全球 AI 的定价已经分成了两个体系。一个在美国,贵但有溢价能力。一个在中国,便宜到近乎免费。
DeepSeek 用自己的方式证明了一件事:并不是所有 AI 公司都必须走高投入、高定价的路。你可以用更好的架构、更高效的调度、更深的生态绑定,把成本压到行业地板价。
问题是——当成本可以无限趋近于零,AI 公司的护城河到底在哪?
你怎么看?你用的是 DeepSeek 的 API,还是 OpenAI 的?评论区聊聊。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体112908