> 自媒体 > (AI)人工智能 > 当所有人都在涨 AI 的价,DeepSeek 把自己的价永久砍到了四分之一
当所有人都在涨 AI 的价,DeepSeek 把自己的价永久砍到了四分之一
来源:贰师爷
2026-06-10 11:38:48
189
管理

5 月 22 日晚上,DeepSeek 在定价说明里改了一行字:原本限时的 2.5 折优惠,从此转为长期价格。换算下来,旗舰模型 V4-Pro 的 API 调用价在 5 月 31 日活动结束后,正式降到原价的四分之一——百万 token 的缓存命中价从 0.1 元降到 0.025 元,输入(缓存未命中)从 12 元降到 3 元,输出从 24 元降到 6 元。

国产模型降价,本来算不上什么大新闻。让这件事显得刺眼的是它的背景:过去半年,几乎整个行业都在往上调价。

关键数据卡 · V4-Pro API 调价

每百万 token

原价

新价

输入 · 缓存命中

0.1 元

0.025 元

输入 · 缓存未命中

12 元

3 元

输出

24 元

6 元

统一降至原价的 1/4,降幅约 75%,5 月 31 日后长期生效。

先看清它在逆什么"势"

2026 年以来,云和大模型这门生意打破了十多年"只降不涨"的惯例。涨价的根子在硬件:HBM、DDR5 这类内存半年里涨幅普遍超过 60%,部分品类相对 2025 年 6 月涨超 500%,SK 海力士和三星的 HBM 产能甚至已排到 2027 年底。成本压到下游,定价跟着普涨。

厂商

AI 相关服务涨幅

亚马逊 AWS

部分 AI 算力服务涨超 20%

微软 Azure

AI 推理与云数据库涨 15%–30%

谷歌云

高端算力资源涨超 25%

阿里云

AI 算力、GPU 租用最高涨 34%

腾讯云 / 百度 / 华为云

核心算力产品涨 10%–25%

也就是说,DeepSeek 这一刀,不是在一个价格战的常态里再补一刀,而是在一个大家都被供应链按着头涨价的环境里,反向走。问题就来了:别人是被成本逼着涨,它凭什么还能降?

降价和涨价,其实是同一件事的两面

答案藏在 4 月 24 日发布、同步开源的 V4 身上。V4-Pro 是一个总参数 1.6 万亿、采用 MoE 架构、原生支持 100 万 token 上下文的模型,它带了一套新的稀疏注意力机制(DSA)。按官方给出的数字,在 1M 上下文这种最烧钱的场景下,V4-Pro 单 token 的推理算力只有上一代 V3.2 的 27%,KV Cache 占用只有 10%。

更关键的一层在硬件侧。据多家报道,V4 这一代把底层从英伟达 CUDA 大幅迁到了华为的 CANN 框架,训练和推理都更多压在国产算力上,DeepSeek 也为此推迟了发布、重写了不少底层代码。具体迁移到哪几款芯片、迁得多彻底,公开信息说法不一,这里不展开;但方向是清楚的——它的成本曲线,正在尽量从那条让所有人涨价的英伟达 HBM 供应链上挪开。

所以"涨价"和"降价"是一枚硬币的两面:同一批 HBM 和 GPU 的紧缺,把绑在这条供应链上的厂商成本顶了上去,也给了一个把推理效率和国产算力都做到位的玩家,一个反向定价的空间。这是新闻标题不会讲、但真正决定这次降价能不能成立的那一层。

那个 0.025 元,是给 Agent 时代留的钩子

值得多看一眼的是降价的结构。三项里降得绝对值最狠的,是缓存命中价:从 0.1 元砍到 0.025 元。这一项对应的,恰恰是长上下文、多轮对话、反复读同一份代码库或文档的工作负载——也就是今天所有 Agent 应用最敏感的那笔成本。

把它和 V4-Pro 的定位连起来看,意图就不含糊了:DeepSeek 称内部员工已经把 V4-Pro 当作日常的编码 Agent 在用,对标的是 Claude 这一档。换句话说,这不是无差别撒钱式降价,而是精准补贴 Agentic 编码这个正在起量的场景,用价格去换开发者把工作流搬过来。对一个高频调用、按 token 烧钱的 Agent 团队来说,这个价差不是省一点,是能直接改变技术选型的量级。

同一周,太平洋两边在玩两种游戏

把时间轴拉到这一周,对照会更有意思。就在 DeepSeek 宣布永久降价的前后,Anthropic 正在洽谈一轮估值超过 9000 亿美元、规模逾 300 亿美元的融资,若落地将首次超过 OpenAI 今年 3 月的 8520 亿美元估值;而 OpenAI 那边在筹备 IPO。

分类

Anthropic / OpenAI

DeepSeek

估值 / 融资

Anthropic 拟超 9000 亿美元估值融资逾 300 亿;OpenAI 备战 IPO

推进约 700 亿元人民币融资,投前估值约 450 亿美元

出资方

红杉、Altimeter 等顶级 VC

国家大基金、腾讯、IDG 等在洽谈

模型

闭源

开源

价格方向

上调 API 价格

永久下调至 1/4

对外口径

估值与营收飞轮

向投资人表示优先突破性研究,而非短期商业化

9000 亿对 450 亿,差着二十倍的估值;一边靠闭源加估值飞轮把数字往上抬,一边拿着部分国家资本、把价格往下打来换生态和算力自主。这两条路当然都还没分出对错,但它们想赢的方式,从一开始就不是同一种。

谁最难受,以及一件没被说清的事

这一刀砍下去,短期内最难受的未必是大洋彼岸的 OpenAI,而更可能是同样指望靠 API 收入撑住现金流的国内同行——Qwen、Kimi、智谱们。当一个开源、能力对标第一梯队、又把价格做到同级新低的选项摆在面前,中小厂商靠"差不多的能力、差不多的价格"留住开发者的空间会被进一步压窄。对海外那些对成本敏感、又不排斥用开源权重的团队来说,这个价位也确实有吸引力。

需要留一个余地的是:现在公开的信息里,没有 V4-Pro 这条产品线的毛利数据。所以"这个价格究竟是规模化之后的合理定价,还是建立在国产算力和国家资本输血之上的、阶段性的低价",目前还无法判断——任何往哪个方向下的断言,都超出了已有材料能支撑的范围。这一点不该含糊带过。

能确定的,大概只有一件:在"模型有多聪明"之外,"每个 token 到底花多少钱、这笔钱受不受制于别人的供应链",正在变成一个同样要紧的问题。DeepSeek 这次没有比拼分数,而是把这条一直存在、却很少被摆到台面的战线,直接标了价。

如果说claude走出的是让企业利用AI大幅降本的路,那么Deepseek一开始的目标就是为了大众普惠使用AI降本提效,二者都是推动时代发展的主要动力。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
广汽丰田威兰达AIR版对比解析:为什么说现在入手正当时?..
#威兰达AIR权益价13.78万#当下的汽车市场,新车层出不穷,价格战此起彼伏..
丰田章男把社长位子交给佐藤恒治才两年,现又紧急换上CFO近健太..
这显然不是一次正常的人事轮替,而是一次危机下的紧急迫降。第一,止血与..
全新汉兰达成了纯电动车?不带发动机的丰田真的有人买吗?..
曾经日系车的换代周期都是比较长的,甚至改款的时间都很长,因此无论是保..
新车 | 售16.98万元起/2月24日公布新权益 全新丰田威兰达入门版官图..
文:懂车帝原创 张晓丹[懂车帝原创 产品] 日前,广汽丰田公布了新一代威..
月供一千多开走丰田SUV?威兰达AIR版这次把“家用”玩明白了..
#威兰达AIR权益价13.78万#月供一千多开走丰田SUV?威兰达AIR版这次把“家..
价格再下探,权益价13.78万元起,全新丰田威兰达AIR版上市..
再来简单回顾一下新车外观,全新威兰达AIR版采用最新的电感外观设计,加..
2026款丰田雅力士发布:升级10.5英寸大屏,保留燃油手动挡..
【网通社快报】丰田近日在日本发布2026款雅力士及雅力士Cross,新车将于3..
丰田陆放到底值不值得买?跑了5000公里,车主只说了大实话..
大家好,我是宇哥。最近很多粉丝问我:预算30万左右,想买一台靠谱的7座..
搭载新一代插混技术,丰田RAV4 PHEV海外发布,售价26.7万..
2026年2月19日,丰田在日本市场正式发布了全新第六代RAV4的PHEV版本,并..
关于作者
国务院环卫工..(普通会员)
文章
2100
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体113339

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索