> 自媒体 > (AI)人工智能 > 刷屏,DeepSeek V4成本暴降73%,梁文锋联手华为寒武纪,源神归位全体起立
刷屏,DeepSeek V4成本暴降73%,梁文锋联手华为寒武纪,源神归位全体起立
来源:36氪
2026-04-28 21:06:18
125
管理

智东西4月24日报道,今日,DeepSeek正式发布并开源DeepSeek-V4系列预览版本,这是其继V3.2之后的新一代旗舰模型体系,智东西第一时间上手实测。

DeepSeek V4“源神”回归影响力果然不同凡响,几乎瞬间刷屏,在微博热搜榜前五占三,仅次于小米YU7GT。

同时,官方公布了DeepSeek-V4系列的API定价:DeepSeek-V4-Pro在输入命中缓存的情况下为1元/百万tokens,输入未命中缓存则为12元/百万tokens,输出为24元/百万tokens;DeepSeek-V4-Flash在输入命中缓存仅0.2元/百万tokens,未命中输入1元/百万tokens,输出2元/百万tokens。

DeepSeek使用Agent能力和编程能力规划的旅行方案旅行方案https://mcp.edgeone.site/share/4TxFYOy24bgaEwxFoxisj

我们的下一个案例与长文本有关,DeepSeek-V4系列模型常常挂在嘴边的就是它能一口气吃下《三体》三部曲,而我们如它所愿上传了完整的《三体》。

上传这样的超长文件后,DeepSeek能够迅速定位我们指定的内容,成功实现大海捞针。不过,这种超长上下文能力是有代价的,仅仅输出这一点内容就烧掉了54万个token。

我们还用“OpenAI更新到了哪一个模型”这一问题,试了试模型的知识截至日期,可以看到,DeepSeek-V4-Pro的知识截止日期目前仍然停在2025年。

02.百万上下文成标配,新架构把“长任务成本”压下来

这一代V4最直接的变化,是把“长上下文”变成默认能力。

不同于传统通过简单扩展窗口的方式,DeepSeek-V4-Pro引入了全新的混合注意力架构,将Compressed Sparse Attention与高压缩注意力(HCA)结合,同时配合DSA稀疏注意力,在token维度进行压缩。

此外,模型引入了流形约束超连接(mHC)增强传统残差连接,并使用Muon优化器提升收敛速度和训练稳定性。这一系列设计,使得模型在“记得更长”的同时,有效控制计算成本。

从官方给出的数据来看,在100万token上下文下,DeepSeek-V4-Pro单token推理TFLOPs相比DeepSeek-V3.2下降约3.7倍至9.8倍区间,KV Cache占用下降9.5倍至13.7倍。

这意味着,过去难以实际运行的超长链路任务(如多轮Agent规划、长文档处理),开始进入可执行范围。

03.推理、知识、代码三线抬升,开源模型逼近闭源上限

从能力结构来看,DeepSeek-V4-Pro的提升是推理、知识与Agent能力的同步抬升。

在知识与推理类任务中,其在SimpleQA、Apex、Codeforces等评测中均超过当前主流开源模型,并在多项任务上接近GPT-5.4与Gemini 3.1 Pro。例如在Apex Shortlist中达到90.2分,已经超越顶级闭源模型;在Codeforces等竞赛类任务中,也维持在第一梯队水平。

在Agent能力相关任务中,DeepSeek-V4-Pro在SWE Verified、Terminal Bench等指标上表现稳定,SWE Verified达到80.6,接近Claude Opus 4.6,明显高于多数开源模型。在Terminal Bench 2.0中,其表现同样超过GLM-5.1 Thinking、Kimi K2.6 Thinking等模型。

整体来看,DeepSeek-V4-Pro已是目前开源模型的“天花板”。

04.Agent能力专项优化,开始围绕真实工作流打磨

这一代DeepSeek-V4明显强化了对Agent场景的适配。其针对Claude Code、OpenClaw、CodeBuddy等主流Agent框架进行了专项优化,在代码生成、文档生成等多步骤任务中表现更稳定。下图为DeepSeek-V4-Pro在某Agent框架下生成的PPT内页示例:

从实际定位来看,DeepSeek-V4-Pro已经被DeepSeek内部作为Agentic Coding模型使用,侧重点在于“完成任务”。在简单任务上,V4-Flash已可与Pro版本接近,而在复杂任务中仍存在明显差距。

本质上是在为Agent应用提供两种“算力档位”。DeepSeek-V4-Flash在简单Agent任务中已经能够与DeepSeek-V4-Pro“旗鼓相当”,但在复杂任务中仍有差距。这种差异,本质上是推理深度与上下文利用能力的差别。

05.结语:DeepSeek-V4亮相,国产算力与开源路线的落地之光

DeepSeek-V4的发布不仅展现了团队在技术和架构上的积淀,也标志着开源大模型在国产算力生态下的实际落地能力。

经过对华为昇腾、寒武纪等国产芯片的适配优化,DeepSeek-V4系列实现了百万token上下文的稳定支持和高效推理,使长链路任务与多步Agent执行成为可能。

这一版本将Pro与Flash的不同定位落到实处,在性能上逼近闭源旗舰模型,在成本上保持高性价比,为国内开发者提供了前所未有的开放选项。

更重要的是,这次发布显示出开源模型不仅能在全球竞争中站稳脚跟,也能够借助国产算力和优化架构,将技术潜力转化为实际可用的生产力。

DeepSeek-V4或许是中国开源力量在高性能AI赛道上迈出的关键一步,也为国内AI生态的创新和落地提供了明确指引。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:江宇 陈骏达,编辑:心缘,36氪经授权发布。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
这或是美国最后一次向中国出售AI芯片!黄仁勋知道时间不多了..
以deepseek为代表的中国AI企业进化太快了。其次,美国不甘心放弃中国市场..
千问模型新增多款技术产品 涵盖语音、视觉、代码等多领域..
封面新闻记者 孟梅 欧阳宏宇9月24日,2025云栖大会现场,阿里云CTO周靖人..
2025年:互联网还是舒适区?
在AI与社交媒体深度捆绑的时代,我们的注意力被算法不断重塑。从GPT5到Ge..
大打免费牌争夺用户 马斯克Grok4与ChatGPT5“短兵相接”..
《科创板日报》8月12日讯(记者 李佳怡)继ChatGPT后,Grok4宣布免费开放..
18款AI模型幻觉率大公开|你的AI靠谱吗?
根据Artificial Analysis最新发布的Omniscience Index测评数据,18款主流..
解放军总医院联合南大、吉大等机构,共同提出SpineGPT..
本研究由解放军总医院牵头,联合浙江大学医学院附属第二医院、复旦大学附..
千问首家接入东航,AI助手竞赛开始抢“机票”
4月23日,千问宣布对外开放“AI办事”能力,首家接入中国东方航空,上线..
千问上线AI讲教材能力,首批覆盖小学阶段语文、数学..
齐鲁晚报·齐鲁壹点记者 季明智进入新学期后,不少学生陷入“开学综合症..
千问免费开放财经分析模块,AI能否替代人工投研判断..
4月7日,阿里巴巴旗下AI助手千问宣布升级“深度研究”能力,新增财经分析..
关于作者
仓莫以北(普通会员)
文章
2026
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105939

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索