> 自媒体 > (AI)人工智能 > DeepSeek V4横空出世:强效果低成本反而不是最大亮点
DeepSeek V4横空出世:强效果低成本反而不是最大亮点
来源:人工智能学家
2026-04-28 16:17:18
96
管理

DeepSeek于2026年4月24日正式发布了旗下新一代旗舰大模型V4,终结了长达数月的市场等待。

此次发布分为两个版本:V4-pro拥有1.6万亿参数,是该公司有史以来规模最大的模型;较轻量的V4-flash则配置2840亿参数,面向通用对话与API服务场景。

两款模型均支持100万token的超长上下文窗口,这意味着它们能够一次性处理海量文本、代码或专业文献。DeepSeek宣称,这一规格是以"世界领先"的成本效益实现的。

从英伟达到华为:一次迫不得已的技术转向

V4发布的技术背景,比模型本身更耐人寻味。

据《The Information》等媒体此前报道,DeepSeek V4的底层代码已从英伟达的CUDA框架全面重写为华为的CANN框架,并率先针对华为昇腾950PR芯片进行深度优化。这不是一次技术迭代,而是一次根基层面的体系切换。

昇腾950PR是华为于2026年3月刚刚发布的旗舰AI芯片,基于SIMD架构设计,FP8精度算力达到1 PFLOPS级别。有消息人士指出,DeepSeek在该芯片上实现了近3倍于对标芯片的性能表现,而推理成本则接近腰斩。

DeepSeek在技术报告中虽同时提及了针对英伟达和华为芯片开发的GPU内核,但明确表示V4-pro当前吞吐量受计算资源限制,并承诺待华为昇腾950PR超级节点大规模出货后,下半年价格将"大幅下降"。

这句话所透露的信息量,远超一句价格预告。它清晰指向了一个事实:DeepSeek的计算基础设施正在加速向国产算力迁移,而这与美国出口管制持续收紧的外部压力高度吻合。

DeepSeek声称V4可与OpenAI和Google DeepMind的顶级闭源模型相媲美,这并非首次听到类似表述。

从V2到V3,DeepSeek每一代模型都以"接近顶尖"的定位出道,也每一次都在部分基准测试中确实做到了令人信服的表现。但"媲美"是一个模糊的词,基准测试的选取、测试条件的设定,都可以让结论的方向大相径庭。

目前DeepSeek尚未发布完整的第三方评测数据,V4的真实能力边界有待独立验证。不过从架构设计看,V4-pro采用了Mega MoE(混合专家)架构,单次前向推理中激活的专家数量据称相较V3有显著提升,这在推理深度上具有实质性意义。

开源背后的中国AI战略布局逻辑

DeepSeek坚持以开源方式发布模型,这一选择在商业逻辑上并不寻常。

对于一家顶尖AI公司而言,开源意味着将核心技术成果免费交出。但这也意味着全球开发者生态的快速集聚、大量外部研究者的压力测试,以及一种隐性的国际公信力背书。更重要的是,开源模型一旦被广泛部署,就形成了事实上的技术标准影响力。

DeepSeek深知这一点。在美国芯片出口管制日益趋严的背景下,通过技术开源占据影响力高地,或许比闭门炼丹更能抵御外部封锁带来的边缘化风险。

此次V4的发布,不仅是一款大模型的上线,更是中国AI产业走向自主计算体系的一个标志性节点。

DeepSeek用一份技术报告、两款模型,悄悄完成了一次宣示:中国AI不再只是追赶者,它已经开始在自己选定的赛道上制定规则。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
兰花草(普通会员)
文章
1921
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105789

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索