
DeepSeek于2026年4月24日正式发布了旗下新一代旗舰大模型V4,终结了长达数月的市场等待。
此次发布分为两个版本:V4-pro拥有1.6万亿参数,是该公司有史以来规模最大的模型;较轻量的V4-flash则配置2840亿参数,面向通用对话与API服务场景。
两款模型均支持100万token的超长上下文窗口,这意味着它们能够一次性处理海量文本、代码或专业文献。DeepSeek宣称,这一规格是以"世界领先"的成本效益实现的。
从英伟达到华为:一次迫不得已的技术转向V4发布的技术背景,比模型本身更耐人寻味。
据《The Information》等媒体此前报道,DeepSeek V4的底层代码已从英伟达的CUDA框架全面重写为华为的CANN框架,并率先针对华为昇腾950PR芯片进行深度优化。这不是一次技术迭代,而是一次根基层面的体系切换。
昇腾950PR是华为于2026年3月刚刚发布的旗舰AI芯片,基于SIMD架构设计,FP8精度算力达到1 PFLOPS级别。有消息人士指出,DeepSeek在该芯片上实现了近3倍于对标芯片的性能表现,而推理成本则接近腰斩。
DeepSeek在技术报告中虽同时提及了针对英伟达和华为芯片开发的GPU内核,但明确表示V4-pro当前吞吐量受计算资源限制,并承诺待华为昇腾950PR超级节点大规模出货后,下半年价格将"大幅下降"。
这句话所透露的信息量,远超一句价格预告。它清晰指向了一个事实:DeepSeek的计算基础设施正在加速向国产算力迁移,而这与美国出口管制持续收紧的外部压力高度吻合。
DeepSeek声称V4可与OpenAI和Google DeepMind的顶级闭源模型相媲美,这并非首次听到类似表述。
从V2到V3,DeepSeek每一代模型都以"接近顶尖"的定位出道,也每一次都在部分基准测试中确实做到了令人信服的表现。但"媲美"是一个模糊的词,基准测试的选取、测试条件的设定,都可以让结论的方向大相径庭。
目前DeepSeek尚未发布完整的第三方评测数据,V4的真实能力边界有待独立验证。不过从架构设计看,V4-pro采用了Mega MoE(混合专家)架构,单次前向推理中激活的专家数量据称相较V3有显著提升,这在推理深度上具有实质性意义。
开源背后的中国AI战略布局逻辑DeepSeek坚持以开源方式发布模型,这一选择在商业逻辑上并不寻常。
对于一家顶尖AI公司而言,开源意味着将核心技术成果免费交出。但这也意味着全球开发者生态的快速集聚、大量外部研究者的压力测试,以及一种隐性的国际公信力背书。更重要的是,开源模型一旦被广泛部署,就形成了事实上的技术标准影响力。
DeepSeek深知这一点。在美国芯片出口管制日益趋严的背景下,通过技术开源占据影响力高地,或许比闭门炼丹更能抵御外部封锁带来的边缘化风险。
此次V4的发布,不仅是一款大模型的上线,更是中国AI产业走向自主计算体系的一个标志性节点。
DeepSeek用一份技术报告、两款模型,悄悄完成了一次宣示:中国AI不再只是追赶者,它已经开始在自己选定的赛道上制定规则。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105789