DeepSeek V4横空出世：强效果低成本反而不是最大亮点-工信会

> 自媒体 > （AI）人工智能 > DeepSeek V4横空出世：强效果低成本反而不是最大亮点

DeepSeek V4横空出世：强效果低成本反而不是最大亮点

来源：人工智能学家

2026-04-28 16:17:18

108

管理

DeepSeek于2026年4月24日正式发布了旗下新一代旗舰大模型V4，终结了长达数月的市场等待。

此次发布分为两个版本：V4-pro拥有1.6万亿参数，是该公司有史以来规模最大的模型；较轻量的V4-flash则配置2840亿参数，面向通用对话与API服务场景。

两款模型均支持100万token的超长上下文窗口，这意味着它们能够一次性处理海量文本、代码或专业文献。DeepSeek宣称，这一规格是以"世界领先"的成本效益实现的。

从英伟达到华为：一次迫不得已的技术转向

V4发布的技术背景，比模型本身更耐人寻味。

据《The Information》等媒体此前报道，DeepSeek V4的底层代码已从英伟达的CUDA框架全面重写为华为的CANN框架，并率先针对华为昇腾950PR芯片进行深度优化。这不是一次技术迭代，而是一次根基层面的体系切换。

昇腾950PR是华为于2026年3月刚刚发布的旗舰AI芯片，基于SIMD架构设计，FP8精度算力达到1 PFLOPS级别。有消息人士指出，DeepSeek在该芯片上实现了近3倍于对标芯片的性能表现，而推理成本则接近腰斩。

DeepSeek在技术报告中虽同时提及了针对英伟达和华为芯片开发的GPU内核，但明确表示V4-pro当前吞吐量受计算资源限制，并承诺待华为昇腾950PR超级节点大规模出货后，下半年价格将"大幅下降"。

这句话所透露的信息量，远超一句价格预告。它清晰指向了一个事实：DeepSeek的计算基础设施正在加速向国产算力迁移，而这与美国出口管制持续收紧的外部压力高度吻合。

DeepSeek声称V4可与OpenAI和Google DeepMind的顶级闭源模型相媲美，这并非首次听到类似表述。

从V2到V3，DeepSeek每一代模型都以"接近顶尖"的定位出道，也每一次都在部分基准测试中确实做到了令人信服的表现。但"媲美"是一个模糊的词，基准测试的选取、测试条件的设定，都可以让结论的方向大相径庭。

目前DeepSeek尚未发布完整的第三方评测数据，V4的真实能力边界有待独立验证。不过从架构设计看，V4-pro采用了Mega MoE（混合专家）架构，单次前向推理中激活的专家数量据称相较V3有显著提升，这在推理深度上具有实质性意义。

开源背后的中国AI战略布局逻辑

DeepSeek坚持以开源方式发布模型，这一选择在商业逻辑上并不寻常。

对于一家顶尖AI公司而言，开源意味着将核心技术成果免费交出。但这也意味着全球开发者生态的快速集聚、大量外部研究者的压力测试，以及一种隐性的国际公信力背书。更重要的是，开源模型一旦被广泛部署，就形成了事实上的技术标准影响力。

DeepSeek深知这一点。在美国芯片出口管制日益趋严的背景下，通过技术开源占据影响力高地，或许比闭门炼丹更能抵御外部封锁带来的边缘化风险。

此次V4的发布，不仅是一款大模型的上线，更是中国AI产业走向自主计算体系的一个标志性节点。

DeepSeek用一份技术报告、两款模型，悄悄完成了一次宣示：中国AI不再只是追赶者，它已经开始在自己选定的赛道上制定规则。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

Claude Code + DeepSeek V4-Pro 真实评测：除了贵，没别的毛病

1个月前

Deepseek 和豆包，哪个做量化策略更好？

1个月前