今天DeepSeek V4上线并开源了权重文件,从技术报告上看相对V3系列有以下变化:MoE万亿参数、原生百万token上下文、三种“推理强度”档位。

在能力和其它第一梯队AI大模型接近的同时,V4依然在使用成本上保持优势,在百万token上下文里V4-Pro的单token FP8 等效 FLOPs 只有V3.2的约27%,KV 缓存约10%。V4-Flash更极致可到约10% FLOPs 与7% KV,这意味着长任务不再是“算力黑洞”而是日常可用。
在API价格上(按百万token计费)V3.2输入2元输出3元,而V4-flash能降低到输入1元输出2元。V4-Flash(284B参数13B激活)就能在能力超过V3.2(671B参数37B激活)。V4-pro更强价格也更贵,不过比起当前最新的其它AI大模型来说价格依然还是便宜不少。比如GPT-5.4输入2.5美元输出15美元,是DeepSeek V4 pro的4倍,GPT-5.4 mini 更是比V4-flash贵了16倍。

值得注意的是华为也发布了昇腾950超节点与DeepSeek的合作:“通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeek V4模型推理部署。”
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106085