
千呼万唤,千等万等,DeepSeek终于放出了V4预览版。
1、双模齐发:
Pro版,参数高达1.6T(MoE,激活49B)
Flash版,参数284B(MoE,激活13B)
2、百万超长上下文:
上下文长度高达1M,而且100万上下文是DeepSeek所有官方服务的标配。
也许你真的可以把整个代码仓库贴进去了。
3、性能对标西方顶尖模型:
挑战的都是Claude-Opus-4.6-Max,GPT-5.4-xHigh,Gemini-3.1-Pro-High。
只不过,闭源模型们也很卷,Claude已经4.7了,GPT也5.5了,一旦入场,真是逆水行舟不进则退。
4、高性价比:
现在大家都知道算力紧张,Tokens昂贵,DeepSeek又研发了一种新的省钱方法:全新注意力极致,在token维度进行压缩。
这也是DeepSeek V4能干100万超长上下文的关键。
5、Agent能力增强
针对Claude Code 、OpenClaw、OpenCode、CodeBuddy等主流的 Agent产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。
6、基于华为昇腾的优化
这个传闻已久,但这次DS不藏了,在提及价格的时候,有一行小字写的非常明显↓
字小事大:*受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。
7、开源!开源!开源!
开源权重 本地化部署,新一代DeepSeek一体机可以走起了,这绝对是买盒子一族的巨大利好。
----------------
除了没有多模态,DeepSeek v4 已经给我们带来了足够惊喜,其实也不需要纠结,从某种意义上来讲,多模态其实更像昂贵的花瓶,你说呢?
这份等待,值了!
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105620