henry 鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI
刚刚,DeepSeek-V4来了!
预览版正式上线并同步开源。
一共两个版本:
DeepSeek-V4-Pro:对标顶级闭源模型,1.6T,49B激活,上下文长度1M;DeepSeek-V4-Flash:更小更快的经济版,284B,13B激活,上下文长度1M。
API价格API这边,V4-Pro和V4-Flash同步上线,支持OpenAI ChatCompletions接口和Anthropic接口两套。
base_url 不变,model 参数改成 deepseek-v4-pro 或 deepseek-v4-flash 即可调用。
两个版本最大上下文都是1M,都同时支持非思考模式和思考模式。思考模式下可以通过reasoning_effort 参数调强度,两档high和max。官方建议复杂 Agent 场景直接上max。

这里有个重点——下半年支持华为算力。
此外,旧模型名要下架。
deepseek-chat和deepseek-reasoner将在三个月后(2026年7月24日)停用,当前阶段内这两个名字分别指向V4-Flash的非思考和思考模式。
对个人开发者影响不大,改一个model参数。对接了生产环境的公司,这三个月要去做迁移。
One more thing发布稿的结尾,DeepSeek 自己引了一句话。
「不诱于誉,不恐于诽,率道而行,端然正己。」
这是荀子《非十二子》里的一句。字面意思是,不被赞誉诱惑,不被诽谤吓到,按自己认定的道往前走,端正自己。
放在今天这个场景里,有点意思。
过去半年,关于V4什么时候发、是不是跳票、是不是已经被别家超越、是不是已经被 Claude 蒸馏数据搞定了之类的传言在中文和英文AI圈来来回回跑了好几轮。年初甚至还有人信誓旦旦说V4会在春节前发,结果等到了四月底。
他们没回应过一次。
然后在某个周五的下午,把V4放出来,同步开源,同步上线官网和App,同步更新API,顺便把内部员工已经弃用Claude的事实写进发布稿。
没有路线图,没有直播,没有访谈。
率道而行这四个字,听着像是一句口号。但如果你把过去半年 V3.2 那次「没什么亮点」的 Exp 版本、DSA那套为V4铺了半年的稀疏注意力、1M 上下文从王牌变成标配的这条路径放在一起看。
DeepSeek已经做到了。
DeepSeek-V4模型开源链接:
[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
DeepSeek-V4 技术报告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105789