> 自媒体 > (AI)人工智能 > 终于来了!DeepSeekV4预览版本正式发布
终于来了!DeepSeekV4预览版本正式发布
来源:澎湃新闻
2026-05-02 09:21:56
79
管理

澎湃新闻记者 范佳来

“不诱于誉,不恐于诽,率道而行,端然正己。”

在DeepSeekV4预览版本上线当天,DeepSeek官方团队表示:“感谢每一位用户的信任与支持,大家的肯定、建议和期许,是我们不竭探索、持续进步的动力,也让我们始终坚守初心,专注于不懈的创新。”

DeepSeek表示:“我们将始终秉持长期主义的原则理念,在尝试与思考中踏实前行,努力向实现AGI的目标不断靠近。”

这些表态,似乎也是对近期传言的回应。4月24日,澎湃新闻记者获悉,外界关注的全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本:

API服务已同步更新,通过修改model_name为deepseek-v4-pro或deepseek-v4-flash即可调用。

相比前代模型,DeepSeek-V4-Pro的Agent能力显著增强。在AgenticCoding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。目前DeepSeek-V4已成为公司内部员工使用的AgenticCoding模型,据评测反馈使用体验优于Sonnet4.5,交付质量接近Opus4.6非思考模式,但仍与Opus4.6思考模式存在一定差距。

DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。

在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。在Agent测评中,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。

值得注意的是,DeepSeek-V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeekSparseAttention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配。

DeepSeek-V4针对ClaudeCode、OpenClaw、OpenCode、CodeBuddy等主流的Agent产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。

目前,DeepSeekAPI 已同步上线 V4-Pro 与 V4-Flash,支持 OpenAIChatCompletions 接口与 Anthropic 接口。访问新模型时,base_url 不变,model 参数需要改为deepseek-v4-pro 或deepseek-v4-flash。

DeepSeek官方提供的模型价格

V4-Pro与V4-Flash最大上下文长度为1M,均同时支持非思考模式与思考模式,其中思考模式支持reasoning_effort 参数设置思考强度(high/max)。对于复杂的Agent场景建议使用思考模式,并设置强度为max。

DeepSeek在去年春节的现象级走红,曾一度被捧上神坛,不过,伴随国产AI的竞速加剧,来自智谱、MiniMax、Kimi等大模型公司的迅速迭代,DeepSeek正在面临激烈竞争。

近期,DeepSeek被首次开启外部融资、人才流失等众多外界声音困扰,此前4月18日,澎湃新闻记者从多位创投圈人士处证实,DeepSeek正在开启其首次外部融资。此前据外媒报道,DeepSeek目标估值超过100亿美元,据外媒援引知情人士透露,DeepSeek已开始与投资人接触,计划融资至少3亿美元以补充资金储备,应对成本日益高昂的AI军备大赛。

根据澎湃新闻记者采访梳理,去年以来,DeepSeek已经流失多位核心成员,其中大部分为“95后”青年科学家:

4月12日,自动驾驶公司元戎启行对外确认,DeepSeek多模态模型核心贡献者阮翀已加盟公司出任首席科学家,DeepSeek第一代大语言模型(LLM)核心作者王炳宣,近期宣布加盟腾讯;DeepSeek-OCR系列核心作者魏浩然也在今年春节前后离职,但尚未披露正式入职哪家大厂。4月16日,前DeepSeek核心研究员郭达雅被曝加盟字节跳动,去年11月12日,前DeepSeek核心研究员罗福莉官宣加盟小米。在基座大模型(LLM)、智能体(Agent)、文本识别(OCR)、多模态等多方面领域,DeepSeek均有核心人才流失。

4月8日,在最新版本中,DeepSeek输入框上方新增“快速模式”与“专家模式”,网页显示,快速模式适合日常对话,即时响应,支持图片和文件中的文字识别;专家模式擅长复杂问题,这也是DeepSeek在官网页面首次引入分层模式。

相关动态,让DeepSeek更新V4的悬念成为大家讨论的热点,当时澎湃新闻记者曾经报道,DeepSeek大概率在今年4月正式上线V4版本,DeepSeek内部人士也曾向记者表示:非常期待。

本 期资深 编 辑 周玉华

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
林凡谈ChatGPT Images2.0:互联网内容信任崩塌后,实名社交迎来黎明..
来源:新浪科技新浪科技讯 4月27日下午消息,近日,ChatGPT Images2.0上..
ChatGPT Images2.0图片真假难验证 林凡认为实名社交迎来黎明..
近日,ChatGPT Images2.0上线,引发关于互联网内容性的热议。脉脉创始人..
ChatGPT 拎包入住云计算一哥,你的下一任好同事可能是 AI..
亚马逊云科技CEO Matt Garman真正的转型发生在更深处。当工作流、数据结..
第一批被ChatGPT“喂大”的大学生毕业了,HR慌了:离开AI他们会什么?..
来源:市场资讯(来源:网易智能)出品 | 网易智能作者 | 辰辰编辑 | 王..
ChatGPT卸载暴涨413%,Claude下载激增100%,奥特曼帝国开始漏水了..
AI界深水炸弹!4月29日,Anthropic被爆正在谈判新一轮融资,估值可能突破..
ChatGPT助业余数学爱好者攻克60年埃尔德什差异问题
据《科学美国人》4月24日报道,23岁的业余数学爱好者利亚姆·普赖斯在没..
刚刚!ChatGPT Images 2.0突然发布,实测强得离谱
还在熬夜做图的设计师们,这下真的有些尴尬了:在几乎没有预告的情况下,..
ChatGPT推出年龄预测功能适配青少年使用
IT之家 4 月 19 日消息,OpenAI 本周(4 月 14 日)宣布,将面向全球市场..
ChatGPT Plus跨区订阅指南(2026 实测:正规渠道约 ¥80 左右)..
ChatGPT Plus跨区订阅指南(2026 实测:正规渠道约 ¥80 左右)背景在不..
关于作者
杨子(普通会员)
文章
2035
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106250

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索