> 自媒体 > (AI)人工智能 > 终于来了!DeepSeekV4预览版本正式发布:Agent、世界知识和推理性能在开源领域领先
终于来了!DeepSeekV4预览版本正式发布:Agent、世界知识和推理性能在开源领域领先
来源:澎湃新闻
2026-04-29 10:35:49
143
管理

“不诱于誉,不恐于诽,率道而行,端然正己。”

在DeepSeekV4预览版本上线当天,DeepSeek官方团队表示:“感谢每一位用户的信任与支持,大家的肯定、建议和期许,是我们不竭探索、持续进步的动力,也让我们始终坚守初心,专注于不懈的创新。”

DeepSeek表示:“我们将始终秉持长期主义的原则理念,在尝试与思考中踏实前行,努力向实现AGI的目标不断靠近。”

这些表态,似乎也是对近期传言的回应。4月24日,澎湃新闻记者获悉,外界关注的全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本:

API服务已同步更新,通过修改model_name为deepseek-v4-pro或deepseek-v4-flash即可调用。

相比前代模型,DeepSeek-V4-Pro的Agent能力显著增强。在AgenticCoding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。目前DeepSeek-V4已成为公司内部员工使用的AgenticCoding模型,据评测反馈使用体验优于Sonnet4.5,交付质量接近Opus4.6非思考模式,但仍与Opus4.6思考模式存在一定差距。

DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。

在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。在Agent测评中,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。

值得注意的是,DeepSeek-V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeekSparseAttention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配。

DeepSeek-V4针对ClaudeCode、OpenClaw、OpenCode、CodeBuddy等主流的Agent产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。

目前,DeepSeekAPI 已同步上线 V4-Pro 与 V4-Flash,支持 OpenAIChatCompletions 接口与 Anthropic 接口。访问新模型时,base_url 不变,model 参数需要改为deepseek-v4-pro 或deepseek-v4-flash。

DeepSeek官方提供的模型价格

V4-Pro与V4-Flash最大上下文长度为1M,均同时支持非思考模式与思考模式,其中思考模式支持reasoning_effort 参数设置思考强度(high/max)。对于复杂的Agent场景建议使用思考模式,并设置强度为max。

DeepSeek在去年春节的现象级走红,曾一度被捧上神坛,不过,伴随国产AI的竞速加剧,来自智谱、MiniMax、Kimi等大模型公司的迅速迭代,DeepSeek正在面临激烈竞争。

近期,DeepSeek被首次开启外部融资、人才流失等众多外界声音困扰,此前4月18日,澎湃新闻记者从多位创投圈人士处证实,DeepSeek正在开启其首次外部融资。此前据外媒报道,DeepSeek目标估值超过100亿美元,据外媒援引知情人士透露,DeepSeek已开始与投资人接触,计划融资至少3亿美元以补充资金储备,应对成本日益高昂的AI军备大赛。

根据澎湃新闻记者采访梳理,去年以来,DeepSeek已经流失多位核心成员,其中大部分为“95后”青年科学家:

4月12日,自动驾驶公司元戎启行对外确认,DeepSeek多模态模型核心贡献者阮翀已加盟公司出任首席科学家,DeepSeek第一代大语言模型(LLM)核心作者王炳宣,近期宣布加盟腾讯;DeepSeek-OCR系列核心作者魏浩然也在今年春节前后离职,但尚未披露正式入职哪家大厂。4月16日,前DeepSeek核心研究员郭达雅被曝加盟字节跳动,去年11月12日,前DeepSeek核心研究员罗福莉官宣加盟小米。在基座大模型(LLM)、智能体(Agent)、文本识别(OCR)、多模态等多方面领域,DeepSeek均有核心人才流失。

4月8日,在最新版本中,DeepSeek输入框上方新增“快速模式”与“专家模式”,网页显示,快速模式适合日常对话,即时响应,支持图片和文件中的文字识别;专家模式擅长复杂问题,这也是DeepSeek在官网页面首次引入分层模式。

相关动态,让DeepSeek更新V4的悬念成为大家讨论的热点,当时澎湃新闻记者曾经报道,DeepSeek大概率在今年4月正式上线V4版本,DeepSeek内部人士也曾向记者表示:非常期待。

澎湃新闻记者 范佳来

(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
ChatGPT出现2.3%致命错误:技术缺陷与商业策略谁之过?..
2025年,华盛顿州立大学的研究人员向ChatGPT提出了一个关于科学假设的简..
仅一条提示,23岁业余爱好者靠ChatGPT破解60年数学难题,陶哲轩:此前所有..
整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 一名没有受过系统数学训练的年..
靠ChatGPT治愈绝症?全网狂欢背后,被折叠的“百万级”隐形财富..
AI治愈癌症的案例看似技术民主化的胜利,实则揭示了精英阶层与技术特权之..
GPT-5.3爆更前夜,全网都被一张图吓到,ChatGPT人格大赏..
「我如何对待你,请生成一张图」!一夜之间,ChatGPT生图新玩法,在全网..
ChatGPT上线苹果CarPlay:支持语音交互但无法控制车辆
【网通社快报】OpenAI近日更新ChatGPT,正式支持苹果CarPlay。用户可在车..
朋友圈刷屏的SBTI测试出自“抽象”区女博主:初衷是劝朋友戒酒,曾把ChatGP..
极目新闻记者 郭奕4月9日晚,“盗版 MBTI”SBTI测试一夜爆火,发布后不久..
一切向“钱”看!ChatGPT正式开测广告,网上骂声一片
OpenAI本周一正式宣布,已开始在美国地区针对ChatGPT的部分用户群体测试..
拥抱美国军方后,ChatGPT 为什么会被卸载?
3月初,一起极具戏剧性的商业决策,将 AI 行业的伦理分歧摆上了台面。在..
英伟达的L4野心:吴新宙拆解“五层蛋糕”,迎接自动驾驶ChatGPT时刻..
至于车端“大脑”的形式,吴新宙谈到,车本身就是一个机器人,他认为汽车..
关于作者
卿嫣(普通会员)
文章
1925
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105872

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索