> 自媒体 > (AI)人工智能 > DeepSeekV4预览版本正式发布
DeepSeekV4预览版本正式发布
来源:大象新闻
2026-04-28 16:41:45
39
管理

“不诱于誉,不恐于诽,率道而行,端然正己。”

在DeepSeekV4预览版本上线当天,DeepSeek官方团队表示:“感谢每一位用户的信任与支持,大家的肯定、建议和期许,是我们不竭探索、持续进步的动力,也让我们始终坚守初心,专注于不懈的创新。”

DeepSeek表示:“我们将始终秉持长期主义的原则理念,在尝试与思考中踏实前行,努力向实现AGI的目标不断靠近。”

这些表态,似乎也是对近期传言的回应。4月24日,澎湃新闻记者获悉,外界关注的全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本:

API服务已同步更新,通过修改model_name为deepseek-v4-pro或deepseek-v4-flash即可调用。

相比前代模型,DeepSeek-V4-Pro的Agent能力显著增强。在AgenticCoding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。目前DeepSeek-V4已成为公司内部员工使用的AgenticCoding模型,据评测反馈使用体验优于Sonnet4.5,交付质量接近Opus4.6非思考模式,但仍与Opus4.6思考模式存在一定差距。

DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。

在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。在Agent测评中,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。

值得注意的是,DeepSeek-V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeekSparseAttention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配。

DeepSeek-V4针对ClaudeCode、OpenClaw、OpenCode、CodeBuddy等主流的Agent产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。

目前,DeepSeekAPI已同步上线V4-Pro与V4-Flash,支持OpenAIChatCompletions接口与Anthropic接口。访问新模型时,base_url不变,model参数需要改为deepseek-v4-pro或deepseek-v4-flash。

DeepSeek官方提供的模型价格

V4-Pro与V4-Flash最大上下文长度为1M,均同时支持非思考模式与思考模式,其中思考模式支持reasoning_effort参数设置思考强度(high/max)。对于复杂的Agent场景建议使用思考模式,并设置强度为max。

DeepSeek在去年春节的现象级走红,曾一度被捧上神坛,不过,伴随国产AI的竞速加剧,来自智谱、MiniMax、Kimi等大模型公司的迅速迭代,DeepSeek正在面临激烈竞争。

近期,DeepSeek被首次开启外部融资、人才流失等众多外界声音困扰,此前4月18日,澎湃新闻记者从多位创投圈人士处证实,DeepSeek正在开启其首次外部融资。此前据外媒报道,DeepSeek目标估值超过100亿美元,据外媒援引知情人士透露,DeepSeek已开始与投资人接触,计划融资至少3亿美元以补充资金储备,应对成本日益高昂的AI军备大赛。

根据澎湃新闻记者采访梳理,去年以来,DeepSeek已经流失多位核心成员,其中大部分为“95后”青年科学家:

4月12日,自动驾驶公司元戎启行对外确认,DeepSeek多模态模型核心贡献者阮翀已加盟公司出任首席科学家,DeepSeek第一代大语言模型(LLM)核心作者王炳宣,近期宣布加盟腾讯;DeepSeek-OCR系列核心作者魏浩然也在今年春节前后离职,但尚未披露正式入职哪家大厂。4月16日,前DeepSeek核心研究员郭达雅被曝加盟字节跳动,去年11月12日,前DeepSeek核心研究员罗福莉官宣加盟小米。在基座大模型(LLM)、智能体(Agent)、文本识别(OCR)、多模态等多方面领域,DeepSeek均有核心人才流失。

4月8日,在最新版本中,DeepSeek输入框上方新增“快速模式”与“专家模式”,网页显示,快速模式适合日常对话,即时响应,支持图片和文件中的文字识别;专家模式擅长复杂问题,这也是DeepSeek在官网页面首次引入分层模式。

相关动态,让DeepSeek更新V4的悬念成为大家讨论的热点,当时澎湃新闻记者曾经报道,DeepSeek大概率在今年4月正式上线V4版本,DeepSeek内部人士也曾向记者表示:非常期待。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
DeepSeek V4发布,万亿参数百万上下文,能否再次震撼AI行业..
今天DeepSeek V4上线并开源了权重文件,从技术报告上看相对V3系列有以下..
一文读懂DeepSeek V4:用27%的算力打赢100%的战争
快思慢想研究院院长 田丰一、开篇:一个让硅谷彻夜难眠的问题DeepSeek V4..
DeepSeek V4突然发布了,1.6万亿参数全开源,代码能力压过GPT-5.4..
没有发布会,没有预热海报,就这么静悄悄突然的来了。我赶快得用上,本篇..
DeepSeek V4正式上线!碾压一众大模型,普通人也能免费用上顶配AI..
#头条创作训练营#就在今天,AI圈炸锅了!国产硬核大模型DeepSeek V4全新..
DeepSeek V4深度解读:开源模型杀疯了的这一天,我看到了什么..
导语我叫老王,在科技圈写了多年文章,见过的发布不下百场。但2026年4月2..
DeepSeek V4重磅更新!万亿参数加持,开源模型直接封神..
#头条创作训练营#AI圈今天彻底沸腾了!憋了足足五个月,国产硬核大模型De..
ZPedia|一文读懂 DeepSeek V4:Agent 能力加冕开源新王,94%幻觉率是暗雷..
DeepSeek V4 的横空出世,再次搅动了全球开源大模型的格局。在 Artificia..
DeepSeek V4实测,终于搞懂了:它最牛的不是聪明,是“扛造”..
这两天,AI圈又被一个叫DeepSeek V4的家伙刷屏了。都说它多厉害多便宜,..
DeepSeekV4引爆国产算力,谁将成为中国的英伟达
来源:市场资讯(来源:泽平宏观展望)中国本土AI芯片企业在全球市场份额..
关于作者
冰冷的开会..(普通会员)
文章
1893
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105740

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索