> 自媒体 > (AI)人工智能 > 实测DeePseekV4:百万上下文十开源第一,吹的神还昱真能打?
实测DeePseekV4:百万上下文十开源第一,吹的神还昱真能打?
来源:真诚小猫xW
2026-04-28 12:56:25
92
管理

DeepSeek V4预览版一开源,直接炸翻AI圈。

官方喊出“开源最强Agent 百万上下文”,定价还低到离谱。

上手实测一周,结论很直白:强是真强,坑也很明显。

先上硬参数:双版本剑指高低两端

V4分Pro和Flash,都是MoE架构,1M上下文成标配 。

- V4-Pro:1.6T总参数,激活49B,对标顶级闭源模型。

- V4-Flash:284B总参数,激活13B,主打低价高并发。

官方数据:推理FLOP降73%,KV缓存占用降90% 。

反套路观点:参数吹得猛,实际激活才是关键,Flash性价比更狠。

代码能力:开源第一梯队,写网页稳、3D小票翻车

实测写赛博朋克风GTA6介绍网页,7秒出完整可运行代码。

模块化清晰,鼠标悬停发光、动态粒子背景,细节拉满。

但挑战3D交互式纸质小票,直接翻车:

- 首次10分钟出空白页;二次渲染倒置、无纸张质感。

- 拖拽交互像史莱姆,形变夸张还穿模。

反套路观点:简单代码封神,复杂3D交互仍是短板,工程化能力待补。

推理与Agent:数学接近满分,经典逻辑题终于答对

数学推理实测:AIME 2026达99.4%,IMO AnswerBench 88.4%。

经典“洗车问题”,V3总绕晕,V4一次算对,逻辑链清晰。

Agent任务更猛:开源榜单第一,媲美Claude Sonnet 4.6 。

但长文本有坑:标称1M上下文,80K后理解明显下滑。

Function Calling约5%概率格式错乱,需加容错处理。

反套路观点:推理强到接近闭源,长文本和稳定性是明显短板。

价格与落地:Flash每百万token仅0.28美元,性价比炸穿

定价直接颠覆行业:

- V4-Flash:输出0.28美元/百万token,比Claude低99%。

- V4-Pro:3.48美元/百万token,同级最低之一。

实测调用:Flash响应快、成本极低,适合日常高并发场景。

Pro适合复杂推理、Agent任务,性价比碾压闭源模型。

深耕泛娱乐与AI测评多年,我想说:

V4不是“PPT模型”,是国产大模型真正的里程碑。

它把百万上下文、强推理、低成本三件事捏合到一起。

但别神化它:稳定性、长文本深度、多模态仍是坎。

开源能打、价格亲民,这波确实赢麻了。

你觉得DeepSeek V4能打过GPT-5.5吗?评论区聊!

需要我把V4与GPT-5.5、Claude Opus 4.6做个关键能力对比表吗?

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
DeepSeek V4,最核心的8家公司(附全产业链梳理图)
一句话说清楚DeepSeek V4发布的核心影响:DeepSeek V4,以百万字超长上下..
深度实测DeepSeek V4:开源模型逆袭闭源?有一个短板不得不提..
最近AI圈最火的话题,莫过于DeepSeek V4的正式发布。作为国产开源大模型..
全面碾压同类?拆解 DeepSeek V4:国产 AI 黑马,凭什么颠覆行业格局..
1. 逻辑推理 & 数学能力,实现跨越式提升过往很多国产大模型,都有一个通..
实测DeepSeek V4:Agent能力领先开源,3D小票翻车,但经
通篇阅读之后的感觉是,因为上下文增加,所以在输出长文档上的效果好了一..
DeepSeek V4炸场背后:硅谷在“造墙”,中国在“修路”..
硅谷巨头闭源互撕:OpenAI与Anthropic互相揭老底、抢风头、贴脸开大。中..
笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了个名?..
文 | 字母AI好家伙……我真的是直接好家伙!3月17日,楽天(乐天)集团正..
DeepSeek V4 来了!超越 Claude Sonnet 4.5,赶紧对接 Claude Code 体验..
第二轮:看不见图,却猜对了病根这里出现了一个既尴尬又有趣的细节。模型..
没想到!DeepSeek V4里,竟还藏着一个中国万亿开源模型..
编辑:好困【新智元导读】DeepSeek V4,1.6万亿参数,Codeforces人类第23..
华为背后助力,DeepSeek V4正式发布,摆脱英伟达GPU依赖?..
采用华为昇腾国产算力,价格大幅下调,性能比肩顶级闭源模型,DeepSeek V..
关于作者
醉看夕阳(普通会员)
文章
1998
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105699

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索