DeepSeek V4实测：别急着封神，也别急着唱衰-工信会

> 自媒体 > （AI）人工智能 > DeepSeek V4实测：别急着封神，也别急着唱衰

DeepSeek V4实测：别急着封神，也别急着唱衰

来源：浪潮短剧

2026-04-28 12:47:32

220

管理

这两天，DeepSeek V4一发布，很多人第一反应就是：小厂又要干翻大厂了？

Flash和Pro的核心差异，官方也说得比较明确：主要在世界知识、复杂理解和综合能力上。

但从我的测试来看，Flash的Agent调用和编程能力并不差。如果只是一些日常任务、简单开发、轻量级工作流，它完全够用。

Pro就贵很多了，输入12元，输出24元。

很多人第一眼看到这个价格，肯定会觉得：这也不便宜啊。

确实不便宜。它比Gemini 5.1、Kimi K2某些档位甚至还要贵一点。但如果只看纯能力跑分，DeepSeek V4 Pro确实更强一些。再考虑到它支持百万上下文，而很多同级模型还停留在20万上下文左右，这个价格就不是不能理解。

尤其在国内，如果你想找一个相对新、能力强、上下文又长的模型，可选项并不多。超过256K以后，很多模型的价格直接起飞，用起来真的会肉疼。

所以我理解的“普惠”，不是说它绝对便宜，而是说在百万上下文这个赛道里，它把门槛打下来了。

官方文档里还有一行小字：预计下半年算力到位后，价格会有明显下降。

这就带来一个很现实的问题：Pro和Flash的价格差了这么多，体验差距真的有十倍吗？

至少在Agent和编程这两块，我觉得没有。

如果是普通工作流、简单自动化、轻量开发任务，我会优先选Flash。Pro当然更强，但它是真的烧钱。

第二项是人性化和中文理解。

这一项，Pro明显比Flash强。

我给V4 Pro发了一连串谐音梗、中文段子和语境梗，它几乎都能理解，而且解释得非常准确。它对中文语义、潜台词、语境关系的把握，比我预期要好。

Flash就明显弱一些。不是不能用，而是在世界知识、语境理解、复杂中文表达上，会出现一些小错误。这个差距本质上还是模型体量和训练能力带来的。

我平时有一个AI辅助工作流：文案我自己写，但AI会帮我整理思路、拆结构、做资料归纳、补充角度。以前我一直用Claude 4.6配合，体验非常顺。

国产模型里，第一个让我觉得能平替的，是Gemini 5.1。第二个，就是DeepSeek V4 Pro。

我身边有朋友拿V4玩角色扮演，反馈相当不错。人物衣服、动作、场景指令都能跟得住，没有那种“怎么说都不听”的感觉。再加上百万上下文，对角色扮演玩家来说确实很友好。

更有意思的是，有人发现V4似乎存在一个特殊的角色扮演模式，只是网页端还没有开放。如果通过API写特定提示词，有机会触发角色内心OS。

这说明官方应该很清楚，很多DeepSeek用户不仅拿它写代码，也拿它写文章、写小说、做角色扮演。未来这块说不定还会有专门优化。

最后说我最期待、也最失望的一项：百万长上下文。

网上很多“大海捞针”测试，V4表现都很好。比如在一大段文本里藏一句话，然后让模型找出来，它基本都能找到。这说明它的召回能力确实不错。

但我没有做传统大海捞针。

我找了一份接近90万字的《武林外传》剧本，把整份内容塞进去，然后问了三个问题，难度逐渐增加。

第一个问题是：“炊事班的大周是做什么的？”

这个问题其实是一个定位点，出现在第60集附近，是一个小彩蛋。台词大意是：“买菜，我已经成为炊事班的大周了。”

这题不算特别难，但有干扰。因为“大周”不是《武林外传》的常规角色。

结果让我有点意外。

某些模型回答得非常准确，但DeepSeek V4第一次直接忽略了第一和第三个问题。如果我单独追问，它甚至会把“大周”理解成李大嘴。

我不信邪，又试了一次。

问题是，百万上下文问一次可不便宜。一次就是十几块钱，直播测试的时候我还现场充值，场面多少有点尴尬。

第二次它回答准确了一些，但第二个问题依然不够完整。第三个开放题没有标准答案，表现倒还可以。

更奇怪的是，我直接在网页端问，反而感觉它的长上下文回答更稳，而且还是免费的。我不知道为什么API侧体验会差一点，希望官方后续能继续优化。

毕竟长上下文是我最看重的功能。

如果DeepSeek V4在百万上下文上不能明显领先，那它为什么要收这么贵？这是一个很现实的问题。

所以整体看下来，我对V4的评价是：喜忧参半，但值得期待。

它不是“国内小厂一夜之间干翻全世界”的爽文主角，也不是有些人说的“不过如此”。它真实的位置应该是：国内顶流，世界一线，但还不是世界第一。

Flash很有性价比，适合大多数普通任务。

Pro能力更强，中文理解、世界知识、复杂推理更稳，但价格偏高，适合重度用户和专业场景。

百万上下文是它最大的卖点，也是它最需要继续打磨的地方。

如果后续价格真的降下来，长上下文稳定性再提升一截，那DeepSeek V4会非常有竞争力。

我不想硬吹，也不想硬黑。

作为一个长期关注AI的人，我更希望看到的是：国内模型继续追赶，继续迭代，继续把好用的能力做便宜。

这一次，DeepSeek V4没有让我感到“核弹爆炸”。

但它确实让我看到了一件事：国产大模型已经越来越接近世界第一梯队了。

这比任何爽文故事，都更值得期待。

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

实测 DeepSeek V4：国产 AI 真的站起来了，普通人用着太香

DeepSeek V4 实测：从两个场景看看效果

相关文章

2026赛季F1季前测试深度解析：法拉利单圈惊艳，梅赛德斯长跑强势..

第三名之争：迈凯伦 vs 红牛围场共识认为，法拉利和梅赛德斯已在领先集团..

V12引擎加持！改装版Datsun 240Z声浪媲美法拉利

【网通社快报】一辆搭载梅赛德斯-奔驰M120V12引擎的Datsun240Z近日引发关..

法拉利最便宜新敞篷车：Amalfi Spider三月首发

IT之家 2 月 19 日消息，汽车媒体 The Supercar Blog 昨日（2 月 18 日）..

法拉利Ferrari全家福

法拉利是世界顶级超跑代表，源自意大利，以赛道基因和极致性能著称。经典..

6.5 v12炸街，我终于懂了法拉利“纯血”的终极浪漫

法拉利purosangue63° 前门开启79° 后门开启劳斯莱斯式优雅，法拉利式性..

Luce只是其中之一法拉利今年有五款新车型亮相

据海外媒体报道称，法拉利2025年的利润正朝着正确的方向发展，订单已满到..

千匹马力、2.5秒破百！法拉利首款纯电Luce曝光

在内燃机领域拼搏数百年的法拉利正式的拥抱纯电赛道。2026年的2月份，法..

法拉利首款纯电车型Luce正式上市，融合经典设计与电动创新..

【网通社快报】法拉利近日正式推出品牌首款纯电动车Luce，引发行业广泛关..

更硬核的296：法拉利“特别版”新车谍照曝光，马力有望逼近700匹..

IT之家 2 月 16 日消息，博主 Derek Photography 公布了一辆伪装严密、外..

关于作者

乖乖(普通会员)

文章

2107

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

DeepSeek 究竟是个啥？一文带你看明白

2025/02/08

02

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

03

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

04

这怕是全网最强的 DeepSeek 图片教程吧，赶紧收藏了！

2025/02/09

05

AI 界黑马DeepSeek 超详细介绍

2025/02/09

标签云

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体114249

@2022 All Rights Reserved

浙ICP备19035174号-6 技术支持：千寻网络

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索