这两天,DeepSeek V4一发布,很多人第一反应就是:小厂又要干翻大厂了?

Flash和Pro的核心差异,官方也说得比较明确:主要在世界知识、复杂理解和综合能力上。
但从我的测试来看,Flash的Agent调用和编程能力并不差。如果只是一些日常任务、简单开发、轻量级工作流,它完全够用。
Pro就贵很多了,输入12元,输出24元。
很多人第一眼看到这个价格,肯定会觉得:这也不便宜啊。
确实不便宜。它比Gemini 5.1、Kimi K2某些档位甚至还要贵一点。但如果只看纯能力跑分,DeepSeek V4 Pro确实更强一些。再考虑到它支持百万上下文,而很多同级模型还停留在20万上下文左右,这个价格就不是不能理解。
尤其在国内,如果你想找一个相对新、能力强、上下文又长的模型,可选项并不多。超过256K以后,很多模型的价格直接起飞,用起来真的会肉疼。
所以我理解的“普惠”,不是说它绝对便宜,而是说在百万上下文这个赛道里,它把门槛打下来了。
官方文档里还有一行小字:预计下半年算力到位后,价格会有明显下降。

这就带来一个很现实的问题:Pro和Flash的价格差了这么多,体验差距真的有十倍吗?
至少在Agent和编程这两块,我觉得没有。
如果是普通工作流、简单自动化、轻量开发任务,我会优先选Flash。Pro当然更强,但它是真的烧钱。
第二项是人性化和中文理解。
这一项,Pro明显比Flash强。
我给V4 Pro发了一连串谐音梗、中文段子和语境梗,它几乎都能理解,而且解释得非常准确。它对中文语义、潜台词、语境关系的把握,比我预期要好。
Flash就明显弱一些。不是不能用,而是在世界知识、语境理解、复杂中文表达上,会出现一些小错误。这个差距本质上还是模型体量和训练能力带来的。
我平时有一个AI辅助工作流:文案我自己写,但AI会帮我整理思路、拆结构、做资料归纳、补充角度。以前我一直用Claude 4.6配合,体验非常顺。
国产模型里,第一个让我觉得能平替的,是Gemini 5.1。第二个,就是DeepSeek V4 Pro。

我身边有朋友拿V4玩角色扮演,反馈相当不错。人物衣服、动作、场景指令都能跟得住,没有那种“怎么说都不听”的感觉。再加上百万上下文,对角色扮演玩家来说确实很友好。
更有意思的是,有人发现V4似乎存在一个特殊的角色扮演模式,只是网页端还没有开放。如果通过API写特定提示词,有机会触发角色内心OS。
这说明官方应该很清楚,很多DeepSeek用户不仅拿它写代码,也拿它写文章、写小说、做角色扮演。未来这块说不定还会有专门优化。
最后说我最期待、也最失望的一项:百万长上下文。
网上很多“大海捞针”测试,V4表现都很好。比如在一大段文本里藏一句话,然后让模型找出来,它基本都能找到。这说明它的召回能力确实不错。
但我没有做传统大海捞针。
我找了一份接近90万字的《武林外传》剧本,把整份内容塞进去,然后问了三个问题,难度逐渐增加。
第一个问题是:“炊事班的大周是做什么的?”
这个问题其实是一个定位点,出现在第60集附近,是一个小彩蛋。台词大意是:“买菜,我已经成为炊事班的大周了。”
这题不算特别难,但有干扰。因为“大周”不是《武林外传》的常规角色。
结果让我有点意外。
某些模型回答得非常准确,但DeepSeek V4第一次直接忽略了第一和第三个问题。如果我单独追问,它甚至会把“大周”理解成李大嘴。
我不信邪,又试了一次。
问题是,百万上下文问一次可不便宜。一次就是十几块钱,直播测试的时候我还现场充值,场面多少有点尴尬。
第二次它回答准确了一些,但第二个问题依然不够完整。第三个开放题没有标准答案,表现倒还可以。
更奇怪的是,我直接在网页端问,反而感觉它的长上下文回答更稳,而且还是免费的。我不知道为什么API侧体验会差一点,希望官方后续能继续优化。
毕竟长上下文是我最看重的功能。
如果DeepSeek V4在百万上下文上不能明显领先,那它为什么要收这么贵?这是一个很现实的问题。
所以整体看下来,我对V4的评价是:喜忧参半,但值得期待。
它不是“国内小厂一夜之间干翻全世界”的爽文主角,也不是有些人说的“不过如此”。它真实的位置应该是:国内顶流,世界一线,但还不是世界第一。
Flash很有性价比,适合大多数普通任务。
Pro能力更强,中文理解、世界知识、复杂推理更稳,但价格偏高,适合重度用户和专业场景。
百万上下文是它最大的卖点,也是它最需要继续打磨的地方。
如果后续价格真的降下来,长上下文稳定性再提升一截,那DeepSeek V4会非常有竞争力。
我不想硬吹,也不想硬黑。
作为一个长期关注AI的人,我更希望看到的是:国内模型继续追赶,继续迭代,继续把好用的能力做便宜。
这一次,DeepSeek V4没有让我感到“核弹爆炸”。
但它确实让我看到了一件事:国产大模型已经越来越接近世界第一梯队了。
这比任何爽文故事,都更值得期待。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105719