> 自媒体 > (AI)人工智能 > DeepSeek V4「叫好不叫座」:模型只是入场券,Codex才是决赛圈
DeepSeek V4「叫好不叫座」:模型只是入场券,Codex才是决赛圈
来源:36氪
2026-05-07 16:43:47
121
管理

去年 DeepSeek V3 发布时,整个 AI 圈的气氛,和今年完全不一样。

那时候的讨论非常热烈,甚至有点像 ChatGPT 刚火爆全球,社交媒体上到处都是实测、跑分、成本分析,很多海外开发者第一次认真讨论一家中国大模型公司。国内和硅谷公司都意识到,原来除了 OpenAI、Anthropic、Google 之外,还有团队能把模型做到这个水平。

更关键的是,它还便宜。DeepSeek 带来的冲击不只是技术层面,更低的训练成本、更激进的工程优化、更高的推理性价比,都让整个行业重新思考大模型的竞争逻辑,很多人都将其视为真正的「Open AI」。

两周前,DeepSeek V4 发布,行业当然非常关注,很多开发者第一时间跑测试、做对比,但整个市场的情绪明显冷静了很多。过去两周,对普通用户来说,该用豆包、ChatGPT 的继续用,而对开发者群体来说,很多使用 Codex、Claude Code 的人,也并没有因为 DeepSeek V4 更便宜就替换掉 GPT-5.5 或者 Claude 4.6/4.7。

图片来源:X

Claude Code、Codex 是真正完整的产品,但 DeepSeek V4 只是模型。SemiAnalysis 在测试报告中还强调:「真正完整的产品是运行框架 模型。缺了其中任一个,你就有所欠缺。」

过去一年,OpenClaw(龙虾)、Claude Code 和 Codex 这类 Agent 框架的存在感越来越强。很多开发者现在已经不会说「我在用 Claude 4.6」,而是直接说「我在用 Claude Code」。同样,很多人在讨论 Codex 而非 GPT-5.5。

DeepSeek 还差一个自己的 Codex

很多人现在回头看 ChatGPT 刚火的时候,会发现当时整个行业其实都在围绕「对话」做产品。无论是 OpenAI、Anthropic 还是国内厂商,本质上都是让模型更像人类聊天,重点是模型更聪明、更自然、更像真人。

但现在 AI 的重点,正在从「聊天」变成「工作」。这个变化看起来好像只是用途的变化,但背后连带整个行业竞争逻辑也变了。以前模型公司最重要的任务,是把模型训练得更聪明;现在越来越重要的问题,则是怎么让 AI 真正完成任务。

这也是为什么最近一年,行业里开始大量出现 Agent、Workflow、Context Engineering、Harness Engineering 这些词。本质上,它们都在解决同一个问题:怎么让 AI 真正进入生产流程。

所以现在很多开发者评价 AI Coding 或者 Agent 产品时,模型作为系统「引擎」当然重要,但直接决定 AI 实际价值的关键,更在于一套系统工程。比如上下文管理,比如工具调用,比如长期记忆,比如任务拆解,比如错误恢复,比如多 Agent 协同。实际工作中,这些能力很多时候甚至比模型本身的优势更重要。

图片来源:X

这也是为什么越来越多人开始说,AI Coding 的竞争已经不只是 LLM 竞争,而是 AgentOS 竞争。

反过来看,也能在一定程度上理解 Claude Code、Codex 的成功。一方面是自家模型在能力上的领先,另一方面则是从底层模型到 Agent 框架的垂直整合,在真实工作环境中可以带来更稳定、高效的表现。尤其是长任务场景下,Claude Code 更像一个能持续自主代理工作的 AI 助手。

而 GPT-5.5 真正重要的地方,也不只是模型更强,还有背后 Codex 工作流越来越成熟。包括文件管理、工具调用、Agent 协同、任务拆解、上下文管理,这些能力的叠加,也让实际 AI 表现出的能力和价值有了质的变化。

OpenAI 前几天也官宣表示,GPT-5.5 发布一周的 API 收入增长速度超过以往任何版本的两倍多,而 Codex 在不到七天内收入翻倍。而且现在来看,这种优势已经从 AI Coding 溢出到了更多的 Agent 场景上。

关注 Anthropic、OpenAI 的朋友应该都能发现,这段时间两家公司都在将 Claude Code、Codex 扩展到更多场景下,包括连接更多第三方应用和平台。

图片来源:X

不仅如此,Claude Code 更多承接了 Claude Cowork 的办公定位,最新推出了专为银行和其他金融服务企业量身定制的 AI Agent,Codex 也在强调更多研究、文书、会计等工作,而不仅限于 Coding。

回头再看 DeepSeek V4,虽然已经在模型层面追上了行业的前沿变化和领先阵营,但还差一个自己的 Codex。事实上,这种呼声已经不小了,还有人在 Github 上开源了基于 DeepSeek V4 开发的终端 Coding Agent——DeepSeek TUI,支持 Skill 以及大量 Agent 框架上的常见功能。

但这毕竟还是第三方开发者的作品,对于 DeepSeek V4 的理解很难比拟官方团队,不太可能充分发挥 V4 的垂直整合优势。最好的期待是,借由 DeepSeek TUI 的反馈和呼声,DeepSeek 官方能够下场打造自己的开源 Agent 框架,自己的 Codex。

本文来自“雷科技”,36氪经授权发布。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
刚刚,ChatGPT免费模型升级了:幻觉砍半/记忆更强/回答更简洁..
梦晨 发自 凹非寺量子位 | 公众号 QbitAIChatGPT默认模型,今天大升级。..
启动商业化3个月,ChatGPT广告价格为什么腰斩了?
ChatGPT广告业务启动仅3个月,CPM价格已从60美元腰斩至25-45美元。这背后..
刚刚,GPT-5.5 Instant全员免费!数亿人的ChatGPT变了
编辑:桃子 好困【新智元导读】太突然了!OpenAI深夜甩出GPT-5.5 Instant..
ChatGPT Plus 订阅避坑:Apple ID、礼品卡和自动续费一次讲清楚..
最近很多人都在问:ChatGPT Plus 能不能通过 App Store 订阅?Apple ID ..
ChatGPT默认模型升至GPT-5.5 Instant,幻觉最高减少52.5%
IT之家 5 月 6 日消息,OpenAI 昨日(5 月 5 日)发布公告,宣布升级 Cha..
ChatGPT为何痴迷于地精?OpenAI是如何解决这一问题的
ChatGPT对地精有着莫名其妙的执念。说真的,它非常非常喜欢地精、小妖精..
AI大事件:ChatGPT广告主平台正式上线、AI自己造AI的概率被估到60%、国产AI..
今天刷了一圈AI圈,几个数字挺有意思的——ChatGPT广告主平台正式上线、A..
ChatGPT上线广告主平台,AI行业迈入广告变现时代
来源:21世纪经济报道21世纪经济报道记者 陈归辞据媒体消息,当地时间5月..
ChatGPT教育研究被撤稿:AI学习红利证据并不牢靠 统计方法遭质疑..
一项在学术界和社交媒体上被广泛引用、曾被视为证明 ChatGPT 明显提升学..
关于作者
泡沫人生(普通会员)
文章
1939
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体107745

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索