DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手-工信会

> 自媒体 > （AI）人工智能 > DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

来源：量子位

2026-06-04 15:48:17

195

管理

鱼羊发自凹非寺

量子位 | 公众号 QbitAI

我悟了，DeepSeek V4系列发布1个月，价格屠夫的本色这才刚刚发力啊！

官方这边，打折促销期还没过，折上折价格已官宣落定为永久降价。

具体来说，Reasonix是一款专为DeepSeek打造的终端coding harness，核心目的很简单，就是两个字：省钱——

长会话能把缓存命中保持在90% ，输入token成本降到1/5的那种。

DeepSeek原生编程Agent

Reasonix的实现思路也不复杂，最核心的一点是：基于字节稳定prefix-cache设计的append-only运行循环。

就是说，Reasonix的工作流程是专门为了DeepSeek的缓存机制设计的：旧的上下文固定不动，新消息只往后追加，尽量保证每一轮请求的前半部分完全一样，从而提高缓存命中率，降低长会话成本。

具体架构可以拆分成3个部分来看。

这样，前缀会被固定下来，在每个会话中仅计算一次；历史消息只追加不重写；而草稿区中的任何信息在归入日志前，均需通过Tool-Call Repair进行提炼。

工具调用修复（Tool-Call Repair）

DeepSeek比较容易遇到的问题包括：

工具调用JSON在内部已经生成，但在最终消息里却消失不见；模型想调用工具，但参数写歪了，即JSON参数畸形；同一工具被反复调用且参数完全相同，即重复调用风暴；JSON被截断。

工具调用修复会通过4轮处理，让Reasonix在真正执行前，先尝试修复这些问题。

成本控制

首先，默认优先使用v4 flash，困难任务才会切pro。

于是关于Reasonix的讨论，是轻轻松松就盖了几百楼。

不少小伙伴已经摩拳擦掌跃跃欲试，但也有人提出疑问：

我们真的需要一个DeepSeek原生编程Agent吗？

有网友分享说，Ta写了一个微型桥接程序，在Codex中使用DeepSeek V4 Pro，同样实现了95%以上的高缓存命中。

并且Ta“没做任何特殊处理，只是将DeepSeek API的格式调整为Codex所需要的”。

anyway，harness和harness之间肯定是有区别的。就有网友分享说，在Claude Code里使用DeepSeek V4比在OpenCode上省钱。

甭管你用了哪一种方案，都欢迎在评论区分享分享心得体验。

大家省才是真的省（doge）。

项目地址：https://github.com/esengine/DeepSeek-Reasonix

参考链接：[1]https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs/ARCHITECTURE.md#pillar-1--cache-first-loop[2]https://esengine.github.io/DeepSeek-Reasonix/index.html#agents

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

DeepSeek V4引爆软件栈大战！AMD ROCm 14天性能暴涨75倍：硬刚NVIDIA CUDA

DeepSeek V4芯模协同背后，国产算力生态开始飞轮加速

相关文章

离大谱！他花12美元给AI投毒，ChatGPT、Claude全中招

这段时间豆包翻车案例经常上热搜，说明AI搜索越来越普及了。“万事不决问..

人工智能发展历程全揭秘：从1956到ChatGPT的崛起之路

前言：AI从实验室到日常生活1956年，当科学家第一次提出“人工智能”这个..

一图看懂AI的Chat、Code、Agent、数据分析

对AI的使用要尽快从chat（聊天），转变成agent（智能体）..

我最近听到一个比喻一针见血：网页端APP端的豆包、DeepSeek、千问、kimi..

GPT-5登场，有三大亮点！OpenAI奥特曼：已从大学生变博士级专家..

千呼万唤始出来，GPT-5终登场。8月8日，人工智能（AI）巨头OpenAI正式推..

腾讯Hy3 preview成本仅为GPT-4o的1/7，为何调用量暴增10倍

上线两周，调用量是上一代Hy2的10倍。在代码和智能体场景，这个数字变成..

豆包再扔王炸！2.0发布：推理成本降一个数量级，正面对标GPT-5和Gemini 3..

字节跳动旗下豆包大模型正式进入2.0阶段，推出面向Agent时代的系统性升级..

GPT-5.5发布：两倍定价，半步进化

（本文作者为强调Next，钛媒体经授权发布）文 | 强调Next昨天（4月23日..

从 ChatGPT 到 Llama 3：大模型训练全流程拆解，小白也能轻松拿捏..

大模型已成我们的万能工具人，但你是否好奇它们为何时而精准时而离谱？本..

关于作者

帝王之星(普通会员)

文章

2018

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

DeepSeek 究竟是个啥？一文带你看明白

2025/02/08

02

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

03

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

04

这怕是全网最强的 DeepSeek 图片教程吧，赶紧收藏了！

2025/02/09

05

AI 界黑马DeepSeek 超详细介绍

2025/02/09

标签云

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体112596

@2022 All Rights Reserved

浙ICP备19035174号-6 技术支持：千寻网络

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索