来源:市场资讯
(来源:AI信息Gap)
本周 AI 快讯 | 1 分钟速览
01 智谱 AutoClaw 上线「自进化」机制与 Skill 商店 :对话结束弹出「进化请求」卡片,用户批准后写入记忆;Skill 商店首发 GLM Office 五件套(PPT、DOCX、XLSX、PDF、Charts),外加女娲、横纵分析法、Frontend Slides 等专家共创 Skill。
02 阿里开源 Qwen3.6-35B-A3B,3B 激活拿下 SWE-bench Verified 73.4% :Apache 2.0 协议,Terminal-Bench 2.0 拿下 51.5;原生 262K 上下文可扩至 101 万,闭源同门 Qwen3.6 Plus 同项 78.8 分。
03 MiniMax 开源 M2.7,首个参与自身训练的 Agent 模型 :自主跑 100 轮优化自家脚手架,内部基准涨 30%;SWE-Pro 56.22 追平 gpt-5.3-Codex,Terminal Bench 2 拿下 57.0,GDPval-AA Elo 1495 居开源最高。
04 腾讯 QQ 原生接入 Hermes Agent,华为云 OfficeClaw 同周启动邀测 :Hermes Agent 是 Nous Research 2 月开源的自进化 Agent,QQ 成为官方首批渠道;华为云 OfficeClaw 起家于工程师个人开源项目,主打「思辨专家团」多 Agent 模式,官网每天 10 点限量放邀请码。
05 火山引擎 Seedance 2.0 API 全面开放,四模态输入接入企业工作流 :4 月 14 日正式开放,海外由 BytePlus 同步发布;配套 1 万多虚拟肖像库,短剧和漫剧行业接入后效率提升 80% 到 90%,豆包日均 Token 已破 120 万亿。
06 Anthropic 发布 Claude Opus 4.7,SWE-bench Verified 87.6%,价格不变 :比前代 Opus 4.6 的 80.8 高 6.8 个百分点;SWE-bench Pro 64.3、CursorBench 70、OSWorld-Verified 78.0;API 沿用每百万 token 5 美元 / 25 美元的定价,但新版 tokenizer 让同样输入多消耗约 1.0 到 1.35 倍 token。
07 Anthropic 上线 Claude Design,Figma 股价跌 7.28%,Krieger 三天前辞董事 :Claude Design 由 Opus 4.7 驱动,支持对话生成原型、PPT、品牌系统;Figma 股价跌至 18.84 美元,Adobe 跌 2.7%、Wix 跌 4.7%;4 月 14 日 Krieger 辞 Figma 董事,同日 The Information 爆料 Opus 4.7 将内置设计工具。
08 Anthropic 同步上线 Claude Code 例程和身份验证 :routines 支持定时、API、GitHub 三种触发,Pro 每日 5 次、Max 15 次、Team 和 Enterprise 25 次;同步启用 Persona 身份验证,少量账户需上传政府证件和自拍,验证数据不用于训练。
09 OpenAI 反手三连发,Codex Mac 电脑操控、生物学 GPT-Rosalind、网络安全 GPT-5.4-Cyber :GPT-5.4-Cyber 4 月 14 日扩面给数千名安全专家,对标 Claude Mythos Preview;Codex Mac 端 4 月 16 日加装电脑操控、应用内浏览器、图像生成和 90 插件;同日发布生物学专用 GPT-Rosalind,合作方含 Amgen、Moderna、艾伦研究所。
10 OpenAI 内部备忘录泄露,新模型 Spud 对撞 Claude,指控 Anthropic 虚报营收 80 亿 :Denise Dresser 四页备忘录指 Anthropic 300 亿 run rate 是毛收入口径计算,按净收入实际约 220 亿;五大 Q2 优先级含新模型 Spud(即 GPT-5.5)、企业 Agent 平台 Frontier、亚马逊合作和部署引擎 DeployCo。
11 谷歌 Gemini 原生 Mac 应用上线,Swift 写成、100 天交付 :4 月 15 日面向 macOS 15 及以上全球免费开放,Option Space 唤起迷你聊天,支持屏幕共享和本地文件;内置 Nano Banana 图像、Veo 视频、音乐、Canvas、Deep Research 等工具;Gemini 是桌面 AI 三家里最后一个落地的。
01|智谱 AutoClaw 上线「自进化」与 Skill 商店,让 Agent「越用越懂你」
「简洁点」「不要用破折号」「参考 XX 的风格」,这类重复叮嘱是很多人用 AI Agent 的共同痛点。4 月 17 日智谱给 AutoClaw(中文名「澳龙」,本地版 OpenClaw)加了一套「自进化」机制,每轮对话结束它会扫描用户的纠正、新教的方法、表达过的偏好和自己踩过的坑,把值得记住的经验抽成一张「进化请求」卡片。用户点同意后写入记忆,下一次同类任务就自动按新经验走。智谱官方的说法是「用得越多越懂你」。

电脑操作 OSWorld-Verified 从 72.7 涨到 78.0,超过 GPT-5.4 的 75.0,与未公开的 Claude Mythos Preview(79.6)只差 1.6 分;XBOW Visual Acuity 从 54.5 跳到 98.5。图像处理最高分辨率从 1568 像素提到 2576 像素,像素数约 3.3 倍。弱项是 BrowSEComp,Opus 4.7 只拿到 79.3,落后 GPT-5.4 Pro 的 89.3 和 Gemini 3.1 Pro 的 85.9,涉及大量实时网页检索和跨页合成的 Agent 工作流值得先做对比评估。
API 沿用每百万 token 5 美元 / 25 美元的定价,但要留意 tokenizer 的变化。Opus 4.7 换了新版 tokenizer,同样输入比 Opus 4.6 多消耗约 1.0 到 1.35 倍 token,算下来实际成本会比前代略高。Prompt Caching 可省最多 90%,Batch API 对输入输出各打 5 折。GitHub Copilot 侧 Opus 4.7 4 月 30 日前以 7.5 倍请求倍率上线 Pro 订阅,之后逐步替换掉 Opus 4.5 和 Opus 4.6。此外新增 xhigh 档思考强度,Hex 测试显示 Opus 4.6 的 high 档大致对应 Opus 4.7 的 low 档,迁移时把思考预算档位同步抬一档才能得到可比输出。
07|Anthropic 上线 Claude Design,Figma 股价跌 7.28%,Krieger 三天前辞董事
Mike Krieger 在 4 月 14 日这天做了两件事。第一件是以 Anthropic 首席产品官身份向 SEC 披露辞去 Figma 董事会席位,当日生效。第二件是那天晚些时候 The Information 爆料 Anthropic 即将发布的 Opus 4.7 将内置设计工具,与 Figma 核心产品形成直接竞争。Krieger 是 Instagram 联合创始人,2024 年出任 Anthropic 首席产品官,去年才加入 Figma 董事会,如今主管 Anthropic Labs 实验室团队。两件事同一天落地,合作期就此结束,接下来就是正面交锋。

4 月 16 日 Codex 桌面 Mac 端做了一次大更新,最关键的一项是新加的电脑操控能力。Codex 可以用自己的光标操作 Mac 桌面应用,支持多 Agent 并行、不干扰用户当前工作,主要面向前端调试和游戏开发。同步上线的还有应用内浏览器(可在页面上批注给 Agent 指令)、基于 gpt-image-1.5 的图像生成、跨会话记忆和自动化,Codex 可以跨天甚至跨周执行任务,响应 Slack、Gmail、Notion 中的活动。新增的 90 多个插件涵盖 Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Neon、Remotion 和 Render 等。这次也是 Codex 首次支持 Intel Mac,OpenAI 同时披露 Codex 目前有 300 万周活开发者。
同日发布的 GPT-Rosalind 是 OpenAI 首款生物学专用模型,致敬 DNA 双螺旋发现者 Rosalind Franklin,定位「生命科学系列」第一款,面向药物发现和转化医学。模型基于 50 种常见生物学工作流训练并接入主流公共生物数据库,BixBench 生物信息与数据分析基准 0.751 通过率,LABBench2 在 11 项研究任务中 6 项超过 GPT-5.4。与 Dyno Therapeutics 合作的 RNA 序列功能预测评估使用了从未进入公开数据集的未发表序列,GPT-Rosalind 十次最佳提交里预测任务超过 95% 的人类专家,序列生成任务达到 84 分位。模型走「Trusted Access」路线,仅向少数合格企业开放研究预览。这一周 OpenAI 和 Anthropic 把战线分别延伸进了设计工具和制药研究。
10|OpenAI 内部备忘录泄露,新模型「Spud」对撞 Claude,指控 Anthropic 虚报营收 80 亿
一份四页内部备忘录 4 月 13 日晚间从 OpenAI 泄露。发件人是今年 2 月从前 COO Brad Lightcap 手里接过职能的首席营收官 Denise Dresser,备忘录被媒体视为她上任后第一次全员战略宣言,矛头直指 Anthropic。Dresser 称 Anthropic 披露的 300 亿美元年化 run rate 是按毛收入口径计算(把 AWS、Azure、Google Cloud 分销渠道的全额计入自家收入),高估了约 80 亿;按 OpenAI 对微软 Azure 分成采用的净收入口径核算,Anthropic 真实可比的 run rate 接近 220 亿,低于 OpenAI 2 月披露的 250 亿。Anthropic 回应称自己在合作中担任交易主体、云厂商是分销渠道,毛收入口径符合会计准则。两家都在筹备 IPO,这是他们第一次在营收口径上公开较量。

比 ChatGPT 和 Claude 桌面端多的一块能力是屏幕共享。用户可以把任意窗口或本地文件共享给 Gemini 后直接提问,比如丢一张复杂图表过去让它给出三个核心要点。内置工具涵盖图像生成 Nano Banana、视频生成 Veo、音乐、Canvas、Deep Research、Guided Learning 和 Personal Intelligence 等。桌面 AI 御三家至此补齐,OpenAI 和 Anthropic 的 Mac 客户端早已推出,Gemini 是最后一个落地。谷歌同时预告 Gemini Live 语音模式即将登陆桌面,作为常驻「悬浮球」提供实时对话。
我是木易,Top2 美国 Top10 CS 硕,现在是 AI 产品经理。
关注「AI信息Gap」,让 AI 成为你的外挂。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106055