> 自媒体 > (AI)人工智能 > OpenAI 指 DeepSeek 通过对美模型进行“蒸馏”来训练 AI,内部备忘录披露
OpenAI 指 DeepSeek 通过对美模型进行“蒸馏”来训练 AI,内部备忘录披露
来源:钛媒体APP
2026-04-30 15:49:05
69
管理

在全球人工智能竞争显著升级之际,OpenAI 正式指出中国初创公司 DeepSeek 采用“蒸馏”技术,从美国的前沿模型中抽取智能。

根据提交给美国国会众议院中国问题特别委员会的内部备忘录(日期为 2026 年 2 月 12 日,星期四),由 Sam Altman 领导的组织称,DeepSeek 利用复杂且混淆的手段绕过 OpenAI 的安全防护,收集数据以训练其 R1 聊天机器人及后续模型。

争议核心在于“模型蒸馏”,这是将较小或较新的 AI 模型用更先进“教师”模型的输出进行训练的过程。通过对 GPT-4o 之类系统进行提示并将其高质量的推理作为训练数据,竞争对手可以在远低于原始研发成本的情况下有效复制复杂逻辑和知识。

OpenAI 表示其监测到与 DeepSeek 员工相关的账户使用第三方路由器和程序化工具掩盖来源,同时提取大量模型响应。此事发生之际,特朗普政府持续收紧对先进半导体的出口管制,旨在保持战略领先。

该备忘录发布的时机尤为敏感,DeepSeek 因以明显低于美国同行的计算预算推出高性能模型如 V3 和 R1 而获得国际好评。

虽然业界最初称赞 DeepSeek 的高效,但 OpenAI 的调查结果显示,这种效率可能由未授权使用美国知识产权补贴。备忘录指出,这些手段不仅构成商业威胁,而且构成国家安全风险,因为蒸馏过程可以在没有原始美国系统所具备的严格安全过滤和对齐协议的情况下转移在生物学和化学等敏感领域的先进能力。

从技术角度看,围绕蒸馏的争论对 AI 公司的“护城河”构成根本性挑战。如果模型的输出可以用来克隆其智能,则拥有更多数据或算力的传统优势变得愈发脆弱。

OpenAI 已采取主动措施,禁止被怀疑进行蒸馏的用户,并呼吁建立一个“公平竞争的环境”,以保护美国创新免遭其他国家再包装。众议院特别委员会主席约翰·穆伦纳(John Moolenaar)将此情形描述为长期技术窃取模式的延续,暗示立法者可能很快对外国实体的 API 访问和数据外流引入更严格的监管。

经济影响同样深远。DeepSeek 能以较低价格提供高端功能,曾在市场上掀起震动,导致一些分析师质疑美国公司偏好的高成本基础设施模式的可持续性。

然而,如果 DeepSeek 的进展确实系于对美模型的蒸馏,那么其长期轨迹可能会受到 OpenAI 目前所主张的限制所制约。备忘录还强调了“非法转售商”和第三方中介的作用,这些中介使中国公司得以规避地理限制,表明下一阶段的美国政策很可能将针对 AI 访问的全球供应链。

展望未来,这一冲突预计将加速“水印”技术的发展,并强化对 API 流量的更积极监控。随着特朗普强调美国的技术主权,我们很可能看到向更封闭生态系统的转变,前沿模型的输出将受到法律和技术障碍的严格管控。

OpenAI 旨在到 2029 年将美国 AI 基础设施扩展到 10 GW 的价值 1000 亿美元的“Stargate 项目”为这场斗争提供了背景,强调竞争已不再仅关乎算法,而是关乎其所产生智能的物理和法律安全。如果蒸馏不受控制,大规模私营对 AI 研究的投资激励可能减弱,从而在 2026 年及以后从根本上改变数字经济的格局。(本文首发钛媒体App , 作者|AGI-Signal,编辑|秦聪慧)

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
阿里发布新一代大语言模型Qwen3.6-Plus 编程能力大幅提升..
来源:环球网 【环球网科技综合报道】4月2日,阿里千问发布新一代大语言..
AI大模型测评,深度解析最强开源模型Qwen3
前几天,阿里发布了Qwen3的新模型。从数值表现来看已经超越了DeepSeek和..
阿里要发飙?Qwen已经干掉Llama,夸克又要干掉Meta眼镜?..
夸克,这个阿里家的小儿子,正在以肉眼可见的速度扩张自己的边界:从“AI..
那个用半成品刷爆SOTA的Qwen3超大杯推理版,现在正式上线..
新一年的基础模型竞逐,没想到是阿里千问率先出手了!就在刚刚,Qwen3-Ma..
亚马逊云科技为何上架Qwen和DeepSeek的最新模型
为何上架Qwen和DeepSeek?开放生态是对抗封闭的最佳武器。国际市场调研机..
qwen3-0.6B这种小模型有什么实际意义和用途吗?
在大模型喧嚣的背后,小模型正在工业场景中悄然崛起。从端侧部署的隐私计..
晚点独家丨林俊旸提出离职,Qwen 多位负责人离开,团队或将调整..
前一天还在奋战模型发布,第二天提离职。文丨陈佳惠 程曼祺编辑丨程曼祺3..
关于Qwen负责人离职这件事,闭源和日活KPI都是假的
短短几句话,直接引发了这两天AI圈的大地震。林俊旸是谁?2019年进阿里达..
智启新章:ChatGPT 4.0全流程赋能学术论文写作的技术实践与思考..
学境思源,一键生成论文初稿AcademicIdeas - 学境思源AI初稿写作当AI从“..
关于作者
搞印刷的黄先..(普通会员)
文章
1994
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106065

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索