> 自媒体 > (AI)人工智能 > 460万美元训练出顶级大模型? 月之暗面杨植麟亲自回应
460万美元训练出顶级大模型? 月之暗面杨植麟亲自回应
来源:观察者网
2026-05-06 14:26:59
163
管理

(文/陈济深 编辑/张广凯)

11月6日,月之暗面发布最新模型Kimi K2 Thinking,在Humanity's Last Exam、TAU-Bench等重要基准测试中,超越GPT-5、Claude 4.5等全球最强开源乃至闭源模型。

对于大家最关心的训练成本问题,杨植麟直接坦言460万美元不实。

他表示:“这不是官方数据。由于训练成本中很大一部分是研究和实验,所以很难量化具体数字。”

而对于优先聚焦文本模型是为了短期刷榜,还是准备持续深耕文本领域的问题,杨植麟则明确表示,“训练视觉语言模型需要时间获取数据和调整训练,所以我们决定先发布一个文本模型。”

甚至有网友问到为什么OpenAI会烧那么多钱,杨植麟更是坦言“我不知道”。

还有网友质疑,Kimi K2 Thinking是否经过专门训练,以在HLE这一基准测试中取得好成绩?它的高分似乎与实际使用中的智能水平不太相符。

杨植麟回应道,Kimi K2 Thinking在提升智能体推理能力方面取得了一些进展,使其在HLE测试中得分较高。月之暗面正在努力进一步提升其通用能力,以便在更多实际应用场景中充分发挥智能的作用。

另有网友问道:“为何K2 Thinking能在一次推理中保持如此长的思维链,而GPT-5不行?”

杨植麟解释道:“我认为推理时间取决于API吞吐,而推理token的数量取决于模型训练方式。我们在训练Kimi K2 Thinking时倾向于使用更多的思考token以获得最佳效果。我们的Turbo API会更快,同时Kimi K2 Thinking原生采用INT4,这也提升了推理速度。

Kimi K2系列模型不阿谀奉承、直接的文风在AI界算是一股清流,有不少网友认可这种风格。吴育昕称,这种写作风格是模型后训练数据和评估的重要组成部分。

月之暗面三位联合创始人还集中回应了与模型服务、开源等相关话题的疑问。

有网友称,Kimi在自己的公司已经成为主要的测试模型,但生产环境会切换到美国本土的模型。这主要是因为领导层担心Kimi是“中国大模型”,可能存在一些风险。

这位网友还分享,自己很喜欢使用Kimi App,自己一位在亚马逊工作的朋友也很喜欢这一应用,但由于亚马逊有规定必须使用自家的AI助手,禁止在工作场合使用其他主流的AI助手App。网友担心,随着Kimi逐渐变得知名,她会不会再也无法在工作场合中使用呢?

吴育昕回应称:“虽然被封禁往往超出我们的控制范围,但开源该模型有望成为消除部分顾虑的有效途径(企业可以自行部署)。我们希望看到一个更加信任的世界,但这需要时间。”

上下文一直是影响AI模型在生产环境应用的重要因素。目前,Kimi K2 Thinking最大支持256K的上下文,有网友反馈这对大型代码库而言并不算大。

杨植麟称,月之暗面应该能在未来的版本中增加上下文长度。

还有网友希望月之暗面能将模型上下文窗口提升到100万个token,周昕宇回复道,月之暗面之前已尝试过100万个token的上下文窗口,但当时的服务成本太高,未来他们会重新考虑更长的上下文窗口。

当被问及有无AI浏览器的开发计划时,周昕宇十分犀利地回复道:要做出更好的模型,并不需要再去套一层新的Chromium壳。

杨植麟称,月之暗面目前将专注于模型训练,但会不断更新kimi.com ,使其包含最新功能。

还有不少网友提到,希望月之暗面能推出规模更小的模型。杨植麟称,Kimi-Linear-48B-A3B-Instruct就是月之暗面发布的小型模型之一,未来他们可能会训练更多模型并添加更多功能。

目前,Kimi已经提供了编程订阅方案,这一计费方式是基于API请求次数,有网友称这种模式导致资源消耗偏高。月之暗面回应称,API请求次数计费能让用户看到费用明细,同时也更符合企业的成本结构。不过,他们会尽快找到更好的方案。

从社区中海外开发者的热烈提问和尖锐反馈可以看出,以Kimi系列为代表的中国模型正受到前所未有的关注。月之暗面此次在Reddit平台的公开问答,集中回应了全球网友对Kimi技术细节的大量兴趣和疑问。这种关注背后,也折射出全球开发者对中国AI创新能力的认可。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
小模型实测|qwen3.5:0.8b 真实能力曝光,惊喜与遗憾并存..
最近一直关注本地模型的部署,重点放到了找能力强的模型,忽略一个问题,..
Qwen 3.5 的口碑持续走高,林俊旸辞职出走,开源阵营震荡..
这件事值得记上一笔。理一理时间线,事情的起点是林俊旸(Junyang Lin,@..
晚点独家丨Qwen 管理调整出炉:周靖人代管千问模型一号位..
预训练、后训练等核心模块暂未有大变化。文丨陈佳惠编辑丨程曼祺《晚点 L..
司马南:看得我目瞪口呆!反腐利器肠道菌群,这个角度太邪门儿了..
文/司马南但看截图,目瞪口呆。俺半天缓不过神儿来。这个世界变化太快,..
2025年ETF“涨幅王”来了!通信ETF(515880)全年收涨125.81%,位居全市场..
2025年收官!ETF“涨幅王”花落谁家?今年以来通信ETF在A股表现优异,AI..
OpenAI于中国注册GPT5商标被驳回
据科技日报报道,当地时间周四(8月7日),OpenAI正式推出新一代人工智能..
一篇带你了解,什么是AI味!解密让大学生闻风丧胆的AI率背后的秘密..
你真的了解“AI味”的判定逻辑吗?它是算法的偏见,还是内容的共性?本文..
AI 不懂「疯狂星期四」
当 AI 遇到「疯狂星期四」,再庞大的语料也翻译不出那句「V我50」的灵魂..
大打免费牌争夺用户 马斯克Grok4与ChatGPT5“短兵相接”..
《科创板日报》8月12日讯(记者 李佳怡)继ChatGPT后,Grok4宣布免费开放..
关于作者
婆罗花开(普通会员)
文章
1960
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体107572

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索