> 自媒体 > (AI)人工智能 > 玩完 DeepSeek R1 新版,外国网友又「蚌埠住了」?
玩完 DeepSeek R1 新版,外国网友又「蚌埠住了」?
来源:极客公园
2025-08-30 10:31:35
132
管理

几天前,没有预热,没有发布会,DeepSeek 低调上传了 DeepSeek R1(0528)的更新。

海外媒体最关注的是,DeepSeek 的更新将幻觉率削减约 45%-50%,并把 R1 的性能推进至 OpenAI o3 与 Google Gemini 2.5 Pro 的相近水平。

与此同时,海外一些开发者、AI 圈研究人员开始跑基准测试,并在社交媒体平台上热议它的新能力,尤其是与科技巨头旗舰模型的差距。

从海外用户这几天的反应来看,DeepSeek 这一次更新,虽然没有今年初横空出世时那样轰动,但依然让不少外国网友表示「鹅妹子嘤」,同时也让越来越多人开始问一个问题: 不单单是成本,来自中国的、开源 AI 社区的模型,是否在各种能力上 , 很快就可以超越世界上最强大的专有模型 ?

01

DeepSeek 再次「登顶」

在各类 AI 社群中,reddit 平台有不少 AI/LLM 相关子社区。其中,在 r/LocalLLaMA 与 r/SillyTavernAI 这样的圈内社区,对 DeepSeek 的更新有不少热帖。

「全新升级的 Deepseek R1 在 LiveCodeBench 上的表现几乎与 OpenAI 的 O3 模型不相上下! 开源的巨大胜利 !」一名用户发布的帖子标题如此声称。

人工智能模型智能指数排行|图片来源:Artificial Analysis

具体模型比较上,该机构在一篇报告中称「DeepSeek R1 的智能程度高于 xAI 的 Grok 3 mini(high)、NVIDIA 的 Llama Nemotron Ultra、Meta 的 Llama 4 Maverick、阿里巴巴的 Qwen 3 253,并与谷歌的 Gemini 2.5 Pro 相当。」

DeepSeek 最大的智力进步出现在 AIME 2024(竞赛数学, 21 分)、LiveCodeBench(代码生成, 15 分)、GPQA Diamond(科学推理, 10 分)和 Humanity's Last Exam(推理与知识, 6 分)

其中在编程方面,该分析机构认为,「R1 在人工分析编码指数中与 Gemini 2.5 Pro 相当,仅落后于 o4-mini(high)和 o3」。

reddit 社区关于 DeepSeek 更新的帖子|图片来源:reddit

即时是对 DeepSeek 更新表示淡定的网友也称:「虽然它不再让我感到惊讶了。每次我都得等到所有营销噱头平息后才能进行全面测试。但无论如何,Deepseek 仍然拥有开放权重的优势,这无疑是一个优点。」

reddit 社区关于 DeepSeek 更新的帖子|图片来源:reddit

这几个月,在 DeepSeek 的对比下,以往的 AI 巨头保持技术和声誉优势的压力,可以说越来越大。

不少网友开始担心其命运,比如「DeepSeek 将继续迫使 AI 公司在价格方面展开竞相压价的竞争。」有的网友认为 DeepSeek「这样做并非全是出于利他主义。通过发布免费模型,你可以阻止竞争对手占据市场主导地位」。

reddit 社区关于 DeepSeek 更新的帖子|图片来源:reddit

最高赞的回复则选择感谢所有模型制作者,持同样看法的用户称,无论是不是利他行为,「我很感激能在短期内从他们的策略中获益」。

这可能也是旁观全球 AI 竞赛时,面对一次次模型升级,当下不少开发者的真实心态。

reddit 社区关于 DeepSeek 更新的帖子|图片来源:reddit

另外,值得注意的是,业界仍在 DeepSeek R2 的发布。在 DeepSeek 更新时,有不少网友问到 R2 的进展,是不是会延迟发布,甚至怀疑「DeepSeek-R1-0528」是不是其实就是「R2」,只是用 R1 系列命名。

「 我们想要 R2 。」在 DeepSeek 官方更新的 X 帖子下,高赞回复如是说。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
荣耀Magic8 RSR评测:不止联名,是能用的“数字超跑”
作为荣耀与保时捷设计的联名顶配机型,这台手机最直观的感受是高级不浮夸..
布加迪复兴20年,从威龙到“终极威龙”,超跑行业在拼什么?..
超跑行业在拼的,早已不是单纯的速度数字,而是技术遗产的传承、极致工艺..
新车 | 超1000马力/“零百”2.5秒/5月首发,法拉利Luce测试车曝光..
文:懂车帝原创 张晓丹[懂车帝原创 产品] 日前,海外媒体曝光了一组法拉..
打造全球最强劲超级跑车的十大汽车制造商
尽管科尼赛克汽车以卓越性能为核心,但其设计也兼顾了实用性。内饰融合了..
奥迪确认下一代TT电动跑车仍按计划推进,与保时捷718 EV平台共享..
【网通社快报】尽管保时捷纯电718项目前途未卜,奥迪CEO高德诺近日明确表..
高性能不值钱的电动化时代,超跑如何自我证明?
静谧却势不可挡的电动化浪潮,席卷了整个汽车市场。这是一个告别燃烧汽油..
保时捷纯电718需求不及预期,豪华纯电跑车市场遇冷了吗?..
豪华纯电跑车市场并未整体遇冷,保时捷纯电718的需求问题更多是品牌自身..
优雅的意式跑车,搭载V8双增压动力,功率640马力,加速3.3s..
在众多超级跑车制造商中,意大利汽车品牌绝对是不容被忽视的。这个领土面..
《Motor Trend》实测兰博基尼Temerario:只有两款油车比它快..
IT之家 2 月 7 日消息,美国老牌汽车杂志《Motor Trend》对兰博基尼全新..
关于作者
天泰悠然(普通会员)
文章
1862
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体104620

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索