DeepSeek V4引爆软件栈大战！AMD ROCm 14天性能暴涨75倍：硬刚NVIDIA CUDA-工信会

> 自媒体 > （AI）人工智能 > DeepSeek V4引爆软件栈大战！AMD ROCm 14天性能暴涨75倍：硬刚NVIDIA CUDA

DeepSeek V4引爆软件栈大战！AMD ROCm 14天性能暴涨75倍：硬刚NVIDIA CUDA

来源：驱动之家

2026-06-04 15:49:08

40

管理

快科技5月11日消息，SemiAnalysis旗下InferenceX性能测试平台发布的最新测试数据显示，自DeepSeek V4大模型发布以来，AMD ROCm软件栈在约14天内实现了75倍的推理吞吐提升。

该测试覆盖了FP4和FP8精度下的8K/1K上下文典型应用场景，测试周期截至5月8日。

在相同交互性水平下，token处理能力同步增长，有效降低了大模型推理延迟，显著改善了终端用户的使用体验。

此次性能飞跃完全来自ROCm软件栈的深度优化，未涉及硬件层面的改动，展现出AMD在AI软件领域的快速迭代能力。

性能提升主要源于两大核心优化：融合mHC操作与RoPE哈达玛变换，降低CPU开销并提高HBM内存利用率。

此外，索引器、键值缓存压缩器等核心计算内核均采用TileLang和Triton语言编写，大幅加快了开发迭代速度。

目前ROCm距离单节点聚合英伟达B200的性能水平仍有5倍差距，距离PD解耦版本B200则还有1.5倍提升空间。

相关信息显示，AMD有望在未来几周内完成剩余的性能优化目标，进一步缩小与NVIDIA CUDA的技术差距。

这是DeepSeek V4发布后，AMD ROCm团队在未提前获得模型权重的情况下启动适配，仅用约两周便交出上述成绩单。

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

DeepSeek 虚拟硬件层

DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

相关文章

离大谱！他花12美元给AI投毒，ChatGPT、Claude全中招

这段时间豆包翻车案例经常上热搜，说明AI搜索越来越普及了。“万事不决问..

人工智能发展历程全揭秘：从1956到ChatGPT的崛起之路

前言：AI从实验室到日常生活1956年，当科学家第一次提出“人工智能”这个..

一图看懂AI的Chat、Code、Agent、数据分析

对AI的使用要尽快从chat（聊天），转变成agent（智能体）..

我最近听到一个比喻一针见血：网页端APP端的豆包、DeepSeek、千问、kimi..

GPT-5登场，有三大亮点！OpenAI奥特曼：已从大学生变博士级专家..

千呼万唤始出来，GPT-5终登场。8月8日，人工智能（AI）巨头OpenAI正式推..

腾讯Hy3 preview成本仅为GPT-4o的1/7，为何调用量暴增10倍

上线两周，调用量是上一代Hy2的10倍。在代码和智能体场景，这个数字变成..

豆包再扔王炸！2.0发布：推理成本降一个数量级，正面对标GPT-5和Gemini 3..

字节跳动旗下豆包大模型正式进入2.0阶段，推出面向Agent时代的系统性升级..

GPT-5.5发布：两倍定价，半步进化

（本文作者为强调Next，钛媒体经授权发布）文 | 强调Next昨天（4月23日..

从 ChatGPT 到 Llama 3：大模型训练全流程拆解，小白也能轻松拿捏..

大模型已成我们的万能工具人，但你是否好奇它们为何时而精准时而离谱？本..

关于作者

细雨入梦(普通会员)

文章

1948

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

DeepSeek 究竟是个啥？一文带你看明白

2025/02/08

02

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

03

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

04

这怕是全网最强的 DeepSeek 图片教程吧，赶紧收藏了！

2025/02/09

05

AI 界黑马DeepSeek 超详细介绍

2025/02/09

标签云

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体112596

@2022 All Rights Reserved

浙ICP备19035174号-6 技术支持：千寻网络

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索