> 自媒体 > (AI)人工智能 > DeepSeek V4发布,万亿参数百万上下文,能否再次震撼AI行业
DeepSeek V4发布,万亿参数百万上下文,能否再次震撼AI行业
来源:科技Canary
2026-04-28 21:30:46
152
管理

今天DeepSeek V4上线并开源了权重文件,从技术报告上看相对V3系列有以下变化:MoE万亿参数、原生百万token上下文、三种“推理强度”档位。

在能力和其它第一梯队AI大模型接近的同时,V4依然在使用成本上保持优势,在百万token上下文里V4-Pro的单token FP8 等效 FLOPs 只有V3.2的约27%,KV 缓存约10%。V4-Flash更极致可到约10% FLOPs 与7% KV,这意味着长任务不再是“算力黑洞”而是日常可用。

在API价格上(按百万token计费)V3.2输入2元输出3元,而V4-flash能降低到输入1元输出2元。V4-Flash(284B参数13B激活)就能在能力超过V3.2(671B参数37B激活)。V4-pro更强价格也更贵,不过比起当前最新的其它AI大模型来说价格依然还是便宜不少。比如GPT-5.4输入2.5美元输出15美元,是DeepSeek V4 pro的4倍,GPT-5.4 mini 更是比V4-flash贵了16倍。

值得注意的是华为也发布了昇腾950超节点与DeepSeek的合作:“通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeek V4模型推理部署。”

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
Kimi团队发布K1.5:让AI像人类一样\u0026#34;边思考边学习\u0026#34;的突破..
这项由Kimi团队开展的研究发表于2025年6月3日,详细介绍了他们最新的多模..
DeepSeek对比Kimi:两个国产AI谁更适合办公?实测告诉你答案..
说实话,最近AI工具多得让人眼花缭乱。DeepSeek和Kimi,两个名字我都听过..
涉嫌违规收集个人信息 Kimi等多款AI应用被通报
5月20日,国家网络与信息安全信息通报中心发布通报,经公安部计算机信息..
阿里Qwen开源模型为什么能火?
阿里Qwen开源模型能火,是因为它用过硬的技术、开放的态度和实惠的价格,..
谁是开源大模型之王?Llama、DeepSeek还是Qwen?
“友商,你们拿什么和我比?”“友商,你们拿什么和我比?”这不是哪家公..
开源Qwen一周连刷三冠,暴击闭源模型!基础模型推理编程均SOTA..
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI卷疯了,通义千问真的卷疯了。Qw..
Qwen负责人转发2025宝藏论文,年底重读「视觉领域GPT时刻」..
闻乐 发自 凹非寺量子位 | 公众号 QbitAI2025最后几天,是时候来看点年度..
成本骤降97% 实测Qwen3.5小模型 国产大模型破局?
阿里推出Qwen3.5系列三款中型开源大模型,性能媲美国际顶尖竞品,开发者..
曝京东拦截员工使用外部AI,美团内部开始限制阿里Qwen模型..
IT之家 4 月 8 日消息,据“大厂日爆”公众号消息,京东在 3 月底正式限..
关于作者
快乐的老范..(普通会员)
文章
1918
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体106085

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索