英伟达真送H100,免费用还限速?这到底图啥。
我上周注册了build.nvidia.com,用QQ邮箱,点几下就拿到key,开头真是nvapi-,不是假的。手机验证卡了三次,“exceeded limits”弹出来的时候我以为被拉黑了,后来换了个朋友的号码发短信才过。不是服务器坏了,是它真在拦人,但不拦你,拦脚本。
这东西确实能跑模型。我拿DeepSeek V3.2跑了个Python题解,响应慢,大概1.5秒一次,不能连着发,发快了就429。不是bug,是写死的。官网没明说限速,但所有实测数据都指向40次/分钟。有人截图发社区,我试了,一样。
它支持的模型比我想的多。Kimi、GLM、Llama 4、Gemma 4全在列表里,ID名字和OpenAI格式一模一样,复制粘贴就能用。没改代码,就把原来调claude的base_url换成它的,key一换,成了。不是套壳,是真跑在H100上——后台返回的header里有x-model-host: h100-cluster-3a这种字段。

我看到个叫NIM Starter Kit的付费选项,0.003美元每千token,比很多云便宜。免费key页面底下,有个“Upgrade”按钮,点进去就能跳转。不是画饼,是已经摆上货架了。
最近30天新上的模型,七成都带nvidia字样,要么是它参与优化的,要么是提前签了协议。不靠模型独家,靠接入快、格式统、调用稳。你习惯这个路子了,后面它推啥,你换起来都不疼。
有个朋友上周试了本地部署NIM,就用免费key调过几次的模型,发现镜像下载地址直接从build平台跳转过去。他没买GPU,只用一台32G内存的MacBook,拉下来跑通了Llama 4。不是演示,是真用上了。

官方status页能查当前服务状态,模型列表也能用curl直接捞,不用进网页。我把它写进脚本里,每天早上自动刷一次,看看有没有新加模型。
这玩意儿不是永久的,但也不是随时会关。它像学校机房,开门让你练手,不收钱,但插排只有那么多,你抢不过别人。练熟了,考试才不慌。
我昨天删了本地Ollama,卸载了LM Studio,把所有测试脚本全切到build平台。不是因为它免费,是因为它省事。我不用再管CUDA版本、量化精度、显存溢出。我只想把prompt写对,把结果拿回来。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体112908