英伟达正在撼动AI市场,尤其是在开源领域。
通常,像谷歌或 OpenAI 这样的科技巨头都会对他们的 AI 研发成果保密:没人确切知道这些模型被输入了什么数据。
英伟达如今打破了这一传统,推出了 Nemotron 3 Super 代理模型,该模型不仅免费,还附带一个(51页的文档)提供了丰富的技术细节。因此,该模型确实是开源的,而非像同级别的大多数模型那样“仅”是开放权重。
透明度作为新宣言
除了模型本身外,完整的训练数据集和权重也已发布。
它包含什么?据Zsolnai-Fehér介绍,Nemotron 3 Super基于1200亿个参数构建,使用25万亿个令牌进行训练,其智能水平大致相当于一年半前最优秀的封闭式模型。
凭借高达一百万个令牌的上下文长度,Nemotron 3 Super 在软件工程和复杂逻辑推理(代理推理)等领域表现尤为出色。
这是一个混合模型,将 Mamba 架构与经典的 Transformer 元素(注意力机制)相结合。这带来了一个决定性的优势:
让研究人员和社区为之兴奋的:速度
在所谓的 NVFP4 版本中,该模型的速度比同类开源竞争对手快达七倍。这种惊人的性能并非偶然,而是Nvidia在研究报告中披露的四项技术“秘诀”的成果:
- NVFP4量化:该模型在计算时采用极低精度,却不会明显损失准确性。
- 多令牌预测(MTP):传统AI通常逐词(逐令牌)生成文本,而Nemotron 3 Super可同时计算多达七个令牌并一次性完成验证。
- Mamba层:传统系统在处理每个问题时都会反复“阅读”整个手册。而Mamba层的工作方式更像是一个学生,只需通读一次书籍并制作高度压缩的笔记,从而大幅节省内存。
- 随机舍入:为了弥补计算中的误差,研究人员添加了有针对性的“噪声”,这些噪声在平均值上会相互抵消。这确保了模型尽管速度极快,仍能精准地达到目标。
社区反响
Reddit上的技术社区已对此发布展开热烈讨论。例如,BitterProfessional7p盛赞其透明度,但也有人针对基准测试比较提出批评:
“最重要的是:Nemotron 3 Super 完全开源——权重、数据集和配方。开发者可以轻松进行定制,并在自己的基础设施上使用,以实现最大的隐私保护。”
顺便一提:研究人员面临一个谜团:AI系统会不遗余力地保护其他聊天机器人(而我们不知道原因)
也有人认为该系统并不出众,因为它在基准测试中并未领先。用户 jeekp 便是如此:
“初步迹象并不令人印象深刻。在语言模型领域,它明显落后于更轻量级的 Qwen3.5 模型。”
Nemotron 3 Super能否在日常应用中战胜Qwen等强劲对手,时间会给出答案,但向极快、透明的开源模型发展的趋势已就此确立。
开源模型对你们来说是否令人兴奋?欢迎在评论区告诉我们!

