Nvidia разтърсва пазара на изкуствения интелект. Особено в областта на отворения код.
Обикновено технологичните гиганти като Google или OpenAI пазят разработките си в областта на изкуствения интелект в тайна: никой не знае точно с какво са били „хранени“ моделите.
Nvidia нарушава тази традиция и с Nemotron 3 Super предоставя агентски модел, който не само е безплатен, но и с(51-странична документация)с технически подробности. Моделът е действително с отворен код, а не „само“ с отворени тегла, както повечето модели от този мащаб.
Прозрачността като ново послание
Освен самия модел бяха публикувани и пълните набори от данни и тегла за обучението.
Д-р Кароли, изследовател в областта на компютърната графика в Университета във Виена и оператор на YouTube канала(
Какво съдържа?Nemotron 3 Super се базира на 120 милиарда параметри, е обучен с 25 трилиона токена и достига интелигентност, която съответства приблизително на най-добрите затворени модели от преди година и половина, според Zsolnai-Fehér.
С дължина на контекста доедин милион токенаNemotron 3 Super е особено силен в области като софтуерно инженерство и сложна логическа аргументация (Agentic Reasoning).
Това е хибриден модел, който комбинира архитектурата Mamba с класически елементи на Transformer (Attention). Това има едно решаващо предимство:
Това, което вдъхновява изследователите и общностите: скоростта
В така наречената NVFP4-версия моделът е до седем пъти по-бърз от сравними конкуренти с отворен код. Тази огромна производителност не е случайна, а е резултат от четири технически „тайни“, които Nvidia разкрива в изследователския си доклад:
- NVFP4-квантизация:Моделът използва изключително ниска прецизност при изчисленията, без да губи осезаемо от точността.
- Multi-Token Prediction (MTP):Докато традиционните ИИ пишат дума по дума (токен по токен), Nemotron 3 Super изчислява доседем токена едновременнои ги верифицира на един дъх.
- Mamba-Layer:Традиционните системи „четат“ цялото ръководство отново и отново при всеки въпрос. Mamba-Layer функционира по-скоро като студент, който чете книгата веднъж и си прави силно компресирани бележки, което спестява огромно количество памет.
- Стохастично закръгляване:За да компенсират неточностите при изчисленията, изследователите добавят целенасочен „шум“, който средно се неутрализира до нула. Това гарантира, че моделът достига целта си с висока точност въпреки високата скорост.
Какво казва общността
В специализираната общност в Reddit пускането вече се обсъжда бурно. BitterProfessional7p например приветства прозрачността, но има и критични гласове по отношение на сравнението с бенчмарка:
„Най-важното е, че Nemotron 3 Super е напълно отворен – тегла, набори от данни и рецепти. Разработчиците могат лесно да го адаптират и да го използват на собствена инфраструктура за максимална поверителност.“
Между другото:Изследователите са изправени пред загадка: системите за изкуствен интелект стигат доста далеч, за да защитят други чатботове (и ние не знаем защо)
Други не намират системата за впечатляваща, защото тя не е начело в бенчмарковете. Такъв е и потребителят jeekp:
»Първите признаци са по-скоро разочароващи. В LM-Arena тя изостава значително от по-леките модели Qwen3.5.«
Дали Nemotron 3 Super ще успее да се наложи в ежедневието срещу силната конкуренция на модели като Qwen, времето ще покаже, но тенденцията към изключително бързи, прозрачни модели с отворен код е окончателно утвърдена.
Интересни ли са за вас моделите с отворен код? Споделете ни в коментарите!

