13.4 C
Берлин
вторник, април 14, 2026

Nvidia пуска първия ИИ модел от този мащаб, който е наистина с отворен код – изследователите и общността се радват на възможностите

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Nvidia разтърсва пазара на изкуствения интелект. Особено в областта на отворения код.

Обикновено технологичните гиганти като Google или OpenAI пазят разработките си в областта на изкуствения интелект в тайна: никой не знае точно с какво са били „хранени“ моделите.

Nvidia нарушава тази традиция и с Nemotron 3 Super предоставя агентски модел, който не само е безплатен, но и с(51-странична документация)с технически подробности. Моделът е действително с отворен код, а не „само“ с отворени тегла, както повечето модели от този мащаб.

Прозрачността като ново послание

Освен самия модел бяха публикувани и пълните набори от данни и тегла за обучението.

Д-р Кароли, изследовател в областта на компютърната графика в Университета във Виена и оператор на YouTube канала(

Какво съдържа?Nemotron 3 Super се базира на 120 милиарда параметри, е обучен с 25 трилиона токена и достига интелигентност, която съответства приблизително на най-добрите затворени модели от преди година и половина, според Zsolnai-Fehér.

С дължина на контекста доедин милион токенаNemotron 3 Super е особено силен в области като софтуерно инженерство и сложна логическа аргументация (Agentic Reasoning).

Това е хибриден модел, който комбинира архитектурата Mamba с класически елементи на Transformer (Attention). Това има едно решаващо предимство:

Това, което вдъхновява изследователите и общностите: скоростта

В така наречената NVFP4-версия моделът е до седем пъти по-бърз от сравними конкуренти с отворен код. Тази огромна производителност не е случайна, а е резултат от четири технически „тайни“, които Nvidia разкрива в изследователския си доклад:

  1. NVFP4-квантизация:Моделът използва изключително ниска прецизност при изчисленията, без да губи осезаемо от точността.
  2. Multi-Token Prediction (MTP):Докато традиционните ИИ пишат дума по дума (токен по токен), Nemotron 3 Super изчислява доседем токена едновременнои ги верифицира на един дъх.
  3. Mamba-Layer:Традиционните системи „четат“ цялото ръководство отново и отново при всеки въпрос. Mamba-Layer функционира по-скоро като студент, който чете книгата веднъж и си прави силно компресирани бележки, което спестява огромно количество памет.
  4. Стохастично закръгляване:За да компенсират неточностите при изчисленията, изследователите добавят целенасочен „шум“, който средно се неутрализира до нула. Това гарантира, че моделът достига целта си с висока точност въпреки високата скорост.

Какво казва общността

В специализираната общност в Reddit пускането вече се обсъжда бурно. BitterProfessional7p например приветства прозрачността, но има и критични гласове по отношение на сравнението с бенчмарка:


Между другото:Изследователите са изправени пред загадка: системите за изкуствен интелект стигат доста далеч, за да защитят други чатботове (и ние не знаем защо)


Други не намират системата за впечатляваща, защото тя не е начело в бенчмарковете. Такъв е и потребителят jeekp:

Дали Nemotron 3 Super ще успее да се наложи в ежедневието срещу силната конкуренция на модели като Qwen, времето ще покаже, но тенденцията към изключително бързи, прозрачни модели с отворен код е окончателно утвърдена.

Интересни ли са за вас моделите с отворен код? Споделете ни в коментарите!

RELATED ARTICLES

Nintendo потвърди датата на излизане на предстоящата ексклузивна игра за Switch

Nintendo официално обяви, чеRhythm Heaven Grooveще излезе на 2 юли 2026 г.Rhythm Heaven Grooveне е виждана от обявяването ѝ...

Вместо да разработва играта: около скандалното ММО „Ashes of Creation“ се появяват нови обвинения, че шефът е водил луксозен...

Отново шум около „Ashes of Creation“: известният ютубър NefasQS обвинява бившия шеф на студиото Стивън Шариф, че е изразходвал...

Crimson Desert: Това, което разработчиците са запазили за бъдещи актуализации, вероятно ще изненада дори най-големите фенове

Pearl Abyss публикува плана за развитие на Crimson Desert до юни 2026 г., който е доста амбициозен.Разработчикът Pearl Abyss...