10.9 C
Берлин
вторник, април 14, 2026

Nvidia пуска първия ИИ модел от този мащаб, който е наистина с отворен код – изследователите и общността се радват на възможностите

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Nvidia разтърсва пазара на изкуствения интелект. Особено в областта на отворения код.

Обикновено технологичните гиганти като Google или OpenAI пазят разработките си в областта на изкуствения интелект в тайна: никой не знае точно с какво са били „хранени“ моделите.

Nvidia нарушава тази традиция и с Nemotron 3 Super предоставя агентски модел, който не само е безплатен, но и с(51-странична документация)с технически подробности. Моделът е действително с отворен код, а не „само“ с отворени тегла, както повечето модели от този мащаб.

Прозрачността като ново послание

Освен самия модел бяха публикувани и пълните набори от данни и тегла за обучението.

Д-р Кароли, изследовател в областта на компютърната графика в Университета във Виена и оператор на YouTube канала(

Какво съдържа?Nemotron 3 Super се базира на 120 милиарда параметри, е обучен с 25 трилиона токена и достига интелигентност, която съответства приблизително на най-добрите затворени модели от преди година и половина, според Zsolnai-Fehér.

С дължина на контекста доедин милион токенаNemotron 3 Super е особено силен в области като софтуерно инженерство и сложна логическа аргументация (Agentic Reasoning).

Това е хибриден модел, който комбинира архитектурата Mamba с класически елементи на Transformer (Attention). Това има едно решаващо предимство:

Това, което вдъхновява изследователите и общностите: скоростта

В така наречената NVFP4-версия моделът е до седем пъти по-бърз от сравними конкуренти с отворен код. Тази огромна производителност не е случайна, а е резултат от четири технически „тайни“, които Nvidia разкрива в изследователския си доклад:

  1. NVFP4-квантизация:Моделът използва изключително ниска прецизност при изчисленията, без да губи осезаемо от точността.
  2. Multi-Token Prediction (MTP):Докато традиционните ИИ пишат дума по дума (токен по токен), Nemotron 3 Super изчислява доседем токена едновременнои ги верифицира на един дъх.
  3. Mamba-Layer:Традиционните системи „четат“ цялото ръководство отново и отново при всеки въпрос. Mamba-Layer функционира по-скоро като студент, който чете книгата веднъж и си прави силно компресирани бележки, което спестява огромно количество памет.
  4. Стохастично закръгляване:За да компенсират неточностите при изчисленията, изследователите добавят целенасочен „шум“, който средно се неутрализира до нула. Това гарантира, че моделът достига целта си с висока точност въпреки високата скорост.

Какво казва общността

В специализираната общност в Reddit пускането вече се обсъжда бурно. BitterProfessional7p например приветства прозрачността, но има и критични гласове по отношение на сравнението с бенчмарка:


Между другото:Изследователите са изправени пред загадка: системите за изкуствен интелект стигат доста далеч, за да защитят други чатботове (и ние не знаем защо)


Други не намират системата за впечатляваща, защото тя не е начело в бенчмарковете. Такъв е и потребителят jeekp:

Дали Nemotron 3 Super ще успее да се наложи в ежедневието срещу силната конкуренция на модели като Qwen, времето ще покаже, но тенденцията към изключително бързи, прозрачни модели с отворен код е окончателно утвърдена.

Интересни ли са за вас моделите с отворен код? Споделете ни в коментарите!

RELATED ARTICLES

Battlefield 6: Сезон 2 достига своя грандиозен финал утре – „Hunter/Prey“ въвежда ново превозно средство, а операциите от BF1...

Battlefield 6 Сезон 2 получава отново огромно количество ново съдържание. Сред новостите са нов игрови режим, ново превозно средство...

Нови попълнения в Steam: Очаква ви една грандиозна седмица, изпълнена с хитове

Тази седмица ви очакват цели 18 изключително вълнуващи нови заглавия. Представяме ви най-интересните PC издания на седмицата.Steam буквално прелива...

Crimson Desert: Патч 1.03 значително улеснява живота ви в отворения свят

Crimson Desert става по-удобна. Новата актуализация до версия 1.03 позволява бързо придвижване по време на катерене и укрепва вашите...