16.9 C
Berlin
poniedziałek, 11 maja, 2026

Nvidia udostępnia pierwszy model AI tej klasy, który jest prawdziwie open source – naukowcy i społeczność cieszą się z nowych możliwości

Follow US

80FaniLubię
908ObserwującyObserwuj
57ObserwującyObserwuj

Nvidia rewolucjonizuje rynek sztucznej inteligencji. Zwłaszcza w obszarze open source.

Zazwyczaj giganci technologiczni, tacy jak Google czy OpenAI, trzymają swoje osiągnięcia w zakresie sztucznej inteligencji w tajemnicy: nikt nie wie dokładnie, czym karmiono modele.

Nvidia zrywa teraz z tą tradycją i dostarcza wraz z Nemotron 3 Super model agentyczny, który jest nie tylko bezpłatny, ale także wyposażony w(51-stronicową dokumentacją). Model jest więc faktycznie open source, a nie, jak większość modeli tej wielkości, „tylko” open weight.

Przejrzystość jako nowa deklaracja

Oprócz samego modelu opublikowano również kompletne zbiory danych i wagi do szkolenia.

Dr Károly, badacz grafiki komputerowej na Uniwersytecie Wiedeńskim i prowadzący kanał na YouTube(

Co w tym jest?Nemotron 3 Super opiera się na 120 miliardach parametrów, został wytrenowany na 25 bilionach tokenów i osiąga poziom inteligencji odpowiadający mniej więcej najlepszym modelom zamkniętym sprzed półtora roku, jak twierdzi Zsolnai-Fehér.

Dzięki długości kontekstu sięgającej nawetmiliona tokenówNemotron 3 Super jest szczególnie silny w takich obszarach, jak inżynieria oprogramowania i złożone rozumowanie logiczne (Agentic Reasoning).

Jest to model hybrydowy, łączący architekturę Mamba z klasycznymi elementami Transformer (Attention). Ma to decydującą zaletę:

Co zachwyca naukowców i społeczności: szybkość

W tak zwanej wersji NVFP4 model jest nawet siedem razy szybszy niż porównywalne konkurencyjne rozwiązania open source. Ta ogromna wydajność nie jest przypadkiem, lecz wynikiem czterech technicznych „sekretów”, które firma Nvidia ujawnia w raporcie badawczym:

  1. Kwantyzacja NVFP4:Model wykorzystuje wyjątkowo niską precyzję obliczeń, nie tracąc przy tym zauważalnie na dokładności.
  2. Prognozowanie wielotokenowe (MTP):Podczas gdy tradycyjne systemy AI piszą słowo po słowie (token po tokenie), Nemotron 3 Super oblicza nawetsiedem tokenów jednocześniei weryfikuje je za jednym zamachem.
  3. Warstwa Mamba:Tradycyjne systemy przy każdym zapytaniu „czytają” cały podręcznik od nowa. Warstwy Mamba działają raczej jak student, który czyta książkę raz i sporządza wysoce skompresowane notatki, co pozwala na ogromną oszczędność pamięci.
  4. Zaokrąglanie stochastyczne:Aby skompensować niedokładności w obliczeniach, naukowcy dodają celowy „szum”, który w uśrednieniu znosi się do zera. Dzięki temu model, pomimo dużej prędkości, precyzyjnie osiąga cel.

Co mówi społeczność

W społeczności specjalistów na Reddicie nowa wersja jest już gorąco dyskutowana. Na przykład BitterProfessional7p chwali przejrzystość, ale pojawiają się też krytyczne głosy dotyczące porównania wyników testów porównawczych:


A propos:Naukowcy stoją przed zagadką: systemy AI posuwają się dość daleko, aby chronić inne chatboty (i nie wiemy dlaczego)


Inni nie uważają tego systemu za oszałamiający, ponieważ nie zajmuje czołowych miejsc w testach porównawczych. Tak samo uważa użytkownik jeekp:

Czas pokaże, czy Nemotron 3 Super poradzi sobie w codziennym użytkowaniu z silną konkurencją modeli takich jak Qwen, ale trend w kierunku niezwykle szybkich, przejrzystych modeli open source został tym samym ostatecznie ugruntowany.

Czy modele open source są dla Was interesujące? Napiszcie nam o tym w komentarzach!

RELATED ARTICLES

W Diablo 4 gracze polują teraz na tajemniczego boga-krowę, ponieważ kawałek surowego mięsa doprowadza społeczność do szału

Ledwie odkryto poziom z krową, a w Diablo 4 czeka już kolejna wielka tajemnica, która czeka na ujawnienie.Zaledwie kilka...

Leon musi zginąć: Resident Evil Requiem niespodziewanie wprowadza obiecany tryb nieskończony

Capcom bez zapowiedzi udostępnia bezpłatną aktualizację, dzięki której możecie poprowadzić Leona przez tryb nieskończony.Od czasu premiery Resident Evil Requiem...

„Bez gwarancji” – główny twórca Star Citizen ma już gotową wymówkę w postaci GTA 6, gdyby Squadron 42 jednak...

W wywiadzie twórca Chris Roberts ujawnia plany dotyczące tego gigantycznego projektu science fiction. Wydaje się, że duży wpływ ma...