Nvidia rewolucjonizuje rynek sztucznej inteligencji. Zwłaszcza w obszarze open source.
Zazwyczaj giganci technologiczni, tacy jak Google czy OpenAI, trzymają swoje osiągnięcia w zakresie sztucznej inteligencji w tajemnicy: nikt nie wie dokładnie, czym karmiono modele.
Nvidia zrywa teraz z tą tradycją i dostarcza wraz z Nemotron 3 Super model agentyczny, który jest nie tylko bezpłatny, ale także wyposażony w(51-stronicową dokumentacją). Model jest więc faktycznie open source, a nie, jak większość modeli tej wielkości, „tylko” open weight.
Przejrzystość jako nowa deklaracja
Oprócz samego modelu opublikowano również kompletne zbiory danych i wagi do szkolenia.
Dr Károly, badacz grafiki komputerowej na Uniwersytecie Wiedeńskim i prowadzący kanał na YouTube(
Co w tym jest?Nemotron 3 Super opiera się na 120 miliardach parametrów, został wytrenowany na 25 bilionach tokenów i osiąga poziom inteligencji odpowiadający mniej więcej najlepszym modelom zamkniętym sprzed półtora roku, jak twierdzi Zsolnai-Fehér.
Dzięki długości kontekstu sięgającej nawetmiliona tokenówNemotron 3 Super jest szczególnie silny w takich obszarach, jak inżynieria oprogramowania i złożone rozumowanie logiczne (Agentic Reasoning).
Jest to model hybrydowy, łączący architekturę Mamba z klasycznymi elementami Transformer (Attention). Ma to decydującą zaletę:
Co zachwyca naukowców i społeczności: szybkość
W tak zwanej wersji NVFP4 model jest nawet siedem razy szybszy niż porównywalne konkurencyjne rozwiązania open source. Ta ogromna wydajność nie jest przypadkiem, lecz wynikiem czterech technicznych „sekretów”, które firma Nvidia ujawnia w raporcie badawczym:
- Kwantyzacja NVFP4:Model wykorzystuje wyjątkowo niską precyzję obliczeń, nie tracąc przy tym zauważalnie na dokładności.
- Prognozowanie wielotokenowe (MTP):Podczas gdy tradycyjne systemy AI piszą słowo po słowie (token po tokenie), Nemotron 3 Super oblicza nawetsiedem tokenów jednocześniei weryfikuje je za jednym zamachem.
- Warstwa Mamba:Tradycyjne systemy przy każdym zapytaniu „czytają” cały podręcznik od nowa. Warstwy Mamba działają raczej jak student, który czyta książkę raz i sporządza wysoce skompresowane notatki, co pozwala na ogromną oszczędność pamięci.
- Zaokrąglanie stochastyczne:Aby skompensować niedokładności w obliczeniach, naukowcy dodają celowy „szum”, który w uśrednieniu znosi się do zera. Dzięki temu model, pomimo dużej prędkości, precyzyjnie osiąga cel.
Co mówi społeczność
W społeczności specjalistów na Reddicie nowa wersja jest już gorąco dyskutowana. Na przykład BitterProfessional7p chwali przejrzystość, ale pojawiają się też krytyczne głosy dotyczące porównania wyników testów porównawczych:
„Najważniejsze jest to, że Nemotron 3 Super jest całkowicie otwarty – wagi, zbiory danych i receptury. Programiści mogą go łatwo dostosować i wykorzystać na własnej infrastrukturze, aby zapewnić maksymalną prywatność.”
A propos:Naukowcy stoją przed zagadką: systemy AI posuwają się dość daleko, aby chronić inne chatboty (i nie wiemy dlaczego)
Inni nie uważają tego systemu za oszałamiający, ponieważ nie zajmuje czołowych miejsc w testach porównawczych. Tak samo uważa użytkownik jeekp:
„Pierwsze oznaki są raczej rozczarowujące. W kategorii LM-Arena plasuje się znacznie za lżejszymi modelami Qwen3.5.”
Czas pokaże, czy Nemotron 3 Super poradzi sobie w codziennym użytkowaniu z silną konkurencją modeli takich jak Qwen, ale trend w kierunku niezwykle szybkich, przejrzystych modeli open source został tym samym ostatecznie ugruntowany.
Czy modele open source są dla Was interesujące? Napiszcie nam o tym w komentarzach!

