18.1 C
Berlin
Pátek, 29 května, 2026

Společnost Nvidia vydává první model umělé inteligence této velikosti, který je skutečně open source – výzkumníci a komunita se těší na nové možnosti

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Nvidia rozvíří trh s umělou inteligencí. Zejména v oblasti open source.

Technologičtí giganti jako Google nebo OpenAI obvykle drží své vývoje v oblasti AI pod pokličkou: nikdo přesně neví, čím byly modely krmeny.

Nvidia nyní s touto tradicí láme a s Nemotron 3 Super přináší agentický model, který je nejen zdarma, ale také s(51stránkovou dokumentací). Model je tedy skutečně open source a ne, jako většina modelů jeho velikosti, „pouze“ open weight.

Transparentnost jako nový trend

Kromě samotného modelu byly zveřejněny také kompletní datové sady a váhy pro trénování.

Dr. Károly, výzkumník v oblasti počítačové grafiky na Vídeňské univerzitě a provozovatel YouTube kanálu(

Co v sobě skrývá?Nemotron 3 Super je založen na 120 miliardách parametrů, byl trénován na 25 bilionech tokenů a dosahuje inteligence, která podle Zsolnai-Fehéra odpovídá přibližně nejlepším uzavřeným modelům z doby před rokem a půl.

S délkou kontextu ažmilion tokenůje Nemotron 3 Super obzvláště silný v oblastech, jako je softwarové inženýrství a komplexní logická argumentace (Agentic Reasoning).

Jedná se o hybridní model, který kombinuje architekturu Mamba s klasickými prvky Transformeru (Attention). To má rozhodující výhodu:

Co nadchne výzkumníky a komunity: rychlost

V takzvané verzi NVFP4 je model až sedmkrát rychlejší než srovnatelné open-source konkurenty. Tento enormní výkon není náhoda, ale výsledek čtyř technických „tajemství“, která Nvidia odhaluje ve výzkumné zprávě:

  1. KVantizace NVFP4:Model využívá při výpočtech extrémně nízkou přesnost, aniž by tím znatelně ztratil na přesnosti.
  2. Multi-Token Prediction (MTP):Zatímco konvenční AI píší slovo po slově (token po tokenu), Nemotron 3 Super vypočítává ažsedm tokenů současněa ověřuje je najednou.
  3. Mamba-Layer:Tradiční systémy při každém dotazu „čtou“ celý manuál znovu a znovu. Mamba-Layer funguje spíše jako student, který si knihu přečte jednou a pořídí si vysoce komprimované poznámky, což výrazně šetří paměť.
  4. Stochastické zaokrouhlování:Aby vyrovnali nepřesnosti při výpočtu, přidávají výzkumníci cílený „šum“, který se v průměru navzájem ruší. To zajišťuje, že model dorazí k cíli přesně i přes vysokou rychlost.

Co říká komunita

V odborné komunitě na Redditu se o tomto vydání již živě diskutuje. BitterProfessional7p například chválí transparentnost, ale objevují se i kritické hlasy ohledně srovnání benchmarků:


Mimochodem:Vědci stojí před záhadou: Systémy umělé inteligence jdou docela daleko, aby chránily jiné chatboty (a my nevíme proč)


Jiní tento systém nepovažují za ohromující, protože v benchmarkových testech nevede. Stejný názor má i uživatel jeekp:

Čas ukáže, zda se Nemotron 3 Super dokáže v každodenním životě prosadit proti silné konkurenci modelů jako Qwen, ale trend směřující k extrémně rychlým, transparentním open-source modelům je tím definitivně upevněn.

Zajímají vás open-source modely? Napište nám to do komentářů!

RELATED ARTICLES

Modern Warfare 4 nepřinese revoluci v multiplayeru, ale v této oblasti ještě více předčí konkurenci mezi střílečkami, kde CoD...

Co se týče střelby, málokterá hra se může Call of Duty rovnat. Modern Warfare 4 tento náskok v roce...

Hunt: Showdown přináší svůj první kulomet a přesto do hry skvěle zapadá: „Mohla by to být zatím nejlepší aktualizace,...

9. června odstartuje v Crytekově střílečce typu extraction nová akce Road to Hell. V rámci ní vývojáři mimo jiné...

Konec kompromisů? První čip Intelu určený výhradně pro herní handheldy je oficiálně představen

Společnost Intel představuje s modely Arc G3 a G3 Extreme první procesory, které byly vyvinuty výhradně pro herní handheldy....