7.9 C
Berlin
Čtvrtek, 30 října, 2025

Pravděpodobně největší videoherní klasika je stará téměř 40 let a nyní pomáhá modernímu výzkumu: Super Mario se setkává s umělou inteligencí.

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Není to nový standard, ale přesto je to vzrušující: Mario jako měřítko pro umělou inteligenci

Benchmarky pro modely AI jsou často suché: Matematika, logické testy, komplexní analýzy dat. Výzkumníci z Kalifornské univerzity v San Diegu však zvolili nový přístup – a jednodušeSuper Mario Brosnechali své umělé inteligence hrát, jak uvádíTechSpot.

Zní to jako zajímavý experiment? Možná. Ale rozhodně ukazuje, že načasování je někdy důležitější než čistý výpočetní výkon.

Experiment: GamingAgent jako ovladač umělé inteligence

Výzkumníci z Hao AI Lab na Kalifornské univerzitě v San Diegu vyvinuli framework GamingAgent (GitHub), který umožňuje modelům AI ovládat instalatéra Maria pomocí kódu v jazyce Python.

Jako základ posloužila emulovaná verze hry Super Mario Bros. na NES. Umělé inteligence dostaly jednoduché pokyny, jako napříkladPřeskoč tohoto protivníkaa snímky obrazovky pro orientaci.

Cílem bylo zjistit, jak dobře dokáží modely plánovat své akce a přizpůsobovat je v reálném čase.

Claude 3.7 dominuje – GPT-4o klopýtá

Výsledky vás možná překvapí: Claude 3.7 od Anthropicu vykázal nejlepší výkon. Zvládl přesné skoky, obratně se vyhýbal soupeřům a celkově si počínal sebevědomě

I jeho předchůdceClaude 3.5si vedl dobře, i když ne tak působivě.

Naopak sGPT-4o od OpenAI a Gemini 1.5 Prood společnosti Google to vypadalo úplně jinak. Modely, které jsou skutečně známé svou silnou schopností logického uvažování, se potýkaly s

Často selhávaly v základních herních mechanismech a často nekontrolovaně skákaly do mezer nebo byly zasaženy soupeři.

Timing poráží logiku

Test ukázal, že rychlé reflexy jsou důležitější než složitá logika – alespoň při hře Mario.

Zatímco některé modely umělé inteligence se snaží situace promýšlet, tento přístup vede k dlouhým prodlevám.

Vždyť jen několik milisekund může ve hře Super Mario Bros. znamenat rozdíl mezi úspěšným skokem a neúspěšným pokusem.

Výzkumníci mají podezření, žemyšlenímodelům, jako je GPT-4o, trvá příliš dlouho, než vypočítajípřed svým činem, a proto skočí do prázdna.

Retro hry jako měřítko umělé inteligence?

Zůstává samozřejmě otázkou, nakolik jsou takové testy smysluplné. Model umělé inteligence, který porazí postavu z videohry Mario, není automaticky vhodný pro řešení složitých úloh v reálném světě. Přesto tento experiment přináší zajímavý poznatek: rozhodující není jen výpočetní výkon, ale také rychlé a intuitivní rozhodování.

RELATED ARTICLES

Testování hry The Outer Worlds 2 nás bavilo téměř 50 hodin, takže chceme tuto RPG hru hned začít hrát...

Nemáte 300 hodin času na Baldur's Gate 3, ale chcete hrát propracovanou RPG hru? Pak si v The Outer...

Battlefield 6 Redsec je tady – nový Battle Royale zvyšuje počet hráčů, ale velké ovace se nekonají (AKTUALIZACE)

Nový režim Battle Royale pro BF6 je nyní k dispozici. Komunita však opakovaně přináší málo pozitivní srovnání s Warzone...

Fortnite odhaluje skin Barta Simpsona

Fortnite poskytlo hráčům podrobnější pohled na skin Barta Simpsona, který se v příští mini sezóně objeví v Battle Royale....