5.9 C
Berlin
Neděle, 14 prosince, 2025

Pravděpodobně největší videoherní klasika je stará téměř 40 let a nyní pomáhá modernímu výzkumu: Super Mario se setkává s umělou inteligencí.

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Není to nový standard, ale přesto je to vzrušující: Mario jako měřítko pro umělou inteligenci

Benchmarky pro modely AI jsou často suché: Matematika, logické testy, komplexní analýzy dat. Výzkumníci z Kalifornské univerzity v San Diegu však zvolili nový přístup – a jednodušeSuper Mario Brosnechali své umělé inteligence hrát, jak uvádíTechSpot.

Zní to jako zajímavý experiment? Možná. Ale rozhodně ukazuje, že načasování je někdy důležitější než čistý výpočetní výkon.

Experiment: GamingAgent jako ovladač umělé inteligence

Výzkumníci z Hao AI Lab na Kalifornské univerzitě v San Diegu vyvinuli framework GamingAgent (GitHub), který umožňuje modelům AI ovládat instalatéra Maria pomocí kódu v jazyce Python.

Jako základ posloužila emulovaná verze hry Super Mario Bros. na NES. Umělé inteligence dostaly jednoduché pokyny, jako napříkladPřeskoč tohoto protivníkaa snímky obrazovky pro orientaci.

Cílem bylo zjistit, jak dobře dokáží modely plánovat své akce a přizpůsobovat je v reálném čase.

Claude 3.7 dominuje – GPT-4o klopýtá

Výsledky vás možná překvapí: Claude 3.7 od Anthropicu vykázal nejlepší výkon. Zvládl přesné skoky, obratně se vyhýbal soupeřům a celkově si počínal sebevědomě

I jeho předchůdceClaude 3.5si vedl dobře, i když ne tak působivě.

Naopak sGPT-4o od OpenAI a Gemini 1.5 Prood společnosti Google to vypadalo úplně jinak. Modely, které jsou skutečně známé svou silnou schopností logického uvažování, se potýkaly s

Často selhávaly v základních herních mechanismech a často nekontrolovaně skákaly do mezer nebo byly zasaženy soupeři.

Timing poráží logiku

Test ukázal, že rychlé reflexy jsou důležitější než složitá logika – alespoň při hře Mario.

Zatímco některé modely umělé inteligence se snaží situace promýšlet, tento přístup vede k dlouhým prodlevám.

Vždyť jen několik milisekund může ve hře Super Mario Bros. znamenat rozdíl mezi úspěšným skokem a neúspěšným pokusem.

Výzkumníci mají podezření, žemyšlenímodelům, jako je GPT-4o, trvá příliš dlouho, než vypočítajípřed svým činem, a proto skočí do prázdna.

Retro hry jako měřítko umělé inteligence?

Zůstává samozřejmě otázkou, nakolik jsou takové testy smysluplné. Model umělé inteligence, který porazí postavu z videohry Mario, není automaticky vhodný pro řešení složitých úloh v reálném světě. Přesto tento experiment přináší zajímavý poznatek: rozhodující není jen výpočetní výkon, ale také rychlé a intuitivní rozhodování.

RELATED ARTICLES

Skyrim vychází po 14 letech již posedmé a bizarní trailer vyvolává bouřlivé reakce na internetu.

Na Vánoce dostaneme od Bethesdy – bubny prosím – opět Skyrim!  Tento dlouhodobě populární RPG titul nyní vychází pro...

Lucid Falls vás uvrhne do děsivých nočních můr, ale stále se jedná o vaše sny a vy můžete manipulovat...

Hororová hra Lucid Falls vás nechá prožít noční můry s děsivými monstry a hádankami, které musíte překonat změnami času,...

Mumintroll: Teplo zimy je zimní dobrodružství založené na slavných příbězích o Muminech

Nový příběh o malém Muminkovi se točí kolem přátelství a tolerance. Při putování zimním Muminkovým údolím potkáte nové i...