17.3 C
Berlin
vendredi, mai 24, 2024

Après 50 000 heures : L’intelligence artificielle doit résoudre les problèmes de l’humanité – mais échoue avec Pokémon Rouge

Follow US

80FansJ'aime
908SuiveursSuivre
57SuiveursSuivre

Rares sont les jeux de Gameboy avec les monstres de poche qui ont suscité autant de nostalgie dans la culture populaire. Mais que se passe-t-il lorsque vous utilisez l’intelligence artificielle sur les Pokémon ?

En outre, la technologie (porteuse d’espoir)pourde nombreux domaines de la vie, des voitures à conduite autonome, des robots dans les usines ou tout simplement pour les smartphones et les ordinateurs domestiques.

Mais l’IA peut-elle aussi briller dans une partie de Pokémon Rouge, le jeu classique de la GameBoy?

Un (YouTuber)ayant des connaissances en programmation et un penchant pour les petits monstres s’est penché sur cette question – avec des résultats étonnants.

Comment fonctionne l’expérience Pokémon du YouTuber?

L’IA à l’origine de l’expérience a joué plus de (50.000 heures)Pokémon Rouge, guidée par le développeur de logiciels et YouTuber Peter Whidden.

Comment entraîner une IA pour Pokémon Rouge?Pour (Peter Whidden)l’un des défis consistait à entraîner l’IA à se comporter comme un joueur humain. Selon le YouTuber, le comportement de l’IA est proche de celui d’un joueur humain

Après chaque action, l’IA devrait ainsi contrôler ce qui se passe à l’écran avant de décider de l’action suivante – un peu comme une personne jouant à Pokémon Rouge avec une manette Gameboy devant les yeux. Pour entraîner l’IA le plus rapidement possible, Whidden a fait tourner 40 sessions de test en parallèle.

(Pour son expérience, l'ingénieux bricoleur a utilisé l'émulateur de Gameboy PyBoy. (Joaquin Corbalan/Adobe Stock ; Peter Whidden))
(Pour son expérience, l’ingénieux bricoleur a utilisé l’émulateur de Gameboy PyBoy. (Joaquin Corbalan/Adobe Stock ; Peter Whidden))

L’astuce du système de récompense:Comment apprendre à une IA à jouer à une partie de Pokémon Rouge ? La solution choisie par le YouTuber : pour que l’algorithme poursuive l’objectif de gagner une partie, il a défini un système de récompenses. Chaque fois que l’IA découvre quelque chose de nouveau dans le jeu, elle est récompensée par un point de récompense.

Ce qui est considéré comme « nouveau » était mesuré par le nombre de pixels différents sur l’écran. Mais cette méthode présentait aussi l’inconvénient que le personnage contrôlé par l’IA regardait une animation aquatique au lieu de poursuivre le jeu dans le sens d’une réussite.

Whidden a d’ailleurs présenté son expérience dans une vidéo de 33 minutes sur YouTube.

A quels obstacles l’expérience Pokémon a-t-elle dû faire face?

Lors de la visite du Centre Pokémon, l’IA a stocké certains Pokémon. Cela a entraîné une baisse du niveau général de l’équipe. Suite à cette mauvaise expérience, l’IA a décidé d’éviter le Centre Pokémon. L’inconvénient est que l’équipe n’a plus été soignée à partir de ce moment-là.
Dans sa vidéo YouTube sur l’expérience,

Whidden déclare à ce sujet :

« Elle [l’IA] n’a certes pas d’émotions comme un être humain, mais un seul événement avec une valeur de récompense extrêmement élevée peut influencer son comportement de manière durable. […] Dans ce cas, il suffit qu’elle perde son Pokémon une seule fois. Cela développe une association négative avec l’ensemble du Centre Pokémon, raison pour laquelle l’IA l’évitera complètement dans tous les jeux à venir. « 

Ainsi, Whidden a dû ajuster davantage son système de récompenses.

A propos :Les Pokémon ont récemment fait leur entrée sur le grand écran, comme en témoigne la bande-annonce du film ci-dessous.

L’IA en mode kamikaze:Non moins remarquable : le comportement initial de l’IA en combat. En effet, au début, elle se précipitait dans tous les combats, indépendamment de ses chances de victoire. C’est pourquoi le YouTuber a introduit une pénalité pour les combats perdus

Mais le comportement de l’IA après un combat perdu était vraiment curieux – mais en quelque sorte logique : elle restait alors sur l’écran de combat, ne le lisait tout simplement plus. Et ce, afin de ne pas perdre de points

En face, Whidden s’est réjoui du grand succès de sa vidéo YouTube, qui a atteint plus de 4,3 millions de spectateurs à ce jour (10.11.2023). Il déclare:

« Voir le nombre de personnes qui s’intéressent [à la vidéo] me procure beaucoup de plaisir. « 

Ce que l’IA a bien fait

Mais l’IA n’a pas fait que des bêtises – elle a même été parfois très intelligente. Puis, à un certain endroit, elle utilisait toujours le même chemin de course. Ce qui, à première vue, n’avait pas de sens, s’est avéré astucieux. Car l’IA s’est servie d’un glitch. Le premier Pokémon qu’elle rencontre est immédiatement capturé en un seul jet.

Pouvez-vous améliorer l’expérience Pokémon du YouTubeur ? De plus, Whidden propose dans sa vidéo quelques conseils sur la manière de réussir une telle expérience par vous-même.

Il a par exemple utilisé la méthode PPO (Proximal Policy Optimization). Selon le site (OpenAI)cet algorithme d’apprentissage offre des performances « comparables ou supérieures aux approches actuelles ». En outre, PPO devrait être facile à mettre en œuvre et à régler.

Que pensez-vous de l’expérience du YouTuber ? Et aussi : avez-vous trouvé la vidéo correspondante amusante ? Avez-vous ressenti de la nostalgie en regardant Pokémon Rouge, ou ne jurez-vous que par Digimon, en fronçant le nez à la simple évocation de Pikachu & Co. N’hésitez pas à nous donner votre avis dans les commentaires

RELATED ARTICLES

Call of Duty 2024 maintenant officiellement annoncé : il s’appellera Black Ops 6

CoD : Black Ops 6 a été officiellement annoncé et sera un "nouveau chapitre sombre" de la série.UPDATE À...

La saison 4 de CoD MW3 et Warzone dévoilée : Roadmap, date de lancement, nouvelles armes et maps

La prochaine saison de Call of Duty est dans les starting-blocks avec de nombreux nouveaux contenus - dont un...

Warhammer 40.000 Rogue Trader : nouveau DLC et support des decks Steam

Les fans de l'univers Warhammer 40.000 peuvent se réjouir : Owlcat Games a publié des nouvelles passionnantes pour Warhammer...