Quand une IA Joue à Pokémon Rouge : Des progrès étonnamment humains

Gaston Cuny
L'image officielle de Pokémon Rouge

Un développeur de logiciel a commencé un voyage pour entraîner une IA à jouer à Pokémon Version Rouge. 50 000 heures plus tard, elle fait des progrès qui semblent très humains.

Il y a près d’une décennie, Twitch Plays Pokémon a capturé les cœurs, les esprits et les doigts d’Internet. Ce phénomène légendaire a inspiré des reconstitutions par Mizkif et des revivals sur TikTok.

Désormais, le chaos célèbre de Twitch Plays Pokémon a inspiré une nouvelle expérience autour de l’utilisation de l’IA. Nous savons ce que vous pensez, et cela n’a rien à voir avec la fin bizarre de Pokémon Écarlate & Violet.

L’ingénieur logiciel basé à Seattle, Peter Whidden, a entrepris le processus ardu de former une IA pour jouer à Pokémon Version Rouge. Il a publié une vidéo explicative sur sa chaîne YouTube qui a recueilli plus de 2,5 millions de vues.

Dans la vidéo, Whidden explique que l’IA a maintenant joué plus de 50 000 heures au jeu et est capable de capturer des Pokémon et de battre les champions d’Arène. L’IA s’appuie sur un modèle de renforcement pavlovien qui donne des “incitations basées sur des points” pour évoluer les Pokémon, explorer de nouvelles zones, et gagner des combats.

Whidden a été stupéfait par les réalisations de la programmation, mais admet lui-même que “ce qui est plus fascinant que ses réussites, ce sont les manières dont elle échoue”. L’IA interprète le système de récompense à sa manière, ce qui conduit à un comportement étonnamment humain.

En dehors de passer des heures à admirer le paysage, l’IA vit quelque chose de comparable à un traumatisme lors d’un incident dans un Centre Pokémon. Le dépôt accidentel d’un Pokémon dans un CP réduit de moitié le niveau global de son équipe et déclenche une réponse négative qu’elle associe au Centre Pokémon.

“Elle n’a pas d’émotions comme un humain, mais un seul événement avec une valeur de récompense extrême peut encore laisser une empreinte durable sur son comportement”, explique Whidden. “Dans ce cas, perdre son Pokémon une seule fois suffit à former une association négative avec tout le Centre Pokémon, et l’IA l’évitera complètement dans tous les futurs jeux.”

L’IA n’a malheureusement pas le talent de Twitch pour les noms. Son Pokémon de départ est toujours nommé AAAAAAA. L’IA de Whidden n’en est encore qu’aux premiers stades de son aventure Pokémon après avoir été retardée par la grotte frustrante du Mont Sélénite. Il a cependant dit à son public qu’un récent changement dans son système de récompense a permis à l’IA de sortir de la grotte et d’atteindre finalement Azuria.

L’ingénieur logiciel a également rendu public le code de son projet et est “ravi” de voir combien de personnes interagissent avec lui. Un fan astucieux a même réussi à appliquer son code à Pokémon Version Cristal, mais nous ne savons pas comment cela s’est passé dans la Génération 2.