Une IA recrée Pac-Man simplement en regardant le jeu en action

copie Pac-Man IA réseaux neurones NVIDIA
| NVIDIA
⇧ [VIDÉO]   Vous pourriez aussi aimer ce contenu partenaire

Le célèbre jeu d’arcade édité par Namco Bandai vient de fêter ses 40 ans. À cette occasion, NVIDIA – société principalement connue pour ses cartes graphiques – a entraîné son système d’intelligence artificielle, GameGAN, de manière à ce qu’elle recrée le jeu Pac-Man uniquement à partir de données visuelles !

Le projet a été réalisé en collaboration avec Namco Bandai. Aucune ligne de code ni aucune image prérendue n’ont été exploités par GameGAN. Le logiciel a simplement été alimenté de données visuelles du jeu en action, avec les frappes de touches de clavier associées. Il a ensuite été capable de recréer le jeu image par image, et celui-ci est tout à fait jouable ! L’entreprise de Santa Clara prévoit d’ailleurs de le mettre prochainement en ligne, sur sa plateforme AI Playground

Un jeu généré par des réseaux de neurones

Le principe du jeu reste le même : Pac-Man doit évoluer dans un labyrinthe, manger des pac-gommes et des fruits, le tout en évitant les fantômes. Bien évidemment, il ne s’agit pas d’une copie conforme : les images sont un peu floues et l’IA n’est pas parvenue à traduire fidèlement le comportement des fantômes, chacun ayant à l’origine été programmé pour agir d’une façon bien spécifique (l’un suit directement Pac-Man, l’autre préfère tendre des embuscades, le troisième se dirige de manière aléatoire, etc.).

Lorsqu’un agent artificiel joue au jeu généré par GameGAN, celui-ci répond aux diverses actions de l’agent en générant de nouvelles images de l’environnement de jeu en temps réel. Les règles ont été assimilées par l’IA simplement en observant le jeu. Un peu à la manière « dont un programmeur humain peut regarder plusieurs parties de Pac-Man sur YouTube et déduire quelles sont les règles du jeu et les reproduire », explique Rev Lebaredian, vice-président de la technologie de simulation chez NVIDIA.

Le logiciel GameGAN – GAN pour generative adversarial network, ou réseau antagoniste génératif – est basé sur un apprentissage dit « non supervisé », autrement dit un apprentissage automatique dont les données ne sont pas étiquetées ; le logiciel doit apprendre sans superviseur, en tâchant de regrouper des objets selon des caractéristiques communes qu’il devra lui-même déterminer. Le principe de base d’un GAN est qu’il se compose de deux réseaux de neurones concurrents : le premier, le générateur, essaie de répliquer les données d’entrée, tandis que le second, le discriminateur, compare le résultat à la source d’origine. Si le résultat n’est pas suffisamment convaincant, les données générées sont rejetées, le générateur ajuste son travail, puis le soumet à nouveau.

IA gameGAN Nvidia Pac-Man
Seung-Wook Kim et ses collaborateurs ont formé GameGAN à partir de 50’000 parties de Pac-Man. Crédits : NVIDIA

Ce n’est pas la première fois qu’une telle IA est utilisée pour générer des mondes virtuels, mais « il s’agit de la première recherche à émuler un moteur de jeu utilisant des réseaux de neurones basés sur GAN », souligne Seung-Wook Kim, chercheur chez NVIDIA et auteur principal du projet. Selon David Ha, chercheur en IA chez Google, c’est aussi la première fois qu’un GAN affiche d’aussi bons résultats dans la « copie » de mondes de jeu.

Il faut dire que le GameGAN de NVIDIA comprend de nouveaux aspects, tels qu’un module de mémoire, qui permet au système de stocker une carte du monde du jeu et de se souvenir de ce qui a déjà été généré. Cela confère au jeu une plus grande cohérence visuelle d’une image à l’autre. GameGAN est également capable de séparer les éléments statiques (les murs du labyrinthe) des éléments dynamiques (les personnages) ; une caractéristique essentielle pour atteindre l’objectif qui vise à utiliser ce type d’IA pour créer de nouveaux niveaux de jeu.

Une nouvelle piste de formation des machines autonomes

Pas moins de 50’000 parties de jeu ont été nécessaires pour l’apprentissage de l’IA ! Mais obtenir ces données de gameplay auprès de joueurs humains n’était pas possible, donc l’équipe a utilisé un agent intelligent pour générer les données. Problème : le logiciel était si doué qu’il n’est presque jamais mort ! « Cela a rendu difficile pour l’IA d’essayer de recréer le jeu en incluant le concept de la mort », explique Sanja Fidler, directrice du laboratoire de recherche de NVIDIA à Toronto.

Par conséquent, dans les premières versions de Pac-Man générées par GameGAN, les fantômes n’atteignaient jamais réellement le personnage principal, mais se contentaient de le suivre à la trace. Comme quoi, les données proposées dans la phase d’apprentissage d’une IA sont vraiment cruciales !

Sur le même sujet : Unreal Engine 5 : un nouveau moteur de jeu vidéo qui offre un spectacle virtuel à la frontière du réel

Le projet n’est pas encore tout à fait abouti et certains éléments du processus doivent encore été peaufinés. Mais ce que vient de réaliser NVIDIA est un aperçu de la façon dont l’IA pourrait à l’avenir être exploitée pour la conception de jeux vidéos. En effet, il suffirait aux développeurs de coder une partie du jeu, puis d’utiliser ce genre de technologie pour créer rapidement des variations ou de nouveaux niveaux. Elle peut également permettre de mixer plusieurs extraits de différents jeux, ce qui offre plus de possibilités aux créateurs.

La conception d’une IA capable d’apprendre les règles d’un monde virtuel simplement en le regardant en action pourrait également trouver tout son intérêt dans la programmation de machines autonomes, qui doivent apprendre les règles du monde réel. Habituellement, ces machines sont formées via un système de simulation, particulièrement long à mettre en œuvre (il faut coder des règles sur la façon dont les objets interagissent et sur le fonctionnement de la lumière dans l’environnement par exemple).

De tels simulateurs pourraient un jour être remplacés par un apprentissage basé sur un GAN. L’IA pourrait par exemple regarder des vidéos de chariots robotiques naviguant dans un entrepôt ou des robots de livraison, puis utiliser ces informations pour concevoir son propre logiciel de navigation. Les possibilités sont presque sans limite : « Nous pourrions éventuellement avoir une IA qui peut apprendre à imiter les règles de conduite, les lois de la physique, simplement en regardant des vidéos et en voyant des agents prendre des mesures dans un environnement », ajoute Sanja Fidler.

Source : NVIDIA

Laisser un commentaire