L'IA peut maintenant jouer à des jeux vidéo : Présentation de SIMA de Google DeepMind
Published on
Dans le monde de l'intelligence artificielle (IA), les jeux vidéo se sont avérés être un terrain d'essai idéal pour les systèmes d'IA, offrant un environnement d'apprentissage riche avec des paramètres en temps réel et des objectifs dynamiques. S'appuyant sur leur expertise en IA et en jeux, Google DeepMind a dévoilé leur dernière réalisation : un agent IA polyvalent appelé SIMA (Scalable Instructable Multiworld Agent). SIMA est capable de comprendre les instructions en langage naturel et d'effectuer des tâches dans une variété d'environnements virtuels 3D, ce qui en fait une avancée significative dans le domaine de l'IA.
SIMA : Agent IA généraliste pour les environnements virtuels 3D
Pour développer SIMA, Google DeepMind s'est associé à huit studios de jeux et a entraîné l'agent sur neuf jeux vidéo différents, notamment des titres populaires comme No Man's Sky et Teardown. Chaque jeu du portefeuille de SIMA présente un monde virtuel unique avec son propre ensemble de défis et de compétences à maîtriser. De la simple navigation et de l'utilisation des menus aux tâches complexes comme l'extraction de ressources ou le pilotage d'un vaisseau spatial, SIMA a été immergé dans des environnements de jeu diversifiés pour apprendre et s'adapter.
Dans le cadre du processus d'entraînement, Google DeepMind a enregistré des paires de joueurs humains interagissant avec les jeux, l'un donnant des instructions et l'autre les exécutant. Ces données ont aidé à entraîner SIMA à comprendre les instructions en langage naturel et à les corréler avec les actions appropriées.
Un agent IA polyvalent
La conception de SIMA privilégie la polyvalence et l'accessibilité. L'agent n'a pas besoin d'accéder au code source d'un jeu ou à des API spécialisées. Il a seulement besoin de deux entrées : les visuels à l'écran et les instructions simples et en langage naturel de l'utilisateur. Cette interface imite la façon dont les humains interagissent avec les environnements virtuels, permettant à SIMA de potentiellement s'engager dans n'importe quel cadre virtuel. Actuellement, les capacités de SIMA sont évaluées sur 600 compétences de base, allant de la navigation et de l'interaction avec les objets à l'utilisation des menus. L'agent effectue des tâches simples en environ 10 secondes.
https://t.co/qz3IxzUpto (opens in a new tab) pic.twitter.com/02Q6AkW4uq
— Google DeepMind (@GoogleDeepMind) March 13, 2024
Généralisation à travers les jeux
Grâce à des évaluations approfondies, Google DeepMind a constaté que les agents SIMA formés sur plusieurs jeux surpassaient les agents formés sur des jeux individuels. Cela met en évidence la capacité de l'agent à généraliser les apprentissages à travers différents mondes de jeu. Même face à un jeu jamais vu, SIMA formé dans de multiples environnements a obtenu des performances remarquables, presque égales à celles d'un agent spécifiquement formé sur ce jeu particulier. La capacité à s'adapter à de nouveaux environnements démontre le potentiel de SIMA à opérer au-delà de son entraînement et à naviguer dans l'inconnu.Voici la traduction française du fichier "iar challenges".
Faire progresser la recherche sur les agents IA
Le développement de SIMA par Google DeepMind marque une étape importante vers la création d'agents IA généralistes, pilotés par le langage. Avec un entraînement plus poussé dans une gamme plus large d'environnements et l'intégration de modèles plus avancés, on s'attend à ce que SIMA devienne de plus en plus polyvalent et adaptable. L'objectif est de développer des systèmes et des agents IA capables de comprendre et d'exécuter des instructions en langage naturel de haut niveau, ouvrant la voie à une IA capable d'assister efficacement les humains dans diverses tâches.
L'engagement de Google DeepMind dans la recherche sur les agents IA est motivé par le désir de créer des systèmes IA utiles et sûrs pour les personnes en ligne et dans des scénarios du monde réel. À mesure que le développement de SIMA progresse, le potentiel d'une nouvelle vague d'agents IA généralistes devient plus prometteur.
Conclusion
L'introduction de SIMA par Google DeepMind signale une avancée significative dans le domaine de l'IA et du jeu. En entraînant l'agent sur une grande diversité d'environnements virtuels et en lui permettant de comprendre les instructions en langage naturel, SIMA démontre le potentiel des systèmes IA à devenir plus polyvalents et utiles dans divers domaines. Avec des recherches plus poussées, l'objectif est de développer des agents IA capables d'exécuter des tâches complexes et de planifier stratégiquement, améliorant ainsi l'interaction homme-IA et permettant à l'IA de devenir un atout inestimable dans la vie quotidienne.