La IA puede jugar a videojuegos ahora: Presentando SIMA de Google DeepMind
Published on
En el mundo de la inteligencia artificial (IA), los videojuegos han demostrado ser un campo de pruebas ideal para los sistemas de IA, ofreciendo un entorno de aprendizaje rico con configuraciones en tiempo real y objetivos dinámicos. Basándose en su experiencia en IA y juegos, Google DeepMind ha presentado su último hito: un agente de IA versátil llamado SIMA (Scalable Instructable Multiworld Agent). SIMA es capaz de entender instrucciones en lenguaje natural y realizar tareas en una variedad de entornos virtuales 3D, lo que lo convierte en un avance significativo en el campo de la IA.
SIMA: Agente de IA generalista para entornos virtuales 3D
Para desarrollar SIMA, Google DeepMind se asoció con ocho estudios de juegos y entrenó al agente en nueve videojuegos diferentes, incluidos títulos populares como No Man's Sky y Teardown. Cada juego en el portafolio de SIMA presenta un mundo virtual único con su propio conjunto de desafíos y habilidades a dominar. Desde la simple navegación y el uso de menús hasta tareas complejas como la extracción de recursos o el pilotaje de una nave espacial, SIMA se sumergió en diversos entornos de juego para aprender y adaptarse.
Como parte del proceso de entrenamiento, Google DeepMind grabó pares de jugadores humanos interactuando con los juegos, donde uno de los jugadores daba instrucciones y el otro las ejecutaba. Estos datos ayudaron a entrenar a SIMA para entender instrucciones en lenguaje natural y correlacionarlas con las acciones apropiadas.Aquí está la traducción al español del archivo markdown:
Acciones en el juego
El agente consta de modelos de visión pre-entrenados y un modelo principal con memoria, lo que le permite generar acciones de teclado y mouse para ejecutar las instrucciones.
Un agente de IA versátil
El diseño de SIMA prioriza la versatilidad y la accesibilidad. El agente no requiere acceso al código fuente del juego o APIs especializadas. Solo necesita dos entradas: los visuales en pantalla y las instrucciones sencillas y en lenguaje natural del usuario. Esta interfaz imita la forma en que los humanos interactúan con entornos virtuales, lo que permite que SIMA pueda participar potencialmente en cualquier entorno virtual. Actualmente, las capacidades de SIMA se evalúan en 600 habilidades básicas, que van desde la navegación y la interacción con objetos hasta el uso de menús. El agente realiza tareas sencillas en aproximadamente 10 segundos.
https://t.co/qz3IxzUpto (opens in a new tab) pic.twitter.com/02Q6AkW4uq
— Google DeepMind (@GoogleDeepMind) March 13, 2024
Generalización a través de juegos
A través de extensas evaluaciones, Google DeepMind encontró que los agentes SIMA entrenados en múltiples juegos superaron a los agentes entrenados en juegos individuales. Esto resalta la capacidad del agente para generalizar los aprendizajes a través de diferentes mundos de juego. Incluso cuando se enfrenta a un juego no visto, SIMA entrenado en múltiples entornos se desempeñó notablemente bien, casi igualando el rendimiento de un agente específicamente entrenado en ese juego en particular. La capacidad de adaptarse a nuevos entornos demuestra el potencial de SIMA para operar más allá de su entrenamiento y navegar por lo desconocido.
Avanzando en la investigación de agentes de IA
El desarrollo de SIMA por parte de Google DeepMind marca un paso importante hacia la creación de agentes de IA generalistas y dirigidos por el lenguaje. Con un entrenamiento más amplio en una gama más amplia de entornos y la integración de modelos más avanzados, se espera que SIMA se vuelva cada vez más versátil y adaptable. El objetivo es desarrollar sistemas y agentes de IA capaces de comprender y ejecutar instrucciones de lenguaje de alto nivel, allanando el camino para una IA que pueda ayudar eficazmente a los humanos en diversas tareas.
El compromiso de Google DeepMind con el avance de la investigación de agentes de IA está impulsado por el deseo de crear sistemas de IA que sean útiles y seguros para las personas en línea y en escenarios del mundo real. A medida que avanza el desarrollo de SIMA, el potencial de una nueva ola de agentes de IA generalistas se vuelve más prometedor.
Conclusión
La introducción de SIMA por parte de Google DeepMind señala un avance significativo en el campo de la IA y los juegos. Al entrenar al agente en una diversidad de entornos virtuales y permitirle comprender instrucciones en lenguaje natural, SIMA demuestra el potencial de los sistemas de IA para volverse más versátiles y útiles en diversos dominios. Con más investigación, el objetivo es desarrollar agentes de IA capaces de ejecutar tareas complejas y planificación estratégica, mejorando así la interacción humano-IA y permitiendo que la IA se convierta en un activo invaluable en la vida cotidiana.