Want to Become a Sponsor? Contact Us Now!🎉

人工智能新闻
人工智能现在可以玩视频游戏了:介绍 Google DeepMind 的 SIMA

人工智能现在可以玩视频游戏了:介绍 Google DeepMind 的 SIMA

Published on

在人工智能 (AI) 的世界里,视频游戏已被证明是 AI 系统的理想测试场地,提供了丰富的学习环境和实时设置以及动态目标。在 AI 和游戏方面的专业知识基础上,Google DeepMind 推出了其最新里程碑:一种名为 SIMA (Scalable Instructable Multiworld Agent) 的通用 AI 代理。SIMA 能够理解自然语言指令,并在各种 3D 虚拟环境中执行任务,这是人工智能领域的一个重大突破。

SIMA: 3D 虚拟环境通用 AI 代理

为了开发 SIMA,Google DeepMind 与八家游戏工作室合作,并在九款不同的视频游戏上训练了该代理,包括《无人深空》和《Teardown》等热门游戏。SIMA 的游戏组合中的每一款游戏都呈现了一个独特的虚拟世界,拥有自己的挑战和需要掌握的技能。从简单的导航和菜单使用到复杂的任务,如采矿或驾驶宇宙飞船,SIMA 都沉浸在各种游戏环境中进行学习和适应。

作为训练过程的一部分,Google DeepMind 记录了人类玩家互动游戏的对话,一个玩家指导,另一个执行指令。这些数据帮助训练 SIMA 理解自然语言指令,并将其与适当的动作相关联。这是一个多功能的 AI 代理。该代理由预训练的视觉模型和一个具有记忆功能的主模型组成,能够生成键盘和鼠标操作来执行指令。

多功能 AI 代理

SIMA 的设计重点是多功能性和可访问性。该代理不需要访问游戏的源代码或专门的 API。它只需要两个输入:屏幕上的视觉效果和用户的简单自然语言指令。这种界面模仿人类与虚拟环境的交互方式,使 SIMA 能够潜在地参与任何虚拟环境。目前,SIMA 的能力正在 600 项基本技能中进行评估,范围从导航和物品交互到菜单使用。该代理可以在大约 10 秒内完成简单任务。

跨游戏的泛化

通过广泛的评估,谷歌 DeepMind 发现,在多个游戏上训练的 SIMA 代理优于在单个游戏上训练的代理。这突出了该代理在不同游戏世界中学习的能力。即使面对一个从未见过的游戏,在多个环境中训练的 SIMA 也表现出色,几乎与专门针对该特定游戏训练的代理的性能相匹配。适应新环境的能力展示了 SIMA 在其训练范围之外运作并导航陌生环境的潜力。Google DeepMind SIMA Benchmarks

推进 AI 代理研究

Google DeepMind 开发 SIMA 标志着创建通用、基于语言的 AI 代理的重要一步。通过在更广泛的环境中进行进一步训练以及集成更先进的模型,SIMA 预计将变得越来越多样化和适应性强。目标是开发能够理解和执行高级语言指令的 AI 系统和代理,为能够有效地协助人类完成各种任务的 AI 铺平道路。

Google DeepMind 致力于推进 AI 代理研究,其动机是创造有助于人们在线上和现实生活中的安全有用的 AI 系统。随着 SIMA 的发展,通用 AI 代理的前景变得更加光明。

结论

Google DeepMind 推出 SIMA 标志着 AI 和游戏领域的重大进步。通过在各种虚拟环境中训练代理并使其能够理解自然语言指令,SIMA 展示了 AI 系统在各个领域变得更加多样化和有用的潜力。通过进一步研究,目标是开发能够执行复杂任务和战略规划的 AI 代理,最终增强人机交互,使 AI 成为日常生活中不可或缺的资产。

Anakin AI - The Ultimate No-Code AI App Builder