Esta IA usó GPT-4 para convertirse en un jugador experto de Minecraft

Esta IA usó GPT-4 para convertirse en un jugador experto de Minecraft

Los investigadores de IA han creado un bot de Minecraft que puede explorar y expandir sus capacidades en el mundo abierto del juego, pero a diferencia de otros bots, este esencialmente ha escrito su propio código a través de prueba y error y mucho Solicitudes GPT-4.

Llamado Voyager, este sistema experimental es un ejemplo de un «agente encarnado», una IA que puede moverse y actuar libremente y con un propósito en un entorno simulado o real. Las IA y los chatbots de tipo asistente personal no tienen que hacer cosas, y mucho menos navegar en un mundo complejo para hacer esas cosas. Pero eso es exactamente lo que un robot doméstico podría hacer en el futuro, por lo que hay mucha investigación sobre cómo podrían hacerlo.

Minecraft es un buen lugar para probar tales cosas porque es una representación muy (muy) aproximada del mundo real, con reglas y física simples y directas, pero también es lo suficientemente complejo y abierto como para lograr mucho o probar. Los simuladores especialmente diseñados también son excelentes, pero tienen sus propias limitaciones.

MineDojo es un marco de simulación construido alrededor de Minecraft, porque no puedes simplemente plantar una IA aleatoria y esperar que descubra qué están haciendo todos esos bloques y cerdos. Sus creadores (muy superpuestos con el equipo de Voyager) recopilaron videos de YouTube, transcripciones, artículos de wiki y numerosas publicaciones de Reddit de r/minecraft, entre otros datos, para que los usuarios puedan crear o refinar una IA. modelo sobre ellos. También permite que estos modelos se evalúen de manera más o menos objetiva al ver qué tan bien hacen cosas como construir una cerca alrededor de una llama o encontrar y extraer un diamante.

LEER  Construyendo un mapa del sistema de salud de EE. UU. con Web Sun de Komodo Health

Viajero sobresale en estas tareas, rindiendo mucho mejor que el único otro modelo que se le acerca, Auto-GPT. Pero tienen un enfoque similar: usan GPT-4 para escribir su propio código sobre la marcha.

Normalmente, solo tiene que entrenar a un modelo con todos esos buenos datos de Minecraft y esperar que descubra cómo luchar contra los esqueletos cuando se pone el sol. Voyager, sin embargo, comienza relativamente ingenuo, y cuando encuentra cosas en el juego, tiene una pequeña conversación interna con GPT-4 sobre qué hacer y cómo.

Dirige la siguiente acción y agrega habilidades a la pila. Créditos de la imagen: MineDojo

Por ejemplo, cae la noche y salen estos esqueletos. El agente tiene una idea general, pero se pregunta: ¿Qué haría un buen jugador de este juego cuando hay monstruos cerca? Bueno, dice GPT-4, si quieres explorar el mundo de manera segura, querrás fabricar y equipar una espada, luego golpear el esqueleto con ella mientras evitas ser golpeado. Y ese sentido general de qué hacer se traduce en objetivos factibles: recolectar piedra y madera, construir una espada en la mesa de trabajo, equiparla y luchar contra un esqueleto.

LEER  Desatando la economía de las mujeres de un billón de dólares

Una vez que se hacen estas cosas, se ingresan en una biblioteca de habilidades generales para que luego, cuando la tarea sea «adentrarse en una cueva para encontrar mineral de hierro», no tenga que volver a aprender a pelear desde cero. Todavía usa GPT, pero usa el GPT-3.5 más barato y rápido, que le dice qué habilidades son más relevantes para una situación dada, por lo que no está tratando de minar el esqueleto y luchar contra el mineral.

Es similar a un agente como Auto-GPT que, ante una interfaz que aún no conoce, debe aprender a orientarse para lograr su objetivo. Pero Minecraft es un entorno mucho más profundo de lo que está acostumbrado a resolver, por lo que un agente especialista como Voyager lo hace mucho mejor. Encuentra más cosas, aprende más habilidades y explora un área mucho más grande que otros robots.

Curiosamente, pero quizás no sorprendentemente, GPT-4 despeja el terreno con GPT-3.5 (es decir, ChatGPT) cuando se trata de generar código útil. Una prueba que reemplazó la primera con la segunda hizo que el agente chocara contra una pared desde el principio, tal vez incluso literalmente, y no mejorara. Il n’est peut-être pas évident de parler aux deux modèles que l’un est beaucoup plus intelligent, mais la vérité est que vous n’avez pas besoin d’être particulièrement intelligent pour mener une conversation apparemment intelligente (demandez-moi comment yo se). La codificación es mucho más difícil y GPT-4 fue una gran actualización allí.

LEER  La búsqueda de Luminoah para reinventar la alimentación por sonda atrae nueva financiación

El propósito de esta investigación no es volver obsoletos a los jugadores de Minecraft, sino encontrar métodos mediante los cuales los modelos de IA relativamente simples puedan mejorar en función de sus «experiencias», a falta de una palabra mejor. Si queremos que los robots nos ayuden en nuestros hogares, hospitales y oficinas, tendrán que aprender y aplicar estas lecciones en acciones futuras.

Puedes leer más sobre Voyager aquí.

Más contenidos sobre empresas en América Latina

Deja una respuesta