top of page

OpenAI enseñó una red neuronal para jugar Minecraft

  • Foto del escritor: Alanars
    Alanars
  • 14 jul 2022
  • 2 Min. de lectura

El modelo aprendió a nadar, cazar animales, comer alimentos y fabricar herramientas de diamantes.


OpenAI, conocido por su herramienta de IA de texto a imagen DALL-E, ha enseñado a una red neuronal a jugar Minecraft con Video PreTraining (VPT). Los investigadores utilizaron un conjunto de datos de video masivo sin etiquetar del juego humano de Minecraft y una pequeña cantidad de datos de contratistas etiquetados.

El modelo puede aprender a fabricar herramientas de diamante, lo que generalmente lleva a los humanos competentes más de 20 minutos (24,000 acciones). Utiliza la interfaz humana nativa de pulsaciones de teclas y movimientos del mouse y "representa un paso hacia agentes generales que usan computadoras".


En particular, OpenAI utilizó los datos para entrenar un modelo de dinámica inversa (IDM), que predice la acción que se está tomando en cada paso del video. Puede usar información pasada y futura para adivinar la acción en cada paso. Luego, el equipo utilizó el IDM capacitado para etiquetar un conjunto de datos mucho más grande de videos en línea y aprender a actuar a través de la clonación conductual.


Entrenado en 70,000 horas de video en línea etiquetado con IDM, el modelo de clonación conductual aprendió a cortar árboles para recolectar troncos, elaborar esos troncos en tablones y luego crear esos tablones en una mesa de elaboración; Según el documento, esta secuencia toma a un humano competente en Minecraft aproximadamente 50 segundos o 1,000 acciones de juego consecutivas.

"Además, el modelo realiza otras habilidades complejas que los humanos a menudo hacen en el juego, como nadar, cazar animales para alimentarse y comer esa comida. También aprendió la habilidad de "saltar pilares", un comportamiento común en Minecraft de elevarse saltando repetidamente y colocando un bloque debajo de ti mismo.

En general, la compañía cree que VPT "allana el camino para permitir que los agentes aprendan a actuar viendo la gran cantidad de videos en Internet". La naturaleza abierta de Minecraft llevó a los investigadores a creer que el método se puede usar en otros dominios similares, por ejemplo, el uso de la computadora.


Obtén más información sobre la investigación aquí.

Comments

Rated 0 out of 5 stars.
No ratings yet

Add a rating

CONTACTO

  • Facebook
  • Twitter
  • Discord

©2024 by NONSENSE

¡Gracias por suscribirte!

bottom of page