El desafío de diamantes de Minecraft deja perplejos a los creadores de IA

El desafío de diamantes de Minecraft deja perplejos a los creadores de IA

A la mayoría de los nuevos jugadores de Minecraft les lleva minutos descubrir cómo desenterrar los diamantes que son clave para el juego, pero entrenar inteligencia artificial para hacerlo ha resultado más difícil de lo esperado.

Durante el verano, el editor de Minecraft Microsoft y otras organizaciones desafiaron a los codificadores a crear agentes de inteligencia artificial que pudieran encontrar las gemas codiciadas.

La mayoría puede descifrarlo en su primera sesión.

Pero de más de 660 entradas enviadas, ninguna estuvo a la altura.

Los resultados de la competencia MineRL, que se pronuncia como mineral, se anunciarán formalmente el sábado en la conferencia NeurIPS AI en Vancouver, Canadá.

El objetivo había sido ver si el problema podía resolverse sin requerir una gran cantidad de potencia informática.

A pesar de la falta de un ganador, uno de los organizadores dijo que todavía estaba “enormemente impresionada” por algunos de los participantes.
“La tarea que planteamos es muy difícil”, dijo Katja Hofmann, investigadora principal de Microsoft Research. “Encontrar un diamante en Minecraft requiere muchos pasos: desde cortar árboles, hacer herramientas, explorar cuevas y encontrar un diamante.

“Si bien ningún agente enviado ha resuelto completamente la tarea, han progresado mucho y aprendido a hacer muchas de las herramientas necesarias en el camino”.

Diamantes mineros
Minecraft se ha vuelto muy popular desde su lanzamiento en 2011.

Se han vendido más de 180 millones de copias del juego de mundo abierto, y el título tiene más de 112 millones de jugadores activos mensuales.

El diamante es uno de los recursos más importantes en Minecraft, ya que se puede usar para crear armaduras fuertes y armas poderosas.

Sin embargo, para obtener la piedra preciosa, un jugador primero debe completar una serie de otros pasos.

“Si está familiarizado con el juego, no debería tomar más de 20 minutos obtener sus primeros diamantes”, dijo el jugador de Minecraft Jules Portelly a la BBC.

Los participantes solo podían usar una sola unidad de procesamiento de gráficos (GPU) y cuatro días de tiempo de entrenamiento. Para el contexto, los sistemas de inteligencia artificial generalmente necesitan meses o años de tiempo de juego para dominar títulos como StarCraft II.

También se puso a disposición de los participantes un conjunto de datos de Minecraft relativamente pequeño, con 60 millones de cuadros de datos grabados de jugadores humanos, para entrenar sus sistemas.
“Al comienzo de cada episodio se engendraron en un mundo de Minecraft generado por procedimientos”, explicó el Dr. Hofmann.

“Entonces realmente necesitaban aprender el concepto de encontrar recursos, hacer herramientas y encontrar un diamante”.
Los organizadores querían que los programadores crearan programas que aprendieran con el ejemplo, a través de una técnica conocida como “aprendizaje de imitación”.

Esto implica intentar que los agentes de IA adopten el mejor enfoque haciendo que imiten lo que los humanos u otro software hacen para resolver una tarea.

Contrasta con depender únicamente del “aprendizaje de refuerzo”, en el que un agente está capacitado de manera efectiva para encontrar la mejor solución a través de un proceso de prueba y error, sin recurrir a los conocimientos anteriores.
IA para todos
Los investigadores han descubierto que usar solo el aprendizaje por refuerzo a veces puede ofrecer resultados superiores.

Por ejemplo, el programa AlphaGo Zero de DeepMind superó uno de los esfuerzos anteriores del centro de investigación, que utilizó tanto el aprendizaje de refuerzo como el estudio de datos etiquetados del juego humano para aprender el juego de mesa Go.

Pero este enfoque “puro” generalmente requiere mucha más potencia informática, lo que lo hace demasiado costoso para los investigadores que no sean organizaciones grandes o gobiernos.

William Guss, el principal organizador de la competencia y estudiante de doctorado en la Universidad Carnegie Mellon, le dijo a la BBC que el objetivo de la competencia había sido demostrar que “lanzar computación masiva a los problemas no es necesariamente la forma correcta de impulsar el estado de El arte como campo “.

Agregó: “Funciona directamente contra la democratización del acceso a estos sistemas de aprendizaje por refuerzo y deja la capacidad de capacitar agentes en entornos complejos a corporaciones con franjas de cómputo”.

Pero el resultado puede servir para subrayar la ventaja que tienen estas entidades bien financiadas.

Leave a Reply

Your email address will not be published. Required fields are marked *