Los robots aprenden a hacer las tareas del hogar viendo YouTube

Los robots aprenden a hacer las tareas del hogar viendo YouTube

El aprendizaje ha sido el santo grial de la robótica durante décadas. Para que estos sistemas prosperen en entornos impredecibles, tendrán que hacer algo más que simplemente responder a la programación: tendrán que adaptarse y aprender. Lo que ha quedado claro cuanto más leo y hablo con expertos es que el verdadero aprendizaje robótico requerirá una combinación de muchas soluciones.

El video es una solución intrigante que ha sido la pieza central de muchos trabajos recientes en el espacio. El año pasado, por esta época, destacamos WHIRL (aprendizaje de robot imitador humano en estado salvaje), un algoritmo desarrollado por CMU y diseñado para entrenar sistemas robóticos al ver una grabación de un ser humano realizando una tarea.

Esta semana, Deepak Pathak, profesor asistente en el Instituto de Robótica CMU presenta VRB (Vision-Robotics Bridge), una evolución hacia WHIRL. Al igual que con su predecesor, el sistema usa un video de un ser humano para demostrar la tarea, pero la actualización ya no requiere que se realice en la misma configuración en la que operará el robot.

LEER  Ecuador asegura $ 40 millones en promesas para un fondo dirigido a nuevas empresas de tecnología climática en África

«Pudimos llevar robots al campus y realizar todo tipo de tareas», dijo el estudiante de doctorado Shikhar Bahl en un comunicado. “Los robots pueden usar este modelo para explorar con curiosidad el mundo que los rodea. En lugar de simplemente agitar los brazos, un robot puede ser más directo con la forma en que interactúa.

El robot monitorea algunas piezas clave de información, incluidos los puntos de contacto y la trayectoria. El equipo usa abrir un cajón como ejemplo. El punto de contacto es el mango y la trayectoria es la dirección en la que se abre. «Después de ver varios videos de humanos abriendo cajones», señala CMU, «el robot puede descubrir cómo abrir cualquier cajón».

Eso sí, no todos los cajones se comportan igual. Los humanos se han vuelto bastante buenos abriendo cajones, pero eso no significa que el gabinete ocasionalmente construido de manera extraña no nos cause problemas. Uno de los principales consejos para mejorar los resultados es crear conjuntos de datos más grandes para el entrenamiento. CMU se basa en videos de bases de datos como Epic Kitchens y Ego4D, el último que contiene «casi 4,000 horas de videos ensimismados de actividades cotidianas de todo el mundo».

LEER  Google apuesta a la IA, Twitter tiene un nuevo CEO y los contratistas de Meta protestan

Bahl señala que hay un gran archivo de posibles datos de entrenamiento que esperan ser monitoreados. “Estamos utilizando estos conjuntos de datos de una manera nueva y diferente”, señala el investigador. «Este trabajo podría permitir que los robots aprendan de la gran cantidad de videos disponibles en Internet y YouTube».

Más contenidos sobre empresas en América Latina

Deja una respuesta