Revolucionando el aprendizaje de los robots: el futuro de la automatización versátil según el MIT
MadridEnseñar a los robots a realizar diferentes tareas es complicado porque deben funcionar bien en diversos entornos. El método tradicional consiste en recopilar datos específicos para cada robot y tarea, lo cual requiere mucho tiempo y dinero. Esto dificulta que los robots se adapten a nuevas situaciones. Investigadores del MIT han desarrollado un nuevo enfoque para resolver este problema.
El MIT ha desarrollado un novedoso método que utiliza una amplia variedad de datos de diferentes fuentes para entrenar robots. Este enfoque podría revolucionar la forma en que los robots aprenden al disminuir la necesidad de datos específicos para cada tarea. El sistema organiza información de diversas áreas, como simulaciones y actividades robóticas en el mundo real, y de distintos tipos de entrada, como imágenes de cámaras y sensores en brazos robóticos. Esto permite que un modelo de IA generativa procese grandes volúmenes de información de manera eficiente.
Su enfoque utiliza Transformadores Preentrenados Heterogéneos (HPT), que son modelos de aprendizaje automático capaces de procesar datos visuales y propioceptivos. Estos modelos convierten la información en un formato que se puede analizar con facilidad de manera conjunta. Gracias a este entrenamiento inicial, el sistema de aprendizaje robótico se vuelve más adaptable. A medida que procesa más datos, el sistema se fortalece, requiriendo solamente una pequeña cantidad de datos específicos para nuevas tareas. Esto ofrece ventajas considerables.
- Disminuye la necesidad de recopilar datos específicos para cada tarea
- Mejora la capacidad de los robots para adaptarse a nuevas tareas y entornos
- Aumenta la eficiencia y el rendimiento del entrenamiento en más del 20%
La investigación del MIT podría tener un gran impacto en el futuro. Están desarrollando un "cerebro robótico" universal que se puede descargar fácilmente en diferentes plataformas robóticas. Esto simplificaría la integración de estos robots sin necesidad de un entrenamiento complejo. La idea es similar a los avances recientes en modelos de lenguaje, donde el uso de grandes cantidades de datos ha llevado a mejoras significativas en la comprensión y generación del lenguaje humano.
Explorar más áreas podría diversificar los datos, mejorando así la capacidad de HPT en robótica. Utilizar datos no etiquetados, como lo hace GPT-4, podría hacer que los robots sean aún más flexibles. A medida que avanza la investigación, podríamos presenciar una transición hacia robots más inteligentes que sean más fáciles y económicos de desarrollar.
El estudio se publica aquí:
http://dx.doi.org/10.48550/arXiv.2409.20537y su cita oficial - incluidos autores y revista - es
Lirui Wang, Xinlei Chen, Jialiang Zhao, Kaiming He. Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers. Submitted to arXiv, 2024 DOI: 10.48550/arXiv.2409.20537Compartir este artículo