Former l’apprentissage robotique : une nouvelle ère de l'automatisation avec des transformers préentraînés hétérogènes
ParisEnseigner aux robots à accomplir diverses tâches est complexe, car ils doivent fonctionner efficacement dans des environnements variés. Habituellement, cela nécessite de rassembler des données spécifiques pour chaque robot et chaque tâche, un processus coûteux en temps et en ressources. Cette approche limite la capacité d'adaptation des robots à de nouvelles situations. Des chercheurs du MIT ont mis au point une nouvelle méthode pour résoudre ce problème.
Une innovation du MIT révolutionne l'apprentissage des robots en exploitant divers ensembles de données provenant de multiples sources. Cette méthode pourrait transformer le processus d'apprentissage des robots en diminuant la dépendance à des données spécifiques pour chaque tâche. Le système structure des informations provenant de simulations, d'activités robotiques réelles et de différentes sources comme les images de caméras et les capteurs sur les bras robotiques. Cela permet à un modèle d’IA générative de gérer efficacement de vastes volumes de données.
Leur méthode exploite les Transformateurs Préentraînés Hétérogènes (TPH), qui sont des modèles d'apprentissage automatique traitant des données visuelles et proprioceptives. Ils transforment ces informations en un format facilement analysable de manière conjointe. Cette formation initiale rend le système d'apprentissage robotique plus adaptable. Le système se renforce en traitant davantage de données, nécessitant seulement une petite quantité de données spécifiques pour accomplir de nouvelles tâches. Cela offre des avantages significatifs.
- Diminue le besoin de collecter de vastes données spécifiques aux tâches
- Augmente la capacité d'adaptation des robots à de nouvelles tâches et environnements
- Améliore l'efficacité et la performance de l'entraînement de plus de 20%
Explorer de nouveaux domaines pourrait diversifier les données, ce qui améliorerait les compétences de HPT en robotique. L'utilisation de données non étiquetées, à l'instar de GPT-4, pourrait rendre les robots encore plus adaptables. Avec l'avancée de la recherche, nous pourrions assister à l'émergence de robots plus intelligents et plus économiques à développer.
L'étude est publiée ici:
http://dx.doi.org/10.48550/arXiv.2409.20537et sa citation officielle - y compris les auteurs et la revue - est
Lirui Wang, Xinlei Chen, Jialiang Zhao, Kaiming He. Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers. Submitted to arXiv, 2024 DOI: 10.48550/arXiv.2409.20537Partager cet article