Robotertraining neu gedacht: Die Zukunft der universellen Automatisierung mit heterogenen vortrainierten Transformern
BerlinForschungserfolg: Roboter anpassungsfähiger machen
Die Schulung von Robotern für unterschiedliche Aufgaben ist eine Herausforderung, da sie in vielen Umgebungen effektiv arbeiten müssen. Traditionell erfordert dies die Erfassung spezieller Daten für jeden Roboter und jede Aufgabe, was zeit- und kostenintensiv ist. Dies erschwert es Robotern, sich an neue Situationen anzupassen. Forschende am MIT haben nun eine neue Methode entwickelt, um dieses Problem zu lösen.
MIT hat eine neuartige Methode entwickelt, die eine Vielzahl von Daten aus unterschiedlichen Quellen nutzt, um Roboter zu trainieren. Dieser Ansatz könnte die Art und Weise revolutionieren, wie Roboter lernen, indem er die Abhängigkeit von spezifischen Daten für jede Aufgabe verringert. Das System organisiert Daten aus verschiedenen Bereichen wie Simulationen und realen Roboteraktivitäten sowie von unterschiedlichen Eingabegeräten wie Kamerabildern und Sensoren an Roboterarmen. Dadurch kann ein generatives KI-Modell große Informationsmengen effektiv verarbeiten.
Ihr Ansatz nutzt Heterogene Vorgebildete Transformer (HPT), maschinelle Lernmodelle, die visuelle und propriozeptive Daten verarbeiten. Diese Informationen werden in ein Format umgewandelt, das eine einfache gemeinsame Analyse ermöglicht. Das anfängliche Training macht das Robotersystem flexibler. Mit der Verarbeitung von mehr Daten wird das System robuster und benötigt nur wenig spezifische Daten für neue Aufgaben. Dies bietet erhebliche Vorteile.
- Verringert den Bedarf an umfangreicher, aufgabenspezifischer Datenerfassung
- Erhöht die Anpassungsfähigkeit von Robotern an neue Aufgaben und Umgebungen
- Verbessert die Effizienz und Leistung des Trainings um mehr als 20%
MITs Forschung könnte die Zukunft erheblich beeinflussen. Die Wissenschaftler arbeiten an der Entwicklung eines universellen "Roboter-Gehirns", das sich mühelos auf verschiedene Roboterplattformen herunterladen lässt. Dies würde die Integration der Roboter erleichtern, ohne dass aufwändige Schulungen erforderlich sind. Die Idee orientiert sich an den jüngsten Fortschritten bei Sprachmodellen, wo große Datenmengen zu bedeutenden Verbesserungen im Verständnis und in der Erzeugung menschlicher Sprache geführt haben.
Die Erforschung weiterer Gebiete könnte die Vielfalt der Daten erhöhen und damit die Fähigkeiten von HPT in der Robotik verbessern. Der Einsatz von nicht gekennzeichneten Daten, ähnlich wie es GPT-4 macht, könnte Roboter noch anpassungsfähiger machen. Mit fortschreitender Forschung könnten wir eine Entwicklung hin zu intelligenteren Robotern erleben, die einfacher und kostengünstiger in der Entwicklung sind.
Die Studie wird hier veröffentlicht:
http://dx.doi.org/10.48550/arXiv.2409.20537und seine offizielle Zitation - einschließlich Autoren und Zeitschrift - lautet
Lirui Wang, Xinlei Chen, Jialiang Zhao, Kaiming He. Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers. Submitted to arXiv, 2024 DOI: 10.48550/arXiv.2409.20537Diesen Artikel teilen