Przełom w szkoleniu robotów: heterogeniczne transformatory w automatyzacji ogólnego przeznaczenia od MIT
WarsawNauka robotów różnych zadań jest trudna, ponieważ muszą one działać dobrze w rozmaitych warunkach. Tradycyjne podejście polega na gromadzeniu specjalnych danych dla każdego robota i zadania, co wymaga dużo czasu i środków finansowych. To utrudnia robotom adaptację do nowych sytuacji. Naukowcy z MIT opracowali nową metodę, aby rozwiązać ten problem.
MIT opracowało innowacyjną metodę wykorzystującą szeroki zakres danych z różnych źródeł do szkolenia robotów. To podejście może zrewolucjonizować sposób, w jaki roboty się uczą, zmniejszając potrzebę stosowania specyficznych danych dla każdego zadania. System porządkuje dane pochodzące z różnych obszarów, takich jak symulacje i rzeczywiste działania robotów, oraz z różnych typów wejść, takich jak obrazy z kamer i czujniki na ramionach robotycznych. Dzięki temu model AI generatywnego może skutecznie przetwarzać ogromne ilości informacji.
Ich podejście wykorzystuje Heterogeniczne Wstępnie Wytrenowane Transformatory (HPT), które są modelami uczenia maszynowego przetwarzającymi dane wizualne i proprioceptywne. Konwertują one informacje w sposób umożliwiający ich wspólną analizę. Dzięki temu wstępnemu szkoleniu system uczenia się robotów staje się bardziej elastyczny. System wzmacnia się, przetwarzając coraz większą ilość danych, potrzebując jedynie niewielkiej ilości specyficznych danych dla nowych zadań. To daje znaczące korzyści.
- Zmniejsza konieczność szeroko zakrojonego zbierania danych specyficznych dla zadania
- Zwiększa zdolność robota do adaptacji w nowych zadaniach i środowiskach
- Podnosi efektywność i wydajność szkolenia o ponad 20%
Badania MIT mogą znacząco wpłynąć na przyszłość. Instytut pracuje nad stworzeniem uniwersalnego „mózgu robota”, który można łatwo pobrać do różnych platform robotycznych. Dzięki temu integracja tych robotów byłaby prostsza, bez potrzeby skomplikowanego szkolenia. Pomysł ten jest zbliżony do ostatnich postępów w modelach językowych, gdzie wykorzystanie dużych ilości danych doprowadziło do znaczących ulepszeń w rozumieniu i tworzeniu języka ludzkiego.
Odkrywanie nowych obszarów może zwiększyć różnorodność danych, co poprawiłoby zdolności HPT w dziedzinie robotyki. Wykorzystanie nieoznakowanych danych, podobnie jak robi to GPT-4, może uczynić roboty bardziej elastycznymi. W miarę postępu badań możemy zaobserwować przesunięcie w kierunku inteligentniejszych robotów, które będą prostsze i tańsze do opracowania.
Badanie jest publikowane tutaj:
http://dx.doi.org/10.48550/arXiv.2409.20537i jego oficjalne cytowanie - w tym autorzy i czasopismo - to
Lirui Wang, Xinlei Chen, Jialiang Zhao, Kaiming He. Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers. Submitted to arXiv, 2024 DOI: 10.48550/arXiv.2409.20537Udostępnij ten artykuł