Robotinlärning förändrar framtiden för allmän automation med heterogena förtränade transformatorer från MIT
StockholmAtt lära robotar olika uppgifter är svårt eftersom de måste fungera bra i en mängd olika miljöer. Vanligtvis innebär detta att man samlar in specifik data för varje robot och uppgift, vilket kräver mycket tid och resurser. Detta gör det utmanande för robotar att anpassa sig till nya situationer. Forskare vid MIT har utvecklat en ny metod för att lösa detta problem.
MIT har utvecklat en ny metod som utnyttjar ett brett spektrum av data från olika källor för att träna robotar. Detta tillvägagångssätt kan förändra hur robotar lär sig genom att minska behovet av specifik data för varje uppgift. Systemet organiserar data från olika områden, såsom simuleringar och verkliga robotaktiviteter, samt från olika typer av inmatning som kamerabilder och sensorer på robotarmar. Detta gör det möjligt för en generativ AI-modell att hantera stora mängder information effektivt.
Deras metod använder Heterogena Förtränade Transformatorer (HPT), vilket är maskininlärningsmodeller som hanterar visuell och proprioceptiv data. De omvandlar denna information till ett format som enkelt kan analyseras tillsammans. Genom den inledande träningen blir robotsystemet mer flexibelt. Systemet blir starkare ju mer data det hanterar och kräver endast lite specifik data för nya uppgifter, vilket ger betydande fördelar.
- Minskar behovet av omfattande datauppsamling för specifika uppgifter
- Ökar robotens anpassningsförmåga till nya uppgifter och miljöer
- Förbättrar den övergripande träningseffektiviteten och prestandan med över 20%
Forskning vid MIT kan få stor betydelse för framtiden. De utvecklar en universell "robot-hjärna" som enkelt kan laddas ner till olika robotplattformar. Detta skulle förenkla integrationen av dessa robotar utan avancerad träning. Idén påminner om den senaste utvecklingen inom språkmodeller, där stora datamängder har lett till förbättringar i förståelse och skapande av mänskligt språk.
Att utforska fler områden kan göra data mer varierad, vilket skulle förbättra HPT:s förmåga inom robotik. Att använda oetiketterad data, på liknande sätt som GPT-4, kan göra robotar ännu mer anpassningsbara. När forskningen fortsätter att utvecklas kan vi se en utveckling mot smartare robotar som är enklare och billigare att utveckla.
Studien publiceras här:
http://dx.doi.org/10.48550/arXiv.2409.20537och dess officiella citering - inklusive författare och tidskrift - är
Lirui Wang, Xinlei Chen, Jialiang Zhao, Kaiming He. Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers. Submitted to arXiv, 2024 DOI: 10.48550/arXiv.2409.20537Dela den här artikeln