Nowe badanie: zaawansowana technologia półprzewodników zwiększa efektywność szkolenia AI i zmniejsza zużycie energii

Czas czytania: 2 minut
Przez Pedro Martinez
- w
Ilustracja zaawansowanych półprzewodników wspomagających rozwój technologii AI.

WarsawNaukowcy z POSTECH i Korea University udoskonalili technologię półprzewodników, wykorzystując Pamięć o Losowym Dostępie Elektromechaniczna (ECRAM), aby poprawić możliwości obliczeń AI. To innowacyjne rozwiązanie pozwala przezwyciężyć ograniczenia obecnego sprzętu cyfrowego, takiego jak procesory CPU i GPU, które mają trudności z nadążeniem za szybkim rozwojem sztucznej inteligencji, w tym aplikacji generatywnych AI.

Oto kilka kluczowych kwestii:

Zespół badawczy składa się z Profesora Seyoung Kim, Kyungmi Noh, Hyunjeong Kwak oraz Profesora Hyung-Min Lee. Urządzenia ECRAM regulują przewodność elektryczną poprzez ruch jonów. Korzystają z trójstykowej struktury, co pozwala na efektywne operacje odczytu i zapisu danych. Zespół stworzył urządzenia ECRAM w formie matrycy 64×64, co stanowi znaczną poprawę w stosunku do poprzedniej matrycy 10×10.

Sprzęt analogowy dostosowuje oporność półprzewodników za pomocą zewnętrznego napięcia lub prądu. Ta metoda umożliwia jednoczesne przetwarzanie zadań AI przez matrycę krzyżową. Chociaż sprzęt analogowy sprawdza się dobrze w przypadku określonych zadań i ciągłych danych, ma trudności z poradzeniem sobie z różnorodnymi wymaganiami dotyczącymi uczenia się i wnioskowania w obliczeniach.

Zespół badawczy rozwiązał te wyzwania poprzez stworzenie urządzeń ECRAM. Urządzenia te regulują przewodnictwo elektryczne za pomocą koncentracji jonów i mają oddzielne ścieżki do odczytu i zapisu danych, zużywając stosunkowo mało energii. Zespół stworzył matrycę 64×64 urządzeń ECRAM, co stanowi największą dotychczas zgłoszoną strukturę. Wyniki badań wykazały doskonałą wydajność elektryczną, niezawodne przełączanie, wysoką skuteczność oraz spójność działania.

Badacze zastosowali zaawansowaną metodę uczenia, znaną jako algorytm Tiki-Taka, na wydajnym sprzęcie. Dzięki temu udało się zwiększyć precyzję w trenowaniu sieci neuronowych AI. Odkryli, że metoda treningu używana przez ich sprzęt pozwala na stabilizację wag i nie obciąża nadmiernie sieci neuronowych. To odkrycie ma kluczowe znaczenie dla potencjalnego udostępnienia tej technologii do celów komercyjnych.

Ta innowacja może zrewolucjonizować obliczenia w sztucznej inteligencji. Cyfrowe układy mają ograniczenia w zakresie mocy i skalowalności. Rozwiązanie analogowe oparte na ECRAM może być bardziej energooszczędne i lepiej skalowalne dla AI. Trójterminalna struktura, która umożliwia operacje o niskim zużyciu energii, jest obiecująca dla zastosowań na dużą skalę.

Profesor Seyoung Kim omówił, w jaki sposób duże matryce i wyspecjalizowane algorytmy AI mogą przewyższać obecne metody cyfrowe pod względem wydajności i zużycia energii. Badania te mogą prowadzić do opracowania nowych technologii szkolenia AI, które będą w stanie obsługiwać bardziej złożone i rozbudowane modele AI.

Badanie otrzymało wsparcie od kilku koreańskich organizacji, takich jak Ministerstwo Handlu, Przemysłu i Energii oraz KEIT. Współpraca między uczelniami a przedsiębiorstwami jest wyrazem silnego zaangażowania w rozwój technologii półprzewodników na potrzeby AI. Ten postęp może wkrótce prowadzić do istotnych zastosowań komercyjnych, jako że AI szybko zdobywa nowe obszary.

Zastosowanie urządzeń ECRAM w sprzęcie analogowym może uczynić obliczenia AI bardziej efektywnymi i skalowalnymi niż w przypadku obecnego sprzętu cyfrowego. Praca zespołu badawczego wskazuje na interesujący kierunek rozwoju technologii AI.

Badanie jest publikowane tutaj:

http://dx.doi.org/10.1126/sciadv.adl3350

i jego oficjalne cytowanie - w tym autorzy i czasopismo - to

Kyungmi Noh, Hyunjeong Kwak, Jeonghoon Son, Seungkun Kim, Minseong Um, Minil Kang, Doyoon Kim, Wonjae Ji, Junyong Lee, HwiJeong Jo, Jiyong Woo, Hyung-Min Lee, Seyoung Kim. Retention-aware zero-shifting technique for Tiki-Taka algorithm-based analog deep learning accelerator. Science Advances, 2024; 10 (24) DOI: 10.1126/sciadv.adl3350
Sztuczna Inteligencja: Najnowsze wiadomości

Udostępnij ten artykuł

Komentarze (0)

Opublikuj komentarz