Dla gigantów technologicznych mniejsze modele AI to lepszy wybór
Duże firmy technologiczne i startupy koncentrują się teraz na mniejszych, bardziej wydajnych modelach AI według WSJ. Początkowo dążyły do tworzenia bardzo dużych modeli, takich jak GPT-4 od OpenAI, które wykorzystują biliony parametrów i kosztują ponad 100 milionów dolarów. Obecnie pracują nad mniejszymi, tańszymi modelami z mniejszą liczbą parametrów.
Microsoft proponuje swoją serię małych modeli Phi, które są tylko 1/100 rozmiaru darmowego modelu używanego przez ChatGPT firmy OpenAI. Te modele są tańsze w szkoleniu i eksploatacji, a mimo to nadal oferują dobrą wydajność.
Małe modele AI korzystają z ograniczonej ilości danych i są tworzone z myślą o określonych zadaniach, co sprawia, że są:
- Ekonomiczne
- Szybsze w reakcji czasowej
- Specjalistyczne
Szef ds. komercyjnych Microsoftu, Yusuf Mehdi, zauważył, że eksploatacja dużych modeli AI będzie z czasem zbyt kosztowna do utrzymania.
Mniejsze modele mogą działać na urządzeniach, co oznacza, że nie są potrzebne kosztowne superkomputery w chmurze. Apple chce wykorzystać sztuczną inteligencję w telefonach, aby uczynić je szybszymi i bardziej bezpiecznymi. Inne firmy technologiczne również podążają tą ścieżką.
Korzyści finansowe i wydajnościowe
Microsoft początkowo zainwestował dużo w generatywną sztuczną inteligencję, ale zauważył, że duże modele są bardziej kosztowne niż zakładano. Mniejsze modele, takie jak Phi, wymagają mniej danych i mocy obliczeniowej, co sprawia, że są tańsze. W tym roku Google oraz startupy takie jak Mistral, Anthropic i Cohere również wprowadziły na rynek mniejsze modele.
Wykorzystanie mniejszych modeli może znacząco obniżyć koszty. Yoav Shoham, współzałożyciel AI21 Labs, stwierdził, że modele te mogą odpowiadać na pytania przy jednej szóstej kosztów w porównaniu do większych. Mniejsze modele sprawdzają się doskonale, gdy są dostosowane do specyficznych zestawów danych, takich jak dokumenty prawne czy komunikacja wewnętrzna, oferując prawie taką samą jakość za niższą cenę.
Kluczowe informacje dotyczące mniejszych modeli:
21 listopada 2024 · 15:27
USA przodują w innowacjach AI, dystansując Chiny w rankingu Stanforda
Experian zastąpiło swoje chatboty AI, używając mniejszych modeli zamiast większych. Ali Khan, dyrektor ds. danych, stwierdził, że mniejsze modele działają równie dobrze, a także przynoszą znaczne oszczędności finansowe. Dodatkowo mniejsze modele są mniej podatne na popełnianie błędów, co czyni je bardziej efektywnymi.
Obecne trendy wpływają na to, co przyniesie przyszłość.
Postęp w dużych modelach AI spowolnił, co daje szansę mniejszym modelom na rozwój. Od momentu, gdy OpenAI wypuściło GPT-4, nie nastąpiły żadne znaczące postępy w dużych modelach. Spowolnienie to jest wynikiem braku nowych, wysokiej jakości danych do trenowania.
Microsoft koncentruje się obecnie na zwiększaniu efektywności sztucznej inteligencji. Sébastien Bubeck, kierujący projektem modelu Phi w firmie Microsoft, podkreślił, że skupienie się na efektywności jest teraz kluczowe.
Podsumowując:
- Wolne tempo rozwoju dużych modeli
- Zwiększone zainteresowanie efektywnością
- Małe modele dobrze wykonujące specyficzne zadania
Mimo że firmy zmieniają kierunek działania, wciąż korzystają z dużych modeli. Apple i Microsoft wprowadzają technologię OpenAI do swoich produktów, jednak jest to tylko niewielka część ich oferty w zakresie sztucznej inteligencji. Apple wspomniało również krótko o swoich aktualizacjach AI podczas niedawnej prezentacji.
Przejście na mniejsze, wyspecjalizowane modele AI to zmiana z tworzenia dużych, efektownych demonstracji na rzecz uczynienia sztucznej inteligencji przydatną i przystępną cenowo dla firm. Teraz priorytetem są praktyczne zastosowania, co umożliwia łatwiejszy dostęp do AI i jej efektywne wykorzystanie w codziennych zadaniach.
20 listopada 2024 · 17:56
Przełom w AI: Maszyny uczą się rozróżniać tekstury powierzchni dzięki technologii kwantowej
18 listopada 2024 · 14:36
Precyzyjne badanie zachowań myszy dzięki AI i mniejszej liczbie zwierząt w eksperymencie
16 listopada 2024 · 17:49
Badania nad zwiększeniem zaufania pasażerów do autonomicznych pojazdów dzięki XAI i nowym strategiom
Udostępnij ten artykuł