För AI-jättar är mindre och effektivare modeller ofta bättre

Lästid: 3 minuter
Av Maria Lopez
- i
Mindre och mer effektiva AI-modeller med bakgrund av dollartecken.

Stora teknikföretag och startups koncentrerar sig nu på mindre, mer effektiva AI-modeller enligt WSJ. Ursprungligen siktade de på att bygga mycket stora modeller som OpenAIs GPT-4, som använder triljoner parametrar och kostar över 100 miljoner dollar att utveckla. Nu arbetar de däremot med mindre, billigare modeller med färre parametrar.

Microsoft erbjuder sin Phi-familj av små modeller, som är bara 1/100 av storleken på den fria modellen som används av OpenAI:s ChatGPT. Dessa modeller är billigare att träna och köra, men de levererar fortfarande bra resultat.

Små AI-modeller använder begränsad data och är utformade för specifika uppgifter, vilket gör dem:

Kostnadseffektiv, snabbare svarstid och specialiserad.

Microsofts kommersiella chef, Yusuf Mehdi, angav att det kommer att bli för dyrt att upprätthålla stora AI-modeller över tid.

Mindre modeller kan köras på enheter, vilket innebär att dyra molnbaserade superdatorer inte behövs. Apple vill använda AI i telefoner för att göra dem snabbare och säkrare. Andra teknikföretag gör samma sak.

Kostnads- och prestandafördelar

Microsoft gjorde ursprungligen en stor investering i generativ AI, men insåg att stora modeller var dyrare än förväntat. Mindre modeller som Phi kräver mindre data och datorkraft, vilket gör dem billigare. I år har även Google och uppstickare som Mistral, Anthropic och Cohere lanserat mindre modeller.

Att använda mindre modeller kan avsevärt minska kostnaderna. Yoav Shoham, medgrundare av AI21 Labs, påpekade att dessa modeller kan besvara frågor till en kostnad som är en sjättedel av större modeller. Mindre modeller fungerar väl när de anpassas för specifika dataset, som juridiska dokument eller intern kommunikation, och ger nästan samma kvalitet men till en lägre kostnad.

Viktiga aspekter rörande mindre modeller:

  • Mindre datakrävande
  • Lägre träningskostnader
  • Effektiv för specifika uppgifter

Experian bytte sina AI-chattbottar från att använda stora modeller till mindre sådana. Ali Khan, Chief Data Officer, förklarade att de mindre modellerna fungerade lika bra och samtidigt sparade mycket pengar. Dessa mindre modeller är dessutom mindre benägna att ge felaktiga svar, vilket gör dem mer effektiva.

Nuvarande trender formar vad som sker härnäst.

Utvecklingen av stora AI-modeller har saktat ner, vilket ger mindre modeller möjlighet att förbättras. Sedan OpenAI släppte GPT-4 har det inte skett några stora framsteg med stora modeller. Bristen på ny, högkvalitativ data för träning har orsakat denna avmattning.

Microsoft satsar nu på att göra AI mer effektiv. Sébastien Bubeck, som leder projektet Phi-modellen vid Microsoft, påpekade att det är viktigt att fokusera på effektivitet just nu.

Sammanfattningsvis:

  • Långsamma framsteg för stora modeller
  • Ökat fokus på effektivitet
  • Små modeller som utför specifika uppgifter väl

Även om företagen går i en ny riktning, använder de fortfarande stora modeller. Apple och Microsoft integrerar OpenAI:s teknologi i sina produkter, men det utgör bara en liten del av deras AI-erbjudanden. Apple nämnde också kort sina AI-uppdateringar under en nyligen genomförd presentation.

Övergången till mindre, specialiserade AI-modeller indikerar en förändring från att skapa stora och imponerande demonstrationer till att göra AI användbar och överkomlig för företag. Fokus ligger nu på praktiska användningsområden, vilket gör AI lättillgänglig och effektiv för vardagliga uppgifter.

Artificiell Intelligens: Senaste nytt

Dela den här artikeln

Kommentarer (0)

Posta en kommentar
NewsWorld

NewsWorld.app är en gratis premium nyhetssida. Vi tillhandahåller oberoende och högkvalitativa nyheter utan att ta betalt per artikel och utan en prenumerationsmodell. NewsWorld anser att allmänna, affärs-, ekonomiska, tekniska och underhållningsnyheter bör vara tillgängliga på en hög nivå gratis. Dessutom är NewsWorld otroligt snabb och använder avancerad teknik för att presentera nyhetsartiklar i ett mycket läsbart och attraktivt format för konsumenten.


© 2024 NewsWorld™. Alla rättigheter reserverade.