Nieuw onderzoek: MIT gebruikt grote taalmodellen om anomalieën in complexe systemen op te sporen

Leestijd: 2 minuten
Door Jeroen Schootbergen
- in
Abstract AI-model voor het detecteren van systeemafwijkingen in gegevens.

AmsterdamOnderzoekers van MIT hebben ontdekt dat grote taalmodellen (LLMs) problemen in complexe systemen zoals windparken kunnen opsporen. Waar traditionele methoden diepe leertechnieken toepassen om enorme hoeveelheden tijdreeksen te analyseren, wat veel tijd en middelen kost, bieden LLMs een snellere en efficiëntere benadering. Vaker gebruikt voor tekstgeneratie, blijken LLMs nu mogelijk een veelbelovende oplossing te zijn.

Het onderzoeksteam van MIT ontwikkelde een kader genaamd SigLLM, dat tijdreeksdata omzet in tekst voor taalmodellen. Ze maakten gebruik van het stapsgewijze karakter van deze modellen, waarin elke nieuwe waarde gebaseerd is op de voorgaande, om zo de dure en complexe training van diepe leermodellen te omzeilen.

Belangrijke Eigenschappen van SigLLM:

  • Omzetting van tijdreeksdata naar tekstgebaseerde input.
  • Implementatie zonder extra fine-tuning.
  • Twee methoden voor anomaliedetectie: Prompter en Detector.

De Prompter-methode maakt gebruik van voorbewerkte gegevens om direct afwijkingen te identificeren, maar genereerde veel valse alarmen, wat aangeeft dat de taak te complex was voor deze methode. Daarentegen voorspelt de Detector-methode de volgende waarde in een tijdreeks en markeert hierbij significante afwijkingen als mogelijke anomalieën. De Detector-methode bleek effectiever te zijn en presteerde vaak beter dan geavanceerde AI-modellen op verschillende datasets, zonder dat er extra aanpassingen nodig waren.

Huidige geavanceerde deep learning modellen presteren nog steeds beter dan grote taalmodellen (LLM's), wat een duidelijk verschil in prestaties laat zien. Echter, LLM's kunnen tijdreeksgegevens verwerken zonder veel opnieuw trainen, waardoor ze een goede optie zijn voor industrieën die niet beschikken over gespecialiseerde machine-learning kennis.

Toekomstig onderzoek zou zich kunnen richten op onontdekte gebieden.

  • Onderzoeken van fine-tuning om de modelprestaties te verbeteren.
  • Versnellen van de analysetijd, die momenteel tussen de 30 minuten en twee uur ligt.
  • Inzicht krijgen in de mechanismen van anomaliedetectie op basis van grote taalmodellen om de nauwkeurigheid verder te verhogen.

Dit onderzoek kan veel meer dan alleen windparken vooruit helpen. Door het verbeteren van dit LLM-gebaseerde systeem, kan het ook nuttig zijn bij het repareren van grote machines en het bewaken van satellieten. De manier waarop LLMs zaken helder kunnen uitleggen, kan operators helpen complexe systemen eenvoudiger te begrijpen en beheren.

Grote-taalmodellen (LLM's) kunnen de efficiëntie verhogen en de kosten verlagen in sectoren waar snelle en nauwkeurige detectie van afwijkingen cruciaal is. Terwijl onderzoekers van MIT hun technieken verbeteren, vormt het gebruik van LLM's in complexe systemen een belangrijke vooruitgang in kunstmatige intelligentie.

De studie is hier gepubliceerd:

NaN

en de officiële citatie - inclusief auteurs en tijdschrift - is

NaN
Wetenschap: Laatste nieuws
Lees meer:

Deel dit artikel

Reacties (0)

Plaats een reactie
NewsWorld

NewsWorld.app is dé gratis premium nieuwssite van Nederland. Wij bieden onafhankelijk en kwalitatief hoogwaardig nieuws zonder daarvoor geld per artikel te rekenen en zonder abonnementsvorm. NewsWorld is van mening dat zowel algemeen, zakelijk, economisch, tech als entertainment nieuws op een hoog niveau gratis toegankelijk moet zijn. Daarbij is NewsWorld razend snel en werkt het met geavanceerde technologie om de nieuwsartikelen in een zeer leesbare en attractieve vorm aan te bieden aan de consument. Dus wil je gratis nieuws zonder betaalmuur (paywall), dan ben je bij NewsWorld aan het goede adres. Wij blijven ons inzetten voor hoogwaardige gratis artikelen zodat jij altijd op de hoogte kan blijven!


© 2024 NewsWorld™. Alle rechten voorbehouden.