Ny studie: MIT-forskare använder stora språkmodeller för att upptäcka avvikelser i komplexa system

Lästid: 2 minuter
Av Juanita Lopez
- i
Abstrakt AI-modell för att identifiera systemavvikelser i data.

StockholmForskare vid MIT har upptäckt att stora språkmodeller (LLM) kan upptäcka problem i komplexa system som vindkraftverk. Traditionella metoder använder djupinlärning för att granska stora mängder tidsseriedata, vilket kräver mycket tid och resurser. Men LLM, som vanligtvis används för uppgifter som textgenerering, kan erbjuda ett snabbare och mer effektivt sätt.

Forskarlaget på MIT utvecklade en ram vid namn SigLLM som omvandlar tidsseriedata till text för användning med språkmodeller. Genom att dra nytta av dessa modellers steg-för-steg-natur, där varje nytt värde baseras på tidigare värden, siktade de på att undvika den kostsamma och komplicerade träningen som krävs för djupa inlärningsmodeller.

Viktiga aspekter av SigLLM:

  • Omvandling av tidsserie-data till textbaserade indata.
  • Implementering utan behov av ytterligare finjustering.
  • Två metoder för avvikelsedetektering: Prompter och Detector.

Prompter-metoden använder förbehandlade data för att direkt identifiera avvikelser, men den genererade många falsklarm, vilket tyder på att uppgiften var för komplex för denna metod. I motsats därtill förutsäger detektor-metoden nästa värde i en tidsserie och markerar betydande avvikelser som möjliga avvikelser. Detektor-metoden visade sig vara mer effektiv och överträffade ofta avancerade AI-modeller på olika datamängder, trots att den inte behövde några ytterligare justeringar.

För närvarande presterar de bästa djupa lärmodellerna bättre än stora språkmodeller (LLMs), vilket visar en tydlig skillnad i resultat. Trots detta kan LLMs hantera tidsseriedata utan att behöva omfattande omträning, vilket gör dem till ett bra alternativ för branscher som saknar specialiserad kunskap inom maskininlärning.

Framtida forskning kan undersöka nya områden.

  • Utforska finjustering för att förbättra modellens prestanda.
  • Förbättra analysens hastighet, som för närvarande tar mellan 30 minuter och två timmar.
  • Förstå de bakomliggande mekanismerna för LLM-baserad avvikelsedetektering för att förbättra deras noggrannhet ytterligare.

Denna forskning kan gynna mer än bara vindkraftparker. Om vi förbättrar detta LLM-baserade system kan det bli användbart inom flera områden, som reparation av stora maskiner och övervakning av satelliter. Genom LLMs förmåga att förklara saker tydligt kan operatörer få bättre förståelse och hantera komplexa system enklare.

Att använda stora språkmodeller (LLMs) kan öka effektiviteten och minska kostnaderna i områden där snabb och korrekt upptäckt av oegentligheter är viktig. Allteftersom MIT-forskare förbättrar sina metoder, innebär användningen av LLMs i komplexa system ett betydande framsteg inom artificiell intelligens.

Studien publiceras här:

NaN

och dess officiella citering - inklusive författare och tidskrift - är

NaN
Vetenskap: Senaste nytt
Läs nästa:

Dela den här artikeln

Kommentarer (0)

Posta en kommentar
NewsWorld

NewsWorld.app är en gratis premium nyhetssida. Vi tillhandahåller oberoende och högkvalitativa nyheter utan att ta betalt per artikel och utan en prenumerationsmodell. NewsWorld anser att allmänna, affärs-, ekonomiska, tekniska och underhållningsnyheter bör vara tillgängliga på en hög nivå gratis. Dessutom är NewsWorld otroligt snabb och använder avancerad teknik för att presentera nyhetsartiklar i ett mycket läsbart och attraktivt format för konsumenten.


© 2024 NewsWorld™. Alla rättigheter reserverade.