Neue Studie: Generative KI und das Risiko des Modellautophagie-Syndroms (MAS) für das Internet

Lesezeit: 2 Minuten
Durch Klaus Schmidt
- in
Fragmentierte Internet-Symbole mit Warnzeichen und Störungen

BerlinGenerative KI-Modelle wie GPT-4 von OpenAI und Stable Diffusion von Stability AI können Texte, Code, Bilder und Videos erstellen. Die Schulung dieser Modelle erfordert jedoch so große Datenmengen, dass Entwickler mit Engpässen konfrontiert sind. Da echte Daten immer schwerer zu finden sind, schlagen einige vor,synthetische Daten zur Ausbildung neuer KI-Modelle zu verwenden. Obwohl synthetische Daten kostengünstiger und in unbegrenzten Mengen verfügbar sind, könnten sie erhebliche Nachteile mit sich bringen.

Die Forschergruppe für Digitale Signalverarbeitung der Rice University hat kürzlich erhebliche Risiken dieses Verfahrens entdeckt. Sie bezeichneten das Problem als "Model Autophagy Disorder" (MAD), was zu einem allmählichen Leistungsabfall bei künstlicher Intelligenz führen kann. Sie untersuchten verschiedene Szenarien, um dies besser zu verstehen.

  • Vollsynthetische Schleife: Generationen, die ausschließlich mit synthetischen Daten trainiert wurden.
  • Synthetische Erweiterungsschleife: Generationen, die mit einer Mischung aus synthetischen Daten und einem festen Satz realer Daten trainiert wurden.
  • Neue Daten-Schleife: Generationen, die mit synthetischen Daten und jedes Mal mit einem neuen Satz realer Daten trainiert wurden.

Mit der zunehmenden Verbreitung von synthetischen Daten könnten generative Modelle an Leistungsfähigkeit verlieren. Ohne genügend neue reale Daten erzeugen diese Modelle weniger genaue, einander ähnelnde und manchmal schwer verständliche Ergebnisse. Dieser Abwärtstrend kann die Modelle dauerhaft schädigen.

Meine eigene Sichtweise zeigt weitreichende Auswirkungen. Überlege erst einmal, wie sehr wir auf das Internet für Informationen angewiesen sind. Wenn immer mehr falsche Daten online gestellt werden, werden zukünftige KI-Modelle unwissentlich mehr von diesen gefälschten Inhalten nutzen. Dies erschwert es, neue, echte Daten zu finden. Infolgedessen könnte die allgemeine Qualität und Vertrauenswürdigkeit der KI-Ergebnisse erheblich sinken.

Menschliche Vorurteile können die Situation verschlimmern. Wenn Nutzer nach optisch ansprechenden Ergebnissen suchen, wählen sie möglicherweise nur bestimmte Beispiele aus, was die Vielfalt der Daten verringert. Dies führt zu weniger flexiblen Modellen, die mehr Fehler machen.

KI-Anwendungen in Bereichen wie medizinische Diagnostik, autonomes Fahren und Finanzprognosen basieren auf präzisen und vielfältigen Daten. Minderwertige Daten können zu schwerwiegenden Fehlern führen und das Vertrauen der Menschen in KI-Systeme erschüttern.

Regulatoren und Technologieunternehmen müssen umgehend handeln. Sie sollten strenge Regeln festlegen, wie viel falsche Daten in Trainingssätzen verwendet werden dürfen. Der Zugang zu realen Daten für alle und die Investition in bessere Datentechniken können zur Lösung des Problems beitragen.

Die Zukunft des Internets und das Vertrauen in KI-Systeme machen MAD zu einem ernsten und dringenden Problem, das schnelle und gemeinschaftliche Maßnahmen erfordert.

Die Studie wird hier veröffentlicht:

https://openreview.net/pdf?id=ShjMHfmPs0

und seine offizielle Zitation - einschließlich Autoren und Zeitschrift - lautet

Sina Alemohammad, Josue Casco-Rodriguez, Lorenzo Luzi, Ahmed Imtiaz Humayun, Hossein Babaei, Daniel LeJeune, Ali Siahkoohi, Richard G. Baraniuk. Self-Consuming Generative Models Go MAD. International Conference on Learning Representations (ICLR), 2024; [abstract]
Wissenschaft: Neueste Nachrichten
Weiterlesen:

Diesen Artikel teilen

Kommentare (0)

Kommentar veröffentlichen
NewsWorld

NewsWorld.app ist der kostenlose Premium-Nachrichtenseite in Deutschland. Wir bieten unabhängige und hochwertige Nachrichten, ohne pro Artikel zu berechnen und ohne ein Abonnementmodell. NewsWorld ist der Ansicht, dass allgemeine, geschäftliche, wirtschaftliche, technische und Unterhaltungsnachrichten auf hohem Niveau kostenlos zugänglich sein sollten. Darüber hinaus ist NewsWorld unglaublich schnell und verwendet fortschrittliche Technologie, um Nachrichtenartikel in einem äußerst lesbaren und attraktiven Format für den Verbraucher zu präsentieren.


© 2024 NewsWorld™. Alle Rechte vorbehalten.