Geheimnisse der KI: wie das SQUID-Genom Rätsel erklärt
BerlinKünstliche Intelligenz spielt inzwischen eine große Rolle in unserem Leben. Sie unterstützt sogar bei der Biologie und der Erforschung des Lebens. Zum Beispiel kann KI eine immense Menge an Genomdaten schnell durchforsten, um neue Ziele für Behandlungen zu identifizieren. Allerdings verstehen Wissenschaftler nicht, wie die heutigen KI-Modelle zu diesen Schlussfolgerungen gelangen.
Wissenschaftler am Cold Spring Harbor Laboratory (CSHL) haben ein neues Werkzeug namens SQUID entwickelt, das für Surrogate Quantitative Interpretability for Deepnets steht. Dieses Tool erleichtert das Verständnis, wie KI-Modelle Genome analysieren.
Im Vergleich zu anderen Werkzeugen bietet SQUID zuverlässigere Ergebnisse, reduziert Hintergrundgeräusche und ermöglicht präzisere Vorhersagen von genetischen Mutationen.
CSHL-Assistenzprofessor Peter Koo erklärt, dass SQUID aufgrund seines einzigartigen Trainings erfolgreich ist. Die meisten Werkzeuge für die Analyse von KI-Modellen stammen aus der Computer Vision oder der natürlichen Sprachverarbeitung. Diese Methoden sind zwar hilfreich, aber nicht optimal für die Genomik. SQUID sticht hervor, da es auf jahrelangen Erkenntnissen aus der quantitativen Genetik basiert.
SQUID arbeitet, indem es zuerst eine Bibliothek von über 100.000 verschiedenen DNA-Sequenzen erstellt. Anschließend verwendet es ein Programm namens MAVE-NN (Multiplex Assays of Variant Effects Neural Network), um diese Sequenzen zu analysieren. Mit MAVE-NN können Wissenschaftler Tausende virtueller Experimente gleichzeitig durchführen, was ihnen hilft zu verstehen, wie die KI ihre besten Vorhersagen trifft.
Virtuelle Experimente können reale Laborexperimente verbessern und präziser machen. Justin Kinney, Professor und Mitautor der Studie, betont, dass virtuelle Experimente die Arbeit im Labor nicht ersetzen können. Sie liefern jedoch wertvolle Erkenntnisse und unterstützen Wissenschaftler dabei, Ideen zu entwickeln, wie Teile des Genoms funktionieren oder wie eine Mutation einen Patienten beeinflussen könnte.
Es gibt zahlreiche verfügbare KI-Modelle, und ständig werden neue entwickelt. Koo, Kinney und ihr Team hoffen, dass SQUID Wissenschaftlern dabei hilft, die besten Modelle für ihre Forschung auszuwählen. Obwohl das menschliche Genom kartiert wurde, bleibt es schwer verständlich. SQUID könnte helfen, indem es klarere Informationen über die medizinischen Auswirkungen genetischer Entdeckungen liefert.
Die Studie wird hier veröffentlicht:
http://dx.doi.org/10.1038/s42256-024-00851-5und seine offizielle Zitation - einschließlich Autoren und Zeitschrift - lautet
Evan E. Seitz, David M. McCandlish, Justin B. Kinney, Peter K. Koo. Interpreting cis-regulatory mechanisms from genomic deep neural networks using surrogate models. Nature Machine Intelligence, 2024; DOI: 10.1038/s42256-024-00851-5Diesen Artikel teilen