Berechnung der Proteinfaltung
Strukturierte Analyse: „The Hardest Problem AI Ever Solved“
Das Video beleuchtet den Durchbruch von Google DeepMind bei der Lösung des 50 Jahre alten „Proteinfaltungsproblems“. Demis Hassabis erklärt dabei den Übergang von KI-Systemen, die Spiele gewinnen, zu Systemen, die fundamentale wissenschaftliche Fragen beantworten.
1. Wie die Faltung der Proteine berechnet wurde
Ein Protein besteht aus einer Kette von Aminosäuren. Seine Funktion wird jedoch fast ausschließlich durch seine dreidimensionale Form bestimmt.
- Das Problem: Eine Kette aus Aminosäuren kann sich theoretisch auf astronomisch viele Arten falten (Levinthal-Paradoxon). Die herkömmliche Bestimmung einer Struktur mittels Röntgenkristallographie dauerte oft Jahre und kostete Vermögen.
- Die Lösung (AlphaFold): AlphaFold nutzt neuronale Netze, die auf der Beziehung zwischen Aminosäuresequenzen und bereits bekannten 3D-Strukturen trainiert wurden. Die KI betrachtet die Kette als ein physikalisches System und berechnet gleichzeitig die Abstände zwischen den Atomen und die Winkel der Bindungen.
- Der Clou: AlphaFold erreicht eine Genauigkeit, die mit experimentellen Methoden vergleichbar ist, benötigt dafür aber nur Bruchteile von Sekunden.
2. Vergleich mit Origami
Hassabis und die Biologie nutzen oft das Bild von Origami, um die Komplexität zu verdeutlichen:
- Basis-Information: Die Aminosäuresequenz ist wie ein flaches Blatt Papier (eindimensionaler Code).
- Falt-Regeln: Wie beim Origami gibt es physikalische Gesetze, die vorschreiben, wie das „Papier“ geknickt werden kann. Ein einziger falscher Falz führt zu einer völlig anderen (oder funktionslosen) Form.
- Selbstorganisation: Während ein Mensch das Papier faltet, faltet sich das Protein im Körper von selbst. Die KI von DeepMind hat gelernt, diesen „Faltplan“ im Voraus zu sehen, ohne den physikalischen Prozess im Zeitraffer simulieren zu müssen.
3. Die eindeutige Berechnung von Millionen Proteinen
Wie stellt man sicher, dass man nicht nur ein Protein löst, sondern alle?
- Massive Skalierung: Nachdem das Modell AlphaFold 2 validiert war, entschied DeepMind, nicht auf Anfragen von Wissenschaftlern zu warten. Sie ließen die KI über alle 200 Millionen bekannten Proteine der gesamten Biologie (Mensch, Tiere, Pflanzen, Bakterien) laufen.
- Datenbank-Ansatz: Diese Strukturen wurden in der „AlphaFold Protein Structure Database“ frei veröffentlicht. Damit wurde das Problem der Strukturvorhersage für die Wissenschaft praktisch „erledigt“ – man muss nicht mehr rechnen, sondern nur noch nachschlagen.
4. Umkehrung der Fragestellung und DNA-Bezug
Du fragtest nach der Verbindung zwischen DNA und dem Computer-Modell sowie der Umkehrbarkeit:
- Der Weg von der DNA zum Protein:
- Die DNA-Sequenz im Genom ist der Bauplan.
- Diese wird in eine Aminosäuresequenz übersetzt.
- Diese Sequenz gibt man in AlphaFold ein.
- Das Ergebnis ist das gefaltete Protein.
- Möhren (Reverse Engineering): Man kann die Frage umkehren. Wenn man weiß, welche Form ein Protein haben muss (z. B. um an ein Virus anzudocken), kann man heute KI nutzen, um die passende Aminosäuresequenz und somit die dazugehörige DNA-Sequenz künstlich zu entwerfen. Das nennt man De-novo-Proteindesign.
- AlphaGenome: Hassabis erwähnt im Video auch AlphaGenome. Dieses Tool hilft dabei, Mutationen in der DNA direkt mit Veränderungen in der Proteinstruktur zu verknüpfen, um zu verstehen, welche genetischen Fehler Krankheiten auslösen.
Zusammenfassende Tabelle
| Bereich | Methode / Vergleich |
| Eingabe | DNA-Sequenz -> Aminosäurekette |
| Rechenweg | Deep Learning (AlphaFold) berechnet räumliche Atomabstände |
| Origami-Analog | Blatt Papier (Sequenz) wird zum 3D-Objekt (Protein) |
| Ergebnis | 3D-Struktur bestimmt die biologische Funktion |
| Umkehrung | Design neuer DNA für gewünschte Proteinformen möglich |