Mark Zuckerberg: Wie uns KI hilft, Zellen zu verstehen und Krankheiten zu heilen

Ein KI-getriebenes, virtuelles Zellmodell soll den Durchbruch beim Verständnis von Erkrankungen bringen, sagt der Meta-CEO, der Geld in das Projekt steckt.

In Pocket speichern vorlesen Druckansicht 7 Kommentare lesen

(Bild: Eva Redamonti)

Lesezeit: 9 Min.
Von
  • Mark Zuckerberg
  • Priscilla Chan
Inhaltsverzeichnis

Meta-CEO Mark Zuckerberg ist Mitbegründer und Co-Chef der Chan Zuckerberg Initiative (CZI). Er studierte Informatik an der Harvard University, bevor er 2004 nach Palo Alto, Kalifornien, zog, um Facebook zu gründen. Zuckerbergs Frau Priscilla Chan ist Mitbegründerin und Co-Chefin der CZI. Sie arbeitet als Kinderärztin in der Bay Area und erwarb ihren BA in Biologie an der Harvard University und ihren MD an der UC San Francisco (UCSF). Im folgenden Text beschreiben Zuckerberg und Chan ein neues KI-Projekt der CZI, von dem sie sich einen neuen Durchbruch in der Medizin erhoffen.

Als kleinste lebende Einheiten sind Zellen der Schlüssel zum Verständnis von Krankheiten – und doch ist so vieles über sie noch unbekannt. Wir wissen zum Beispiel nicht, wie Milliarden von Biomolekülen wie DNA, Proteine oder Lipide zusammentreffen, um dann gemeinsam zu wirken. Auch wissen wir nicht, wie die vielen Zelltypen in unserem Körper kooperieren. Wir haben deshalb auch nur ein begrenztes Verständnis davon, warum und wie Zellen, Gewebe und Organe krank werden und was nötig ist, damit sie wieder gesunden können.

Künstliche Intelligenz könnte uns künftig helfen, all diese Fragen zu beantworten und das gewonnene Wissen anzuwenden, um die Gesundheit und das Wohlbefinden der Menschen auf der ganzen Welt zu verbessern. Allerdings erst dann, wenn Forscher Zugang zu diesen leistungsstarken neuen Technologien erhalten und sie auch nutzen können.

Stellen wir uns vor, wir hätten die Möglichkeit, jeden Zellzustand und jeden Zelltyp mithilfe von KI-Modellen darzustellen. Eine "virtuelle Zelle" könnte das Aussehen und die bekannten Eigenschaften jedes Zelltyps in unserem Körper simulieren – von den Stäbchen und Zapfen, die das Licht in unserer Netzhaut erkennen, bis zu den Kardiomyozyten, die unser Herz am Schlagen halten.

Wissenschaftler könnten mit einem solchen Simulator vorhersagen, wie Zellen auf bestimmte Umweltbedingungen und Reize reagieren: wie eine Immunzelle auf eine Infektion antwortet, was auf zellulärer Ebene geschieht, wenn ein Kind mit einer seltenen Krankheit geboren wird – oder sogar, wie der Körper eines Patienten auf ein neues Medikament reagieren könnte. Wissenschaftlicher Fortschritt in der Medizin, Patientendiagnosen und Behandlungsentscheidungen würden dadurch schneller, sicherer und effizienter.

Im Rahmen der Chan-Zuckerberg-Initiative helfen wir inzwischen mit, diese medizinischen Daten zu generieren und die notwendige Computerinfrastruktur aufzubauen. Sie soll all das verwirklichen und den Wissenschaftlern die Werkzeuge an die Hand zu geben, die sie benötigen, um neueste Fortschritte in der KI zu nutzen und Krankheiten besser zu bekämpfen.

Fortschritte in der KI in Verbindung mit großen Mengen wissenschaftlicher Daten haben bereits die Struktur von fast allen bekannten Proteinen vorhergesagt. DeepMind trainierte AlphaFold auf der Grundlage von 50 Jahren sorgfältig gesammelter Daten und löste in nur fünf Jahren das Geheimnis der Proteinstrukturen. ESM, ein weiteres KI-System, das bei Meta entwickelt wurde, arbeitet als Protein-Sprachmodell, das nicht auf Texte, sondern auf über 60 Millionen Proteinsequenzen trainiert wurde. Es wird für eine breite Palette von Anwendungen eingesetzt, etwa die Vorhersage von Proteinstrukturen und der Auswirkungen von Mutationen anhand einzelner Sequenzen.

Für ein virtuelles Zellmodell – genauer: ein Zellmodellierungssystem – werden ebenfalls große Datenmengen benötigt. Seit 2016 hat das CZI bereits Forscher auf der ganzen Welt dabei unterstützt, Daten über Zellen und ihre Bestandteile zu generieren und für KI zu beschreiben, die sogenannte Annotation. Werkzeuge zur Integration dieser großen Datensätze werden entwickelt, um sie für Forscher allgemein zugänglich zu machen, damit sie daraus lernen und darauf aufbauen können.

Ein globales Forscherkonsortium hat eine Referenzkarte aller Zelltypen im Körper erstellt, und unser Biohub in San Francisco erstellt Zellatlanten für den gesamten Organismus. Zusammen ergeben diese Datensätze den ersten Entwurf des quelloffenen Human Cell Atlas, der die Zelltypen im Körper von der Entwicklung bis zum Erwachsenenalter aufzeichnen wird. Unser SF Biohub und das Chan Zuckerberg Imaging Institute arbeiten gemeinsam an OpenCell, das die Standorte der verschiedenen Proteine in unseren Zellen kartiert.

Mehr über Künstliche Intelligenz

Forscher nutzen auch Modelle des maschinellen Lernens wie "Geneformer" und "scGPT", um vorhandene große Gen- und Zelldatensätze zu untersuchen. Dazu gehören auch Informationen, die von CELLxGENE generiert wurden, einer Open-Source-Softwareplattform, die die Wissenschafts- und Technologie-Teams des CZI entwickelt haben. Die Erforschung jeder einzelnen Zellart wird so beschleunigt. Mit einem neuen Prototyp eines Datenportals für die Kryo-Elektronentomographie bemüht sich das Institut für Bildgebung des CZI in Zusammenarbeit mit Experten für maschinelles Lernen, eine automatische Annotation von Mikroskopiedaten zu erreichen. Dies wird die Verarbeitungszeit von Monaten oder sogar Jahren auf nur wenige Wochen verkürzen.

Wir wollen die Daten so repräsentativ wie möglich halten, um sicherzustellen, dass wissenschaftliche Durchbrüche allen Menschen zugutekommen. Dazu gehört auch die Einbeziehung pädiatrischer Daten in den vorhandenen Human Cell Atlas, um Lücken in unserem Wissen über die zellulären Mechanismen von Krankheiten zu schließen, die in der Kindheit auftreten. Mit unseren Mitteln für sogenannte Ancestry Networks unterstützen wir auch Forscher, die Referenzdaten über Zellen auf der Grundlage von Gewebeproben von Menschen afrikanischer Herkunft, Latino-Personen, Menschen aus Südostasien sowie indigenen Völkern erfassen. Es sollen Daten über bislang wenig untersuchte Ethnien und Abstammungsvarianten entstehen.

Forschungsteams haben mit diesen gut kuratierten Datensätzen bereits erste Entdeckungen gemacht. Ein Team stellte fest, dass das defekte Gen, das mit Mukoviszidose in Verbindung gebracht wird, von einem Zelltyp exprimiert wird, auf den Wissenschaftler noch nie zuvor gestoßen waren. Eine andere Gruppe identifizierte Atemwegszellen, die am anfälligsten für SARS-CoV-2 sind. Andere Forscher nutzen die Daten, um neue Möglichkeiten für das Gene-Splicing zu finden, mit denen krankheitsverursachende Mutationen in bestimmten Zellen korrigiert werden können.

All diese Entdeckungen sind nur ein erster Schritt bei der Entwicklung von neuen Therapieformen für Krankheiten – und wir glauben, dass KI die Rate möglicher neuer Erkenntnisse in der Forschung in Zukunft erheblich beschleunigen könnte.

Um das virtuelle Zellmodell zu schaffen, bauen wir einen Hochleistungscomputer-Cluster mit mehr als eintausend H100-GPUs auf, der es uns ermöglichen wird, neue KI-Modelle zu entwickeln, die auf verschiedene große Datensätze über Zellen und Biomoleküle trainiert werden. Dazu gehören auch solche, die unseren eigenen Forschern erzeugt werden. Wir hoffen, dass dies die Wissenschaft im Laufe der Zeit in die Lage versetzen wird, jeden Zelltyp sowohl im gesunden als auch krankhaften Zustand zu simulieren. Diese Simulationen lassen sich dann abfragen, um herauszufinden, wie sich schwer fassbare biologische Phänomene wahrscheinlich abspielen – einschließlich der Überlegung, wie Zellen konkret entstehen, wie sie im Körper interagieren und wie genau krankheitsverursachende Veränderungen sie beeinflussen.

Unser Computing-Cluster wird nicht so groß sein wie die im privaten Sektor für kommerzielle Produkte verwendeten. Doch sobald es in Betrieb ist, wird es eines der weltweit größten KI-Cluster für die wissenschaftliche Forschung ohne Profit-Motiv sein. Dies wird eine wichtige Ressource für Forschungsteams sein, die bereit sind, Datensätze auf neue Weise zu nutzen, aber durch die bislang unerschwinglich hohen Kosten für den Zugang zu neuester KI behindert werden. Wie unsere anderen Tools auch werden diese digitalen Zellmodelle und die damit verbundenen Daten und Anwendungen für Forscher weltweit frei zugänglich sein.

Die Generierung dieser Datensätze, der Aufbau des KI-Clusters und die Nutzung von KI für die Biologie sind die Art von multidisziplinären, gemeinschaftlichen Bemühungen, die unsere Arbeit ausmachen sollen.

Unser Biohub-Netzwerk hat Experten aus verschiedenen Disziplinen und Institutionen zusammengebracht, um einige der größten und riskantesten Herausforderungen der Wissenschaft zu bewältigen, die in traditionellen universitären Umgebungen nicht gelöst werden konnten. Durch Projekte wie CELLxGENE haben Forscher auf der ganzen Welt dazu beigetragen, einen Korpus von Einzelzelldaten aufzubauen – ein Beweis dafür, wie effektiv eine gemeinsame Ressource für offene Wissenschaft werden kann, wenn nur mehr Menschen Ressourcen und Fachwissen beisteuern.

Als das CZI im Jahr 2016 seine wissenschaftliche Arbeit aufnahm, setzten wir uns ein großes Ziel: Wir wollten der wissenschaftlichen Community dabei helfen, bis zum Ende dieses Jahrhunderts alle Krankheiten zu heilen, sie zu verhindern oder zumindest zu behandeln. Wir sind davon überzeugt, dass dieses Ziel erreichbar ist und erheblich vorangetrieben werden kann, wenn führende Wissenschaftler und Technologen zusammenarbeiten, um das Beste aus den Möglichkeiten der KI herauszuholen. Wir sollten damit beginnen, die Geheimnisse unserer Zellen zu entschlüsseln. Das könnte zu Forschungsergebnissen führen, die uns helfen, viele der Krankheiten, wie wir sie heute kennen, aus der Welt zu schaffen.

(bsc)