Mit statistischen Methoden den Krankheitsverlauf vorhersehen
Eine Unterzuckerung kommt bei einem Diabetiker meist nicht zufällig. Genauso wenig wie ein Börsenkurs ohne Grund abstürzt. Zumindest theoretisch ist deshalb auch beides vorhersehbar. In der Praxis gelingen derartige Prognosen bisher allerdings nur in den seltensten Fällen. Wenn Alexander Marx mit seinem Projekt Erfolg hat, wird sich das für Kinder mit Typ 1 Diabetes in Zukunft aber ändern: «Wir arbeiten an Vorhersagemodellen, die frühzeitig erkennen sollen, ob in der Nacht eine Unterzuckerung droht», erklärt der Fellow am ETH AI Center. «Wenn sich Kinder am Tag stark körperlich betätigen, kann ihr Blutzuckerspiegel im Schlaf unter eine kritische Schwelle fallen. Mit einem verlässlichen Prognosemodell liesse sich dieses Risiko vermeiden.»
Ursache-Wirkungs-Netzwerke sichtbar machen
Marx befasst sich mit dieser Fragestellung in der Forschungsgruppe für medizinische Datenwissenschaften von Julia Vogt. «Ich komme mehr aus der theoretischen Ecke und habe bisher vor allem mit künstlich erzeugten Daten gearbeitet. Das AI Center hat den Anspruch, Theorie und Praxis zusammenzuführen. Das finde ich spannend. Ich muss jetzt die theoretischen Konzepte auch mit realen Daten zum Funktionieren bringen.»
Sein wissenschaftliches Rüstzeug hat sich Marx an der Universität des Saarlandes im deutschen Saarbrücken erarbeitet. Nach einem Masterabschluss in Bioinformatik befasste er sich am dort ansässigen Max Planck Institut für Informatik im Rahmen seiner Doktorarbeit mit Causal Discovery. Mit diesen statistischen Methoden lassen sich aus Beobachtungsdaten sogenannte kausale Graphen erstellen, die Ursache-Wirkungs-Netzwerke sichtbar machen.
Aus Zusammenhängen Vorhersagen ableiten
Dabei werden beispielsweise aus Umfragedaten alle Faktoren eruiert, bei denen ein Wirkungszusammenhang mit einer bestimmten Grösse vermutet wird. Ein allgemeines Beispiel wäre die Abhängigkeit des Einkommens einer Person von Alter, Wohnort, Geschlecht, Bildung, Zivilstand oder Kinderzahl. Auf Basis der gefundenen Zusammenhänge können dann Vorhersagen für Personen, die nicht befragt wurden, gemacht werden. Dafür müssen nicht einmal die gesamten Abhängigkeitsketten bekannt sein, wie Marx präzisiert. Es reicht, die kleinste Menge an Faktoren zu eruieren, die für eine Prognose ausreicht.
Von den synthetischen Daten in die klinische Realität
Marx hat mit diesen Methoden und mit Unterstützung von künstlicher Intelligenz unter anderem anhand von simulierten Daten untersucht, wie die Aktivitäten von etwa 500 selektierten Genen in einer menschlichen Zelle zusammenhängen. Im Idealfall kann man diese Verfahren in Zukunft so skalieren, sodass sie alle rund 25'000 Gene einer Zelle miteinbeziehen können. Derartige Computer-Analysen von Gennetzwerken würden der biologischen und der medizinischen Forschung einfach und schnell ein umfassendes Verständnis der Vorgänge in einer Zelle eröffnen. Um das Gleiche mit Laborexperimenten zu erreichen, wäre ein enormer Aufwand nötig. Es müsste nämlich jedes Gen einzeln mit gentechnologischen Werkzeugen abgeschaltet und dann die Auswirkungen auf die Aktivität aller anderen Gene gemessen werden.
Für die Projekte, die Marx am AI Center in Angriff nimmt, muss er die Causal-Discovery-Methoden auf ein neues Komplexitätsniveau heben. Anstelle von vollständigen Beobachtungsdatensätzen oder synthetischen Daten, wie bei der Genexpression, arbeitet er jetzt mit echten Daten aus der klinischen Praxis. Das macht die Aufgabenstellung markant schwieriger, wie der Informatiker schon bald festgestellt hat: «In der Realität fehlen häufig einzelne Informationen, Messwerte oder ganze Datensätze und die Erhebung unterscheidet sich auch immer von Spital zu Spital und manchmal sogar von Arzt zu Arzt.»
Nicht-relevante Korrelationen eliminieren
Die klinischen Daten, die Marx für sein Vorhersagemodell in Zusammenarbeit mit Ärztinnen und Ärzten des Universitäts-Kinderspital beider Basel (UKBB) auswertet, enthalten unter anderem Zeitreihen der Pulsfrequenz und des Blutzuckerspiegels sowie Informationen zu physischen Aktivitäten, zur Kalorienaufnahme, zu Insulininjektionen und zur Schlafqualität. In einem ersten Schritt geht es nun darum, die Daten zu filtern und allfällige Korrelationen, die nicht mit der Fragestellung zusammenhängen, aus dem Modell auszuschliessen.
Um künftig robuste und für einen behandelnden Arzt auch nachvollziehbare Prognosen abgeben zu können, muss die Anzahl der Faktoren nämlich möglichst tiefgehalten werden. So oder so lässt sich heute noch nicht vorhersagen, ob das Modell in der Praxis erfolgreich sein wird: «Wir stossen mit unserem Projekt in Bereiche vor, die wir mit den zur Verfügung stehenden Methoden bisher noch nicht beherrschen.»
Naturnähe, Berge und Klettergemeinschaften
Erfolgreich gelungen ist dem Nachwuchsforscher in jedem Fall sein Start in Zürich: «Als ich im Herbst zum ersten Mal hierherkam, habe ich mich sehr schnell wohlgefühlt. Die Stadt ist sehr schön und man ist in kurzer Zeit in den Bergen.» Die Nähe zu Natur und Bergen gefallen dem passionierten Sportkletterer besonders. «Beim Klettern kann ich abschalten. Meine Gedanken sind dann ganz auf die Griffe fokussiert. Dazu kommt die Gemeinschaft. Ich unternehme gerne etwas mit anderen zusammen.» In Saarbrücken war er noch weit weg von den Bergen und hat darum vor allem in der Halle Bouldern betrieben. Jetzt freut er sich darauf, von Zürich aus auch öfter im alpinen Gelände unterwegs sein zu können.
Äusserst international und interdisziplinär
Ebenso gut wie in der Stadt Zürich und in ihrer Umgebung gefällt es Marx auch am AI Center: «Das Center ist ausserordentlich international. Dazu kommt die Vielfalt der Fachgebiete. Es ist beeindruckend und inspirierend, wenn man im Alltag ganz selbstverständlich mit Koryphäen aus unterschiedlichen Wissenschaftsdisziplinen auf Augenhöhe diskutieren kann.»
Die Interdisziplinarität des AI Center beschränkt sich aber nicht auf soziale Kontakte. Marx hat zusätzlich zur Bioinformatikerin Julia Vogt mit Peter Bühlmann einen Co-Mentor, der auf hochdimensionale Statistik spezialisiert ist, mit der sich Datensätze untersuchen lassen, in denen jedem Objekt viele Merkmale zugeordnet sind. Dazu gehören auch die Diabetikerdaten, die Marx analysiert. Zudem besteht auch eine institutionalisierte Zusammenarbeit mit der Gruppe für biomedizinische Informatik von Gunnar Rätsch, der an der Schnittstelle von Machine Learning und Bioinformatik forscht.
Aus unterschiedlichen Datenquellen lernen
Marx ist denn auch selbst nicht nur in einem Themengebiet aktiv. In einem anderen Projekt beschäftigt sich mit dem sogenannten multimodalen Lernen. Hier geht es darum, in Daten aus unterschiedlichen Quellen Gemeinsamkeiten zu finden. Dadurch sollen etwa die Ergebnisse einer PET (Positronen-Emissions-Tomographie), welche Anomalien im Stoffwechsel von Geweben dreidimensional sichtbar macht, mit den Ergebnissen einer röntgenbasierten CT (Computertomographie) kombiniert werden, die Anomalien in den Gewebedichten schichtweise zum Vorschein bringt.
Eine durch Machine Learning automatisierte Kombination der Analyse der beiden Bildgebungsverfahren könnte die Tumordiagnostik entscheidend weiterbringen. Die Vision ist ein KI-System, das in den zwei Datensätzen die Gemeinsamkeiten findet und daraus zuverlässige Diagnosen und Prognosen ableitet.
Erste Erfahrungen als Dozent sammeln
Aktuell freut sich der Jungakademiker auf seine erste Vorlesung, die er in diesem Sommersemester gemeinsam mit Kollegen aus dem AI Center hält: «Die Zusammenarbeit mit Studierenden hat mir schon immer viel Spass gemacht und die Master-Studentinnen und -Studenten an der ETH haben ein sehr hohes Niveau. Aus den Diskussionen kann ich immer wieder Inputs mitnehmen, über die ich selbst noch nicht nachgedacht hatte.» Marx wird im Rahmen seines Fellowship also nicht nur seine wissenschaftlichen Fähigkeiten schulen, sondern auch erste Erfahrungen als Dozent sammeln können.
Über seine eigene Zukunft will Marx noch keine konkreten Prognosen wagen. «Nach den ersten Erfahrungen bin ich zuversichtlich, dass meine Zeit an der ETH mich auf beide Karriereoptionen – Wissenschaft und Industrie – gut vorbereitet.»