Wie verändert maschinelles Lernen die Wissenschaft?
Maschinelles Lernen ist in den letzten zwei Jahrzehnten wie eine Bombe eingeschlagen und wird eine entscheidende Technologie der Zukunft sein. Es verändert grosse Bereiche der Gesellschaft, darunter das Gesundheitswesen, das Bildungswesen, den Verkehr, die Lebensmittel- und Industrieproduktion, und hat enorme Auswirkungen auf Wissenschaft und Forschung.
Das maschinelle Lernen, ein Teilbereich der künstlichen Intelligenz, ist ein Prozess, der Computern hilft, ohne direkte Anweisungen und aus Erfahrung zu lernen. Dazu werden Algorithmen eingesetzt, um Muster in Daten zu erkennen, die dann zur Erstellung von Modellen verwendet werden, die Vorhersagen treffen können. Und Daten sind der Schlüssel. Das maschinelle Lernen und die zunehmende Verfügbarkeit riesiger Datenmengen versprechen, die Wissensproduktion zu revolutionieren. Der heutige exponentielle Wachstumszyklus beim Deep Learning und anderen Technologien wurde mit der kambrischen Explosion vor einer halben Milliarde Jahren verglichen, als das Leben auf der Erde eine kurze Phase sehr schneller Diversifizierung erlebte.
Professor James Larus, Dekan der EPFL School of Computer and Communications Sciences (IC), stimmt zu, dass das maschinelle Lernen und die KI einen tiefgreifenden Einfluss auf unser Leben haben werden und wir ihr volles Potenzial noch nicht annähernd ausgeschöpft haben.
«Für mich ist maschinelles Lernen ein sehr leistungsfähiges Werkzeug, das noch in den Kinderschuhen steckt und immer noch eine Art 'dunkle Kunst' ist. Wir unterrichten Kurse über maschinelles Lernen, die zugrunde liegende Mathematik und können den Studierenden Beispiele dafür geben, wie es in der Vergangenheit angewendet wurde, aber wir können ihnen keine Prinzipien vermitteln, weil wir buchstäblich nicht einmal wissen, warum es so gut funktioniert, wie es funktioniert.»
Lenka Zdeborová von der EPFL beschäftigt sich mit dieser grundlegenden Frage. Als ausserordentliche Professorin für Physik, Informatik und Kommunikationssysteme im Statistical Physics of Computation Laboratory – Teil der Fakultät für Grundlagenwissenschaften (SB) und der Fakultät für Informatik und Kommunikation (IC) – widmet sie sich leidenschaftlich der Weiterentwicklung der Theorie des Berechenbaren und der Möglichkeiten des maschinellen Lernens und der künstlichen Intelligenz.
«In den Wissenschaften wollen wir die Objekte, die wir untersuchen, besser verstehen, das Ziel ist nicht festgelegt. Wir müssen das Ziel so formulieren, dass das maschinelle Lernsystem für die wissenschaftliche Arbeit nützlich ist, und die Rolle betrachten, die das maschinelle Lernen bei der Veränderung der wissenschaftlichen Methode selbst spielt. Es ist ein faszinierendes Feld, das sich mit dem Erfolg des maschinellen Lernens in den letzten zehn Jahren entwickelt hat.»
Gemeinsam mit Kollegen aus der Physik, der Chemie, den Ingenieurwissenschaften und den Biowissenschaften hat Zdeborová gerade eine neue Vorlesungsreihe für Doktorierende über wissenschaftliches maschinelles Lernen ins Leben gerufen, in der die neuesten Arbeiten an der EPFL und weltweit vorgestellt werden.
Eine weitere EPFL-Initiative – die Projektkomponente «Machine Learning 4 Science» des Kurses «Machine Learning» der IC-Professoren Martin Jaggi und Nicolas Flammarion – baut campusübergreifende Kooperationen auf und bringt wissenschaftliche Projekte von Labors aus allen Disziplinen mit Studierenden zusammen, die ihr Fachwissen im Bereich des maschinellen Lernens in neue Bereiche einbringen. Zwischen 2018 und 2020 haben mehr als 600 Studierende an Projekten teilgenommen, die von 77 Labors der EPFL und sogar von externen Institutionen wie dem CERN vorgeschlagen wurden.
«Es ist der grösste Masterstudiengang auf dem Campus, und die Studierenden aller Fachrichtungen wollen dieses Tool erlernen, da sie wissen, dass es für ihre zukünftige Karriere nützlich sein wird. Sie können in jedes beliebige Labor auf dem Campus gehen und ein praktisches Projekt in interdisziplinärer Zusammenarbeit durchführen. Es ist eine echte Win-Win-Situation, und ich denke, man kann mit Fug und Recht behaupten, dass beide Seiten von dieser Struktur profitieren», sagt Jaggi.
Eines der Projekte der letzten Runde aus dem Labor von Cathrin Brisken in der Fakultät für Life Sciences befasste sich mit einem Algorithmus für maschinelles Lernen, der es ermöglicht, Mauszellen von menschlichen Zellen zu unterscheiden, was für die Krebsforschung besonders nützlich ist. Onkologen untersuchen Tumore in der Regel, indem sie menschliche Zellen auf Mäuse transplantieren. Dies erfordert normalerweise mehrere Fluoreszenzfärbungen und die Analyse vieler Gewebeproben, bevor man die menschlichen Zellen findet. Das Programm des IC-Studenten Quentin Juppet vereinfacht all dies, indem es den Prozess der Zellklassifizierung automatisiert. Es ist so vielversprechend, dass er es in eine Masterarbeit umgewandelt hat, deren Ergebnisse kürzlich im Journal of Mammary Gland Biology and Neoplasia veröffentlicht wurden.
Ein weiteres Projekt, das ebenfalls aus der Fakultät für Biowissenschaften stammt, befasst sich mit der Verwendung von maschinellem Lernen zur Kategorisierung von Mutationsphänotypen anhand von Bildern von Zebrafisch-Embryonen. Professor Andrew Oates, Dekan des Fachbereichs und Leiter des Timing, Oscillations, Pattern Laboratory: «Mein Labor hat zweimal teilgenommen, und jedes Mal hatten wir es mit einer ganz besonderen Gruppe von Studierenden zu tun, die Initiative und Kreativität bei der Lösung eines echten wissenschaftlichen Problems im Labor mit Hilfe des maschinellen Lernens gezeigt haben. Soweit ich weiss, ist dieses Projekt eine Premiere auf dem Gebiet der Embryologie und hat Auswirkungen auf die effizientere Nutzung des Zebrafisches als System zur Modellierung menschlicher genetischer Störungen. Wir hätten diese Arbeit nicht in Angriff genommen, wenn wir nicht die Möglichkeit gehabt hätten, mit dem Programm Machine Learning 4 Science zusammenzuarbeiten», sagt er.
Andere Arbeiten befassten sich mit unglaublich vielfältigen Forschungsfragen: Vorhersage des Schweregrads von Schlaganfällen anhand von Daten aus Pacman-Spielen, automatische Erkennung von verfügbaren Flächen für Solaranlagen auf Dächern, Lawinenvorhersage, Musik jenseits von Dur und Moll und Verbesserung von Messungen der Süsswasserqualität.
Für James Larus ist die Zukunft schon da, und sie wird nur noch erstaunlicher werden: «Derzeit basiert das maschinelle Lernen auf einem Modell, das in den 1940er Jahren entwickelt wurde, wie das Gehirn funktioniert, und es war damals noch nicht einmal genau. Jetzt erforschen wir das vom Gehirn inspirierte maschinelle Lernen auf der Grundlage der neuesten neurowissenschaftlichen Erkenntnisse, um anspruchsvollere und effektivere Modelle zu entwickeln und die nächste Generation von Systemen der künstlichen Intelligenz aufzubauen. Ich bin also sehr zuversichtlich, dass das maschinelle Lernen über einen langen Zeitraum hinweg Fortschritte machen und die Zahl der erfolgreichen Anwendungen enorm steigern wird. Es wird die Wissenschaft für immer verändern.»