Vordenker des aktiven maschinellen Lernens
Künstliche Intelligenz und maschinelles Lernen zählen für Andreas Krause zu den spannendsten Fragen unserer Zeit. Das Spektrum der Ansätze, die er entwickelt und geprägt hat, reicht von den theoretischen und mathematischen Grundlagen bis hin zu praktischen Fragen, die das Zusammenspiel von Menschen und lernenden Systemen betreffen.
«Menschen sind in der Lage, selbst komplexe Aufgaben sehr effizient lösen zu lernen», erläutert Andreas Krause, der als Informatikprofessor an der ETH Zürich wirkt. «Ich würde gerne verstehen, wie man Maschinen ähnlich effizientes Lernen beibringen kann», sagt er, der zu Europas führenden Forschern in dem rasant sich entwickelnden Gebiet des maschinellen Lernens gehört.
Zum ersten Mal mit dem Thema des maschinellen Lernens in Berührung kam er während seiner Diplomarbeit, die er 2004 an der TU München abschloss. Um sich in die Grundlagen zu vertiefen, ging er danach nach Pittsburgh und schrieb seine Doktorarbeit an der Carnegie Mellon University über Fragen der optimalen Informationsgewinnung. Nachdem er 2008 promoviert hatte, wechselte er 2009 als Assistenzprofessor an das Caltech in Pasadena, bevor er 2011 an die ETH Zürich kam. Seither hat er auch Leitungsaufgaben beim Swiss Data Science Center, beim ETH AI Center und bei der europäischen Initiative für lernende Systeme, ELLIS, übernommen.
Der Rössler-Preis 2021, den er am Mittwoch am Thanks Giving-Anlass der ETH Foundation erhalten hat, honoriert seine wegweisenden Leistungen. «Andreas Krause ist ein exzellenter Forscher, ein engagierter Dozent und hat sich als junger Wissenschaftler bereits etliche Meriten geholt in einer der prägendsten Technologien des 21. Jahrhunderts», würdigte ETH-Präsident Joël Mesot in seiner Laudatio.
Die Faszination der lernenden Agenten
Andreas Krause fesseln besonders Fragen der optimalen Informationsgewinnung, die ein effizientes, aktives und bestärkendes Lernen erfordern. Zentral dabei ist der Umgang mit Unsicherheit, wenn noch nicht alle Informationen vorliegen oder sehr viele alternative Lösungswege vorhanden sind.
Beim klassischen «passiven» maschinellen Lernen wird ein Lernverfahren mittels grosser Datensätze trainiert, um bestimmte Muster aus durch Experten annotierten Daten herzuleiten – zum Beispiel lässt sich so eine Klassifikationsregel finden, die auf Fotos erkennt, ob diese Fussgänger oder Verkehrsschilder zeigen. Im Unterschied zu den passiven Lernverfahren entscheiden «aktive» Lernverfahren selbst darüber, welche Daten sie benötigen, um die gestellte Aufgabe effektiv zu erfüllen. Beispielsweise wählen sie aus einem Bilddatensatz diejenigen zur Beschriftung durch Experten aus, die für den Lernfortschritt hilfreich sind – dies kann unter anderem Zeit und Kosten sparen sowie Fehler reduzieren. Andere aktive Verfahren schlagen Experimente vor, deren Ausgang Informationsgewinn verspricht.
Man bezeichnet solche Computerprogramme auch als lernende Agenten. «Mich faszinieren aktive Lernverfahren, bei denen ein lernender Agent selbständig entscheidet, welche Daten ihm nützen, um gute Entscheidungen zu treffen», sagt Andreas Krause.
Solche Fragen treten beispielsweise in der Robotik auf. Krause illustriert dies anhand einer Drohne, die selbständig durch Experimentieren lernt, gewisse Aufgaben zu lösen. Die Schwierigkeit dabei ist, dass sich am Anfang nicht genau sagen lässt, was zu Abstürzen führen könnte und was nicht. Am Anfang muss sich die Drohne vorsichtig verhalten, und je mehr Daten sie gewonnen und ausgewertet hat, umso bessere Leistung wird sie erbringen können ohne sich oder andere in Gefahr zu bringen.
Das Dilemma zwischen alten und neuen Daten
Ganz trivial ist die selbständige Informationsgewinnung allerdings nicht: Um seine Aufgabe optimal zu erfüllen, muss der lernende Agent eine gute Mischung finden aus bereits vorhandenen Daten sowie aus Daten, die er zusätzlich erwerben muss.
Die Forschung spricht in diesem Zusammenhang vom «Exploration-Exploitation-Dilemma»: wenn der lernende Agent nämlich selbständig entscheidet, welche Experimente er durchführt, um zusätzliche Daten zu gewinnen, dann beeinflussen seine Entscheidungen auch, welche Daten er beim Lernen zur Verfügung hat und welche nicht.
Eine der wegweisenden Leistungen Andreas Krauses ist es, dass er das erste mathematische Lernverfahren entwickelte, für das man, ausgehend von gewissen Annahmen, beweisen kann, dass es auch in komplexen Anwendungen das «Exploration-Exploitation-Dilemma» effektiv löst. Mathematisch gesprochen handelt es sich dabei um eine Spielart der bayesschen Optimierung, die auch dem Lernen der Drohnen, die nicht abstürzen sollen, zugrundliegt und unter bestimmten Voraussetzungen gewisse formale Sicherheitsgarantien ermöglicht.
Pionierhafter Forscher und Lehrer mit Leib und Seele
Tatsächlich ist Andreas Krauses Forschung sehr mathematisch geprägt: Damit aktive Lernverfahren zum Beispiel nützliche Daten so effizient wie möglich gewinnen, werden ganz bestimmte, «submodulare» Funktionen gebraucht. Heute gilt Andreas Krause als Pionier, der die submodulare Optimierung in das maschinelle Lernen einführte. Die Erkenntnisse aus einer sehr einflussreichen Publikation von Andreas Krause aus der Zeit in den USA fanden sogar praktische Anwendung in Wasserverteilungsnetzen: Dabei ging es um die Frage, wo man Sensoren am besten platziert, sodass sich die Wasserqualität optimal messen lässt.
Andreas Krause ist nicht nur ein scharfsichtiger Denker, wenn es um mathematischen Grundlagen des maschinellen Lernens geht, sondern auch einer, der die möglichen Auswirkungen dieser Technologien auf Wirtschaft und Gesellschaft reflektiert. Ihm ist es ein Anliegen, dass sowohl die Algorithmen oder Berechnungsregeln, die den Lernverfahren zugrundliegen, zuverlässig, erklärbar und nachvollziehbar sind, als auch, dass die Ergebnisse, Entscheidungen oder Empfehlungen für die Menschen, die sie je nachdem betreffen, fair und vertrauenswürdig sind.
Mit dieser Überzeugung widmet sich Andreas Krause der Ausbildung. Es liegt ihm am Herzen, den künftigen KI-Expertinnen und Experten sowohl solide Grundlagen in Mathematik und Informatik zu vermitteln als auch einen Sinn für einen verantwortungsvollen Umgang mit diesen Technologien. Von diesem Engagement zeugen die «Goldene Eule», mit dem ihn die ETH-Studierenden 2012 für seine Lehre ehrten, als auch die über tausend Studierenden, die seine Vorlesung «Introduction to Machine Learning» besuchen. Ebenso war er federführend am Aufbau des Masterprogramms Data Science und des DAS Data Science beteiligt, und im ETH AI Center achtet er darauf, dass verstärkt unternehmerische Aspekte in die Ausbildung einfliessen, damit vermehrt Spin-offs die erworbenen KI-Kompetenzen in die Praxis weitertragen.