Damit möglichst kein Plankton unerkannt entwischt

Die Eawag will Methoden der künstlichen Intelligenz weiterentwickeln, um sie vermehrt in der Wasserforschung einzusetzen. Eine aktuelle Anwendung ist das Monitoring von Planktongesellschaften in Seen. Mit Methoden des maschinellen Lernens ist es gelungen, eine automatische Klassifizierung der Kleinstlebewesen zu implementieren.    
Forschende der Eawag nutzen Deep-learning-Methoden mit künstlichen neuronalen Netzen, um Plankton automatisch zu klassifizieren. Hintergrund: Aquascope-Aufnahme des Wasserflohs Bosmina. (Foto und Grafik: Eawag)

Wie identifiziert eine Maschine Plankton? Ganz ähnlich wie Menschen die Gesichter anderer Menschen erkennen. Zwei Prozesse spielen hierbei zusammen. Zunächst sind beim Menschen bestimmte Regionen des Gehirns darauf spezialisiert, Gesichter zu erfassen. Daher reagieren schon Babys auf Gesichter oder auch gesichtsähnliche Muster. Die Fähigkeit ist jedoch bei der Geburt noch sehr vage ausgeprägt. Erst nach und nach lernen Kinder durch das Betrachten vieler verschiedener Gesichter, Menschen immer besser zu erkennen und zu unterscheiden.

Ganz ähnlich funktioniert die automatische Klassifizierung von Plankton. Zuerst entwickeln Forschende eine Architektur für maschinelles Lernen, die darauf spezialisiert ist, Fotos zu klassifizieren. Diese Architektur ist noch sehr vage und flexibel. In einem zweiten Schritt lernt die Maschine dann selbstständig mithilfe von Trainingsbeispielen, also tausenden von durch Fachpersonen identifizierten Planktonfotos, wichtige Merkmale und Muster zu erkennen und daraus die Art des Planktons abzuleiten. Die Maschine lernt mit jedem weiteren identifizierten Planktonfoto hinzu, passt selbstständig ihre Architektur an und verfeinert so ihre Fähigkeit, Plankton zu klassifizieren.

Maschinen lernen ähnlich wie Menschen

Ähnlich wie bei den Menschen, die in der Regel nicht sagen können, woran sie ihr Gegenüber erkannt haben, bleibt auch beim maschinellen Lernen im Dunkeln, welche Merkmale die Maschine für die Identifikation des Planktons nutzt. Doch wenn es darum geht, Millionen von Planktonfotos zu klassifizieren, ist das auch nicht von grossem Interesse. «Unser Ziel ist es, möglichst viele Planktonarten in kurzer Zeit korrekt identifizieren zu können», sagt der Physiker Marco Baity-Jesi, Leiter der Eawag-Gruppe Datenwissenschaften. «Da bietet maschinelles Lernen grosse Vorteile.» Während eine Fachperson höchstens einige Dutzend Bestimmungen pro Tag schafft und am Ende des Tages auch genug davon hat, bestimmt die Maschine täglich rund eine Million Fotos von Plankton treffsicher, und das ohne Verschleisserscheinungen. 

Eine Gruppe von Forschenden um Sreenath Kyathanahally, Postdoc in der Gruppe Datenwissenschaften, und Baity-Jesi hat nun weiterentwickelte Modelle des maschinellen Lernens, genauer gesagt des deep learnings, auf die Klassifizierung von Zooplankton in Schweizer Seen angewandt. Die besten Modelle basierten auf den Methoden «transfer learning» und «ensembling». «Wir konnten zeigen, dass diese Modelle Planktonfotos besser klassifizieren als die bisher verwendeten Modelle», sagt Baity-Jesi. «Wir haben eine Genauigkeit von 98 Prozent erreicht.» Die Planktonfotos stammen vom Aquascope, einem Unterwassermikroskop der Eawag-Gruppe Phytoplankton Dynamiken, geleitet von Francesco Pomati, das täglich mehrere Tausend Fotos von Plankton im Greifensee macht.

Deep learning – das «Gehirn» der Maschine weiterentwickeln

Was genau ist nun deep learning, transfer learning und ensembling? Zurück zur Analogie der Gesichtserkennung: Das, was die Evolution über Jahrmillionen geschafft hat, nämlich die Entwicklung des menschlichen Gehirns mit all seinen Finessen und hochspezialisierten Funktionen, versuchen die Forschenden beim deep learning zumindest näherungsweise nachzubilden. Inspiriert vom menschlichen Gehirn vertiefen sie die inneren Strukturen des «Maschinengehirns» und bauen künstliche neuronale Netze mit vielen Zwischenschichten in die Algorithmen ein. Die Maschine lernt so, bereits Erlerntes mit neuen Inhalten zu verknüpfen und dadurch laufend hinzuzulernen – und das ohne das Eingreifen des Menschen. Mit jedem weiteren Planktonfoto lernt die Maschine, selbst unscheinbare Unterschiede der kleinen Lebewesen zu erkennen und sie richtig zu klassifizieren.

Eine andere Weiterentwicklung ist das ensembling. Das gleicht der Überführung eines Kriminellen: Eine Augenzeugin ist gut, mehrere Augenzeugen sind besser. Beim ensembling kombinieren die Forschenden daher mehrere deep-learning-Methoden – die Augenzeugen der Maschine –, um die Treffsicherheit zu erhöhen. Damit möglichst wenig Plankton sich unerkannt davonschleichen kann.

Transfer Learning – erworbenes Wissen auf eine neue Aufgabe übertragen

Parallel zur Entwicklung des «Maschinengehirns» wird der maschinelle Lernprozess weiter verfeinert. Beim transfer learning geht es darum, bereits gewonnenes Wissen aus anderen Anwendungen zu nutzen. Kann die Maschine zum Beispiel bereits Gesichter klassifizieren, kann sie dieses Wissen nutzen, um schneller Seeplankton klassifizieren zu lernen. Auch diese Art des Lernens hat eine menschliche Analogie. Wer in Europa aufwächst, lernt zuerst europäische Gesichter zu unterscheiden. Asiaten sehen für Europäer eher ähnlich aus. Doch hat man erstmal die typischen europäischen Gesichtszüge verstanden, lernt man auch schneller, asiatische Gesichter unterscheiden, zum Beispiel bei einem längeren Aufenthalt in Asien.

Maschinen lernen auch, Hochwasser und Toxizität von Substanzen vorherzusagen

Die Methoden der künstlichen Intelligenz, wie etwa das maschinelle Lernen, können die Wasserforschung in vielen Bereichen unterstützen. «Wir unterstützen auch andere Eawag-Projekte», sagt Baity-Jesi. Dazu gehört zum Beispiel ein Projekt zur Untersuchung von Hochwasservorhersagemodellen unter der Leitung von Peter Reichert, Gruppenleiter Systemanalyse und Wassermanagement, und Chaopeng Shen, einem Gastprofessor aus den USA, der zurzeit an der Eawag arbeitet. «In einem anderen Projekt arbeiten wir mit der Gruppe Tierische Zellen und Organismen von Kristin Schirmer zusammen, um vorherzusagen, wie chemische Substanzen auf Fische wirken.» Letzteres dürfte die Zahl der Tests an lebenden Tieren zur Bestimmung der Toxizität von Substanzen verringern.

Mehr Informationen

Originalpublikation

Sreenath P. Kyathanahally, Thomas Hardeman, Ewa Merz, Thea Bulas, Marta Reyes, Peter Isles, Francesco Pomati & Marco Baity-Jesi (2021) Deep Learning Classification of Lake Zooplankton. Frontiers in Microbiology, 12, p. 3226, DOI: https://doi.org/10.3389/fmicb.2021.746297

Links

  • Plankifier Eawag-Projekt
  • Aquascope Integrating high resolution monitoring and trait-based modelling to understand and predict phytoplankton dynamics