Deep-Learning-basierte Bildanalyse ist jetzt nur noch einen Klick entfernt
In den letzten fünf Jahren hat sich die Bildanalyse von traditionellen mathematischen und beobachtungsbasierten Methoden hin zu datengesteuerter Verarbeitung und künstlicher Intelligenz verlagert. Diese wichtige Entwicklung macht die Erkennung und Identifizierung wertvoller Informationen in Bildern einfacher, schneller und zunehmend automatisiert – in nahezu jedem Forschungsbereich. Im Bereich der Biowissenschaften zeigt Deep-Learning, ein Teilgebiet der künstlichen Intelligenz, ein zunehmendes Potenzial für die Analyse von Biobildern. Leider erfordert die Verwendung von Deep-Learning-Modellen häufig Programmierkenntnisse, über die nur wenige Biowissenschaftsfachleute verfügen. Um den Prozess zu vereinfachen, haben Fachleute für Bildanalyse der EPFL und der UC3M in Zusammenarbeit mit dem Center for Imaging der EPFL deepImageJ entwickelt – ein Open-Source-Plugin, das in einem heute in Nature Methods veröffentlichten Artikel beschrieben wird.
Einsatz neuronaler Netze in der biomedizinischen Forschung
Deep-Learning-Modelle sind ein bedeutender Durchbruch für die vielen Bereiche, die auf Bildgebung angewiesen sind, wie etwa die Diagnostik und die Arzneimittelentwicklung. In der Biobildgebung kann Deep Learning beispielsweise dazu verwendet werden, riesige Bildsammlungen zu verarbeiten und Läsionen in organischem Gewebe zu erkennen, Synapsen zwischen Nervenzellen zu identifizieren und die Struktur von Zellmembranen und Zellkernen zu bestimmen. Es ist ideal für die Erkennung und Klassifizierung von Bildern, die Identifizierung bestimmter Elemente und die Vorhersage von Versuchsergebnissen.
Bei dieser Art von künstlicher Intelligenz wird ein Computer darauf trainiert, eine Aufgabe auszuführen, indem er auf grosse Mengen von zuvor beschrifteten Daten zurückgreift. Sie ist vergleichbar mit CCTV-Systemen, die Gesichtserkennung durchführen, oder mit Handy-Kamera-Apps, die Fotos verbessern. Deep-Learning-Modelle basieren auf hochentwickelten Computerarchitekturen, den so genannten künstlichen neuronalen Netzen, die für bestimmte Forschungszwecke trainiert werden können, z. B. zur Erkennung bestimmter Zelltypen oder Gewebeläsionen oder zur Verbesserung der Bildqualität. Das trainierte neuronale Netz wird dann als Computermodell gespeichert.
Künstliche Intelligenz, aber ohne den Code
Für die biomedizinische Bildgebung entwickelt ein europäisches Forschendenkonsortium ein Repository mit diesen vortrainierten Deep-Learning-Modellen, den BioImage Model Zoo. «Um diese Modelle zu trainieren, benötigen die Forschenden spezifische Ressourcen und technische Kenntnisse – vor allem in der Python-Programmierung –, über die viele Biowissenschaftler nicht verfügen», sagt Daniel Sage, Ingenieur am EPFL Center for Imaging, der die Entwicklung von deepImageJ leitet, «aber idealerweise sollten diese Modelle für jeden verfügbar sein.»
Das deepImageJ-Plugin überbrückt die Kluft zwischen künstlichen neuronalen Netzen und den Forschenden, die sie verwenden. Jetzt kann eine Biowissenschaftlerin eine Computeringenieurin bitten, einen Algorithmus für maschinelles Lernen zu entwerfen und zu trainieren, um eine bestimmte Aufgabe zu erfüllen, die die Wissenschaftlerin dann einfach über eine Benutzeroberfläche ausführen kann – ohne jemals eine einzige Zeile Code zu sehen. Das Plugin ist quelloffen und kostenlos und wird die Verbreitung neuer Entwicklungen in der Informatik und die Veröffentlichung biomedizinischer Forschungsergebnisse beschleunigen. Es soll eine kollaborative Ressource sein, die es Fachleuten des Ingenieurwesens, der Informatik, der Mathematik und der Biologie ermöglicht, effizienter zusammenzuarbeiten. Ein Modell, das kürzlich von einem EPFL-Masterstudenten in einem interdisziplinären Team entwickelt wurde, ermöglicht es den Forschenden beispielsweise, menschliche Zellen von Mäusezellen in Gewebeschnitten zu unterscheiden.
Forschende können auch Nutzende schulen
Biowissenschaft-Fachleute auf der ganzen Welt hoffen schon seit mehreren Jahren auf ein solches System, aber bis das Center for Imaging der EPFL auf den Plan trat, hatte sich noch niemand der Herausforderung gestellt, ein solches System zu bauen. Die Forschungsgruppe wird von Daniel Sage und Michael Unser, dem akademischen Direktor des Zentrums, zusammen mit Arrate Muñoz-Barrutia, ausserordentliche Professorin an der UC3M, geleitet. Professorin Muñoz-Barrutia leitete die operative Entwicklungsarbeit zusammen mit einer ihrer Doktorandinnen, Estibaliz Gómez-de-Mariscal, und Carlos García López de Haro, einem wissenschaftlichen Mitarbeiter im Bereich Bioengineering.
Damit möglichst viele Forschende das Plugin nutzen können, entwickelt die Gruppe auch virtuelle Seminare, Schulungsmaterialien und Online-Ressourcen, um das volle Potenzial der künstlichen Intelligenz besser auszuschöpfen. Diese Materialien richten sich sowohl an Programmierende als auch an Biowissenschaftsfachleute, damit sich die Nutzenden schnell mit der neuen Methode vertraut machen können. DeepImageJ wird auch am ZIDAS vorgestellt, einem einwöchigen Kurs über Bild- und Datenanalyse für Biowissenschaften in der Schweiz.