Mit KI die Giftigkeit von Chemikalien vorhersagen

Forschende der Eawag und des Swiss Data Science Center haben KI-Algorithmen mit einem umfassenden ökotoxikologischen Datensatz trainiert. Jetzt können ihre Machine-Learning-Modelle vorhersagen, wie giftig Chemikalien für Fische sind.
Fische werden häufig als Versuchstiere benutzt. Maschinelles Lernen soll die Tierversuche ersetzen (Foto: Adobe Stock).

Chemikalien spielen in unserem Alltag eine wichtige Rolle, etwa in der Produktion von Lebensmitteln, Medikamenten bis hin zu verschiedenen Gütern des täglichen Bedarfs. Dabei wird ihr Einfluss auf die menschliche Gesundheit und die Umwelt mit verschiedenen Kontrollmechanismen genau überwacht. So schreibt etwa die EU in der REACH-Verordnung vor, dass für alle Chemikalien mit einem jährlichen Mindestproduktionsvolumen von 10 Tonnen Fischtoxizitätstests durchgeführt werden müssen. Diese Versuche sind teuer – und benötigen jedes Jahr in Europa schätzungsweise 50’000 Fische.

Die Wissenschaft arbeitet schon seit mehreren Jahrzehnten an alternativen Methoden, die günstiger sind und vor allem ohne Versuchstiere auskommen. Grosse Hoffnungen liegen auf computerbasierten Methoden, mit denen die Auswirkungen von Chemikalien auf Fische vorhergesagt werden können.

Vielversprechende Vorhersagekraft der Modelle

Das Wasserforschungsinstitut Eawag und das Swiss Data Science Center (SDSC) haben gemeinsam einen umfassenden ökotoxikologischen Datensatz kuratiert, um ihn der Wissenschaft als Benchmark und Entwicklungsgrundlage für weitere KI-Algorithmen zur Verfügung zu stellen. Der Datensatz namens «ADORE» besteht aus rund 26’000 Datenpunkten, welche die Wirkungen von knapp 2’000 Chemikalien auf 140 Fischarten beschreiben. Er enthält zudem eine grosse Zahl an Merkmalen sowohl der Chemikalien als auch der Arten.  

Wie die Forschenden in einem soeben veröffentlichten Fachartikel darlegen, schaffen es die Machine-Learning-Modelle die Giftigkeit von Chemikalien gut vorherzusagen. «Die festgestellten Abweichungen liegen im Bereich der normalen biologischen Schwankungen», sagen die beiden Erstautoren der Publikation, Lilian Gasser, Datenwissenschaftlerin beim SDSC, und Christoph Schür, Postdoktorand an der Eawag. Die Forschenden stufen die untersuchten Methoden deshalb als «vielversprechend für die Vorhersage von akuter Fischsterblichkeit» ein. Des Weiteren könnten diese Methoden auch anhand passender Daten auf andere Spezies-Gruppen angewendet werden. 

«Allerdings gibt es noch Einschränkungen, die es zu beachten gilt», halten die Forschenden selbstkritisch fest. Denn obwohl die Algorithmen im Durchschnitt brauchbare Vorhersagen liefern, liegen sie bei den einzelnen Fischarten teilweise noch deutlich daneben. So schätzen sie etwa die Giftigkeit einer Chemikalie für bestimmte Fischarten zu hoch und für andere Arten zu niedrig ein. «Offenbar werden die Modelle hauptsächlich von einigen wenigen chemischen Eigenschaften beeinflusst und erfassen artspezifische Empfindlichkeiten noch nicht ausreichend», sagt Gasser.

Mit angemessenem Testverfahren zu aussagekräftigen Ergebnissen

Bei ihren Arbeiten haben Gasser und Schür die Tatsache berücksichtigt, dass die Art und Weise, wie man die Daten in einen Trainings- und einen Testdatensatz aufteilt, einen entscheidenden Einfluss auf die Anwendbarkeit der Machine-Learning-Modelle hat. «Es ist zwingend nötig, den Algorithmus nur an Chemikalien zu testen, die nicht im Trainingsdatensatz vorhanden sind, um nachzuweisen, dass er in der Lage ist, chemische Merkmale zu identifizieren, tatsächlich die Toxizität vorhersagen,» kommentieren Gasser und Schür.  

Die Zukunft der Chemikaliensicherheit

Laut Gasser und Schür und ihren Mitautoren ist es unwahrscheinlich, dass Machine-Learning-Modelle und künstliche Intelligenz Fischtoxizitätstests in naher Zukunft überflüssig machen, aber sie dürften langfristig zu deren Reduktion beitragen. Den Forschenden schwebt eine gezieltere Bewertung der Chemikaliensicherheit vor, die in Zukunft neben den physikochemischen Eigenschaften der Chemikalien und den Angaben zur Sterblichkeit auch weitere biologische Faktoren miteinbezieht.

So könnten die Modellvorhersagen etwa mit den Auswertungen einer Reihe anderer – tierversuchsfreier – Tests kombiniert werden, die zurzeit an der Eawag mit unterschiedlichen Fischzell-Linien entwickelt und validiert werden. Für die Entwicklung eines solchen Chemikaliensicherheitssystems mit hoher Aussagekraft regen die Forschenden eine enge Zusammenarbeit mit den Regulierungsbehörden an, damit die Umsetzung von der Forschung in die Praxis gemeinsam vorangebracht werden kann.

Originalpublikation

Gasser, L.; Schür, C.; Perez-Cruz, F.; Schirmer, K.; Baity-Jesi, M. (2024) Machine learning-based prediction of fish acute mortality: implementation, interpretation, and regulatory relevanceEnvironmental Science: Advancesdoi:10.1039/d4va00072bInstitutional Repository

Schür, C.; Gasser, L.; Perez-Cruz, F.; Schirmer, K.; Baity-Jesi, M. (2023) A benchmark dataset for machine learning in ecotoxicologyScientific Data, 10(1), 718 (20 pp.), doi:10.1038/s41597-023-02612-2Institutional Repository