Ein KI-Sprung in die chemische Synthese

EPFL-Forschende stellen ChemCrow vor, ein auf grossen Sprachmodellen basierendes KI-System, das die Chemie durch die Integration von 18 fortschrittlichen Werkzeugen für Aufgaben wie organische Synthese und Arzneimittelentdeckung revolutioniert. ChemCrow rationalisiert komplexe Prozesse in der chemischen Forschung und macht sie sowohl für Fachleute als auch für Neulinge effizienter.
Konzeptkunst für ChemCrow. Bildrechte: Ella Maru Studio

Die Chemie mit ihren komplizierten Prozessen und ihrem enormen Innovationspotenzial war schon immer eine Herausforderung für die Automatisierung. Herkömmliche Berechnungswerkzeuge werden trotz ihrer fortschrittlichen Fähigkeiten aufgrund ihrer Komplexität und des für ihre Bedienung erforderlichen Fachwissens oft nicht ausreichend genutzt.

Nun haben Forschende der Gruppe von Philippe Schwaller an der EPFL ChemCrow entwickelt, eine KI, die 18 von Fachleuten entwickelte Tools integriert und damit in der Lage ist, Aufgaben in der chemischen Forschung mit einer noch nie dagewesenen Effizienz zu bewältigen. «Sie fragen sich vielleicht, warum eine Krähe (Crow)?», sagt Schwaller. Die Antwort: «Weil Krähen dafür bekannt sind, dass sie gut mit Tools umgehen können.»

ChemCrow wurde von den Doktoranden Andres Bran und Oliver Schilter (EPFL, NCCR Catalysis) in Zusammenarbeit mit Sam Cox und Professor Andrew White (FutureHouse von der University of Rochester) entwickelt.

ChemCrow basiert auf einem grossen Sprachmodell (LLMs) wie GPT-4, das durch LangChain für die Tool-Integration erweitert wurde, um chemische Syntheseaufgaben autonom durchzuführen. Die Wissenschaftlerin und Wissenschaftler ergänzten das Sprachmodell mit einer Reihe von spezialisierten Softwaretools, die bereits in der Chemie eingesetzt werden, darunter WebSearch für die internetbasierte Informationsbeschaffung, LitSearch für die Extraktion wissenschaftlicher Literatur und verschiedene Molekular- und Reaktionstools für die chemische Analyse.

Durch die Integration von ChemCrow mit diesen Werkzeugen konnten die Forschenden das Programm in die Lage versetzen, selbstständig chemische Synthesen zu planen und auszuführen, z. B. die Herstellung eines Insektenschutzmittels und verschiedener Organokatalysatoren, und sogar bei der Entdeckung neuer Chromophore zu helfen, Substanzen, die für die Farbstoff- und Pigmentindustrie von grundlegender Bedeutung sind.

Das Besondere an ChemCrow ist seine Fähigkeit, einen strukturierten Denkprozess an chemische Aufgabenstellungen anzupassen und anzuwenden: «Das System ist vergleichbar mit einer menschlichen Fachfrau, die Zugang zu einem Taschenrechner und Datenbanken hat, die nicht nur die Effizienz dieser Expertin verbessern, sondern sie auch sachlicher machen – im Fall von ChemCrow, indem sie Halluzinationen reduzieren», erklärt Andres Camilo Marulanda Bran, der Erstautor der Studie.

«Krähen sind dafür bekannt, dass sie gut mit Werkzeugen umgehen können.»      Philippe Schwaller, Gruppenleiter EPFL

ChemCrow erhält eine Eingabeaufforderung vom Benutzer, plant im Voraus, wie die Aufgabe zu lösen ist, wählt die relevanten Werkzeuge aus und verfeinert seine Strategie iterativ auf der Grundlage der Ergebnisse der einzelnen Schritte. Dieser methodische Ansatz stellt sicher, dass ChemCrow nicht nur in der Theorie funktioniert, sondern auch in der praktischen Anwendung für die reale Interaktion mit Laborumgebungen geerdet ist.

Durch die Demokratisierung des Zugangs zu komplexem chemischem Wissen und Prozessen senkt ChemCrow die Einstiegshürde für Nicht-Experten und erweitert gleichzeitig das Instrumentarium für erfahrene Chemiker. Dies kann die Forschung und Entwicklung in den Bereichen Pharmazie, Materialwissenschaften und darüber hinaus beschleunigen und den Prozess effizienter und sicherer machen.

Weitere Informationen

Weitere Mitwirkende

  • Universität von Rochester
  • FutureHouse

Finanzierung

  • Schweizerischer Nationalfonds (NCCR Catalysis)
  • Nationale Wissenschaftsstiftung (NSF)
  • Nationale Gesundheitsinstitute (National Institute of General Medical Sciences)

Referenzen

Andres M. Bran, Sam Cox, Oliver Schilter, Carlo Baldassari, Andrew D. White, Philippe Schwaller, Augmenting large language models with chemistry tools, Nature Machine Intelligence, 8 May 2024

Die Gruppe von Philippe Schwaller ist Teil des neuen EPFL AI Center, das mit mehr als vierzig anderen Labors den Weg zu einer vertrauenswürdigen, zugänglichen und integrativen KI weist.