GPT-3 verändert die chemische Forschung

Wissenschaftlerinnen und Wissenschaftler der EPFL zeigen, wie GPT-3 die chemische Analyse verändern kann, indem es sie schneller und benutzerfreundlicher macht.
© EPFL/iStock

Künstliche Intelligenz entwickelt sich immer mehr zu einem zentralen Werkzeug in der chemischen Forschung und bietet neuartige Methoden zur Bewältigung komplexer Herausforderungen, mit denen herkömmliche Ansätze Schwierigkeiten haben. Eine Unterart der künstlichen Intelligenz, die in der Chemie immer häufiger zum Einsatz kommt, ist das maschinelle Lernen. Dabei werden Algorithmen und statistische Modelle verwendet, um Entscheidungen auf der Grundlage von Daten zu treffen und Aufgaben zu erfüllen, für die sie nicht ausdrücklich programmiert wurden.

Um zuverlässige Vorhersagen treffen zu können, erfordert maschinelles Lernen jedoch auch grosse Datenmengen, die in der chemischen Forschung nicht immer verfügbar sind. Kleine chemische Datensätze bieten einfach nicht genug Informationen, um diese Algorithmen zu trainieren, was ihre Effektivität einschränkt.

In einer neuen Studie haben Forschende aus dem Team von Berend Smit an der EPFL eine Lösung in grossen Sprachmodellen wie dem GPT-3 gefunden. Diese Modelle werden auf riesigen Textmengen trainiert und sind für ihre umfassenden Fähigkeiten beim Verstehen und Generieren von menschenähnlichen Texten bekannt. GPT-3 bildet die Grundlage für die bekanntere künstliche Intelligenz ChatGPT.

Die jetzt in Nature Machine Intelligence veröffentlichte Studie stellt einen neuartigen Ansatz vor, der die chemische Analyse mit Hilfe künstlicher Intelligenz erheblich vereinfacht. Entgegen der anfänglichen Skepsis stellt die Methode GPT-3 nicht direkt chemische Fragen: «GPT-3 kennt den grössten Teil der chemischen Literatur nicht, und wenn wir ChatGPT eine chemische Frage stellen, beschränken sich die Antworten in der Regel auf das, was man auf Wikipedia finden kann», sagt Kevin Jablonka, der leitende Forscher der Studie. «Stattdessen stimmen wir GPT-3 mit einem kleinen Datensatz ab, der in Fragen und Antworten umgewandelt wird, und schaffen so ein neues Modell, das in der Lage ist, genaue chemische Erkenntnisse zu liefern.»

Bei diesem Prozess wird GPT-3 mit einer kuratierten Liste von Fragen und Antworten gefüttert. «Bei hochentropischen Legierungen ist es zum Beispiel wichtig zu wissen, ob eine Legierung in einer einzigen Phase oder in mehreren Phasen auftritt», sagt Smit. «Die kuratierte Liste von Fragen und Antworten ist vom Typ: Q= ‹Ist die <Name der hochentropischen Legierung> einphasig?› A= ‹Ja/Nein›.»

Er fährt fort: «In der Literatur haben wir viele Legierungen gefunden, bei denen die Antwort bekannt ist, und wir haben diese Daten zur Feinabstimmung von GPT-3 verwendet. Was wir zurückbekommen, ist ein verfeinertes KI-Modell, das darauf trainiert ist, diese Frage nur mit Ja oder Nein zu beantworten.»

«Dies wird die Art und Weise, wie wir Chemie betreiben, verändern.»      Berend Smit, EPFL

In Tests beantwortete das Modell, das mit relativ wenigen Fragen und Antworten trainiert wurde, über 95 % sehr unterschiedlicher chemischer Probleme richtig und übertraf damit oft die Genauigkeit modernster maschineller Lernmodelle. «Der Punkt ist, dass dies so einfach ist wie eine Literatursuche, die für viele chemische Probleme funktioniert», sagt Smit.

Einer der bemerkenswertesten Aspekte dieser Studie ist ihre Einfachheit und Schnelligkeit. Herkömmliche Modelle des maschinellen Lernens benötigen Monate für ihre Entwicklung und erfordern umfangreiche Kenntnisse. Im Gegensatz dazu benötigt der von Jablonka entwickelte Ansatz fünf Minuten und erfordert keinerlei Kenntnisse.

Die Auswirkungen der Studie sind tiefgreifend. Sie stellt eine Methode vor, die so einfach ist wie eine Literaturrecherche und auf verschiedene chemische Probleme anwendbar ist. Die Möglichkeit, Fragen wie «Ist die Ausbeute einer [Chemikalie], die mit diesem [Rezept] hergestellt wird, hoch?» zu formulieren und genaue Antworten zu erhalten, kann die Planung und Durchführung chemischer Forschung revolutionieren.

In dem Papier stellen die Autoren fest: «Neben einer Literaturrecherche könnte die Abfrage eines grundlegenden Modells [z. B. GPT-3,4] zu einem routinemässigen Weg werden, ein Projekt zu starten, indem das kollektive Wissen, das in diesen grundlegenden Modellen kodiert ist, genutzt wird», oder, wie Smit es kurz und bündig ausdrückt: «Dies wird die Art und Weise, wie wir Chemie betreiben, verändern.»

Weitere Informationen

Andere Mitwirkende

  • EPFL-Labor für Künstliche Chemische Intelligenz
  • Helmholtz-Institut für Polymere in der Energietechnik (Helmholtz-Zentrum Berlin und FSU Jena)

Finanzierung

  • Schweizerischer Nationalfonds für Wissenschaft
  • Grantham Foundation für den Schutz der Umwelt
  • RMI Drittes Derivat
  • Carl-Zeiss-Stiftung

References

Kevin Maik Jablonka, Philippe Schwaller, Andres Ortega-Guerrero, Berend Smit, Is GPT all you need for low-data discovery in chemistry?, Nature Machine Intelligence 2023