Wie menschliche und künstliche Intelligenz sich ergänzen können
Als Mennatallah El-Assady mit sieben Jahren Querflöte spielen lernt, fällt es ihr zunächst schwer, die schwarzen Punkte auf den Notenlinien in Töne zu übersetzen. Die Lösung: Sie malt jeden Ton in einer anderen Farbe an. «So konnte ich plötzlich gut Noten lesen und machte schnell Fortschritte», erzählt sie. Dass sie eine Form von Legasthenie hat, findet El-Assady erst später heraus.
Heute entwickelt sie intelligente Computerprogramme und arbeitet seit kurzem am ETH AI Center als Post-Doc Fellow. Die Spezialität der 31-Jährigen sind interaktive Visualisierungen, welche die mathematischen Daten hinter KI-Anwendungen grafisch darstellen. Das Ziel: Auch Personen ohne Programmierkenntnisse sollen die Arbeitsweise der Algorithmen verstehen und gezielt darauf Einfluss nehmen können.
Obschon El-Assady nicht mehr regelmässig musiziert, hat sie die Leserlichkeit der Notenschrift nicht losgelassen. So hat sie kürzlich eine Web-App mitentwickelt, die Tonfolgen statt nur mit klassischen Noten zusätzlich anhand von Farbkreisen darstellt. Nicht nur können sich Nutzer:innen ein beliebiges Musikstück in der farbig erweiterten Notenschrift anzeigen lassen. Intuitive Bedienelemente ermöglichen ihnen zudem, die Eigenheiten des Stückes besser kennenzulernen.
In einer Box lässt sich etwa per Mausklick eine Folge von hohen und tiefen Tönen zeichnen; Suchalgorithmen spüren die entsprechende Melodie auf und markieren sie farbig. «Mit solchen visuellen Metaphern können Menschen auch ohne Musikvorkenntnisse ein Lied interpretieren», sagt El-Assady.
Faszination für KI-Anwendungen früh entdeckt
Das Musikprogramm ist nur eines von vielen Projekten, an denen die ETH-Forscherin während des Doktorats – halb an der Universität Konstanz, halb an der Ontario Tech University – gearbeitet hat. «Eigentlich ist es ein Seitenprojekt, das ich anfangs mehr zum Spass nebenher entwickelt habe», erzählt sie. Die Idee sei entstanden, weil die Musik viele Parallelen zur Sprache aufweist.
Die computerbasierte Sprachanalyse ist nämlich das Forschungsgebiet, mit dem sich El-Assady seit bald neun Jahren befasst. Wie KI in Form von Suchmaschinen, Sprachassistenten oder Chatbots den Menschen unterstützen kann, fasziniert sie schon während dem Studium. Gleichzeitig realisiert sie aber auch, dass menschlicher Input unabdingbar ist – besonders, um Algorithmen für eine spezifische Aufgabe im Alltag zu trainieren.
Als Beispiel nennt die ETH-Forscherin ein Sprachmodell, das darauf spezialisiert ist, die wichtigen Begriffe und Themen in einer Textdatenbank zu identifizieren. Für Politikwissenschaftler:innen sei ein solches KI-Programm nützlich, weil sie damit die langen Transkripte politischer Debatten schneller und einfacher analysieren könnten, so El-Assady. Das Problem: Es gibt unzählige Möglichkeiten, die Themenkategorien zu definieren.
Interaktives Programm fragt Menschen um Input
«Sprachalgorithmen sehen den Text nicht so wie ein Mensch», erklärt die KI-Spezialistin. Die intelligenten Algorithmen würden Textbausteine, die häufig gemeinsam auftreten, zu einem Thema zusammenfassen. «Der Mensch hingegen berücksichtigt auch den grösseren Kontext und allgemeines Weltwissen», so El-Assady.
Wegen dieser Unterschiede und weil jede Person eigene Vorstellungen mitbringe, findet El-Assady die Zusammenarbeit von menschlicher und künstlicher Intelligenz so wichtig. «Gemeinsam erzielen Mensch und Computer bessere Resultate als einzeln», ist sie überzeugt. Die Parameter der Algorithmen an die persönlichen Bedürfnisse anzupassen, gelinge in konventionellen KI-Programmen jedoch meist nur den Softwareentwickler:innen.
Diese Einschränkung zu überwinden, ist seit jeher El-Assadys Antrieb. Am Beispiel der KI-basierten Themenanalyse hat sie dafür eine Reihe von interaktiven Visualisierungen entworfen. Eine Mindmap-ähnliche Grafik zeigt etwa in Echtzeit, wie der Algorithmus während des Lernprozesses die Textbausteine neuen Themenblöcken zuordnet.
Ist das KI-Modell bei einer Zuordnung unschlüssig, präsentiert es den Nutzer:innen verschiedene Optionen und fragt sie um eine Einschätzung. Je mehr Feedback das Modell von einer bestimmten Person erhält, desto besser lernt es deren Präferenzen kennen und passt die Vorschläge entsprechend an.
US-Politikanalyse weckt grosses Interesse
Dieser Ansatz eigne sich nicht nur, um KI-Anwendungen auf Einzelpersonen zuzuschneiden, erklärt die KI-Spezialistin. «Viel mehr können wir so Inputs von Menschen mit unterschiedlichen Hintergründen in die Entwicklung der Computermodelle einfliessen lassen.» Gerade bei der Sprachanalyse seien möglichst viele verschiedene Blickwinkel wichtig, um Verzerrungen und Diskriminierungen vorzubeugen, fügt El-Assady an.
Eine weitere Visualisierung hilft, den Gesprächsverlauf genauer zu untersuchen. Farbige, sich bewegende Blasen zeigen auf, wie ausführlich Themen in einer Diskussion besprochen werden und welche Person dabei die Gesprächsführung übernimmt. Auch die Argumentationsstrukturen der Sprecher:innen stellt El-Assady grafisch dar und erlaubt dabei, die Parameter unkompliziert anzupassen.
Am Fallbeispiel der Fernsehdebatten zwischen Donald Trump und Hillary Clinton im Herbst 2016 hat El-Assady den Nutzen der interaktiven Sprachanalyse unter Beweis gestellt. Gerade die Blasenvisualisierung verdeutlicht gut, wie Trump den Ton angibt und so den Moderator und Clinton zwingt, ihm zu folgen.
Vorfreude auf neue interdisziplinäre Projekte
Das Echo auf die Analyse, welche die KI-Spezialistin auf einer Website veröffentlicht, ist gross. Mehrere amerikanische Universitäten haben sie für Vorträge eingeladen. Viele neue Zusammenarbeiten und Forschungsfragen seien daraus entstanden. Auch an der ETH stossen die KI-basierten Politikanalysen auf Interesse. Bereits haben Wissenschaftler:innen des Swiss Data Science Center El-Assady angefragt, ob sie ein ähnliches Programm für die schweizerdeutschen Parlamentsdebatten entwickeln könne.
El-Assady denkt inzwischen über neue Anwendungsgebiete für ihre Visualisierungen nach. Grosses Potential für die Sprachanalyse-Tools sieht sie bei der Bekämpfung von Falschinformationen auf Social-Media-Plattformen. So liesse sich damit beispielsweise der Informationsgehalt und die Argumentationslinien in extremen Filterblasen auswerten.
Um diese und viele weitere Ideen umzusetzen, hat sie sich für die Stelle am AI Center beworben. «Die ETH-Wissenschaftlerinnen und Wissenschaftler arbeiten an KI-Anwendungen für unglaublich viele verschiede Lebensbereiche», so El-Assady. Sie kann es kaum erwarten, neue interdisziplinäre Projekte mit anderen Pioneer Fellows anzupacken. Im soeben gestarteten Frühlingssemester wird sie ihre Expertise zudem in einer neuen Wahlvorlesung für Informatikstudierende weitergeben.