Zuwachs bei den Datenwissenschaften
Genauere und modernere Messmethoden bedeuten detailliertere Einblicke in die Welt, die uns umgibt. Sie bedeuten aber auch, dass ein Vielfaches an Daten anfällt. «Diese zu verarbeiten und auszuwerten, wird zu einer immer grösseren Herausforderung», sagt Gerd Mann, Gesamtleiter der IT am PSI.
Das Swiss Data Science Center SDSC unterstützt den ETH-Bereich mit Expertise und neuen Methoden wie dem maschinellen Lernen und künstlicher Intelligenz, diese Aufgaben zu meistern, mit der die Forschenden vor allem in Forschungsprojekten mit komplexer Datenverarbeitung konfrontiert werden. Das SDSC entstand im Jahr 2017 im Rahmen des Strategischen Fokusbereiches Datenwissenschaften und ist bislang an der ETH Zürich und der École polytechnique fédérale de Lausanne EPFL angesiedelt. Ein dritter Standort wird nun in den kommenden Jahren am PSI in Villigen aufgebaut. «Diese neue Einheit wird dabei helfen, eine weitere Brücke zwischen den Datenwissenschaften und den Fachwissenschaften zu schlagen und gleichzeitig die stark wachsenden Datenmengen zu adressieren, die an grossen Forschungsinfrastrukturen in der Schweiz gesammelt werden», sagt SDSC-Direktor Olivier Verscheure.
Angestrebt wird dafür auch der Ausbau der Zusammenarbeit des PSI mit dem Schweizer Supercomputercenter Centro Svizzero di Calcolo Scientifico CSCS.
Datenexplosion – eine Chance für die Wissenschaft
Schätzungen haben ergeben, dass die Datenmengen, die jedes Jahr alleine am PSI generiert werden, von derzeit etwa 3,6 Petabytes (= 3,6 Billiarden Bytes) auf über 50 Petabytes in den nächsten vier Jahren ansteigen werden. Ein Grund dafür ist das geplante Upgrade der Synchrotron Lichtquelle Schweiz unter dem Projektnamen SLS 2.0, aber auch, dass der Freie-Elektronen-Röntgenlaser SwissFEL mit weiteren Strahllinien und damit neuen, noch komplexeren Detektoren in den Regelbetrieb gehen wird.
«Nicht allein das PSI steht vor der Herausforderung und den Chancen der wachsenden Datenmengen, sondern auch andere Forschungsdomänen innerhalb und ausserhalb des ETH-Bereiches», ergänzt Gerd Mann. Sprich: Überall, wo komplexe Systeme erforscht werden, werden heute mehr und komplexere Daten gemessen. Das gilt beispielsweise auch für die Lebenswissenschaften und die Umweltwissenschaften, welche viel mit Bild- und Videoaufnahmen arbeiten. Videoaufzeichnungen mit hoher Auflösung produzieren beispielsweise mehr als 7 Terabytes Rohdaten pro Stunde.