Projekt MorphoSphere
Intelligentes, Interaktives Repository für digitalisierte Morphologie
Bildgebungsverfahren sind einer der Hauptfaktoren für die Entstehung großer Datenmengen in Neutronen- und Photonenanlagen. Derzeit werden viele Petabyte an Rohdaten generiert, was zu einem Rückstau im Analyseprozess führt und den wissenschaftlichen Fortschritt in vielen Anwendungsbereichen verlangsamt. Um diesen kritischen Engpass zu überwinden, entwickelt MorphoSphere eine leistungsstarke Datenmanagementarchitektur für ein verteiltes, intelligentes und interaktives Speicher- und Analyse-Repository für digitalisierte Morphologie als Pilotprojekt für integrative Datenplattformen innerhalb des Dreiecks aus datenerzeugenden (Photonen-, Neutronen- oder Ionen-)Nutzereinrichtungen (PNI-Einrichtungen), groß angelegten Dateneinrichtungen (LSDF), Hochleistungsrechnersystemen (HPC) und spezifischen wissenschaftlichen Gemeinschaften. Ziel ist es, nicht nur die Verwaltung der Datenübertragung, -verarbeitung und -speicherung zu optimieren, sondern auch die computergestützte Analyse, Visualisierung und öffentliche Verfügbarkeit, wodurch die wissenschaftliche Produktion erheblich gefördert wird.
MorphoSphere wird innovative Ansätze entwickeln, um die Speisung verteilter Repositorien aus föderativer Datengenerierung zu erleichtern. Die weitere Integration von speicherverteilten Rechenverfahren und maschinellem Lernen in diese Repositorien wird die Nutzung aller in großen 3D-Datensätzen enthaltenen Informationen ermöglichen und so eine intelligente autonome 3D-Bildrekonstruktion, morphologische und morphometrische Analysen ermöglichen, unterstützt durch KI auf der Grundlage von verteiltem und föderiertem Lernen, selbst für sehr große volumetrische Datensätze und Probenserien aus Hochdurchsatz-Experimenten.
Die MorphoSphere-Architektur konzentriert sich zunächst auf die Bedürfnisse der Lebenswissenschaften für morphologische Studien und kann später übertragen und angepasst werden, um weitere domänenspezifische Anforderungen, z. B. aus der Materialforschung, zu integrieren. Sie wird die Korrelation morphologischer Daten mit anderen Datentypen, z. B. genetischen oder Umweltinformationen, erleichtern und so die Zusammenarbeit zwischen verschiedenen wissenschaftlichen Gemeinschaften fördern und zur Demokratisierung von Daten auf nationaler Ebene und darüber hinaus beitragen.
Das Universitätsrechenzentrum fokussiert in diesem Forschungsprojekt die Entwicklung und Bereitstellung eines verteilten Datenmanagementsystems. Dies muss insbesondere effizienten Zugriffsmöglichkeiten für die Forschenden und performante Datentransfers ermöglichen. Hierzu kommen verschiedene Konzepte und Lösungen, die in verschiedenen Communities entwickelt wurden zum Einsatz. Die Entwicklungen erfolgen in Zusammenarbeit mit den Projektpartnern am KIT und DESY und sollen nachhaltig für die Forschung bereitgestellt werden.
Status und Laufzeit
Das Projekt läuft von 2025-11 bis 2028-10.
Projektpartner:innen
- Engineering Mathematics and Computing Lab (EMCL), Prof. Dr. Vincent Heuveline, IWR, Heidelberg University
- Laboratorium für Applikationen der Synchrotronstrahlung (LAS), Prof. Dr. Tilo Baumbach, Karlsruhe Institute of Technology
- Service-Bereich Future IT - Research and Education (FIRE), Dr. Martin Baumann, University Computing Centre, Heidelberg University
- Deutsches Elektronen-Synchrotron DESY, Martin Gasthuber
Finanzierung
Das Projekt wird vom Bundesministerium für Forschung, Technologie und Raumfahrt (BMFTR) gefördert.