Nachlese zur neunten Digital Kitchen von SaxFDM

von Maik Fiedler

Den letzten SaxFDM Digital Kitchen Termin des Jahres 2021 bestritt am 16. Dezember Dr. Oliver Knodel vom Helmholtz-Zentrum Dresden – Rossendorf.

Der Informatiker und Data Scientist stellte in der Session mit dem Titel „Full Integrated Research Data Lifecycle – The Project HELIPORT“ ein ambitioniertes Projekt zur Unterstützung des Datenmanagements am HZDR vor.

Zu Beginn des Kitchens skizzierte Knodel die Ausgangspunkte, welche zur Idee, Beantragung und Umsetzung der HELmholtz ScIentific Project WORkflow PlaTform, kurz HELIPORT, geführt haben.

Speziell am HZDR bestehen Herausforderungen hinsichtlich des Forschungsdaten und -softwaremanagements im Bereich der sehr diversen (Groß)forschungsanlagen und in der Betreuung von unterschiedlichen Nutzergruppen. Für die Bewältigung der anfallenden Aufgaben im Lebenszyklus eines Forschungsexperimentes stehen den MitarbeiterInnen des HZDR zahlreiche Services und Software-Werkzeuge zur Verfügung. Werkzeuge beispielsweise zur Proposal-Einreichung und Publikation von Forschungsdaten sind bereits vielfältig erprobt und erfreuen sich großer Nutzerzahlen. Alle Services haben jedoch unabhängig von ihrer Handhabung gemeinsam, dass sie untereinander nicht oder nur unzureichend miteinander verbunden und die entstehenden Metadaten daher nicht interoperabel sind.

WissenschaftlerInnen benötigen gemäß der FAIR-Prinzipien für die Dokumentation der Datengenese in allen Phasen des Forschungsprojektes zusätzliche Metadaten. Der Data Life Cycle und die damit verbundenen Aufgaben sind bekannter weise oft nur schwer mit zentralen Projektaufgaben vereinbar.

Vor diesem Hintergrund war 2019 die Idee zur Entwicklung eines Data Management Guidance Systems geboren. Diese beinhaltete das Mapping aller Systeme des HZDR auf die konkreten Aufgaben im Datenlebenszyklus und somit das Angebot einer signifikanten Unterstützung im Dokumentationsprozess. Nicht zuletzt lassen sich durch ein Guidance System auch neue bzw. bis dato unbekannte Tools niedrigschwellig in den institutionellen Servicekatalog integrieren und somit für das Forschungsdatenmanagement etablieren. Die systematische und prozessimmanente Versorgung mit Managementtools wird in Zukunft dabei helfen, der permanenten Überforderung/Überlastung der WissenschaftlerInnen am HZDR vorzubeugen.

Dr. Knodel erläuterte wie HELIPORT den kompletten Lebenszyklus eines wissenschaftlichen Projekts registrieren und die zugehörigen Programme und Systeme miteinander verknüpfen kann. Die maschinenlesbare Dokumentation aller im jeweiligen Forschungsprojekt durchgeführten Arbeitsschritte macht jeden Arbeitsschritt transparent, verständlich sowie zitierbar und trägt somit zur Einhaltung guter wissenschaftlicher Praxis bei.

Das Stichwort Dokumentation ist überhaupt eines, wenn nicht sogar das größte Benefit des HELIPORT-Projektes. Da die Genese der Daten automatisiert dokumentiert werden, können durch die Einbeziehung dieser Beschreibung weitere synergetische Effekte auf dem Weg zu FAIR erzeugt werden. Die Dokumentation ermöglicht nicht nur die Reproduktion von Forschungsergebnissen, sondern erlaubt auch weitere Automatisierungsschritte bei vergleichbaren Forschungsabläufen und lässt zudem eine präzisere Planung bzw. Beschreibung des Datenmanagements im Rahmen von Drittmittelprojekten zu.

Durch die Generierung entsprechender PIDs im Projektverlauf lassen sich systematisch elementar wichtige Punkte im Forschungsprozess identifizieren und verlustfrei reproduzieren. Eigens dafür wurde am HZDR ein eigener Handle-Server aufgesetzt. Für praktisch jeden Projektschritt kann ein persistentes Handle vergeben werden und zunächst intern auch versioniert und aufgelöst werden. Eine weitere Anreicherung der Metadaten wird durch die Einbindung von extern nachnutzbaren Identifiern wie DOIs für Publikationen, ORCIDs für Personen oder RORs für Großgeräte erreicht. Am Ende des jeweiligen Prozesses sind Daten und Workflows(Software) über das hausinterne Datenrepositorium RODARE mit DOI versionier- und publizierbar. Auch der Workflow selbst (in der Common Workflow Language, kurz CWL, beschrieben) kann als Teil des Datenpaketes veröffentlicht werden. Dem Zielpunkt „FAIR“ kommt das HZDR damit deutlich näher als bisher. Auch die Betreiber der im Prozess genutzten Geräte werden mit dieser Referenz sichtbarer.

Die nahtlose Kopplung zwischen HELIPORT und HPC Rechenressourcen erfolgt über das Authentifikationssystem UNICORE. Die CWL Workflows in HELIPORT werden im Rahmen des Projektes direkt auf die UNICORE-eigene Beschreibungssprache abgebildet, um so möglichst effizient auf unterschiedlichen HPC Systemen, welche UNICORE unterstützen, ausgeführt  werden zu können. 

Die Arbeit am Projekt schreitet gut voran. Das Webfrontend ist bereits in einem ersten Entwurf komplett nutzbar. Auch eine Rest API zur Kommunikation mit externen Systeme ist vorhanden. Die Plattform wird aktuell mit Testprojekten (TELBE am HZDR, Polaris Laser in Jena) exemplarisch getestet und hinsichtlich Usability evaluiert. Die HELIPORT-Instanz läuft derzeit nur am HZDR. Sie soll aber zeitnah bei den Projektpartnern an der Universität Jena, dem Forschungszentrum Jülich eingesetzt werden und anschließend innerhalb der Helmholtz-Gemeinschaft Deutscher Forschungszentren (HGF) zur weiteren Adaption freigegeben werden.

Das „Look and Feel“ von HELIPORT zeigte Dr. Knodel anschließend in einer kleinen Live Demo und gab somit potenziellen Nachnutzern bereits einen Blick in eine „rosige“ Zukunft der Metadatenerfassung. Während einer lebhaften Diskussion stand Knodel für Fragen nach Nutzerakzeptanz, Usability, Mehrarbeit, Templates und Automatisierung Rede und Antwort.

Noch etwas in eigener Sache:

Die Digital Kitchen im SaxFDM lebt vom „gemeinsamen Kochen“ und steht für alle offen. Gern können Sie Ihr Projekt in einer der nächsten Veranstaltungen vorstellen und damit eine überregionale Community erreichen. Immer am dritten Donnerstag im Monat. Wir, die KollegInnen vom AK Öffentlichkeitsarbeit im SaxFDM, freuen uns auf Sie. Sprechen Sie uns gern an.