Dokumentation von Zwischenständen im Forschungsprozess mit RePlay-DH

Definition und Umsetzung von Prozessmetadaten

Was wir unter Prozessmetadaten verstehen

Um Zwischenergebnisse in der eigenen Forschungsarbeit besser dokumentieren zu können, ist es hilfreich auf ein einfaches Metadatenschema zurückgreifen zu können. Das ermöglicht, mit wenig Aufwand eine sinnvolle Beschreibung der getanen Arbeit zu gewährleisten. Im Projekt RePlay-DH wurde dazu ein Schema für Metadaten serialisiert, das den Prozess, der zu einem Zwischenstand geführt hat, abbildet. Diese Metadaten, im Projekt als „Prozessemetadaten“ bezeichnet, werden beim Speichern der Änderungen (als Commit in Git) mit abgelegt.

Wie wir die Prozesse in der Computerlinguistik abbilden

Dazu wurden sieben Felder definiert, die in einem Arbeitsschritt in der Regel anfallen: Das Feld „Title“ beinhaltet eine kurze Beschreibung des Workflowschritts. „Person“, bildet die Person(en) ab, die an diesem Arbeitsschritt beteiligt waren (z.B. Annotator). Die „Description“ bietet die Möglichkeit einen Freitext zur Beschreibung des Zwischenergebnisses einzugeben. Das  Feld „Input“ benennt die Dateien, die während des jeweiligen Arbeitsschrittes beteiligt waren (z.B. Korpora) . Das „Output“-Feld, beinhaltet die Ressourcen, die erzeugt, bzw. angepasst wurden (z.B. Ergebnisdaten).  Die eingesetzten Softwarewerkzeuge werden im Feld „Tool“  aufgenommen. Es ist dabei möglich, beliebig viele Programme oder Skripte zu erfassen und auch deren Ausführungsreihenfolge und deren Parameter anzugeben. In „Custom Properties“ können beliebige Metadateneinträge hinterlegt werden, um zusätzlich maschinenlesbare Informationen bereitstellen zu können.

Wie findet die technische Umsetzung statt?

Die Prozessmetadaten werden im Datenaustauschformat JSON modelliert und mit Hilfe eines JSON-Schemas validiert. Es wird dabei angestrebt, dass der Inhalt der Prozessmetadaten im Idealfall nur einmal angeben werden muss bzw. möglichst automatisch generiert wird, so dass der Nutzer sich auf seine eigentliche Forschungsarbeit konzentrieren kann. Des Weiteren soll es im Client künftig möglich sein, die Prozessmetadaten für den eigenen Arbeitsprozess auch auf andere Fachbereiche anzupassen.

Universität Stuttgart veröffentlicht Forschungsdatenpolicy

Leitlinien zum Umgang mit Forschungsdaten

Die Universität Stuttgart hat auf ihren Webseiten eine Forschungsdatenpolicy veröffentlicht. Sie enthält für die Forscher die Leitlinien der Universität zum Umgang mit Forschungsdaten. Die Forschungsdatenpolicy beschreibt und setzt die Rahmenbedingungen für den Umgang mit Forschungsdaten und die Organisation des Forschungsdatenmanagements an der Universität Stuttgart. Damit erhalten die Forscher der Universität Leitlinien, die sie als Richtschnur für den Umgang mit eigenen Forschungsdaten verwenden können.

Eine deutsche und englische Version befinden sich auf der Webseite der Universitätsbibliothek im Bereich Forschungsdatenmanagement.

Informationsseite zum Forschungsdatenmanagement online

Forschung und Daten managen: www.forschungsdaten.info

Im Rahmen einer Initiative des Ministeriums für Wissenschaft, Forschung und Kunst in Baden-Württemberg (MWK) ist eine neue Informationsseite zum Forschungsdatenmanagement in Baden-Württemberg und darüber hinaus online gegangen. Die Webseite bietet Informationen zum Prozess des Forschungsdatenmanagements und deckt damit alle relevanten Fragestellungen ab, die für ein erfolgreiches Forschungsdatenmanagement wichtig sind. Ferner gibt sie eine Übersicht über die in Baden-Württemberg geförderten E-Science-Projekte:

https://www.forschungsdaten.info/

Empfehlungen zum Forschungsdatenmanagement in Deutschland

Positionspapier des Rates für Informationsinfrastrukturen

Der Rat für Informationsinfrastrukturen hat in der Mitte dieses Jahres ein Positionspapier mit dem Titel „Leistung aus Vielfalt“ mit „Empfehlungen zu Strukturen, Prozessen und Finanzierung des Forschungsdatenmanagements (FDM) in Deutschland“ veröffentlicht. In diesem empfiehlt er den Aufbau einer Nationalen Forschungsdateninfrastruktur, kurz NFDI, die „Kompetenzen bündeln und [eine] Grundversorgung mit Services für das Forschungsdatenmanagement schaffen“ soll. In diesem Papier werden alle wichtigen Kriterien für ein erfolgreiches FDM genannt, die aus Sicht des Rates ausgebaut und gefördert werden sollten:

  • Einbettung der Informationsinfrastrukturen in einen europäischen Kontext,
  • Klärung der Fragen der Langzeitarchivierung und Verfügbarkeit der Daten,
  • Schaffung von organisatorischen Leitlinien im FDM (wie z. B. der Veröffentlichung von Forschungsdatenpolicies und der Erstellung von Datenmanagementplänen (DMP)),
  • Schaffung und Ausbildung von akademischen und nicht-akademischen Personal für das FDM sowie
  • Stärkung der Informationskompetenz in Lehre und Forschung.

Nachzulesen ist das Positionspapier auf der Webseite des Rates für Informationsinfrastrukturen und kann auch dort als PDF-Datei heruntergeladen werden.