Das Konzept von RePlay-DH: Datenmanagement per Versionsverwaltung

Ein einfacher Client hilft bei der Nutzung einer komplexen Versionsverwaltungssoftware.

Für viele Wissenschaftler in den digitalen Geisteswissenschaften stellt sich ab einem bestimmten Punkt die Frage, wie man am besten den Überblick in komplexen Projekten behalten kann. Das Projekt Replay-DH entwickelt anhand eines Use Case aus der Computerlinguistik zur Korpus-Annotation eine Softwareumgebung, die durch den Einsatz von Versionsverwaltungssoftware für Übersichtlichkeit beim Management der eigenen Daten und Tools während des Forschungsprozesses sorgen soll.

Die Problemstellung

Prozesse in den digitalen Geisteswissenschaften tendieren dazu, teils hochgradig individualisiert abzulaufen und können dabei beliebig komplex werden. Das Resultat: bei ungenügender Dokumentation, kann eine Nachvollziehbarkeit der Resultate unter Umständen nur noch eingeschränkt, im schlimmsten Falle gar nicht mehr, gewährleistet werden. Während die digitalen Geisteswissenschaften bislang viele Softwareentwicklungen im Bereich virtueller Forschungsumgebungen verzeichnen, ist ein Ansatz, der den Wissenschaftler an seiner eigenen Forschungsumgebung am Arbeitsplatz abholt, bislang nicht realisiert und auch in der Literatur noch nicht näher beschrieben.

Das Konzept

RePlay Digital Humanities nimmt dieses Manko als Prämisse zur Entwicklung einer Neu-Implementierung eines bestehenden Systems, indem das Konzept einer Versionsverwaltungssoftware für einen neuen Kontext und eine neue Nutzergruppe anwendbar gemacht wird, kann der Forscher seine gewohnten Arbeitsprozesse beibehalten. Replay-DH unterstützt den Forscher während des Arbeitsprozesses beim Management und bei der Beschreibung der genutzten Tools und der erhobenen Daten, um eine bestmögliche Reproduzierbarkeit der Forschungsergebnisse zu gewährleisten.

Wie funktioniert das Ganze? Die Architektur hinter der Idee
  • Git als Basis des Datenmanagements
  • Java-Anwendung als plattformübergreifende Software
  • Anbindung an (GitLab-)Server zur Kollaboration in Forschergruppen
  • Anbindung an (DSpace-)Repositorien zur Veröffentlichung der Inhalte
Warum sollte ich den Replay-Client als Wissenschaftler nutzen?
  • Bessere Dokumentation und Wiederauffindbarkeit bestimmter Arbeitsstände
  • Möglichkeit der Anbindung an eine lokal vorahandene Git-Infrastruktur (z.B. GitLab am Institut)
  • Möglichkeit des kollaborativen Arbeitens mit Kollegen
  • Möglichkeit der Anbindung an eine Veröffentlichungs-Infrastruktur

RePlay-DH-Client: Live-Demo bei den Open-Access-Tagen 2017

Client-Demo am Montag, den 11.9.2017, ab 15 Uhr im kleinen Lesesaal der SLUB Dresden.

Wer eine erste Version des Clients live sehen möchte kann dies bei den diesjährigen Open-Access-Tagen in Dresden:

Wir zeigen eine erste Version unseres Clients am Montag, den 11.09.2017 ab 15 Uhr im kleinen Lesesaal der SLUB Dresden im Rahmen des Tool-Marktplatzes. Mit diesem neuen Format bieten uns die OA-Tage die Möglichkeit, interessierten Nutzern ein Hands-On zu ermöglichen.

Die erste Testversion unseres Clients erlaubt bereits Einblicke in das vorgesehene Software-Design und die geplanten Funktionen. Ein wesentlicher Fokus liegt dabei auf einer einfachen Bedienbarkeit bei gleichzeitig höchstmöglicher Flexibilität in der Verwaltung und Bezeichnung der eigenen Forschungsdaten.

Bei Interesse kann eine Testversion des Clients bei der Projektgruppe angefragt werden.

Posterbeitrag E-Science-Tage 2017

Poster zeigt Konzept hinter dem Projekt ReplayDH

Die E-Science-Tage 2017 in Heidelberg boten unserem Projekt eine gute Möglichkeit, das für Replay-DH entwickelte Konzept näher zu erläutern: im Zentrum steht dabei die Entwicklung eines Clients zur Verwaltung von Forschungsdaten für Corpus-Annotationen in der Computerlinguistik.

Mit unserem Posterbeitrag konnten wir die Idee, spezifische Prozesse aus der Computerlinguistik (im Sinne eines „Workflow-Trackers“) mit einer Versionsverwaltung zu dokumentieren, Arbeitsstände mit Kollegen teilen zu können und daraus ausgewählte Teilschritte zu veröffentlichen, erstmals einem interessierten Publikum näher erläutern und erste Feedbacks einholen. Wir halten Sie über die Weiterentwicklung unseres Clients auf dem Laufenden und freuen uns über Feedback aus der Community der Computerlinguisten und dem Bereich der Digital Humanities!

Neuigkeiten aus dem Projekt Replay-DH

Informationskanal zu den aktuellen Entwicklungen, per RSS-Feed abonnierbar

Die Entwicklungen im Projekt Replay-DH schreiten voran und das Feedback von potenziellen Nutzern zu unseren Konzepten und in Kürze zu unserem Client, wird immer relevanter.

Mit diesem Blog stellen wir allen Interessierten Informationen rund um das Projekt bereit. Im Zentrum von Replay-DH steht die Entwicklung eines Clients, der Forschern bei der Arbeit mit Text-Corpora, genauer bei der Corpus-Annotation, eine Hilfestellung geben soll: der Client dokumentiert dabei die eigenen Arbeitsprozesse und soll es in einem späteren Entwicklungsstadium ermöglichen, Arbeitsstände mit Kollegen zu teilen. Das Programm nutzt dabei die Funktionen der Versionsverwaltungssoftware Git und passt diese auf das Anwendungsszenario der Corpus-Annotation an.

In unserem Blog werden wir sie über weitere Entwicklungen und neu implementierte  Features auf dem Laufenden halten! Wenn Sie Interesse an den weiteren Entwicklungen haben, können Sie sich auch einen RSS-Feed einrichten. Da das Projekt Replay-DH mit dem Feedback aus der Fachcommunity lebt, ist Ihr Feedback sehr willkommen!