Einführung

Beim Teilen und Publizieren von Daten spielt die Dauer der Datenablage und -speicherung zunächst eine untergeordnete Rolle. Gemäß den Leitlinien zur guten wissenschaftlichen Praxis der DFG sollen Forschungsdaten für „einen angemessenen Zeitraum“ aufbewahrt werden, was in der Regel einen Zeitraum von 10 Jahren umfasst. [1]

Ein Backup ist kein Archiv - Eine langfristig verlässliche Sicherung digitaler Informationen ist nur in einem „echten“ digitalen Archiv möglich.

Eine langfristige Sicherung sowie dauerhafte Aufbewahrung und Pflege über 10 Jahre nennt man Langzeitarchivierung, im Falle von digitalen Daten handelt es sich um Digitale Langzeitarchivierung (DLZA).

Für eine digitale (Langzeit-) Archivierung müssen Forschungsdaten bestimmte Voraussetzungen erfüllen, damit diese über einen langen Zeitraum auch nachnutzbar bleiben, d.h. langfristig ohne Verlust wiedergegeben und interpretiert werden können. [2] Die große Herausforderung für die Langzeitarchivierung besteht demnach darin, Daten, Metadaten und Dokumente so zu erhalten, dass sowohl die Lesbarkeit der Dateien als auch die Interpretierbarkeit ihrer Inhalte garantiert werden. Die Langzeitarchivierung ist dabei einem fortwährenden technischen und soziokulturellen Wandel unterworfen. Die Verwendung möglichst offener, nicht proprietärer Datenformate wird empfohlen.

Langzeitarchivierung weist drei zentrale Bereiche auf: 1. die Dokumentation der Forschungsdaten, 2. deren langfristige Aufbewahrung sowie 3. die Bereitstellung eines Zugangs zu den Daten. [3]

Warum sollten Daten archiviert werden? [4]

  • Forschungsergebnisse belegen, reproduzieren und darauf aufbauen
  • Integrität, Transparenz und Nachvollziehbarkeit der Forschung gewährleisten
  • langfristiger Datenerhalt für die wissenschaftliche Gemeinschaft
  • Daten langfristig nutzbar (lesen) und interpretierbar (verstehen) halten

Welche Herausforderungen bestehen bei der Langzeitarchivierung?

  • durch den technologischen Wandel werden Datenträger, Dateiformate, Software und Ablageorte schnell unzugänglich und unbenutzbar
  • regelmäßige Überprüfung der Daten im Hinblick auf Erhaltung ihrer Nutzbarkeit sicherstellen vs. Personalfluktuation, Projektbefristungen
  • Bereitstellung technischer Infrastruktur und organisatorischer Maßnahmen
  • Etablierung von Workflows und Standards (Rechtsfragen, Qualitätssicherung)

Wie lassen sich die Herausforderungen lösen?

  • umfassende Dokumentation und Beschreibung durch Metadaten, Verwendung von Metadatenstandards
  • Verwendung von Dateiformaten, die kompatibel und zur Langzeitarchivierung geeignet sind sowie die verlust­freie Konvertierung in alternative Formate ermöglichen
  • Verwendung offener Dateiformate (offen dokumentierte, nachvollziehbare Spezifikationen, Hersteller-unabhängig, mit unterschiedlichen Programmen nutzbar)
  • Durchführung der Langzeitarchivierung durch renommierte Dateninstitute/ Forschungsdatenzentren, dann müssen Forschende o.g. Anforderungen nicht selbst gewährleisten
  • Nutzung vertrauenswürdiger, möglichst zertifizierter Archive

Rechtliche Aspekte & Ethik

In der Phase der Datenarchivierung müssen verschiedene rechtliche Aspekte berücksichtigt werden (siehe Exkurs Rechtliche Aspekte im FDM). Besonders das Urheberrecht spielt eine zentrale Rolle. Im digitalen Raum ist jede Vervielfältigung urheberrechtlich relevant, die die Rechte von Autor*innen, Eigentümer*innen, Verlagen etc. tangieren kann. Daher ist es essenziell, die Urheberrechte klar zu definieren und entsprechende Genehmigungen einzuholen, bevor Daten archiviert werden. Bei der Archivierung personenbezogener Daten sind Zustimmung und Einwilligung der betroffenen Personen notwendig. Es muss festgelegt werden, nach welcher Zeit diese Daten gelöscht werden, um den Datenschutzanforderungen gerecht zu werden. Eine zwingende Anonymisierung ist erforderlich, um die Privatsphäre der Betroffenen zu schützen und gesetzliche Vorgaben zu erfüllen.

Das Vertragsrecht regelt, wie lange Daten aufbewahrt werden dürfen oder müssen. Es ist wichtig, diese vertraglichen Vorgaben genau zu befolgen, um rechtliche Konflikte zu vermeiden und die Integrität der archivierten Daten sicherzustellen.


[1] Deutsche Forschungsgemeinschaft (2022). Leitlinien zur Sicherung guter wissenschaftlicher Praxis. Kodex. https://doi.org/10.5281/zenodo.6472827, Leitlinie 17: Archivierung
[2] https://www.tu-braunschweig.de/forschung/forschungsdaten-transparenz/forschungsdaten/grundkurs-forschungsdatenmanagement/archivieren-publizieren-und-teilen-von-forschungsdaten/archivieren
[3] https://blog.rwth-aachen.de/forschungsdaten/2023/08/24/forschungsdaten-archivieren-publizieren
[4] https://www.uni-kassel.de/forschung/forschungsdatenmanagement/daten-managen/daten-archivieren-und-publizieren

Weiterführendes