Einführung
Forschungsdaten sind die Basis von Erkenntnissen und wissenschaftlichem Fortschritt. Im Forschungsprozess erhobene bzw. erzeugte Daten sind nicht nur für die eigene Arbeit relevant, sondern auch für Andere. Einerseits findet Forschung oftmals im Verbund mit anderen Forschenden und weiteren Partnereinrichtungen statt, dann müssen Daten über Einrichtungs- und Ländergrenzen hinweg geteilt und ausgetauscht werden, damit sie aus verschiedenen Blickwinkeln (weiter)-verarbeitet werden können. Andererseits können Dritte, wie z.B. andere Forschende und die Öffentlichkeit, unabhängig vom ursprünglichen Forschungsprojekt und -zweck ein Interesse an bereits vorhandenen Daten haben, damit sie diese nicht selbst erheben, sondern überprüfen und auch nachnutzen können. Für ihren Zugriff müssen Forschungsergebnisse und -daten publiziert und damit veröffentlicht werden.
Grundsätzlich sollten Forschungsergebnisse gemäß guter wissenschaftlicher Praxis nach den FAIR-Prinzipien aus Gründen der Nachvollziehbarkeit, Anschlussfähigkeit der Forschung und Nachnutzbarkeit in den wissenschaftlichen Diskurs eingebracht werden [1]. Grundlage hierfür ist die „Herstellung von öffentlichem Zugang zu Forschungsergebnissen“ [1], z.B in Form einer Veröffentlichung von Forschungsdaten in einem anerkannten Datenarchiv. Auch müssen die Vorgaben von Mittelgebern/ Forschungsförderern, Partnern und Publikationsorganen/Verlagen berücksichtigt werden. Forschende sollten spätestens in dieser Phase entscheiden, ob und wie sie Dritten den Zugang zu welchen Daten ermöglichen können. Dabei sind längst nicht alle erzeugten Daten zur Veröffentlichung relevant oder geeignet und geteilte Daten nicht immer gleichzusetzen mit offenen Daten. Bei der Selektion und Aufbereitung für eine Forschungsdatenveröffentlichung sollte ein Blick auf die Qualität der Daten gelegt werden.
Warum sollten Forschungsdaten geteilt und publiziert werden? [2]
- Erhöhung der eigenen Sichtbarkeit, Zitierfähigkeit, Überprüf- und Reproduzierbarkeit
- Wissen austauschen und Wissenserhalt sichern
- Nachnutzung ermöglichen statt Neuerhebung - Kosten werden gespart
- Datenverlust vorbeugen - Daten gehen nicht verloren, sondern stehen für weitere Forschungen zur Verfügung
- leichtere Zusammenarbeit, Erschließen neuer Kooperationen
- offene Wissenschaftskultur - gesamtgesellschaftlicher Nutzen offener Daten
- Erfüllung von Anforderungen Dritter (Hochschule, Mittelgeber, Verlage)
Damit wissenschaftliche Datensätze für Dritte leicht zu finden und nachnutzbar sind, sollten einheitliche Standards und Formate verwendet und die Datensätze mit Metadaten versehen werden. Diese die Daten beschreibenden Informationen können je nach Datentyp und Fachdisziplin sehr unterschiedlich sein.
Eine eindeutige Identifikation sowie dauerhafte Referenzierung und Auffindbarkeit gelingt mithilfe der Vergabe von Persistent Identifiers (PIDs), dauerhaften (persistenten), digitalen Identifikatoren. Häufig verwendete Identifikatoren für Daten und digitale Objekte sind DOI (Digital Object Identifiers) und URN (Uniform Resource Names) sowie ORCID (Open Researcher and Contributor ID) und ROR (Research Organization Registry) zur eindeutigen Identifikation von Personen bzw. Organisationen.
In allen Fällen werden Speichermedien benötigt, auf denen Daten sicher abgelegt und mit verschiedenen Berechtigungen und Sichtbarkeitsstufen für Dritte zugänglich gemacht werden können. Dazu werden folgende Speichermedien empfohlen:
- Fachliche, institutionelle oder generische Repositorien (Speicherort für digitale Objekte, Archiv)
- Datenjournale
- zum Teilen innerhalb von Verbundprojekten ebenfalls empfohlen: Cloud-Dienste (eigene Hochschule oder Angebot der niedersächsischen Academic Cloud)
Mit der Veröffentlichung von Daten müssen Hinweise zu ihrer Nachnutzung gegeben werden. Dies geschieht über die Vergabe von Lizenzen, wie z.B. die der Creative Commons.
Eine Datenveröffentlichung kann auf verschiedenen Wegen erfolgen. Sofern keine rechtlichen Aspekte dagegenstehen, wird eine Open Access Veröffentlichung besonders empfohlen, um die Daten einem großen Kreis an potenziellen Interessierten zuzuführen.
Rechtliche Aspekte & Ethik
Beim Teilen und Publizieren von Daten müssen rechtliche und ethische Rahmenbedingungen eingehalten werden (siehe Exkurs Rechtliche Aspekte im FDM).
- Zunächst sollten die Forschungsfolgen und ethischen Aspekte bewertet werden.
- Die Eigentums- und Urheberrechte der Daten müssen geklärt sein, bevor eine Veröffentlichung erfolgen kann.
- Vertragliche Regelungen und Geheimhaltungsvereinbarungen mit Dritten sind zu beachten.
- Forschungsergebnisse, die Patentanmeldungen betreffen, sollten nicht veröffentlicht werden.
- Für personenbezogene Daten ist ein Ethikvotum oder eine Einwilligungserklärung notwendig, und die Datensicherheit muss durch Anonymisierung, Pseudonymisierung oder Sicherheitsstandards wie ISO27001 gewährleistet sein.
- Je nach Fachdisziplin können weitere rechtliche oder ethische Aspekte bei der Abwägung einer Datenveröffentlichung eine Rolle spielen. Zum Beispiel in der Biodiversitätsforschung können dies Aspekte des Artenschutzes sein, aus welchen möglicherweise eine Veröffentlichung der exakten Koordinaten von Artenvorkommen nicht zulässig ist.
[1] Deutsche Forschungsgemeinschaft (2022). Leitlinien zur Sicherung guter wissenschaftlicher Praxis. Kodex. https://doi.org/10.5281/zenodo.6472827, Leitlinie 13: Herstellung von öffentlichem Zugang zu Forschungsergebnissen
[2] https://www.tu-braunschweig.de/forschung/forschungsdaten-transparenz/forschungsdaten/grundkurs-forschungsdatenmanagement/archivieren-publizieren-und-teilen-von-forschungsdaten