Auf dieser Seite möchten wir einen Überblick über die wichtigsten Begriffe rund um das Forschungsdatenmanagement (FDM) geben. Wir nutzen an vielen Stellen Inhalte aus dem Glossar von forschungsdaten.info mit freundlicher Genehmigung des Redaktionsteams. Falls Sie einen Eintrag vermissen, kontaktieren Sie uns gerne.
Die 3-2-1-Regel ist eine Empfehlung zur Datensicherung. Sie besagt, dass Sie
- mindestens drei Kopien der Daten,
- auf mindestens zwei verschiedenen Speichermedien (Externe Festplatte, USB-Stick, lokale Festplatte (aber lokal kritisch wg. Ransomware-Attacken)) und
- eine davon an einem anderen Ort (dezentral) hinterlegen sollten.
Wenn Sie an Ihrer Institution mit einem Cloud-System arbeiten, erfüllen Sie die Regel bereits, wenn Sie die entsprechenden Dateien in der Cloud, auf Ihrem Dienst-Laptop und einem anderen Medium (z. B. Sicherheitskopie auf externer Festplatte) abgelegt haben.
Die Academic Cloud bietet einen akademischen Werkzeugkasten für Forschung, Studium und Arbeit mit Tools zum Datenmanagement und zur Zusammenarbeit. Sie wird von der Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG) betrieben und kann von Universitäten, Hochschul- oder Forschungseinrichtungen in Niedersachsen genutzt werden kann. Die Server stehen in Niedersachsen und die angebotenen Dienstleistungen sind datenschutzkonform.
Die angebotenen Tools und Services sind praktische Softwares, die u.a. auf Weiterentwicklungen oder eigenen Instanzen von Open Source Software basieren. Sie finden dort Tools und Software in den folgenden Bereichen
- Virtuelle Ablage- und Speichermöglichkeiten
- Gemeinsame Dateibearbeitung, auch von LaTeX-Dokumenten
- Einfache Erstellung und Auswertung von Umfragen
- Erstellung von PIDs für Publikationen
- Sofortige Erstellung von Kurz-URLs
- Gemeinsame Chat- und virtuelle Konferenzräume
Eine Übersicht über alle verfügbaren Dienste in der Academic Cloud finden sie hier.
Die Anonymisierung von personenbezogenen Daten in der Wissenschaft gehört zur guten wissenschaftlichen Praxis. Laut BDSG (Bundesdatenschutzgesetz) § 3, Abs. 6 versteht man unter Anonymisierung jegliche Maßnahmen, die personenbezogene Daten so verändern, dass „die Einzelangaben über persönliche oder sachliche Verhältnisse nicht mehr oder nur mit einem unverhältnismäßig großen Aufwand an Zeit, Kosten und Arbeitskraft einer bestimmten oder bestimmbaren natürlichen Person zugeordnet werden können“. Zu unterscheiden ist die Anonymisierung von der Pseudonymisierung. Quelle: forschungsdaten.info
Um eine maximale Nachnutzbarkeit wissenschaftlicher Forschungsdaten zu gewährleisten, die prinzipiell dem Urheberrecht unterliegen können, kann die Vergabe zusätzlicher Nutzungsrechte z. B. durch eine entsprechende Lizenzierung der Daten in Betracht gezogen werden. Die Verwendung liberaler Lizenzmodelle, insbesondere der weltweit anerkannten Creative-Commons-Lizenzen (CC), ist dabei eine Möglichkeit, Bedingungen für die Nachnutzung der publizierten Forschungsdaten nachvollziehbar festzulegen. Quelle: forschungsdaten.info
Beachten Sie auch unseren Exkurs: Rechtliche Aspekte im FDM für weitere Informationen.
Weiterführende Informationen, Videos und andere nützliche Materialien zu Open-Content-Lizenzen finden sich auch hier.
Data Stewards sind Expertinnen und Experten für Forschungsdatenmanagement. Sie werden an Forschungseinrichtungen eingesetzt, um Forschende beim nachhaltigen Umgang mit ihren Daten zu unterstützen. Dezentrale oder Embedded Data Stewards arbeiten auf der Fakultäts-, Instituts- oder Projektebene und helfen Forschenden bei disziplinspezifischen Anfragen. Zu den Aufgaben von Data Stewards gehören vor allem die Beratung, Schulung, Bedarfsermittlung und Requirements Engineering. Quelle: forschungsdaten.info
In der Landesinitiative FDM NDS Säule 2 wird unter der Bezeichnung Data Steward die lokale FDM-Ansprechperson verstanden, die Forschende an den Hochschulen rund um den Forschungsdaten-Lebenszyklus begleiten und mit verschiedenen Angeboten das FDM an der Hochschule unterstützen und professionalisieren möchten.
Der Datenmanagementplan (DMP) ist ein strukturiertes Dokument über den Umgang mit Forschungsdaten vor, während und nach einem Forschungsprojekt. Datenmanagementpläne enthalten neben allgemeinen Informationen zum Projekt und einer Projektbeschreibung Informationen zu relevanten Policies, zum Datenhandling sowie zur Publikation und Archivierung der Forschungsdaten. Weitere Informationen finden Sie unter Schritt 1: Forschungsvorhaben planen.
Der Schutz von personenbezogenen Daten ist im Forschungsdatenmanagement vor allem im Bereich der Gesundheits- und sozialwissenschaftlichen Forschung von Bedeutung. Durch Anonymisierung oder Pseudonymisierung lassen sich aber auch sensible Daten weiterverwenden bzw. sicher ablegen. Es empfiehlt sich, lokale Datenschutzbeauftragte mit einzubeziehen. Ein erster Überblick über das Thema findet sich bei forschungsdaten.info.
Zudem gibt es mit den Interactive Virtual Assistants 1-3 von BERD@NFDI bereits erste Tools für den Datenschutz, die Online frei verfügbar sind. IVA1 zeigt beispielsweise anhand eines Fragenkataloges auf, ob ein Projekt überhaupt von der Datenschutzgrundverordnung (DSGVO) betroffen ist. IVA2 hilft Ihnen, herauszufinden, was Sie beachten müssen, um eine rechtmäßige Zustimmung zur Datenverarbeitung zu erhalten. Und IVA3 führt Sie durch den Prozess der Feststellung, ob die Datenverarbeitung im Rahmen Ihres Forschungsprojekts eine bundes- oder landesrechtliche Grundlage berührt.
Ein Digital Object Identifier (DOI) ist eines der gebräuchlichsten Systeme zur persistenten Identifikation digitaler, physischer oder abstrakter Objekte bzw. Dokumente. Ein DOI bleibt über die gesamte Lebensdauer eines bezeichneten Objekts gleich. Das DOI-System wird von der International DOI Foundation gemanagt. Quelle: forschungsdaten.info
Ein DOI wird von dafür autorisierten Einrichtungen vergeben. Die Vergabe von DOI erfolgt beispielsweise über Repositorien, wenn Daten in ihnen gespeichert werden bzw. von Verlagen/Zeitschriften, wenn Daten oder Artikel in ihnen publiziert werden.
DOI werden hauptsächlich für das wissenschaftliche Zitieren und Verlinken verwendet. Wichtig ist dabei die Zuordnung aktueller und strukturierter Metadaten.
Das Ziel der Langzeitarchivierung ist es, den Zugang zu archivierten Daten über einen langen Zeitraum zu ermöglichen. Eine Aufbewahrungsfrist der Forschungsdaten für einen Zeitraum von mindestens zehn Jahren hat sich als Standard etabliert. Dabei gilt es, einem Datenverlust vorzubeugen, die authentische Datenwiedergabe langfristig zu ermöglichen und ein geeignetes Archivierungssystem (Metadaten, Struktur) zu verwenden. Im Zuge der Planung werden die verschiedenen Aspekte der IT-Infrastruktur, wie Hard- und Software berücksichtigt. Zusätzlich sollten gesellschaftliche Entwicklungen mit in die Planung einbezogen werden. Quelle: forschungsdaten.info
ELN - findet man in der Regel als engl. Abkürzung - bedeutet Electronic Laboratory Notebook, also Elektronisches Laborbuch. Das meint Software, mit der sich der gesamte Lebenszyklus von Forschungsdaten digital festhalten lässt. Die ELN sollen die "analogen" Laborbücher ersetzen, zumal Untersuchungsergebnisse heute ohnehin digital erhoben werden. Bekanntere (Open Source) ELN sind Chemotion (von NFDI4Chem) für die Chemie und verwandte Wissenschaften, eLabFTW für jede Form der experimentellen Wissenschaften, openBIS (von der ETH Zürich) für Life Sciences und quantitative Forschungsbereiche oder NOMAD (von FAIRmat) für Materialwissenschaften.
Die Technische Universität Darmstadt hat einen ELN Finder auf ihrer Website erstellt, der es ermöglicht, nach einer passenden Laborbuch-Software zu suchen.
Die ZB Med hat zur Einführung ins Thema ein Video-Tutorial veröffentlicht und einen ELN-Wegweiser veröffentlicht, der helfen soll, das passende ELN zu finden.
Der Begriff FAIR (Findable, Accessible, Interoperable und Reusable) Data wurde 2016 erstmals von der FORCE 11-Community für ein nachhaltiges Forschungsdatenmanagement geprägt. Hauptziel der FAIR Data Prinzipien ist eine optimale Aufbereitung der Forschungsdaten, die demnach auffindbar, zugänglich, interoperabel und wiederverwendbar sein sollen. Die FAIR-Prinzipien wurden auch von der Europäischen Kommission in den Förderrichtlininen des EU Horizon 2020 aufgenommen und sind auch Teil des Antrags des Nachfolgeförderprojekts Horizon Europe. Quelle: forschungsdaten.info
Um Forschungsdaten möglichst FAIR zu machen bzw. zu halten, bietet forschungsdaten.info zudem einige praktische Tipps.
Die FAIR-Prinzipien finden Sie ausführlich beschrieben zum Beispiel bei der TIB Hannover.
Grundlegend versteht man unter Forschungsdaten Daten, die im Forschungsprozess erhoben und verarbeitet werden. Eine einheitliche Definition von Forschungsdaten ist allerdings nicht einfach, weil deren Ausgestaltung sehr vom jeweiligen Fachgebiet abhängt. Je nach Fachgebiet können das also Messwerte, Proben, Tabellen, Fotografien, Videos, Interviews, Fragebögen, Texte, Software, Code und vieles mehr sein. Wenn im Forschungsdatenmanagement die Rede von Forschungsdaten ist, bezieht sich das meistens auf digital vorliegende Forschungsdaten.
Das Verständnis von Forschungsdaten hat sich vom Rohmaterial für Publikationen hin zu einer eigenständigen, wertvollen Ressource weiterentwickelt. Somit ist auch das Thema der Datenpublikation stärker in den Fokus gerückt.
Egal welche Forschung Sie betreiben und auf welche Art und Weise Sie Forschungsdaten nutzen oder produzieren: Das Thema betrifft uns alle.
Forschungsdatenmanagement (FDM) bezeichnet die Prozesse, welche Forschungsdaten durchlaufen. Dies sind vor allem die Aufbereitung, Verarbeitung und Verwaltung von Forschungsdaten. Daten sollten so aufbereitet werden, dass sie möglichst langfristig überprüfbar und nachnutzbar sind. Forschungsdatenmanagement sollte sich daher an den FAIR-Prinzipien orientieren. Das bedeutet, Forschungsdaten sollten Findable (Auffindbar), Accessible (Zugänglich), Interoperable (Interoperabel) und Reusable (Wiederverwendbar) sein.
Durch gute Planung und ein gutes FDM sind und bleiben Ihre Daten übersichtlich, geordnet und dokumentiert. Das erleichtert die Zusammenarbeit und ermöglicht das Nachvollziehen Ihrer Forschungsergebnisse. Darüber hinaus beugt gutes FDM dem Verlust von Daten vor.
Eine Forschungsdaten-Policy (auch Datenrichtlinie, Forschungsdatenrichtlinie oder Research data policy) ist ein Dokument, welches vorschreibt, wie an der betreffenden Institution mit Forschungsdaten umgegangen werden soll.
Dies soll dazu beitragen, dass die wichtige Ressource Forschungsdaten effizient gemanagt wird. Es existieren in Deutschland mittlerweile sowohl Datenrichtlinien einzelner Universitäten (institutionelle Policys) als auch interdisziplinäre und disziplinäre Richtlinien. Auch einige wissenschaftlichen Journale und die meisten Forschungsförderer (Forschungsräte, Vereine und Stiftungen) im internationalen Raum haben inzwischen eine solche Datenrichtlinie eingeführt. Quelle: forschungsdaten.info
Weitere Informationen zu Leitlinein und Policies finden Sie in diesem Artikel.
Betroffene müssen bei jeglicher Erhebung, Verarbeitung oder Veröffentlichung ihrer personenbezogenen oder personenbeziehbaren Daten transparent über den Zweck der Erhebung, die Art der Datenverarbeitung, die Speicherung, die Nutzung und den langfristigen Umgang mit ihren Daten informiert werden. Dies umfasst auch Informationen über die Maßnahmen zur Wahrung der Vertraulichkeit, wie beispielsweise die Anonymisierung, sowie ihre Rechte, die Einwilligung jederzeit widerrufen und eine Löschung ihrer Daten verlangen zu können.
Beachten Sie auch unseren Exkurs: Rechtliche Aspekte im FDM für weitere Informationen.
Die Leitlinien zur Sicherung der guten wissenschaftlichen Praxis dienen als Orientierung im Rahmen wissenschaftlicher Arbeitsprozesse. In Deutschland sind diese Regeln zum Beispiel in Empfehlung 15 bis 17 der Deutschen Forschungsgemeinschaft (DFG) zu finden. Hier heißt es: „Wissenschaftlerinnen und Wissenschaftler sichern öffentlich zugänglich gemachte Forschungsdaten beziehungsweise Forschungsergebnisse sowie die ihnen zugrunde liegenden, zentralen Materialien und gegebenenfalls die eingesetzte Forschungssoftware, gemessen an den Standards des betroffenen Fachgebiets, in adäquater Weise und bewahren sie für einen angemessenen Zeitraum auf. Sofern nachvollziehbare Gründe dafür existieren, bestimmte Daten nicht aufzubewahren, legen die Wissenschaftlerinnen und Wissenschaftler dies dar. Hochschulen und außerhochschulische Forschungseinrichtungen stellen sicher, dass die erforderliche Infrastruktur vorhanden ist, die die Archivierung ermöglicht.“ Damit soll gewährleistet sein, dass Forschungsergebnisse überprüfbar bleiben. Eine Publikation der Daten fördert zudem die Nachnutzbarkeit der Forschungsdaten. Quelle: forschungsdaten.info
Die 19 Leitlinien des Kodex „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“ müssen Hochschulen und Forschungseinrichtungen rechtsverbindlich umsetzen, um Fördermittel der DFG erhalten zu können.
Metadaten sind letztlich nichts anderes als Daten, die Daten beschreiben. Am bekanntesten sind Metadaten aus dem Bibliothekswesen: So werden beispielsweise für eine Publikation Angaben darüber gemacht, wer der/die Autor*in ist, wann das Werk erschienen ist, wo es bei wem verlegt wurde, in welcher Sprache es erschienen ist usw. In vielen Disziplinen haben sich Standards entwickelt, nach denen ein Datensatz, ein Forschungsergebnis oder eine Untersuchung beschrieben werden sollen, die naturgemäß sehr unterschiedlich sind. Einen Überblick über Metadatenstandards nach Fachdisziplinen finden Sie beispielsweise im Metadata Standards Catalogue der Research Data Alliance (RDA) bei der University of Bath (UK).
Unter Open Access wird ein kostenloser und möglichst barrierefreier Zugang zu digitalen wissenschaftlichen Inhalten verstanden. Den Nutzenden werden in der Regel umfangreiche Nutzungsrechte und einfache Zugangswege ermöglicht. Die Urheberschaft verbleibt dabei in der Hand des Urhebers. Durch Open Access können wissenschaftliche Informationen maximal verbreitet, genutzt und weiterverarbeitet werden. Open Access stellt eine wichtige Errungenschaft der Open-Science-Bewegung dar.
Bei der Veröffentlichung von wissenschaftlichen Inhalten werden vornehmlich zwei Wege unterschieden:
- Die Veröffentlichung von wissenschaftlichen Inhalten in einem Open-Access-Medium, wird als „Goldener Weg“ bezeichnet.
- Die Veröffentlichung einer kostenpflichtigen und einer parallelen kostenfreien Version, wird „Grüner Weg“ genannt
Weitere Informationen finden Sie z.B. auf forschungsdaten.info.
open-access.network ist eine disziplinübergreifende Plattform zum Thema Open Access. Auf der Website finden sich umfassende, weiterführende Informationen und Materialien (z.B. anschauliche Videos; Blog).
Open Data (offene Daten) bezeichnet Daten, die von Dritten zu jedem Zweck (etwa zur Information, Auswertung oder auch bis hin zu wirtschaftlichen Weiterverwendung) genutzt, weiterverbreitet und weiterverwendet werden dürfen. Einschränkungen der Nutzung sind lediglich erlaubt, um den Ursprung und die Offenheit des Wissens zu wahren, so kann etwa durch die Kennzeichnung mit CC-BY darauf bestanden werden, dass die Urheberin oder der Urheber genannt werden muss. Die Idee von offenen Daten ist es, dass durch die freie Nachnutzung eine größere Transparenz gegeben ist und mehr Zusammenarbeit entsteht. Quelle: forschungsdaten.info
"Guide to Open Data" der Open Access-Publikationsplattform der EU „Open Research Europe“ (ORE).
Die ORCID (Open Researcher and Contributor ID) ist eine Identifikationsnummer, mit der sich alle in Forschung und Wissenschaft tätigen Personen eindeutig und dauerhaft identifizieren können. Sie ist eine Art digitale Visitenkarte, auf der Sie Fördermittel, Projekte, Publikationen, Werdegang u. a. m. eintragen können. Sie dient dazu, die eigene Arbeit im digitalen Raum eindeutig referenzierbar und leicht auffindbar zu machen.
Als Persistent Identifier versteht man im Forschungsdatenmanagement einen dauerhaften (persistenten), digitalen Identifikator, bestehend aus Ziffern und/oder alphanumerischen Zeichen, welcher einem Datensatz (oder einem anderen digitalen Objekt) zugeordnet wird und direkt auf diesen verweist.
Häufig verwendete Identifikator-Systeme sind DOI (Digital Object Identifiers), [ORCID (Open Researcher and Contributor), ROR (Research Organization Registry) und URN (Uniform Resource Names). Im Gegensatz zu anderen seriellen Identifikatoren (bspw. URL-Adressen) verweist ein Persistent Identifier auf das Objekt selbst und nicht auf seinen Standort im Internet. Ändert sich der Standort eines mit einem Persistent Identifier assoziierten digitalen Objekts, so bleibt der Identifikator derselbe. Es muss lediglich in der Identifikator-Datenbank der URL-Standort geändert oder ergänzt werden. So wird sichergestellt, dass ein Datensatz dauerhaft auffindbar, abrufbar und zitierbar bleibt. Quelle: forschungsdaten.info
Sowohl die Datenschutz-Grundverordnung (DSGVO) als auch das Bundesdatenschutzgesetz (BDSG) definieren personenbezogene Daten als Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person beziehen. Dies schließt Angaben wie Namen, Identifikationsnummern, Beruf oder Nationalität ein. Besonders schutzwürdig sind z.B. Daten zu ethnischer Herkunft, politischen Meinungen, religiösen Überzeugungen, Gesundheit und Sexualleben, die einem strengeren Schutz unterliegen.
Weitere Informationen finden Sie auf forschungsdaten.info sowie in unserem Exkurs: Rechtliche Aspekte im FDM.
Im Gegensatz zur Anonymisierung werden bei der Pseudonymisierung lediglich bestimmte Identifikationsmerkmale, wie beispielsweise der Name, durch ein Pseudonym (ein Buchstaben- und/oder Zahlencode) ersetzt werden, um so die Bestimmung der betroffenen Personen zu erschweren oder auszuschließen (BDSG § 3, Abs. 6a). Während der Dauer einer wissenschaftlichen Studie ist es häufig unvermeidlich personenbezogene Daten und Code in einer Referenzliste und die Studiendaten in einer davon getrennten Datenbank zu führen, also eine Pseudonymisierung von Daten durchzuführen. Eine Anonymisierung der Daten erreicht man, indem die Referenzliste, beispielsweise nach Abschluss der Studie, gelöscht wird, sodass kein Bezug zwischen einzelnen Personen und den Studienergebnissen mehr hergestellt werden kann. Quelle: forschungsdaten.info
Beachten Sie auch unseren Exkurs: Rechtliche Aspekte im FDM für weitere Informationen.
Repositorien sind Speicherorte für digitale Objekte. Dort können Forschungsdaten abgelegt und auch veröffentlicht werden.
Es empfiehlt sich, Forschungsdaten in einem fachspezifischen Repositorium zu veröffentlichen, weil dort der Impact größer ist. Ist ein solches nicht bekannt, kann bei Re3Data (eine Art Suchmaschine für Repositorien) mit entsprechenden Filtern nach einem passenden Repositorium gesucht werden. Auch bei Risources (über Katalog/Kategorie/Open-Access-Repositorium) lassen sich Repositorien finden. Selbstverständlich kann Ihnen auch die FDM-Ansprechperson Ihrer Hochschule oder unser Projektteam bei der Suche behilflich sein.
Spielt die fachspezifische Veröffentlichung keine Rolle, sollte ein institutionelles Repositorium (i.d.R. das der eigenen Institution) gewählt werden. Für unseren Verbund ist das GRO.data.
Sollte das nicht möglich oder zielführend sein, kann auf generische Repositorien wie Zenodo oder Figshare zurückgegriffen werden.
Das Research Organization Registry bietet offene, nachhaltige und eindeutige Identifikatoren für Forschungsorganisationen weltweit. Jeder Eintrag ist mit einer ROR-ID versehen und beschreibt die oberste Ebene einer wissenschaftlichen Einrichtung, ohne Abteilungen wie Fakultäten oder Sektionen zu erfassen. Der Schwerpunkt von ROR liegt auf der Zuordnung von Publikationen und Forschungsressourcen zu Einrichtungen (Affiliation).
Damit Publikationen und Ressourcen korrekt den Einrichtungen der Autorinnen und Autoren bzw. der erstellenden Personen zugeordnet werden, muss die ROR-ID in die DOI-Metadaten eingetragen werden. Quelle: PID Service TIB