Forschungsdaten: Was muss bei der Veröffentlichung beachtet werden?
Was sind Forschungsdaten?
Für den Begriff „Forschungsdaten“ gibt es keine festgelegte Definition. Sie entstehen während des Forschungsprozesses und sind die Grundlage für wissenschaftliche Ergebnisse.
Wie Forschungsdaten letztlich aussehen hängt von der jeweiligen Disziplin ab. Auch sind keine bestimmten Formate festgelegt. Forschungsdaten in den Lebenswissenschaften können Mess-, Erhebungs- und Beobachtungsdaten, audio-visuelle Materialien, wie Bilder oder Videos, aber auch Softwareentwicklungen sein. Eine Publikation solcher Daten parallel zu einem wissenschaftlichen Artikel erlaubt die Verifikation und Reproduzierbarkeit der Ergebnisse und der daraus gezogenen Schlüsse. Ähnliches gilt für die singuläre Publikation von Forschungsdaten.
Welche Bedeutung haben die FAIR Data-Prinzipien?
Die FAIR-Prinzipien sind ein Set von Leitlinien für Forschungsdaten, sie fördern deren größtmöglichen Nutzen. Das Akronym FAIR steht hierbei für Findable (auffindbar), Accessible (zugänglich), Interoperable (interoperabel) und Reusable (wiederverwendbar). Sie wenden sich direkt an Datenproduzent:innen und Autor:innen von Forschungsdatenpublikationen und bieten allen Beteiligten am Forschungsprozess einen Rahmen für das Management wissenschaftlicher Daten.
Siehe auch: FAIR Data-Prinzipien
Was ist mit Forschungsdatenmanagement gemeint?
Die Veröffentlichung von Forschungsdaten setzt voraus, dass dem Thema von der Antragstellung bis zum Projektabschluss besondere Aufmerksamkeit gewidmet wird. Es müssen grundlegende Voraussetzungen geschaffen werden, damit eine Verifikation, die Reproduzierbarkeit der Ergebnisse und der daraus gezogenen Schlüsse, sowie die Nachnutzung der Daten möglich sind.
Das Forschungsdatenmanagement beschreibt alle Maßnahmen, die entlang des sog. Lebenszyklus von Forschungsdaten ergriffen werden sollten, um Daten FAIR zu machen.
Am Anfang steht die Erstellung eines Datenmanagementplans (engl.: Data Management Plan, kurz: DMP).
Wie funktioniert ein Datenmanagementplan (DMP)?
Im DMP wird festgelegt, wie die im Rahmen eines Projekts erhobenen Daten verwaltet und verwendet werden. Folgende Themen sollten dabei behandelt werden:
- Allgemeine Informationen zum Projekt und den Projektzielen
- Beschreibung bereits vorhandener Daten, die eventuell nachgenutzt werden können
- Beschreibung der zu erhebenden Daten, einschließlich einer Einschätzung der Datenmenge sowie zum Format
- Angaben zur geplanten Verwaltung und Speicherung der Daten sowie zur Archivierung
- Angaben zur Erstellung der Metadaten
- Informationen zur Behandlung von administrativen und rechtlichen Aspekten, wie zum Beispiel:
- Vorgaben der mittelgebenden Einrichtungen
- Zuständigkeiten
- Datenschutzaspekte
- Zugriffsrechte
- Angaben zu den benötigten Ressourcen, die zur Umsetzung des DMPs erforderlich sind
Datenmanagementpläne sind in einigen Förderprogrammen verpflichtend, eine Mitveröffentlichung wird als bewährte Praxis empfohlen. Sie stellen alle erforderlichen Maßnahmen sicher, sodass die Daten im Sinne einer guten wissenschaftlichen Praxis durch Qualitätssicherungsmaßnahmen publikationsfähig und nachnutzbar sind, und rechtliche Aspekte, wie z.B. Umgang mit persönlichen Daten, mitbedacht wurden.
DMPs müssen immer auch die disziplinspezifischen Gegebenheiten berücksichtigen. Die aus dem Projekt WissGrid entstandene Checkliste zum Forschungsdaten-Management bietet eine gute Orientierung, welche Aspekte dabei berücksichtigt werden sollten.
RDMO
Verschiedene Softwaretools unterstützen die Erstellung eines DMP. In Deutschland setzt sich mittlerweile der Research Data Management Organizer (RDMO) durch, der im Rahmen eines DFG-Projektes erstellt wurde:
„Mit dem Research Data Management Organiser (RDMO) können Institutionen und Forschende das Forschungsdatenmanagement ihrer Projekte strukturiert planen und durchführen. Es erlaubt das Erfassen aller relevanten Planungsinformationen in Datenmanagementplänen und die Verwaltung aller Datenmanagementaufgaben über den gesamten Datenlebenszyklus.“ (vgl. https://rdmorganiser.github.io/).
Was ist bei der Veröffentlichung von Forschungsdaten zu beachten?
Metadaten
Um Forschungsdaten auffindbar („findable“) zu machen, ist insbesondere die Metadatenerfassung wichtig. Über die Metadaten werden die Daten fachgemäß beschrieben.
Hierzu haben sich unterschiedliche, fachspezifische Metadatenstandards durchgesetzt, deren Nutzung das Kriterium „interoperable“ unterstützen. Die Verwendung von Standards in maschinenlesbarer Form - neben der von Menschen lesbaren - ist ein wichtiger Beitrag zur Interoperabilität von Forschungsdaten. Ein weiteres Beispiel ist die Verwendung von Ontologien bei der Schlagwortvergabe, in den Lebenswissenschaften z.B. der Thesaurus Medical Subject Headings (MeSH) oder der Multilingual Agricultural Thesaurus AGROVOC.
Persistente Identifikatoren
Die Vergabe von persistenten Identifikatoren, wie z.B. eines Digital Object Identifier (DOI) für Forschungsdaten, ermöglicht die Zitierfähigkeit. Damit ist zudem ein Reputationsgewinn für die Autor:innen verbunden.
Siehe auch: DOI-Service von ZB MED
Veröffentlichung in Zeitschriften
Bei der Publikation in Zeitschriften gilt zu beachten, dass einige Zeitschriften auf die gleichzeitige Veröffentlichung der wissenschaftlichen Ergebnisse und der dazugehörigen Daten bestehen. Dazu gehören unter anderem die Zeitschriften von PLOS ONE.
German Medical Science (GMS) bietet die Möglichkeit, Forschungsdaten, die einer Publikation zugrunde liegen, über das Forschungsdatenrepositorium Dryad zu veröffentlichen.
Welche Lizenzierungsarten und rechtliche Aspekte gibt es?
Die Rechtslage im Hinblick auf die Nutzung von Forschungsdaten ist kompliziert. Daher können wir Ihnen nur erste Hinweise geben.
Open-Content-Lizenzen
Generell ermöglicht die Lizenzierung über eine Open-Content-Lizenz, Nachnutzenden angepasste Rechte einzuräumen und somit dem Prinzip „reusable“ zu entsprechen. Wie für Textpublikationen können auch für Forschungsdaten Creative-Commons-Lizenzen (CC) verwendet werden. Die neueste Version CC 4.0 bietet sich mit einer verbesserten globalen Orientierung für die Lizenzierung von Forschungsdaten an und löst damit zunehmend die älteren Open-Data-Commons-Lizenzen (ODC) ab.
Siehe auch:
Creative-Commons-Lizenzen: Was ist darunter zu verstehen?
Open-Data Commons-Licenses
Urheberrecht
Bei Forschungsdaten greift je nach Beschaffenheit der Daten das Urheberrecht nicht, weil die dort geforderte Schaffungshöhe nicht erreicht wird (§ 2, Abs. 2 UrhG).
Urheberrechtsschutz besteht aber für eigens entwickelte Software oder Bild- und Tonmaterialien. Zudem greift bei Daten, die in einer Datenbank abgelegt sind, das Leistungsschutzrecht der Datenbankherstellenden (§ 87b UrhG). Datensammlungen sind somit ebenfalls geschützt, sofern diese „systematisch oder methodisch angeordnet und einzeln mit Hilfe elektronischer Mittel oder auf andere Weise zugänglich sind und deren Beschaffung, Überprüfung oder Darstellung eine nach Art oder Umfang wesentliche Investition erfordert“.
Leistungsschutzrecht
Das Leistungsschutzrecht schützt den- oder diejenige, der oder die die Investition getätigt hat, um die Daten aufzubereiten. Die reine Erstellung der Daten ist allerdings dadurch nicht geschützt. Das Urheberrecht greift bei Datenbankwerken lediglich für 15 Jahre. Eine im Zusammenhang mit Forschungsdaten vergebene Open Content-Lizenz (z.B. eine Creative Commons-Lizenz) ist möglicherweise wirkungslos, wenn das Urheberrecht nicht greift. Geschützt sind aber in jedem Fall Auswertungen, Abbildungen etc. die auf Grundlage der Daten angefertigt wurden. Mit der aktuellen Creative-Commons-Lizenz 4.0 können nun auch Datenbanken lizenziert werden.
Datenschutz
Insbesondere bei lebenswissenschaftlichen Studien, in denen personenbezogene Daten erhoben werden, greift das Bundes- und/oder Landesdatenschutzgesetz. Für die Speicherung und Weiterverwendung der personenbezogenen Daten auch zu wissenschaftlichen Zwecken ist eine Einverständniserklärung der Betroffenen einzuholen (§ 4 Abs. 1 BDSG). Außerdem müssen die Daten so anonymisiert werden, dass keine Rückschlüsse auf einzelne Personen mehr möglich sind (§ 3a BDSG).
Die Datenschutzbeauftragten einer Institution geben Auskunft darüber, wie die Daten erhoben und verarbeitet werden müssen, damit das Vorgehen rechtskonform ist. Generell ist zu empfehlen, rechtliche Aspekte von der zuständigen Abteilung der jeweiligen Institution prüfen zu lassen.
Siehe auch:
"Rechte an Forschungsdaten und Datenbanken" von irights.info
"Urheberrecht in der Wissenschaft" - eine Handreichung von BMBF und dbv
Welche Vorgaben der mittelgebenden Einrichtungen gibt es?
Nachfolgend haben wir die Vorgaben einiger Mittelgeber zusammengestellt. Die Liste ist nicht vollständig. Wenn eine Einrichtung dort nicht erscheint, bedeutet dies nicht, dass sie keine Vorgaben macht.
Deutsche Forschungsgemeinschaft (DFG)
Die DFG spricht sich für die Veröffentlichung von Forschungsdaten aus und fördert auch Projekte zum Aufbau entsprechender Infrastrukturen. Informationen hierzu finden Sie im Merkblatt „Informationsinfrastrukturen für Forschungsdaten“.
In ihren "Leitlinien zur Sicherung guter wissenschaftlicher Praxis" weist die DFG darauf hin, dass einer Veröffentlichung zugrundeliegende Daten für einen Zeitraum von 10 Jahren "zugänglich und nachvollziehbar" aufzubewahren sind. Diese Frist beginnt mit der Veröffentlichung. Eine Verkürzung der Frist muss begründet werden (Leitlinie 17). Darüber hinaus hat die DFG „Leitlinien zum Umgang mit Forschungsdaten“ verabschiedet, in denen die Erwartungen an die Antragsstellenden bezüglich des Umgangs mit Forschungsdaten in DFG geförderten Projekten und Unterstützungsleistungen zusammengefasst werden. Im Bereich der Lebenswissenschaften wurden zudem spezifische „Richtlinien zum Umgang mit Forschungsdaten in der Biodiversitätsforschung" veröffentlicht.
Für die Erstellung eines Datenmanagementplans bietet die "Checkliste für Antragstellende im Umgang mit Forschungsdaten" Anhaltspunkte.
National Institute of Health (NIH)
In ihrer aktuellen Policy macht das NIH die Vorlage eines Datenmanagement- und Veröffentlichungsplans für alle Anträge erforderlich, unabhängig von der Fördersumme. In diesen soll dargelegt werden, wie die wissenschaftlichen Daten und die zugehörigen Metadaten verwaltet und weitergegeben werden, unter Berücksichtigung möglicher Einschränkungen.
Siehe auch: „NIH Grants Policy Statement“
Europäische Kommission
In Horizon Europe, dem aktuellen Förderprogamm für Forschung und Innovation der EU, soll grundsätzlich freier Zugang zu Forschungsdaten gewährleistet sein, sofern keine legitimen Interessen, rechtliche Einschränkungen oder Vorschriften dagegen sprechen. In den Arbeitsprogrammen können darüber hinaus zusätzliche Verpflichtungen zum freien Zugang zu Forschungsergebnissen festgelegt werden.
Die Forschenden sind angehalten, sich an den FAIR-Prinzipien (s.o.) zu orientieren. Hierzu gehört u.a. die Speicherung und Bereitstellung der Daten in einem Repositorium.
Die Erstellung eines Datenmanagementplans ist in allen Projekten verpflichtend, welche Daten erstellen, nutzen oder wiederverwenden. Dafür wird ein DMP-Template bereitgestellt - dessen Verwendung wird empfohlen, ist jedoch nicht verpflichtend.
Siehe auch: Programm Guide Horizon Europe, Version 2.0, 2022
Wie finde ich ein geeignetes Forschungsdatenrepositorium?
Einige Einrichtungen in Deutschland haben eine Forschungsdaten-Policy und unterstützen ihre Angehörigen aktiv darin, Forschungsdaten zu publizieren. Dazu gehört auch die Bereitstellung der entsprechenden Infrastruktur, etwa eines Forschungsdatenrepositoriums. Für Daten, die in einem Repositorium publiziert werden, wird in der Regel immer ein Persistenter Identifier (z.B. DOI) vergeben, der die dauerhafte Verfügbarkeit und Zitierfähigkeit sicherstellt. Beim Einstellen der Daten kann festgelegt werden, ob die Daten erst nach einer Sperr- oder Embargofrist veröffentlicht werden sollen.
Um ein geeignetes Repositorium für die Ablage von Forschungsdaten zu finden, gibt es entsprechende Suchdienste, unter anderen das Registry for Research Data, kurz re3data. Für die Lebenswissenschaften werden dort derzeit mehr als 1.650 internationale Repositorien angezeigt, in Deutschland gibt es über 190 Repositorien in diesen Disziplinen.
PUBLISSO – Fachrepositorium Lebenswissenschaften (FRL)
Im FRL können digitale Forschungsdaten eigenständig sowie im Zusammenhang mit wissenschaftlichen Publikationen verzeichnet und bis 1 Terabyte kostenfrei veröffentlicht werden. Eine Ausnahme bilden Daten mit Personenbezug, welche unter den Datenschutz fallen. PUBLISSO bietet verschiedene Optionen für die Publikation von Forschungsdaten.
Wir beraten Sie hierzu gern! E-Mail: forschungsdaten@zbmed.de
Dryad
Eine weitere Alternative für Daten aus den Lebenswissenschaften ist Dryad. Das Repositorium fungiert als Speicherort von Daten, die wissenschaftlichen Artikeln zugrunde liegen. Das Einstellen von Datensätzen ist kostenpflichtig, während die Nutzung der dort unter einer Creative-Commons-Lizenz verfügbar gemachten Daten kostenfrei ist. Die Gebühren werden zur Finanzierung der Infrastruktur und zur Sicherstellung der langfristigen Zugreifbarkeit verwendet. Dryad geht hierzu Kooperationen mit Institutionen, Zeitschriften, Universitäten, Fachgesellschaften etc. ein, aber auch Mitglieder von Einrichtungen, die keine Kooperation mit Dryad haben, können gegen entsprechende Kostenübernahme ihre Datensätze zu Verfügung stellen. ZB MED kooperiert mit Dryad im Rahmen von German Medical Science (GMS).
Zenodo
Ein fachübergreifendes Repositorium, welches neben wissenschaftlichen Publikationen auch Forschungsdaten erfasst, ist ZENODO. Hier können Sie beispielsweise gezielt nach Datensätzen, Video-/Bildmaterial oder Software recherchieren. Das Repositorium wird vom CERN in Genf betreut und weiterentwickelt. Der Aufbau wurde durch EU-Gelder finanziert und ist Teil einer europaweiten Open-Access-Infrastruktur.
Welche Alternativen zu Forschungsdatenrepositorien gibt es?
Auch viele Verlage haben mittlerweile die Bedeutung von Forschungsdaten erkannt und bieten den Autor:innen an, diese als Supplements mit zu veröffentlichen. Einige Zeitschriften fordern dies sogar.
Zudem gibt es spezielle „Data Journals“, die sich auf die Veröffentlichung von Forschungsdaten spezialisiert haben. Eine nicht abgeschlossene Liste zur ersten Orientierung findet sich im Wiki von Forschungsdaten.org.
Auch im Zuge der Diskussion um „Big Data“ werden aktuell regelmäßig neue Zeitschriften gegründet, die sich mit methodischen Aspekten beschäftigen und geeignete Publikationsorgane darstellen können.
Siehe auch: unsere Informationsseiten zum Thema Forschungsdatenmanagement
Disclaimer
Bitte beachten Sie: Unser Service kann keine verbindliche Rechtsberatung anbieten, sondern stellt Informationen zur ersten Orientierung bereit. ZB MED – Informationszentrum Lebenswissenschaften hat die Angaben auf den folgenden Seiten sorgfältig geprüft, übernimmt aber für mögliche Fehler keine Haftung. Soweit nicht anders angegeben, beziehen sich Ausführungen zu einzelnen Rechtsnormen auf deutsches Recht. (Zuletzt aktualisiert: 16.03.2023).
Kontakt
Dr. Jasmin Schmitz
Leitung Publikationsberatung
Tel: +49 (0)221 478-32795
E-Mail senden
Birte Lindstädt
Leitung Forschungsdatenmanagement
Tel: +49 (0)221 478-97803
E-Mail senden
Weiterführende Links
Checkliste WissGrid
DOI-Service von ZB MED
Open-Data-Commons
PLOS ONE – Publication Criteria
GMS
zu rechtlichen Aspekten
Hoeren, Thomas: Skript Internetrecht
Open Data Commons – Licenses
Informationen zu „Rechte an Forschungsdaten und Datenbanken“ von irights.info
Handreichung „Urheberrecht in der Wissenschaft“ vom BMBF
zu Vorgaben der mittelgebenden Einrichtungen
DFG: Förderprogramm „Informationsinfrastrukturen für Forschungsdaten“
DFG: „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“
DFG: „Leitlinien zum Umgang mit Forschungsdaten“
DFG: „Richtlinien zum Umgang mit Forschungsdaten in der Biodiversitätsforschung“
NIH Grants Policy Statement
Guidelines on FAIR Data Management in Horizon 2020
zu Forschungsdatenrepositorien bzw. Alternativen
re3data
Dryad
GMS
ZENODO
Wiki „Forschungsdaten“
Zusätzliche Informationen
ZB MED Blog-Beitrag: "Electronic Lab Notebooks als Teil des Forschungsdatenmanagements"
Lauscher, M. & Vandendorpe, J. (2024): Why doing research data management? (abgerufen am 07.03.2024)