Skip to content

Daten finden und nachnutzen

Zitation:

Blümm, M., Fritsch, K., Bock, S., Hackenbuchner, J., Arning, U., & Förstner, K. U. (2024). VL_09_Finden. FDM@Studium.nrw Blended-Learning-Basiskurs „Forschungsdatenmanagement“ (Version 0.1). https://landesinitiativefdmnrw.github.io/FDMatStudium/thk/texte/VL_09_Finden.html

Lernziele

INFO

Icon_Findability

Icon_Nachnutzung

In diesem Themenblock bekommen Sie eine Einführung in die Suche und Nachnutzung von Daten. Speziell wird darauf eingegangen, wo Sie nach Datensätzen suchen können und insbesondere worauf Sie (auch zur Einhaltung der Guten wissenschaftlichen Praxis) achten müssen, um einen Datensatz nachnutzen zu dürfen. Hier lernen Sie über Webseiten zur Datenrecherche, Persistente Identifikatoren (PID), CC-Lizenzen und wie ein Datensatz korrekt zitiert wird.

Daten finden und nachnutzen

Haben Sie sich im Forschungsprozess auf ein Forschungsthema geeinigt, können Sie u. a. mit Hilfe von Metasuchmaschinen, Datenportalen und Repositorien passende Datensätze finden.

Veröffentlichte Datensätze werden auf unterschiedlichen Webseiten zur Verfügung gestellt. Die Datensätze dürfen (unter Einschränkungen) zur Nachnutzung verwendet werden. Unter die Webseiten fallen Metasuchmaschinen, Datenportale und Repositorien, die jeweils unterschiedliche Forschungsthemen und Datenformate abdecken. Die unterschiedlichen Arten der Webseiten werden hier vorgestellt und teilweise auch inklusive Tutorials angeführt, die das Finden von Datensätzen auf den jeweiligen Webseiten erklären.

Metasuchmaschinen und Datenportale

Icon_Suchmaschine

In diesem Abschnitt werden Ihnen einige Metasuchmaschinen und Datenportale vorgestellt:

"Eine Metasuchmaschine ist ein System, das Informationen von anderen Suchmaschinen nutzt, um eine vollständige und angemessene Antworten auf eine Frage zu geben."

-- (Arimetrics 2022)

"Offene Datenportale erleichtern den Zugang zu und die Wiederverwendung von Informationen des öffentlichen Sektors."

-- (European Commission 2022)

Icon_Beispiel

Beispiele für Metasuchmaschinen und Datenportale:

  • DataCite Commons → unterstützt die Suche in registrierten Datensätzen
  • Tutorial, englisch (3:26 Min.)
  • BASE → Suchmaschine für wissenschaftliche Webdokumente
  • Tutorial, deutsch (3:10 Min.)
  • unter „Suchergebnis eingrenzen“ → „Dokumentart“:„Forschungsdaten“; „Nachnutzung“:„Open Access“
  • Google Dataset Search → durchsucht laut Google Millionen von Datensätzen in tausenden Repositorien
  • Tutorial, englisch (3:28Min.)
  • govdata → bietet Zugang zu offenen Daten von Bundes-, Landes- und Kommunalverwaltungen in Deutschland
  • European Union Open Data Portal → macht offene Daten der EU zugänglich

Repositorien

Icon__Repositorium

Neben Metasuchmaschinen und Datenportalen sind sogenannte Repositorien im Forschungsprozess die bevorzugten Webseiten zur kategorisierten und langfristigen Suche nach qualitativ hochwertigen Datensätzen.

„Digitale Forschungsdaten-Repositorien sind Informationsinfrastrukturen, die digitale Forschungsdaten möglichst dauerhaft – anhand der Anforderungen der jeweiligen Nutzergruppe – speichern und organisieren, um die Auffindbarkeit und Zugänglichkeit der Daten zu sichern.“

-- (forschungsdaten.org 2015)

Icon_Beispiel

Beispiele für Repositorien:

  • re3data
    • Suche nach fachspezifischen Repositorien
    • Tutorial, deutsch (2:59 Min.)
    • Tutorial, englisch, detaillierter (4:11 Min.)
  • DFG RIsources
    • Informationsportal zu wissenschaftlichen Forschungsinfrastrukturen
  • Zenodo
    • disziplinübergreifende Suche
  • EUDAT/B2Share
    • Plattform, die aus dem Horizon 2020 Förderungsprogramm der Europäischen Union entstanden ist
  • figshare
    • besonders für visuelle Grafikdatensätze (Poster, Diagramme, Videos)

Qualitätsmerkmale eines guten Repositoriums

Hier sind einige Repositorien aufgeführt, die sich zur Suche nach fachspezifischen und qualitativen Datensätzen zur Nachnutzung im Forschungsprozess eignen. Doch auch Repositorien unterscheiden sich qualitativ und inhaltlich. Folgend sind einige Merkmale aufgelistet, die darauf hinweisen, ob es sich um ein qualitatives Repositorium eignet (TKFDM o.D.):

Icon__Qualitätskontrolle

  • PID für Datensätze
  • PID für Autor:innen
  • Metadaten
  • Download- und Exportmöglichkeiten
  • Beschreibung/Dokumentation
  • Zugriffsmöglichkeiten
  • Lizenzen
  • Überblick/Vorschau des Datensatzes
  • Versionierung
  • Anmeldung und Bearbeitung
  • Auffindung durch Suchmaschine

Repositorien können mit Zertifikaten ausgezeichnet werden, die einen Mindestmaß an Qualität garantieren. U. a., vergibt die community-basierte und gemeinnützige Organisation CoreTrustSeal Core Level Zertifizierungen an Repositorien. Diese basieren auf dem DSA-WDS Core Trustworthy Data Repositories Requirements Catalogue. Repositorien sind qualitativ und können zertifiziert werden, wenn:

  • Die Daten im Internet auffindbar sind.
  • Die Rechtssituation der Daten geklärt ist und diese ohne Einschränkung zugänglich sind.
  • Die Daten in einem gebräuchlichen Format vorliegen.
  • Die Daten zuverlässig sind.
  • Die Daten über PIDs zitierbar sind.

-- (Forschungsdaten.info 2023b)

Persistente Identifikatoren (PID)

Icon__PID

Eines der Qualitätsmerkmale eines Repositoriums sind Persistente Idenfikatoren. Doch was bedeutet das?

"Ein Persistenter Identifikator (Persistent Identifier; PID) ist eine konstante Internet-Adresse für digitale Objekte. Er stellt sicher, dass ein Datensatz dauerhaft auffindbar, abrufbar und zitierbar bleibt, auch wenn sich sein physischer Standort ändert"

-- (Präsidium der TH Köln 2021).

Bekannte Beispiele von PIDs sind:

  • DOI (Digital Object Identifier),
  • ORCID (Open Researcher Contributor Identification)
  • oder URN (Uniform Resource Name).

"Im Gegensatz zu anderen seriellen Identifikatoren (bspw. URL-Adressen) verweist ein PID auf das Objekt selbst und nicht auf seinen Standort im Internet. Die Forschungsdaten sollen mit PIDs versehen werden. Ein PID stellt sicher, dass Daten adressierbar und identifizierbar sind. Er kann während des Forschungsprozesses und zur Publikation von Forschungsdaten verwendet werden."

-- (Präsidium der TH Köln 2021)

Wichtige Aspekte bei der Nachnutzung von Daten

Icon__Nachnutzung

Um bereits erhobene und publizierte Daten nach wissenschaftlichen Standards nachzunutzen, sind einige Aspekte zu beachten.

Die Daten müssen...

  • zugänglich sein. Offene Daten/“Open Data” bzw. Daten mit offenen Lizenzen dürfen verwendet werden (z. B. Creative-Commons-Lizenzen).
  • zitierfähig und nachhaltig verfügbar sein. Das heißt, sie verfügen über alle notwendigen Informationen und über einen PID.
  • erschlossen sein. Metadaten und eine Dokumentation der Daten erleichtern die Interpretation und Reproduzierbarkeit der Daten. Was wurde mit diesen Daten untersucht und als Ergebnis festgehalten? Was möchte ich untersuchen und wie unterscheidet sich das vom vorherigen Nutzen?
  • qualitativ sein. Dafür müssen sie in speziellen Datenformaten* verfügbar sein und folgendes erfüllen: Datenvollständigkeit und Datenrichtigkeit.

*mehr dazu unter „Datenformaten“ in VL1 „Was ist FDM?“

Bei Open-Access-Publikationen werden sogenannte Creative-Commons-Lizenzen, oder CC-Lizenzen, vergeben. Sie regeln die Verwendung und Nachnutzung der Publikation von Dritten. Creative-Commons-Lizenz beeinflussen aber das Urheberrecht nicht, es werden lediglich Nutzungsrechte für Forschungsdaten vergeben. CC-Lizenzen sind international weit verbreitet, allerdings gibt es je nach Version der Lizenz nationale Anpassungen. Die aktuelle Version 4.0 ist international gültig.

CC BY

Icon_CC-BY

Namensnennung

Diese Lizenz erlaubt Dritten, ein Werk zu verbreiten, zu verändern, zu verbessern und darauf aufzubauen, auch kommerziell, solange der Urheber des Originals genannt wird.

CC BY-SA

Icon_CC-BY-SA

Namensnennung - Weitergabe unter gleichen Bedingungen

Diese Lizenz erlaubt es Dritten, ein Werk zu verbreiten, zu verändern, zu verbessern und darauf aufzubauen, auch kommerziell, solange der Urheber des Originals genannt wird und die auf seinem Werk basierenden neuen Werke unter denselben Bedingungen veröffentlicht werden.

CC BY-ND

Icon_CC_BY_ND

Namensnennung - Keine Bearbeitung

Diese Lizenz erlaubt Dritten die Weiterverbreitung des Werkes, kommerziell wie nicht-kommerziell, solange dies ohne Veränderungen und vollständig geschieht und der Urheber genannt wird.

CC BY-NC

Icon_CC-BY_NC

Namensnennung - Nicht kommerziell

wie CC BY – zusätzlich mit der Einschränkung „nur nicht kommerziell“

CC BY-NC-SA

Icon_CC-BY_NC_SA

Namensnennung - Nicht-kommerziell - Weitergabe unter gleichen Bedingungen

wie CC BY SA – zusätzlich mit der Einschränkung „nur nicht kommerziell“

CC BY-NC-ND

Icon_CC-BY_NC_ND

Namensnennung - Nicht-kommerziell - Keine Bearbeitung

wie CC BY ND – zusätzlich mit der Einschränkung „nur nicht kommerziell“

Mehr über die Creative-Commons-Lizenzen unter der Creative Commons Liste der Lizenzen, Muuß- Merholz 2021 und FAQ 2021.

Datensätze korrekt zitieren

Die Herkunft nachgenutzter Datensätze muss, wie andere Quellen, die verwendet wurden, durch eine Angabe nachgewiesen, also zitiert, werden. Die absolute Ehrlichkeit in Bezug auf die eigenen und fremden Beiträge ist eine grundlegende Voraussetzung für Gute wissenschaftliche Praxis. Nach wissenschaftlichen Standards verfügen auffindbare Datensätze i. d. R. über folgende Informationen:

Urheber

Ab fünf Namen sollte mit “et al.” oder Ähnlichem abgekürzt werden

Veröffentlichungsdatum

Jahr der Veröffentlichung des Datensatzes

Titel

Titel und eventuell weitere Titel der Studie/des Datensatzes

Version

Versionsnummer der Ressource

Publikationsagent

Name des Datenzentrums/der Institution, das/die Ressource veröffentlicht hat

Genereller Ressourcentyp

Datensatz, Text oder andere Ressourcentypen

Identifikator

Hier erscheint ein PID. Um direkt auf die Quelle des Objektes verweisen zu können, sollte der DOI-Name entweder mit der URL des Resolvers abgedruckt (http://doi.org/doi:10.4232/1.10770) oder – platzsparender – mit einem Hyperlink (doi:10.4232/1.10770) unterlegt werden.

(Quelle: Forschungsdaten.info 2024)

Mögliche Zitation von Datensätzen

Icon_Zitieren

  • Urheber (Veröffentlichungsdatum): Titel. Publikationsagent. Identifikator oder
  • Urheber (Veröffentlichungsdatum): Titel. Version. Publikationsagent. Genereller Ressourcentyp. Identifikator.

-- (Quelle: Forschungsdaten.info 2024)

Beispielszenarien für die Zitation von Datensätzen

  • Beispielszenario 1: Interaktive Mobilitätsstudie: Bike Sharing in Köln

Beispielszenario 1: Interaktive Mobilitätsstudie: Bike Sharing in Köln. https://av.tib.eu/media/35422

  • Eser, Alexander (2018): Interaktive Mobilitätsstudie - Bike Sharing Köln. Kaufberater.io. Stummfilm. https://doi.org/10.5446/35422

  • Beispielszenario 2: Refill Stationen Coffee to-go in Bonn

Refill Stationen Coffee to-go in Bonn. https://www.govdata.de/web/guest/suchen/-/details/refill-stationen-coffee-to-go

  • o.A. (2023, 02. Mai): Refill Stationen - Coffee to go. Open.NRW. Datensatz. Eingeschränkte Nutzung.

  • Beispielszenario 3: Indikator Klimasensitive Vogelarten

Indikator Klimasensitive Vogelarten. Geoportal. Datensatz

Leitfragen und Aufgaben

Leitfragen

Icon_Fragezeichen

  1. Wie kann nach Forschungsdaten recherchiert werden?
  2. Welche Möglichkeiten/Initiativen gibt es, die Nachnutzung von Forschungsdaten zu begünstigen?

Aufgabe

Icon_Aufgabe

Arbeiten Sie die angegebenen Materialien durch und beantworten Sie für sich die Fragen. Dokumentieren und reflektieren Sie Ihre Ergebnisse in Ihrem Lernportfolio

Weiterführende Materialen und Quellen

Icon_Findability

Literatur

Forschungsdaten.info. (2023a, 5. Mai). Datenjournale. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/datenjournale/

Forschungsdaten.info. (2023b, 5. Mai). Forschungsdaten finden. Zugriff am 18.10.2023, von https://www.forschungsdaten.info/themen/finden-und-nachnutzen/forschungsdaten-finden/

Forschungsdaten.info. (2024, 6. März). Persistente Identifikatoren. Zugriff am 12.06.2024, https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/persistente-identifikatoren/

Gerlach, R., Rex, J., Lang, K. et al. (2020). Fact Sheet: Research Data Repositories. Zenodo. https://doi.org/10.5281/zenodo.3900922

Lin, D., Crabtree, J., Dillo, I. et al. (2020) The TRUST Principles for digital repositories. Sci Data 7,144. [https://doi.org/10.1038/s41597- 020-0486-7](https://doi.org/10.1038/s41597- 020-0486-7)

Pampel, H. & Elger, K. (2021). 5.6 Publikation und Zitierung von digitalen Forschungsdaten. In M. Putnings, H. Neuroth & J. Neumann (Ed.), Praxishandbuch Forschungsdatenmanagement (S. 521-536). Berlin, Boston: De Gruyter Saur. https://doi.org/10.1515/9783110657807-028

Quellen

Arimetrics. (2022). What is Metasearch engine. Zugriff am 18.10.2023, von https://www.arimetrics.com/en/digital-glossary/metasearch-engine

Forschungsdaten.info. (2023c, 5. Mai). Repositorien. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/repositorien/

Forschungsdaten.info. (2023d, 5. Mai). Zitieren von Daten. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/finden-und-nachnutzen/zitieren-von-daten/

European Commission. (2022, 7. June). Open data portals. Zugriff am 18.10.2023, von https://digital-strategy.ec.europa.eu/en/policies/open-data-portals

FAQ - CC Germany. (2021, 29. September). CC Germany. Abgerufen am 21. Oktober 2023, von https://de.creativecommons.net/faqs/#h.opqkebeeaptr

Forschungsdaten.org. (2015, 15. September). Repositorium. Zugriff am 18.10.2023, von https://www.forschungsdaten.org/index.php/Repositorium

Muuß-Merholz, J. (2021, 30. März). Die CC-Lizenzen im Überblick Welche Lizenz für welche Zwecke? wb-web. Zugriff am 18.10.2023, von https://wb-web.de/material/medien/die-cc-lizenzen-im-uberblick-welche-lizenz-fur-welche-zwecke-1.html

Präsidium der TH Köln. (2021). Leitlinie zum Umgang mit Forschungsdaten. Zugriff am 20. Oktober 2023, von https://www.th-koeln.de/mam/downloads/deutsch/forschung/leitlinie_zum_umgang_mit_forschungsdaten.pdf

TKFDM (Thüringer Kompetenznetzwerks Forschungsdatenmanagement). o. D. Handreichung. Repositorien für Forschungsdaten. Zugriff am 20. Oktober 2023, von https://forschungsdaten-thueringen.de/files/material/Infomaterial/Handreichungen/handreichung_forschungsdatenrepositorien.pdf