Appearance
Datenlebenszyklus
Zitation:
Blümm, M., Fritsch, K., Bock, S., Hackenbuchner, J., Arning, U., & Förstner, K. U. (2024). 03_LE_Datenlebenszyklus. FDM@Studium.nrw Blended-Learning-Basiskurs „Forschungsdatenmanagement“ (Version 1.0). https://landesinitiativefdmnrw.github.io/FDMatStudium/thk/texte/03_LE_Datenlebenszyklus.html
Lernziele
Lernziele
In diesem Themenblock lernen Sie den Datenlebenszyklus mit seinen unterschiedlichen Stationen kennen und verstehen, wie der Datenlebenszyklus mit den einzelnen Phasen von Forschungsprozessen verknüpft ist.
Der Datenlebenszyklus: Die unterschiedlichen Stationen beim Arbeiten mit Daten verstehen
Im breiten Feld des FDMs spielt beim Umgang mit Daten insbesondere der Datenlebenszyklus eine wichtige Rolle, denn er deckt alle wichtigen Phasen eines Forschungsprozesses ab. Die einzelnen Phasen des Datenlebenszyklus dienen als Orientierung, um eine fundierte wissenschaftliche Arbeitsweise zu ermöglichen. Je nach Art des Forschungsprojekts können die Phasen des Datenlebenszyklus unterschiedlich ausgeprägt sein und müssen nicht zwangsläufig in chronologischer Reihenfolge durchlaufen werden. Vielmehr kommen die Phasen je nach Bedarf in den Fokus und können auch mehrfach betrachtet werden. Das Entscheidende ist, dass die einzelnen Phasen mit ihren jeweiligen Aspekten systematisch behandelt werden, wie im Folgenden näher erläutert wird. Die übergeordneten Leitpunkte des Datenlebenszyklus können auch im Studienkontext wie folgt dargestellt werden:
- Planung des Forschungsvorhabens oder Projekts
- Erfassung der Daten (entweder durch eigene Datenerhebung oder Suche nach und Nutzung von bereits vorhandenen Daten Anderer)
- Verwaltung und Organisation der Daten
- Arbeit mit den Daten (Aufbereitung und Analyse der Daten)
- Aufbewahrung und Bereitstellung der Daten
Der folgende Datenlebenszyklus kann als Leitfaden für den Umgang mit Daten dienen, beginnend mit der Planung und endend mit der Aufbewahrung.
Interaktiver Arbeitskompass:
Hier finden Sie eine interaktive Visualisierung des Arbeitskompasses.
Aufgrund der Möglichkeit zur Interaktion kann die Visualisierung der in dieser Lerneinheit behandelten Inhalte nicht barrierearm angeboten werden. Die Visualisierung enthält keine neuen Inhalte.
Quelle: Arbeitskompass zum Thema FDM, Katharina Fritsch.
Arbeitskompass:
Aufgrund der Möglichkeit zur Interaktion kann die Visualisierung – abhängig von Ihrer Internetverbindung und dem genutzen Ausgabemedium – ein paar Sekunden Ladezeit benötigen. Nach Anlicken des Links öffnet sich ein neues Fenster. Bitte haben Sie etwas Geduld.
Quelle: Arbeitskompass zum Thema FDM, Katharina Fritsch.
Forschungsvorhaben oder Projekt planen
Zu Beginn des Forschungsvorhabens oder Projekts steht die Planung an einschließlich der Erstellung einer ersten Dokumentation. Während des gesamten Projekts ist die kontinuierliche Dokumentation von großer Bedeutung. Es ist von grundlegender Wichtigkeit von Anfang an schriftlich festzuhalten, wie die Daten im Laufe des Projekts behandelt werden sollen, um für Klarheit und Einheitlichkeit zu sorgen. Bei der Planung liegt auch ein besonderes Augenmerk darauf, das Untersuchungsdesign festzulegen, eine Kultur der Datenerfassung zu etablieren und rechtliche sowie ethische Gesichtspunkte zu berücksichtigen. Ebenso gehört zur Planung die Erstellung eines Zeitplans. Es ist wichtig, sich mit den entsprechenden Lizenzen vertraut zu machen oder zu entscheiden, ob eigene Daten erhoben werden sollen. Hierbei werden auch Dateiformate, Benennungen von Dateien und Speicherorte festgelegt. Zudem sollten ggf. Überlegungen zur Zusammenarbeit während des Projekts sowie zur möglichen gemeinsamen Nutzung von Daten nach Projektende angestellt werden. Um diese Aspekte schriftlich festzuhalten und ihnen somit einen verbindlichen Charakter zu verleihen, ist es ratsam eine Dokumentation oder einen Datenmanagementplan zu erstellen. Außerdem wird in diesem Schritt bereits die Datenhaltung nach Abschluss des Projekts geplant.
Daten erfassen: Selbst erheben oder zum Nachnutzen finden
Zu Beginn sollte eine Recherche und Durchsicht bereits vorhandener Literatur und die Identifizierung von Daten, die bereits vorhanden sind und später genutzt werden können, erfolgen. Bei der Nachnutzung von Daten Dritter ist es notwendig, die Zustimmung zur Datennutzung einzuholen, möglicherweise durch die Anwendung von offenen Lizenzen.
Um bereits erhobene und veröffentlichte Daten gemäß wissenschaftlichen Standards nachzunutzen, sind einige Faktoren zu berücksichtigen. Die Daten müssen:
- zugänglich sein. Offene Daten/“Open Data” bzw. Daten mit offenen Lizenzen dürfen verwendet werden (z. B. Creative Commons).
- zitierfähig und langfristig verfügbar sein. Das heißt, sie verfügen über alle notwendigen Informationen und über eine dauerhafte Kennung, einen sogenannten Persistent Identifier (PID), wie z. B. eine DOI oder eine URN.
- qualitativ hochwertig sein. Das heißt, sie sind vollständig, fehlerfrei, bereinigt und lückenlos.
- in weit verbreiteten und nicht-proprietären Dateiformaten verfügbar sein.
- erschlossen sein. Metadaten und eine Dokumentation der Daten erleichtern die Interpretation und Reproduzierbarkeit der Daten. Welche Untersuchungen wurden mit diesen Daten durchgeführt und welche Ergebnisse wurden erzielt? Was möchte ich untersuchen und wie unterscheidet es sich von bisheriger Nutzung?
Wenn eigene Daten erhoben werden, etwa durch Experimente, Beobachtungen, Messungen oder Simulationen, ist es von höchster Bedeutung, fachspezifische Standards und gesetzliche Vorschriften einzuhalten. Die Einwilligung zur Verarbeitung von sensiblen Daten muss eingeholt werden. Fehler während der Datenerfassung könnten sich negativ auf den gesamten Forschungsprozess auswirken, daher ist hier äußerste Vorsicht geboten. Darüber hinaus sind sowohl bei der Nachnutzung von Daten als auch bei der Datenerhebung Metadaten zu dokumentieren.
Daten verwalten und organisieren
In dieser Phase kommt die Umsetzung der zuvor geplanten wesentlichen Schritte ins Spiel, einschließlich der einheitlichen Speicherung, Sicherung und Verwaltung der Daten sowie der Erfassung und Erstellung von Metadaten und einer gründlichen Dokumentation. Bei der Aufbewahrung und Sicherung von Daten ist es wichtig, neben den klaren Dateinamen und einer geregelten Versionskontrolle aus vorherigen Phasen, eine gut durchdachte Ordnerstruktur und die 3-2-1-Backup-Regel zu berücksichtigen.
Mit Daten arbeiten: Aufbereiten und analysieren
Während der Datenverarbeitung erfolgt die praktische Bearbeitung von Daten, inklusive Aufbereitung, Analyse und Interpretation. In dieser Phase werden die Daten, die entweder selbst erstellt oder von anderen wiederverwendet wurden, aktiv verarbeitet. Dies kann durch Aktivitäten wie Dateneingabe, Digitalisierung, Konvertierung, Transkription oder Übersetzung erfolgen. Es ist auch wichtig, die Daten zu sichern, zu überprüfen, zu validieren und bei Bedarf zu reinigen und zu anonymisieren. Bei der Datenverarbeitung können verschiedene Tools und Programmiersprachen hilfreich sein. Nach der quantitativen, qualitativen oder gemischten Analyse der bearbeiteten Daten werden diese interpretiert und bewertet. Die daraus hervorgehenden Ergebnisse werden dann wiederum in Form von verbalen Erklärungen, Bewertungen und visuellen Darstellungen präsentiert.
Auch in diesem Abschnitt ist eine sorgfältige Organisation und Dokumentation aller Schritte, besonders mit Blick auf zukünftiges Verständnis, äußerst ratsam. Um die Bearbeitung und Wiederauffindbarkeit der Daten zu erleichtern, werden bei der Speicherung und Sicherung sinnvolle Dateinamen verwendet und zusätzliche Metadaten eingefügt.
Daten aufbewahren und bereitstellen
Bei der Aufbewahrung und Bereitstellung von Daten ist es wichtig, dass diese zugänglich, zitierfähig und erschlossen sind (genauer unter dem Punk "Daten erfassen"). Außerdem sollten sie in weit verbreiteten und nicht-proprietären Dateiformaten verfügbar sein.
Bei der Weitergabe und gemeinsamen Nutzung von Daten, sei es mit Kommiliton:innen für Studienprojekte oder zur Abgabe bei Lehrkräften, ist es entscheidend, die ethischen und rechtlichen Aspekte im Umgang mit Daten im Auge zu behalten und Zugriffsrechte angemessen zu verwalten.
Bei einer Publikation oder Langzeitarchivierung sind weitere Schritte erforderlich. Dazu gehört die Auswahl eines geeigneten Archivs, wie beispielsweise eines Repositoriums, sowie die Definition der Urheberrechte und Festlegung von Zugriffsrechten für diejenigen, die auf die Daten zugreifen sollen (z. B. mit Creative Commons-Lizenzen). Die Verwendung angemessener Dateiformate und die Hinterlegung der relevanten Metadaten sind ebenfalls wichtig, um sicherzustellen, dass die Daten leicht auffindbar und wiederverwendbar sind. Repositorien, die den FAIR-Prinzipien entsprechen, erfüllen beide Anforderungen. Um eine vorbildliche wissenschaftliche Praxis zu gewährleisten, wird empfohlen, (Roh)Daten für einen Zeitraum von zehn Jahren verfügbar zu halten, wie es in den Leitlinien der Deutschen Forschungsgemeinschaft (Deutsche Forschungsgemeinschaft 2022) festgelegt ist.
Leitfragen und Aufgaben
Leitfragen
- Welche Stationen des Datenlebenszyklus sind in Ihrem Studium besonders relevant?
Aufgaben
Arbeiten Sie die angegebenen Materialien durch und beantworten Sie für sich die Frage. Dokumentieren und reflektieren Sie Ihre Ergebnisse in Ihrem Lernportfolio.
Lektüre
Rümpel, S. (2011). Der Lebenszyklus von Forschungsdaten. In S. Büttner, H.-C. Hobohm & L. Müller. Handbuch Forschungsdatenmanagement (S. 25-34). Bad Honnef: Bock + Herchen. 2011.
Weiterführende Materialen und Quellen
Literatur
Dierkes, J. (2021). 4.1 Planung, Beschreibung und Dokumentation von Forschungsdaten. In M. Putnings, H. Neuroth & J. Neumann (Ed.), Praxishandbuch Forschungsdatenmanagement (S. 303-326). Berlin, Boston: De Gruyter Saur. https://doi.org/10.1515/9783110657807-018
Forschungsdaten.info. (2023, 5. Mai). Datenlebenszyklus. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/informieren-und-planen/datenlebenszyklus/
Hochschule Bonn-Rhein-Sieg. (2023). Forschungsdatenmanagement. Zugriff am 18.10.2023, von https://www.h-brs.de/de/bib/forschungsdatenmanagement
Krähwinkel, E., Langner, P., Lipp, R., et al. (2022). HeFDI Data Learning Materials: Forschungsdatenmanagement – eine Online-Einführung (Version 1.0). Zenodo. https://zenodo.org/records/6373596#.Y9Jfo4fMJPZ
Quellen
Deutsche Forschungsgemeinschaft. (2022). Leitlinien zur Sicherung guter wissenschaftlicher Praxis. Kodex. https://doi.org/10.5281/zenodo.6472827