Skip to content

Speichern von Daten

Zitation:

Blümm, M., Fritsch, K., Bock, S., Hackenbuchner, J., Arning, U., & Förstner, K. U. (2024). 08_LE_Daten-Speichern. FDM@Studium.nrw Blended-Learning-Basiskurs „Forschungsdatenmanagement“ (Version 1.0). https://landesinitiativefdmnrw.github.io/FDMatStudium/thk/texte/08_LE_Daten-Speichern.html

Lernziele

Icon_Diskette

Lernziele

In diesem Themenblock lernen Sie die Speicherung von Daten und Dateien kennen, welche Aspekte dabei im Forschungsprozess zu beachten sind und welchen Empfehlungen zu folgen ist. Außerdem lernen Sie über Vor- und Nachteile verschiedener Speichermedien sowie unterschiedlicher Datenformate.

(Forschungsdaten.info 2023e; Forschungsdaten.info 2023f).

[Video Daten-Speicherung:]

Daten speichern und das Datenverlustrisiko minimieren

Icon_GWP

Im FDM ist eine sinnvolle Speicherung von Daten eine Voraussetzung für die Gute wissenschaftliche Praxis (GWP) und gewährleistet die Möglichkeit einer langfristigen Nachnutzbarkeit der Daten. Um möglichst zu verhindern, dass Daten beschädigt werden, verloren gehen oder veralten, sollten bei der Speicherung von Daten und Dateien einige Aspekte beachtet werden. So kann vorgebeugt werden, dass Daten bspw. aufgrund technischer Fehler etwa durch einen Schaden an der Festplatte oder aufgrund veralteter Software nicht mehr lesbar sind oder versehentlich gelöscht werden.

Icon_Nachnutzung

Backup- und Datensicherungsmaßnahmen sind unerlässlich: Forschungsdaten müssen vor unbefugtem Zugriff (z. B. Cyber-/Hackerangriffe) und Datenverlust (z. B. technische Fehler/Brand) geschützt werden. Insbesondere sensible, personenbezogene Daten müssen durch Pseudonymisierung oder Anonymisierung besonders geschützt werden (Weiner et al. 2020).

Vor- und Nachteile von Speichermedien finden Sie unter (Forschungsdaten.info 2023f). Vor- und Nachteile von Speichermedien

Icon_USB_StickIcon_CDIcon_SD-KarteIcon_Speicher_CloudIcon_Speicher_PCIcon_Speicher_Festplatte

Wichtige Aspekte bei der Speicherung von Daten

Abildung_Speichern

Um das Risiko des Datenverlustes bestmöglich zu reduzieren, sollte bei der Sicherung der Daten und Dateien insbesondere darauf geachtet werden, dass diese:

  • regelmäßig,
  • in mehreren Kopien,
  • in weit verbreiteten Datenformaten,
  • von den Rohdaten getrennt,
  • strukturiert (zu einem festgelegten Zeitpunkt) und
  • einheitlich

erfolgt.

Abildung_3-2-1-Regel

Darüber hinaus ist es wichtig, die 3 - 2 - 1 - Regel zu beachten. Gleichermaßen sollte die Sicherung der Daten mit einer guten Ordner- und Dateistruktur, inklusive einer geeigneten Dateibenennung, einhergehen.

Icon_Ordnerstruktur

Icon_Organisieren

Icon_Dateibenennung

Abildung_3-2-1-Regel

Empfehlungen zur Datensicherung

Icon_Diskette

Icon_Idee

Es ist hilfreich[1]:

  • alle fünf Jahre die alten externen Speichermedien mit neueren auszutauschen.
  • notwendige Softwareanwendungen in die Backup-Strategie einzubeziehen.
  • eine regelmäßige Kontrolle der Daten und Dateien durchzuführen (z. B. einmal jährlich, stichprobenartig).
  • einen geeigneten Ablageort für Daten und Dateien zu wählen, der
    • über ausreichend Speicherkapazität verfügt,
    • allen beteiligten und berechtigten Personen Zugriff ermöglicht und
    • Zugriff durch Unbefugte verhindert.
  • offene W-LAN-Verbindungen zu vermeiden.
  • gute Virus- und Malwarescanner zu verwenden.
  • DSGVO-konforme Clouddienste, wie etwa die Cloud-Speicherlösung sciebo, zu wählen (https://hochschulcloud.nrw/).[^1]

[1]: Quelle: VerbundFDB 2018

TIP

Kostenlose Clouddienste (bspw. Google Drive, Dropbox, OneDrive) sollten nicht verwendet werden, da deren Serverstandorte nicht in Deutschland, sondern in Amerika liegen. In Amerika sind aufgrund des USA PATRIOT Acts (2001) die eigenen Daten vor einem Zugriff Dritter nicht geschützt (Krähwinkel, Langner, Lipp et al. 2022).

Universitäten und Hochschulen haben interne Leitlinien zum Umgang mit Forschungsdaten erstellt, wie beispielsweise die Leitlinie der Technischen Hochschule Köln (Präsidium der TH Köln, 2021), in der zum Thema Sicherung von Daten folgendes zusammengefasst ist:

Die Sicherung von Daten wird meistens als ein Backup oder eine Sicherungskopie bezeichnet und dient der Wiederherstellung der ursprünglichen Daten im Falle eines Datenverlusts.

Bei einem Backup oder einer Datensicherung werden alle für ein Projekt relevanten Daten gespeichert. Die Archivierung von Daten bedeutet sowohl die systematische Sicherung ausgewählter Daten für einen unbegrenzten Zeitraum als auch der Erhalt und die Betreuung dieser Daten über geeignete Verfahren.

Die Langzeitarchivierung (LZA) ist ein Verfahren, das Forschungsdaten für > einen unbestimmten Zeitraum (i.d.R. > 10 Jahre ab Projektende), über technologische und > soziokulturelle Veränderungen hinaus, verfügbar und interpretierbar hält.

Datenformate

Damit Daten langfristig nachnutzbar sind und einfacher geteilt werden können, sollte darauf geachtet werden, dass zum einen so wenig unterschiedliche Datenformate wie möglich verwendet werden, zum anderen die Daten in:

  • offenen, d.h. nicht herstellerspezifischen,
  • standardisierten,
  • langlebigen,
  • weit verbreiteten,
  • von Maschinen und Menschen lesbaren,
  • mit Metadaten versehenen

Formaten vorliegen und gespeichert werden. Dies erhöht die Wahrscheinlichkeit, dass es auch in einigen Jahren noch Software und Hardware gibt, die die Daten lesen können. Auch sollten die Formate möglichst verlustfrei konvertiert werden können.

Unter den oben genannten Aspekten eignen sich folgende Formate:

DateitypEmpfohlenes Format[1]
Text.pdf/a .txt .xml
Tabelle.xml .csv (mit Einschränkungen)
Foto.tiff .tif (.jpg ist nicht verlusfrei)
Grafik.png, .svg
Audio.wav .flac (mit Einschränkungen) (mp3 ist nicht verlustfrei)

Dateiformate können folgendermaßen konvertiert werden:

  • verlustfrei → bevorzugt
  • verlustbehaftet → für geringere Dateigrößen
  • sinnhaft → wesentliche Inhalte bleiben bestehen.

Leitfragen und Aufgaben

Leitfragen

Icon_Fragezeichen

  • Was ist die Relevanz von Daten/Dateispeicherung und Backup im FDM?
  • Wissensübertragung: Welche Rolle spielt die Dateispeicherung im Studium? Worauf ist hier zu achten? Welche Probleme können entstehen?

Aufgabe

Icon_Aufgabe

Arbeiten Sie die angegebenen Materialien durch und beantworten Sie für sich die Fragen. Dokumentieren und reflektieren Sie Ihre Ergebnisse in Ihrem Lernportfolio.

Weiterführende Materialen und Quellen

Literatur

Icon_Findability

Forschungsdaten.info (2023a, 5. Mai). Datenübertragung. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/organisieren-und-aufbereiten/datenuebertragung/

Forschungsdaten.info. (2023b, 5. Mai). Passworthilfen. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/speichern-und-rechnen/passworthilfen/

Forschungsdaten.info (2023c, 24. Juli). Formate erhalten. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/formate-erhalten/

Forschungsdaten.info. (2023d, 11. August). Speichern und Übertragen großer Datenmengen. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/speichern-und-rechnen/speichern-und-uebertragen-grosser-datenmengen/

Putnings, M., Neuroth, H., & Neumann, J. (2021, 19. Dezember). Praxishandbuch Forschungsdatenmanagement. De Gruyter Saur. https://doi.org/10.1515/9783110657807

Weber, A. & Piesche, C. (2021). 4.2 Datenspeicherung, -kuration und Langzeitverfügbarkeit. In M. Putnings, H. Neuroth & J. Neumann (Ed.), Praxishandbuch Forschungsdatenmanagement (pp. 327- 356). Berlin, Boston: De Gruyter Saur. https://doi.org/10.1515/9783110657807-019

Weiner, B., Wünsche, S., Kühne, S. et al. (2020, 30. April). Crashkurs Forschungsdatenmanagement. Zenodo. https://doi.org/10.5281/zenodo.3778431

Quellen

Forschungsdaten.info. (2023e, 5. Mai). Datensicherheit und Backup. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/speichern-und-rechnen/datensicherheit-und-backup/

Forschungsdaten.info. (2023f, 5. Mai). Datenspeicherung und die Lebensdauer von Datenträgern. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/speichern-und-rechnen/datenspeicherung-und-die-lebensdauer-von-datentraegern/

Krähwinkel, E., Langner, P., Lipp, R., et al. (2022). HeFDI Data Learning Materials: Forschungsdatenmanagement eine Online-Einführung (Version 1.0). Zenodo. https://zenodo.org/records/6373596#.Y9Jfo4fMJPZ

Präsidium der TH Köln. (2021). Leitlinie zum Umgang mit Forschungsdaten. Zugriff am 20. Oktober 2023, von https://www.th-koeln.de/mam/downloads/deutsch/forschung/leitlinie_zum_umgang_mit_forschungsdaten.pdf

VerbundFDB. (2018, 20. Juli). Daten benennen und organisieren. Zugriff am 18.10.2023, von https://www.forschungsdaten-bildung.de/dateien-benennen


  1. Praxishandbuch Forschungsdatenmanagement (Putnings, Neuroth, und Neumann 2021). ↩︎