Appearance
Speichern von Daten
Zitation:
Blümm, M., Fritsch, K., Bock, S., Hackenbuchner, J., Arning, U., & Förstner, K. U. (2024). 08_LE_Daten-Speichern. FDM@Studium.nrw Blended-Learning-Basiskurs „Forschungsdatenmanagement“ (Version 1.0). https://landesinitiativefdmnrw.github.io/FDMatStudium/thk/texte/08_LE_Daten-Speichern.html
Lernziele
Lernziele
In diesem Themenblock lernen Sie die Speicherung von Daten und Dateien kennen, welche Aspekte dabei im Forschungsprozess zu beachten sind und welchen Empfehlungen zu folgen ist. Außerdem lernen Sie über Vor- und Nachteile verschiedener Speichermedien sowie unterschiedlicher Datenformate.
(Forschungsdaten.info 2023e; Forschungsdaten.info 2023f).
[]
Daten speichern und das Datenverlustrisiko minimieren
Im FDM ist eine sinnvolle Speicherung von Daten eine Voraussetzung für die Gute wissenschaftliche Praxis (GWP) und gewährleistet die Möglichkeit einer langfristigen Nachnutzbarkeit der Daten. Um möglichst zu verhindern, dass Daten beschädigt werden, verloren gehen oder veralten, sollten bei der Speicherung von Daten und Dateien einige Aspekte beachtet werden. So kann vorgebeugt werden, dass Daten bspw. aufgrund technischer Fehler etwa durch einen Schaden an der Festplatte oder aufgrund veralteter Software nicht mehr lesbar sind oder versehentlich gelöscht werden.
Backup- und Datensicherungsmaßnahmen sind unerlässlich: Forschungsdaten müssen vor unbefugtem Zugriff (z. B. Cyber-/Hackerangriffe) und Datenverlust (z. B. technische Fehler/Brand) geschützt werden. Insbesondere sensible, personenbezogene Daten müssen durch Pseudonymisierung oder Anonymisierung besonders geschützt werden (Weiner et al. 2020).
Vor- und Nachteile von Speichermedien finden Sie unter (Forschungsdaten.info 2023f). Vor- und Nachteile von Speichermedien
Wichtige Aspekte bei der Speicherung von Daten
Um das Risiko des Datenverlustes bestmöglich zu reduzieren, sollte bei der Sicherung der Daten und Dateien insbesondere darauf geachtet werden, dass diese:
- regelmäßig,
- in mehreren Kopien,
- in weit verbreiteten Datenformaten,
- von den Rohdaten getrennt,
- strukturiert (zu einem festgelegten Zeitpunkt) und
- einheitlich
erfolgt.
Darüber hinaus ist es wichtig, die 3 - 2 - 1 - Regel zu beachten. Gleichermaßen sollte die Sicherung der Daten mit einer guten Ordner- und Dateistruktur, inklusive einer geeigneten Dateibenennung, einhergehen.
Empfehlungen zur Datensicherung
Es ist hilfreich[1]:
- alle fünf Jahre die alten externen Speichermedien mit neueren auszutauschen.
- notwendige Softwareanwendungen in die Backup-Strategie einzubeziehen.
- eine regelmäßige Kontrolle der Daten und Dateien durchzuführen (z. B. einmal jährlich, stichprobenartig).
- einen geeigneten Ablageort für Daten und Dateien zu wählen, der
- über ausreichend Speicherkapazität verfügt,
- allen beteiligten und berechtigten Personen Zugriff ermöglicht und
- Zugriff durch Unbefugte verhindert.
- offene W-LAN-Verbindungen zu vermeiden.
- gute Virus- und Malwarescanner zu verwenden.
- DSGVO-konforme Clouddienste, wie etwa die Cloud-Speicherlösung sciebo, zu wählen (https://hochschulcloud.nrw/).[^1]
[1]: Quelle: VerbundFDB 2018
TIP
Kostenlose Clouddienste (bspw. Google Drive, Dropbox, OneDrive) sollten nicht verwendet werden, da deren Serverstandorte nicht in Deutschland, sondern in Amerika liegen. In Amerika sind aufgrund des USA PATRIOT Acts (2001) die eigenen Daten vor einem Zugriff Dritter nicht geschützt (Krähwinkel, Langner, Lipp et al. 2022).
Universitäten und Hochschulen haben interne Leitlinien zum Umgang mit Forschungsdaten erstellt, wie beispielsweise die Leitlinie der Technischen Hochschule Köln (Präsidium der TH Köln, 2021), in der zum Thema Sicherung von Daten folgendes zusammengefasst ist:
Die Sicherung von Daten wird meistens als ein Backup oder eine Sicherungskopie bezeichnet und dient der Wiederherstellung der ursprünglichen Daten im Falle eines Datenverlusts.
Bei einem Backup oder einer Datensicherung werden alle für ein Projekt relevanten Daten gespeichert. Die Archivierung von Daten bedeutet sowohl die systematische Sicherung ausgewählter Daten für einen unbegrenzten Zeitraum als auch der Erhalt und die Betreuung dieser Daten über geeignete Verfahren.
Die Langzeitarchivierung (LZA) ist ein Verfahren, das Forschungsdaten für > einen unbestimmten Zeitraum (i.d.R. > 10 Jahre ab Projektende), über technologische und > soziokulturelle Veränderungen hinaus, verfügbar und interpretierbar hält.
Datenformate
Damit Daten langfristig nachnutzbar sind und einfacher geteilt werden können, sollte darauf geachtet werden, dass zum einen so wenig unterschiedliche Datenformate wie möglich verwendet werden, zum anderen die Daten in:
- offenen, d.h. nicht herstellerspezifischen,
- standardisierten,
- langlebigen,
- weit verbreiteten,
- von Maschinen und Menschen lesbaren,
- mit Metadaten versehenen
Formaten vorliegen und gespeichert werden. Dies erhöht die Wahrscheinlichkeit, dass es auch in einigen Jahren noch Software und Hardware gibt, die die Daten lesen können. Auch sollten die Formate möglichst verlustfrei konvertiert werden können.
Unter den oben genannten Aspekten eignen sich folgende Formate:
Dateityp | Empfohlenes Format[1] |
---|---|
Text | .pdf/a .txt .xml |
Tabelle | .xml .csv (mit Einschränkungen) |
Foto | .tiff .tif (.jpg ist nicht verlusfrei) |
Grafik | .png, .svg |
Audio | .wav .flac (mit Einschränkungen) (mp3 ist nicht verlustfrei) |
Dateiformate können folgendermaßen konvertiert werden:
- verlustfrei → bevorzugt
- verlustbehaftet → für geringere Dateigrößen
- sinnhaft → wesentliche Inhalte bleiben bestehen.
Leitfragen und Aufgaben
Leitfragen
- Was ist die Relevanz von Daten/Dateispeicherung und Backup im FDM?
- Wissensübertragung: Welche Rolle spielt die Dateispeicherung im Studium? Worauf ist hier zu achten? Welche Probleme können entstehen?
Aufgabe
Arbeiten Sie die angegebenen Materialien durch und beantworten Sie für sich die Fragen. Dokumentieren und reflektieren Sie Ihre Ergebnisse in Ihrem Lernportfolio.
Weiterführende Materialen und Quellen
Literatur
Forschungsdaten.info (2023a, 5. Mai). Datenübertragung. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/organisieren-und-aufbereiten/datenuebertragung/
Forschungsdaten.info. (2023b, 5. Mai). Passworthilfen. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/speichern-und-rechnen/passworthilfen/
Forschungsdaten.info (2023c, 24. Juli). Formate erhalten. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/formate-erhalten/
Forschungsdaten.info. (2023d, 11. August). Speichern und Übertragen großer Datenmengen. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/speichern-und-rechnen/speichern-und-uebertragen-grosser-datenmengen/
Putnings, M., Neuroth, H., & Neumann, J. (2021, 19. Dezember). Praxishandbuch Forschungsdatenmanagement. De Gruyter Saur. https://doi.org/10.1515/9783110657807
Weber, A. & Piesche, C. (2021). 4.2 Datenspeicherung, -kuration und Langzeitverfügbarkeit. In M. Putnings, H. Neuroth & J. Neumann (Ed.), Praxishandbuch Forschungsdatenmanagement (pp. 327- 356). Berlin, Boston: De Gruyter Saur. https://doi.org/10.1515/9783110657807-019
Weiner, B., Wünsche, S., Kühne, S. et al. (2020, 30. April). Crashkurs Forschungsdatenmanagement. Zenodo. https://doi.org/10.5281/zenodo.3778431
Quellen
Forschungsdaten.info. (2023e, 5. Mai). Datensicherheit und Backup. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/speichern-und-rechnen/datensicherheit-und-backup/
Forschungsdaten.info. (2023f, 5. Mai). Datenspeicherung und die Lebensdauer von Datenträgern. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/speichern-und-rechnen/datenspeicherung-und-die-lebensdauer-von-datentraegern/
Krähwinkel, E., Langner, P., Lipp, R., et al. (2022). HeFDI Data Learning Materials: Forschungsdatenmanagement – eine Online-Einführung (Version 1.0). Zenodo. https://zenodo.org/records/6373596#.Y9Jfo4fMJPZ
Präsidium der TH Köln. (2021). Leitlinie zum Umgang mit Forschungsdaten. Zugriff am 20. Oktober 2023, von https://www.th-koeln.de/mam/downloads/deutsch/forschung/leitlinie_zum_umgang_mit_forschungsdaten.pdf
VerbundFDB. (2018, 20. Juli). Daten benennen und organisieren. Zugriff am 18.10.2023, von https://www.forschungsdaten-bildung.de/dateien-benennen
Praxishandbuch Forschungsdatenmanagement (Putnings, Neuroth, und Neumann 2021). ↩︎