Skip to content

Einführung in das Data Wrangling

An der Universität Duisburg-Essen ist im Rahmen des Projekts FDM@Studium.nrw der Moodle-Selbstlernkurs Einführung in das Data Wrangling – Konzepte und Umsetzung in SPSS entstanden. Der Kurs vermittelt einen Überblick über den Prozess des Data Wrangling. Data Wrangling kann grob mit dem deutschen Wort "Datenaufbereitung" übersetzt werden und beschreibt den Prozess der Vorbereitung erhobener Daten zur anschließenden eigenen Analyse sowie der Nachnutzung durch Dritte. Grundlage des Kurses ist ein Rohdatensatz mit Daten aus einer Umfrage zur Studienmotivation, der zunächst in die Statistik-Software SPSS (Statistical Package for the Social Sciences) überführt werden muss. Dafür müssen verschiedene Fragen zusammengefasst werden, geschaut werden, ob es fehlende Werte im Datensatz gibt, überlegt werden, wie mit fehlenden Daten umgegangen wird und überprüft werden, ob die verschiedenen Fragen überhaupt zusammenfasst werden können. Der Prozess des Data Wrangling besteht aus mehreren Schritten, die alle gleichsam wichtig sind, damit am Ende aus den Daten valide Forschungsergebnisse entstehen können.

Der Kurs „Data Wrangling“ wurde als Wahlmodul im Themenfeld „Spezielle Methoden und Datentypen“ für den ebenfalls als Selbstlernkurs konzipierten Basiskurs [„Discover the Data“] (https://www.twillo.de/edu-sharing/components/render/a9eb44b3-2049-4d6b-a9e6-b766056b2895) entwickelt. Er kann aber auch eigenständig verwendet werden. Erklärvideos unterstützen die Vermittlung. Zur Dokumentation des Vorgehens werden die Studierenden angehalten, ein Codebuch zu führen.

Der Kurs wird in Kürze über die Lernplattform orca.nrw zur Ansicht und als Download für Moodle bereitgestellt.