Lehre & Beispielkurs:
Datenanalyse und Visualisierung

Ich biete maßgeschneiderte Kurse und Workshops zu Datenanalyse, Visualisierung, Python und wissenschaftlichem Rechnen an. Nachfolgend finden Sie Kurse, die ich gehalten habe, sowie ein Beispielprogramm.

Derzeit biete ich Kurse im Rahmen meiner Haupttätigkeit an. Sie können mich dort kontaktieren: Kontakt aufnehmen.

Vergangene Kurse und Workshops

Beispielhafter Kursinhalt

Datenanalyse und Visualisierung: Pandas und Matplotlib

Dauer: 24. April 2025 - 15. Mai 2025 | Ort: Leipzig, Deutschland (Präsenz)

Dieser Kurs ist beendet. Sie können mich jedoch kontaktieren, um einen ähnlichen Kurs zu buchen oder ein individuelles Programm für Ihre Gruppe (n>5) anzufragen.

Veranstaltungsseite

Modul 1: Grundlagen der Datenanalyse
Einführung in Konzepte und Abläufe der Datenanalyse mit Python. Verständnis von Datentypen, Datenstrukturen und grundlegenden Analysemethoden zur Gewinnung von Erkenntnissen.
Themen: Python-Datenstrukturen, Grundlagen von NumPy, statistische Kennzahlen, Datensäuberung

Modul 2: Grundlagen von Pandas
Zentrale Konzepte der Bibliothek Pandas zur Datenmanipulation und -analyse. Arbeiten mit Series- und DataFrame-Objekten zur Vorbereitung von Daten für Visualisierung und Analyse.
Themen: DataFrame-Erstellung, Indexierung, Auswahl, grundlegende Operationen, Umgang mit fehlenden Werten

Modul 3: Zeitreihen & Datenoperationen mit Pandas
Arbeiten mit Zeitreihendaten in Pandas. Techniken zur zeitlichen Datenmanipulation, Resampling und Trendanalyse mit praktischen Beispielen anhand von TERENO-Umweltdaten.
Themen: Zeitreihen-Indexierung, Resampling, Gleitende Fenster, Saisonalitätsanalyse, Trenderkennung

Modul 4: Grundlagen der Visualisierung
Grundlagen effektiver Datenvisualisierung. Verständnis der Visualisierungspipeline und Auswahl geeigneter Darstellungsformen für verschiedene Datentypen und Analyseziele.
Themen: Visualisierungstheorie, Diagrammauswahl, Farbgebung, Wahrnehmungsprinzipien

Modul 5: Matplotlib: Für mehr als Präsentation
Fortgeschrittene Matplotlib-Techniken mit Fokus auf Visualisierungen in Publikationsqualität. Erstellung komplexer Diagramme und Anpassung für wissenschaftliche Kommunikation.
Themen: Figurenaufbau, Publikationsstandards, statistische Visualisierungen, individuelles Styling, Integration mit Pandas

Modul 6: Angewandte Analyse mit Umweltdaten
Praktische Anwendung von Pandas und Matplotlib zur Analyse von Umweltdatensätzen. Schwerpunkt auf TERENO-Daten zur Erkennung von Trends, Korrelationen und Vorhersageverfahren für Boden- und Klimadaten.
Themen: Korrelationsanalyse, Trendvisualisierung, multivariate Darstellungen, Vorhersagetechniken

Bonus
Modul 7: Georäumliche Visualisierung in Python
Techniken zur Visualisierung georäumlicher Daten in Python mit Bibliotheken, die sich mit Pandas und Matplotlib integrieren. Erstellung von Karten und geografischen Visualisierungen für Umweltdaten.
Themen: GeoPandas, Basiskarten, räumliche Interpolation

Bonus
Modul 8: 3D-Visualisierung mit VTK/Python
Einführung in die 3D-wissenschaftliche Visualisierung mit VTK in Python. Visualisierung volumetrischer Daten und 3D-Oberflächen für fortgeschrittene Anwendungen.
Themen: VTK-Grundlagen, Volumenrendering, Isosurfaces, 3D-Plottechniken, interaktive Visualisierung

Bonus
Modul 9: Informationsverarbeitung und Schätzung
Statistische Ansätze zur Informationsgewinnung und Schätzung aus Daten. Techniken zum Umgang mit Unsicherheit und zur Gewinnung verlässlicher Erkenntnisse aus verrauschten Umweltdatensätzen.
Themen: Statistische Inferenz, Konfidenzintervalle, Hypothesentests, Regressionsanalyse

Bonus
Modul 10: Klassische Machine-Learning-Ansätze
Einführung in Machine-Learning-Techniken zur Datenanalyse. Einsatz von scikit-learn zusammen mit Pandas für prädiktive Modellierung und Mustererkennung in Umweltdaten.
Themen: Lernthechniken, Clustering, Dimensionsreduktion, Modellbewertung