🚀 Challenge: Cluster-Analyse Fix & Finish

Hier ist die Aufgabenstellung der Korrekturen, die du vom Anfangsskript (R-Tutorial-ST-before-Class-2025-04-07a-BS.Rmd) bis zum finalen Ergebnis vornehmen musst. Viel Erfolg!

1. Behebung fataler Code-Fehler

  • Cluster-Zuweisung: Im Originalskript war die Zeile zur Speicherung der Cluster-IDs unvollständig oder fehlerhaft programmiert. Wir haben cutree(hclust_solution, k = 3) implementiert, um die 40 Befragten korrekt den Gruppen zuzuordnen.
  • Daten-Aggregation: Die aggregate-Funktion war im Anfangsskript nur als leeres Gerüst vorhanden. Ich habe sie so aufgesetzt, dass sie die Mittelwerte der Verhaltensvariablen pro Cluster berechnet und im Objekt agg_data speichert.

2. Vervollständigung der Visualisierungen (YOUR TASK)

  • Segmentierungs-Variablen: Im ersten Entwurf fehlten die Boxplots für search_specific, buy_too_much und compare_prices. Diese wurden hinzugefügt, um die Unterschiede im Shopping-Verhalten (z. B. “Bargain Hunters” vs. “Explorers”) sichtbar zu machen.
  • Targeting-Variablen: Die Boxplots für demografische Daten (income) und Mediennutzung (read_online_news, use_social_media, listen_radio) wurden komplett neu erstellt, da diese im Startskript nur als Platzhalter existierten.

3. Inhaltliche Ausarbeitung (TODOs)

  • Cluster-Charakterisierung: Die Platzhalter (TODO) in der Beschreibung wurden durch konkrete Analysen ersetzt. Zum Beispiel wurden die “Explorers” als junge Gruppe mit hoher Social-Media-Affinität identifiziert, während “Loyal Buyers” als ältere, einkommensstarke Radio-Hörer charakterisiert wurden.
  • K-Means Integration: Der K-Means-Abschnitt wurde von einer bloßen Vorbereitung zu einer funktionierenden Analyse mit 3 Clustern und gesetztem set.seed(123) für die Reproduzierbarkeit ausgebaut.

Das Endergebnis: Du wirst dann eine saubere Kette von der Distanzmatrix über das Dendrogramm bis hin zu den Marketing-Empfehlungen haben.