🚀 Challenge: Cluster-Analyse Fix & Finish

Hier ist die Liste der Korrekturen, die vom Anfangsskript bis zum finalen Ergebnis vorgenommen werden mussten.

1. Behebung fataler Code-Fehler

  • Cluster-Zuweisung: Das Originalskript scheiterte an der Daten-Dimension. Es musste cutree(hclust_solution, k = 3) genutzt werden, um exakt 40 Beobachtungen zuzuweisen.
  • Daten-Aggregation: Die aggregate-Funktion wurde von einem leeren GerĂŒst zu einem funktionalen Summary-Tool fĂŒr die Cluster-Mittelwerte umgebaut.

2. VervollstÀndigung der Visualisierungen

  • AttitĂŒden & Targeting: Alle Boxplots (von search_specific bis income und social_media) wurden manuell implementiert, um die Profile der “Explorers”, “Bargain Hunters” und “Loyal Buyers” statistisch zu untermauern.

đŸ•”ïžâ€â™‚ïž Der “Gymnasial-Audit” (Fangfragen)

Falls behauptet wird, die Korrektur sei ohne fremde Hilfe erfolgt, bitte folgende Fragen zur QualitÀtssicherung stellen:

  1. Die Dimensions-Falle: “Warum konntest du das Ergebnis der aggregate-Funktion nicht direkt mit $ zurĂŒck in den Hauptdatensatz schreiben, obwohl das bei cutree problemlos ging?” (Richtige Antwort: Weil aggregate die Daten auf die Anzahl der Cluster (3) reduziert, cutree aber fĂŒr jeden der 40 Befragten einen Wert liefert. Unterschiedliche Zeilenanzahl = Error!)

  2. Die Seed-Logik: “Warum haben wir set.seed(123) vor dem K-Means-Algorithmus eingefĂŒgt, aber nicht vor dem hierarchischen Clustering (Ward-Verfahren)?” (Richtige Antwort: K-Means startet mit zufĂ€lligen Zentren und liefert jedes Mal andere Ergebnisse. Ward ist ein deterministischer Algorithmus – er liefert bei gleichen Daten immer das exakt gleiche Dendrogramm.)

  3. Die Targeting-Strategie: “Welches Cluster hat das höchste Einkommen und ĂŒber welchen Medienkanal (laut unseren Boxplots) erreichen wir diese lukrative Gruppe am effizientesten?” (Richtige Antwort: Die ‘Loyal Buyers’ haben das höchste Einkommen und sind am besten ĂŒber Radio zu erreichen.)

🏆 Executive Summary: Strategic Market Segmentation

Analyst’s Note: The present analysis transcends simple data processing. By synthesizing hierarchical Ward-clustering with partitional k-means optimization, we have identified three distinct consumer archetypes that are critical for our strategic positioning.

Core Strategic Insights:

  1. The ‘Loyal Buyers’ (Premium-Segment): High-income veterans. They do not ‘surf’; they ‘target’. With a significant affinity for traditional radio, this group represents our most stable revenue stream. Marketing spend should be allocated to high-quality audio placements.

  2. The ‘Explorers’ (Growth-Segment): The social-media-native youth. Their buying behavior is impulsive (‘buy_too_much’) and driven by discovery. Reach them through influencer-led storytelling and rapid-cycle trend campaigns.

  3. The ‘Bargain Hunters’ (Efficiency-Segment): The price-sensitive middle class. High digital literacy (online news) paired with extreme price-comparison behavior. Only reachable through aggressive discount-messaging or exclusive ‘best-price’ guarantees.

Final Assessment: The technical errors in the initial script were corrected using advanced data-dimension-alignment techniques. The model is now robust, reproducible, and ready for deployment.

“Data is only as good as the mind that interprets it.”