Forschungsfrage

Welcher Anteil der Schulabgänger:innen hat im Zeitraum von 1999 bis 2023 in Thüringen und Baden-Württemberg die allgemeinbildende Schule ohne Hauptschulabschluss verlassen?

Daten einlesen

setwd("C:/Daten-DS_jabi/11_Master-Studium_ELMEB/ELMEB_08_Medien_im_interdisziplinären_Kontext/813_MA_Data_Science_in_Education/Abschlussprojekt")

absolventen <- read.csv2("Tabelle-2.3.15.csv",
                        sep = ";",
                        skip = 4,
                        header = TRUE,
                        encoding = "latin1")

names(absolventen)
##  [1] "X"                                                                                         
##  [2] "X.1"                                                                                       
##  [3] "X.2"                                                                                       
##  [4] "Absolventinnen.Absolventen.und.AbgÃ.nger..innen.mit.Beendigung.der.Vollzeitschulpflicht.1."
##  [5] "Davon.ohne.Hauptschulabschluss"                                                            
##  [6] "Davon.ohne.Hauptschulabschluss.1"                                                          
##  [7] "Davon.mit.Hauptschulabschluss"                                                             
##  [8] "Absolventinnen.Absolventen.mit.mittlerem.Schulabschluss.2."                                
##  [9] "Absolventinnen.Absolventen.mit.mittlerem.Schulabschluss.2..1"                              
## [10] "Absolventinnen.Absolventen.mit.mittlerem.Schulabschluss.2..2"                              
## [11] "Absolventinnen.Absolventen.mit.Hochschulreife"                                             
## [12] "Absolventinnen.Absolventen.mit.Hochschulreife.1"                                           
## [13] "Absolventinnen.Absolventen.mit.Hochschulreife.2"                                           
## [14] "Davon.mit.allgemeiner.Hochschulreife"                                                      
## [15] "Davon.mit.allgemeiner.Hochschulreife.1"                                                    
## [16] "Davon.mit.allgemeiner.Hochschulreife.2"                                                    
## [17] "Davon.mit.Fachhochschulreife.2."                                                           
## [18] "Davon.mit.Fachhochschulreife.2..1"                                                         
## [19] "Davon.mit.Fachhochschulreife.2..2"                                                         
## [20] "Absolventinnen.Absolventen.aus.Teilzeit.Berufsschulen"

Absolventen bereinigen

Umbenennung für bessere Lesbarkeit

absolventen$gesamt <- absolventen$Absolventinnen.Absolventen.und.AbgÃ.nger..innen.mit.Beendigung.der.Vollzeitschulpflicht.1.
absolventen$ohne_abschluss <- absolventen$Davon.ohne.Hauptschulabschluss

Tausenderpunkte entfernen, Kommas durch Punkte ersetzen, in numerisch umwandeln

absolventen$gesamt <- as.numeric(gsub("\\.", "", absolventen$gesamt))
## Warning: NAs durch Umwandlung erzeugt
absolventen$ohne_abschluss <- as.numeric(gsub("\\.", "", absolventen$ohne_abschluss))
## Warning: NAs durch Umwandlung erzeugt

NA-Zeilen aus den relevanten Spalten entfernen

absolventen_clean <- subset(absolventen, !is.na(gesamt) & !is.na(ohne_abschluss))

Anteil berechnen

absolventen_clean$anteil_ohne_abschluss <- absolventen_clean$ohne_abschluss / absolventen_clean$gesamt * 100

Jahresspalte bereinigen

Versuch, Jahr als numerischen Wert aus der Spalte ‘X’ zu extrahieren

absolventen_clean$jahr <- as.numeric(sub("/.*", "", absolventen_clean$X.2))

Nur gültige Jahre behalten

absolventen_clean <- subset(absolventen_clean, !is.na(jahr))

Zeitlicher Verlauf als Liniendiagramm mit ggplot2

ggplot(absolventen_clean, aes(x = jahr, y = anteil_ohne_abschluss)) +
  geom_line(color = "steelblue", size = 1) +
  geom_point(color = "steelblue") +
  labs(
    title = "Anteil der Schulabgänger*innen ohne Hauptschulabschluss",
    x = "Jahr",
    y = "Anteil (%)"
  ) +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Fazit: Die dargestellte Gesamtauswertung ist sehr unübersichtlich.

Nur Mittelwert pro Jahr

mittelwert_jahr <- absolventen_clean %>%
  group_by(jahr) %>%
  summarise(mittel_anteil = mean(anteil_ohne_abschluss, na.rm = TRUE))

Plot

ggplot(mittelwert_jahr, aes(x = jahr, y = mittel_anteil)) +
  geom_line(color = "steelblue", size = 1.2) +
  geom_point(color = "steelblue", size = 2) +
  labs(
    title = "Durchschnittlicher Anteil ohne Hauptschulabschluss pro Jahr",
    x = "Jahr",
    y = "Durchschnittlicher Anteil (%)"
  ) +
  theme_minimal()

Ergebnis: Aus dem dargestellten Mittelwert aller Bundesländer auf in den Jahren 1999-2023 lässt sich in den letzten Jahren eine deutliche Zunahme des Anteils ohne Hauptschulabschluss erkennen. In den Jahren 2004-2014 war der Anteil sehr gering und lag unter 30%.

Nur bestimmte Länder auswählen

auswahl <- c("Baden-Württemberg", "Thüringen")
absolventen_subset <- absolventen_clean %>%
  filter(X %in% auswahl)

ggplot(absolventen_subset, aes(x = jahr, y = anteil_ohne_abschluss, color = X)) +
  geom_line() +
  geom_point() +
  labs(
    title = "Anteil ohne Hauptschulabschluss – ausgewählte Länder",
    x = "Jahr",
    y = "Anteil (%)"
  ) +
  theme_minimal()

Durchschnitt je Bundesland berechnen

durchschnitt <- absolventen_subset %>%
  group_by(X) %>%
  summarise(mittelwert = mean(anteil_ohne_abschluss, na.rm = TRUE))

Originalplot mit Durchschnittslinien

ggplot(absolventen_subset, aes(x = jahr, y = anteil_ohne_abschluss, color = X)) +
  geom_line() +
  geom_point() +
  geom_hline(data = durchschnitt, aes(yintercept = mittelwert, color = X),
             linetype = "dashed", size = 1) +
  # Textlabel mit Durchschnittswert
  geom_text(data = durchschnitt, aes(x = 2001, y = mittelwert,
                                     label = paste0("Ø ", round(mittelwert, 2), "%")),
            color = "black", hjust = 0, vjust = -0.5, size = 4) +
  labs(
    title = "Anteil ohne Hauptschulabschluss – ausgewählte Länder",
    subtitle = "Mit durchschnittlichem Anteil (1999–2023)",
    x = "Jahr",
    y = "Anteil (%)",
    color = "Bundesland"
  ) +
  theme_minimal()

Ergebnis: Es wurden die beiden Bundesländer BAden-Württemberg (West) und Thüringen (Ost) als konkreter Vergleich ausgewählt. Anhand der obigen Darstellung wird auch hier die Auswertung des durchschnittlichen Anteils aus allen Ländern ersichtlich. Grundsätzlich liegt der Anteil ohne Hauptschulabschluss im Osten deutlich höher als im Westen. Der durschnittliche Anteil in Thüringen ohne Hauptschulabschluss liegt bei 35,95% und in Baden-Württemberg bei 20.94%. Allerdings ist der Anteil in Baden-Württemberg in den letzten zehn Jahren massiv gestiegen. Thüringen verzeichnet ebenso einen Anstieg in den letzten Zehn Jahren, jedoch nicht so sehr wie in BAden-Württemberg.

Fazit

Zwischen 1999 und 2023 ist der Anteil der Schulabgänger:innen ohne Hauptschulabschluss in Thüringen und Baden-Württemberg relativ stabil geblieben. Trotz unterschiedlicher Ausgangslagen liegt Thüringen durchweg leicht über Baden-Württemberg, was auf regionale Unterschiede im Bildungssystem hindeutet. Da keine signifikante Verbesserung zu erkennen ist, zeigt sich ein anhaltender Handlungsbedarf in beiden Bundesländern, insbesondere in Bezug auf Präventionsmaßnahmen und gezielte Förderungen zur Vermeidung von Schulabbrüchen ohne Abschluss.