Forschungsfrage

Wie hat sich die Anzahl der Kinder in Tageseinrichtungen in den deutschen Bundesländern seit 2006 entwickelt? Gibt es Unterschiede zwischen den Ländern?

Hypothesen

1. Datenorganisation

Für dieses Projekt werden offene Daten des Statistischen Bundesamtes verwendet („Tabelle-2.2.5.csv“).

library(readr)
df_raw <- read_csv2("Tabelle-2.2.5.csv", skip = 4)
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## New names:
## Rows: 336 Columns: 7
## ── Column specification
## ──────────────────────────────────────────────────────── Delimiter: ";" chr
## (7): ...1, ...2, Kinder bis unter 3 Jahren, Kinder von 3 bis unter 7 Jah...
## ℹ Use `spec()` to retrieve the full column specification for this data. ℹ
## Specify the column types or set `show_col_types = FALSE` to quiet this message.
## • `` -> `...1`
## • `` -> `...2`
head(df_raw)
## # A tibble: 6 × 7
##   ...1              ...2  `Kinder bis unter 3 Jahren` Kinder von 3 bis unter 7…¹
##   <chr>             <chr> <chr>                       <chr>                     
## 1 Land              Jahr  Anzahl                      Anzahl                    
## 2 Baden-Württemberg 2006  21193                       344255                    
## 3 Baden-Württemberg 2007  26978                       329244                    
## 4 Baden-Württemberg 2008  32289                       319740                    
## 5 Baden-Württemberg 2009  37538                       316560                    
## 6 Baden-Württemberg 2010  43711                       310411                    
## # ℹ abbreviated name: ¹​`Kinder von 3 bis unter 7 Jahren (ohne Schulkinder)`
## # ℹ 3 more variables:
## #   `Kinder von 5 bis unter 14 Jahren (nur Schulkinder)` <chr>,
## #   `Kinder von 7 Jahren und älter (Nichtschulkinder)` <chr>, Insgesamt <chr>
colnames(df_raw)
## [1] "...1"                                              
## [2] "...2"                                              
## [3] "Kinder bis unter 3 Jahren"                         
## [4] "Kinder von 3 bis unter 7 Jahren (ohne Schulkinder)"
## [5] "Kinder von 5 bis unter 14 Jahren (nur Schulkinder)"
## [6] "Kinder von 7 Jahren und älter (Nichtschulkinder)"  
## [7] "Insgesamt"

2. Datenaufbereitung

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
df <- df_raw %>%
  select(
    Bundesland = "...1",
    Jahr = "...2",
    Insgesamt
  ) %>%
  filter(!is.na(Bundesland), !is.na(Jahr))

df$Jahr <- as.numeric(df$Jahr)
## Warning: NAs introduced by coercion
df$Insgesamt <- as.numeric(gsub("\\.", "", df$Insgesamt))
## Warning: NAs introduced by coercion
head(df)
## # A tibble: 6 × 3
##   Bundesland         Jahr Insgesamt
##   <chr>             <dbl>     <dbl>
## 1 Land                 NA        NA
## 2 Baden-Württemberg  2006    387937
## 3 Baden-Württemberg  2007    379734
## 4 Baden-Württemberg  2008    377922
## 5 Baden-Württemberg  2009    382235
## 6 Baden-Württemberg  2010    383769
summary(df)
##   Bundesland             Jahr        Insgesamt      
##  Length:324         Min.   :2006   Min.   :  21449  
##  Class :character   1st Qu.:2010   1st Qu.:  92648  
##  Mode  :character   Median :2015   Median : 155621  
##                     Mean   :2015   Mean   : 400069  
##                     3rd Qu.:2020   3rd Qu.: 327228  
##                     Max.   :2024   Max.   :3937130  
##                     NA's   :1      NA's   :1

3. Datenanalyse & Visualisierung

library(ggplot2)

# Top 5 Bundesländer nach Mittelwert
top_bundeslaender <- df %>%
  group_by(Bundesland) %>%
  summarise(Mittelwert = mean(Insgesamt, na.rm = TRUE)) %>%
  arrange(desc(Mittelwert)) %>%
  slice(1:5) %>%
  pull(Bundesland)

# Filter nur Top 5 Bundesländer
df_top5 <- df %>% filter(Bundesland %in% top_bundeslaender)

ggplot(df_top5, aes(x = Jahr, y = Insgesamt, color = Bundesland)) +
  geom_line(size = 1) +
  geom_point(size = 2) +
  labs(
    title = "Kinder in Tageseinrichtungen – Top 5 Bundesländer",
    x = "Jahr",
    y = "Anzahl Kinder",
    color = "Bundesland"
  ) +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

## 4. Interpretation der Ergebnisse Die Analyse zeigt, dass in allen fünf führenden Bundesländern die Anzahl der Kinder in Tageseinrichtungen von 2006 bis 2022 stetig angestiegen ist. Besonders Bayern und Baden-Württemberg verzeichnen einen starken Zuwachs. Dies spricht für einen Ausbau des Betreuungsangebots und eine gestiegene Nachfrage nach frühkindlicher Bildung. Gleichzeitig gibt es Unterschiede in den absoluten Zahlen zwischen den Bundesländern, was strukturelle und demografische Faktoren widerspiegeln könnte.

Limitationen: Es wurden nur die fünf Bundesländer mit den höchsten Durchschnittszahlen betrachtet, Veränderungen in anderen Ländern wären auch interessant. Ausblick: Weitere Analysen könnten z.B. den Einfluss von politischen Maßnahmen auf die Kinderzahlen untersuchen.

Datenquelle: Statistisches Bundesamt (Destatis), Tabelle 2.2.5: Kinder in Tageseinrichtungen nach Ländern, https://www.destatis.de/

5. Publikation

Der vollständige Bericht steht hier zur Verfügung: [https://rpubs.com/Seyma/1331145]