Wie hat sich die Anzahl der Kinder in Tageseinrichtungen in den deutschen Bundesländern seit 2006 entwickelt? Gibt es Unterschiede zwischen den Ländern?
Für dieses Projekt werden offene Daten des Statistischen Bundesamtes verwendet („Tabelle-2.2.5.csv“).
library(readr)
df_raw <- read_csv2("Tabelle-2.2.5.csv", skip = 4)
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## New names:
## Rows: 336 Columns: 7
## ── Column specification
## ──────────────────────────────────────────────────────── Delimiter: ";" chr
## (7): ...1, ...2, Kinder bis unter 3 Jahren, Kinder von 3 bis unter 7 Jah...
## ℹ Use `spec()` to retrieve the full column specification for this data. ℹ
## Specify the column types or set `show_col_types = FALSE` to quiet this message.
## • `` -> `...1`
## • `` -> `...2`
head(df_raw)
## # A tibble: 6 × 7
## ...1 ...2 `Kinder bis unter 3 Jahren` Kinder von 3 bis unter 7…¹
## <chr> <chr> <chr> <chr>
## 1 Land Jahr Anzahl Anzahl
## 2 Baden-Württemberg 2006 21193 344255
## 3 Baden-Württemberg 2007 26978 329244
## 4 Baden-Württemberg 2008 32289 319740
## 5 Baden-Württemberg 2009 37538 316560
## 6 Baden-Württemberg 2010 43711 310411
## # ℹ abbreviated name: ¹`Kinder von 3 bis unter 7 Jahren (ohne Schulkinder)`
## # ℹ 3 more variables:
## # `Kinder von 5 bis unter 14 Jahren (nur Schulkinder)` <chr>,
## # `Kinder von 7 Jahren und älter (Nichtschulkinder)` <chr>, Insgesamt <chr>
colnames(df_raw)
## [1] "...1"
## [2] "...2"
## [3] "Kinder bis unter 3 Jahren"
## [4] "Kinder von 3 bis unter 7 Jahren (ohne Schulkinder)"
## [5] "Kinder von 5 bis unter 14 Jahren (nur Schulkinder)"
## [6] "Kinder von 7 Jahren und älter (Nichtschulkinder)"
## [7] "Insgesamt"
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
df <- df_raw %>%
select(
Bundesland = "...1",
Jahr = "...2",
Insgesamt
) %>%
filter(!is.na(Bundesland), !is.na(Jahr))
df$Jahr <- as.numeric(df$Jahr)
## Warning: NAs introduced by coercion
df$Insgesamt <- as.numeric(gsub("\\.", "", df$Insgesamt))
## Warning: NAs introduced by coercion
head(df)
## # A tibble: 6 × 3
## Bundesland Jahr Insgesamt
## <chr> <dbl> <dbl>
## 1 Land NA NA
## 2 Baden-Württemberg 2006 387937
## 3 Baden-Württemberg 2007 379734
## 4 Baden-Württemberg 2008 377922
## 5 Baden-Württemberg 2009 382235
## 6 Baden-Württemberg 2010 383769
summary(df)
## Bundesland Jahr Insgesamt
## Length:324 Min. :2006 Min. : 21449
## Class :character 1st Qu.:2010 1st Qu.: 92648
## Mode :character Median :2015 Median : 155621
## Mean :2015 Mean : 400069
## 3rd Qu.:2020 3rd Qu.: 327228
## Max. :2024 Max. :3937130
## NA's :1 NA's :1
library(ggplot2)
# Top 5 Bundesländer nach Mittelwert
top_bundeslaender <- df %>%
group_by(Bundesland) %>%
summarise(Mittelwert = mean(Insgesamt, na.rm = TRUE)) %>%
arrange(desc(Mittelwert)) %>%
slice(1:5) %>%
pull(Bundesland)
# Filter nur Top 5 Bundesländer
df_top5 <- df %>% filter(Bundesland %in% top_bundeslaender)
ggplot(df_top5, aes(x = Jahr, y = Insgesamt, color = Bundesland)) +
geom_line(size = 1) +
geom_point(size = 2) +
labs(
title = "Kinder in Tageseinrichtungen – Top 5 Bundesländer",
x = "Jahr",
y = "Anzahl Kinder",
color = "Bundesland"
) +
theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## 4. Interpretation der Ergebnisse Die Analyse zeigt, dass in allen
fünf führenden Bundesländern die Anzahl der Kinder in Tageseinrichtungen
von 2006 bis 2022 stetig angestiegen ist. Besonders Bayern und
Baden-Württemberg verzeichnen einen starken Zuwachs. Dies spricht für
einen Ausbau des Betreuungsangebots und eine gestiegene Nachfrage nach
frühkindlicher Bildung. Gleichzeitig gibt es Unterschiede in den
absoluten Zahlen zwischen den Bundesländern, was strukturelle und
demografische Faktoren widerspiegeln könnte.
Limitationen: Es wurden nur die fünf Bundesländer mit den höchsten Durchschnittszahlen betrachtet, Veränderungen in anderen Ländern wären auch interessant. Ausblick: Weitere Analysen könnten z.B. den Einfluss von politischen Maßnahmen auf die Kinderzahlen untersuchen.
Datenquelle: Statistisches Bundesamt (Destatis), Tabelle 2.2.5: Kinder in Tageseinrichtungen nach Ländern, https://www.destatis.de/
Der vollständige Bericht steht hier zur Verfügung: [https://rpubs.com/Seyma/1331145]