Code

In diesem HTML-Dokument, welches automatisch über R Markdown generiert wurde, wird die Arbeit mit dem Statistikprogramm “R” für die Bachelorarbeit “Die Herkunft als Ursache der Arbeitsmarktintegration von Frauen mit Migrationsbio-grafie in Deutschland. Eine quantitative Analyse der Mikrozensus Daten von 2023 auf Basis der Assimilationstheorie.” präsentiert. Dafür werden verwendete packages von “R”, die deskriptiven Statistiken zu dem Einkommen und den Cultural Zones und der Code für die Nullmodelle vorgestellt.

Die Referenzen der verwendeten packages und deren Autoren*innen

lme4 Bates, D., Maechler, M., Bolker, B., & Walker, S. (2022). Lme4: Linear Mixed-Effects Models using ’Eigen’ and S4 (Version 1.1-31) [Computer software]. https://cran.r-project.org/web/packages/lme4

readxl Wickham, H. 2022. readxl: readxl: Read Excel Files (Version 1.4.5) [Computer software]. https://cran.r-project.org/web/packages/readxl/

tidyverse Wickham, H. 2022. Tidyverse: Easily Install and Load the ”Tidyverse” (Version 1.3.2) [Computer software]. https://cran.r-project.org/web/packages/tidyverse

Die deskriptive Statistik zu den Variablen Einkommen und “Cultural Zone” zusätzliche Angaben der deskriptiven Statistik wie Standardabweichung, Fallzahl und Varianz befinden sich in den Nullmodellen. uDurch ist die Variable der Frauen mit Migrationsbiografie, die ein Einkommen unter dem Durchschnitt Deutschlands haben. Durch ist die Variable der Frauen mit Migrationsbiografie, die ein Einkommen im Durchschnitt Deutschlands haben. ueDurch ist die Variable der Frauen mit Migrationsbiografie, die ein Einkommen über dem Durchschnitt Deutschlands haben. CZ_nr sind die Nummern der “Cultural Zones”, die nach der Ähnlichkeit zu Deutschland sortiert wurden, beispielsweise hat laut Theorie “Prostant Europe” als Zone die höchste Ähnlichkeit zu Deutschland und hat somit die Nummer “1”. Die Funktion “summary” fasst die deskriptive Statistik zusammen für die Variablen.

Der Datensatz “dat.xlsx”, welcher sich in dem Anhang der Bachelorarbeit befindet, wird als “wvs” eingelesen.

summary(wvs$uDurch)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.4906  0.6875  0.6060  0.7791  0.9346

summary(wvs$Durch)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 0.00000 0.00000 0.00000 0.02895 0.06397 0.13115

summary(wvs$ueDurch)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 0.00000 0.00000 0.00000 0.03326 0.07475 0.15094

summary(wvs$CZ_nr)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   3.000   6.000   5.297   7.000   8.000

Die Nullmodelle für die Mehrebenenregression lauten m2, m2b und m2c. m2 ist das Modell für Frauen die ein Nettoeinkommen unter dem Durchschnitt Deutschlands haben. m2b ist das Modell für Frauen die ein Nettoeinkommen im Durchschnitt Deutschlands haben. m2c ist das Modell für Frauen die ein Nettoeinkommen über dem Durchschnitt Deutschlands haben. Die Modelle werden über die Funktion “lmer” erstellt und mit “summary” zusammengefasst.

m2 <- lmer(uDurch ~ 1 + (1 | CZ_nr), data = wvs) 

summary(m2)

## Linear mixed model fit by REML ['lmerMod']
## Formula: uDurch ~ 1 + (1 | CZ_nr)
##    Data: wvs
## 
## REML criterion at convergence: -0.3
## 
## Scaled residuals: 
##     Min      1Q  Median      3Q     Max 
## -2.1773 -0.3310  0.2288  0.6155  1.9794 
## 
## Random effects:
##  Groups   Name        Variance Std.Dev.
##  CZ_nr    (Intercept) 0.02328  0.1526  
##  Residual             0.04318  0.2078  
## Number of obs: 37, groups:  CZ_nr, 8
## 
## Fixed effects:
##             Estimate Std. Error t value
## (Intercept)  0.54414    0.07037   7.733

m2b <- lmer(Durch ~ 1 + (1 | CZ_nr), data = wvs) 

summary(m2b)

## Linear mixed model fit by REML ['lmerMod']
## Formula: Durch ~ 1 + (1 | CZ_nr)
##    Data: wvs
## 
## REML criterion at convergence: -124.3
## 
## Scaled residuals: 
##     Min      1Q  Median      3Q     Max 
## -1.2298 -0.5082 -0.2957  0.7184  2.0821 
## 
## Random effects:
##  Groups   Name        Variance  Std.Dev.
##  CZ_nr    (Intercept) 0.0005765 0.02401 
##  Residual             0.0014245 0.03774 
## Number of obs: 37, groups:  CZ_nr, 8
## 
## Fixed effects:
##             Estimate Std. Error t value
## (Intercept)  0.02694    0.01165   2.312

m2c <- lmer(ueDurch ~ 1 + (1 | CZ_nr), data = wvs)

## boundary (singular) fit: see help('isSingular')

summary(m2c)

## Linear mixed model fit by REML ['lmerMod']
## Formula: ueDurch ~ 1 + (1 | CZ_nr)
##    Data: wvs
## 
## REML criterion at convergence: -107.5
## 
## Scaled residuals: 
##     Min      1Q  Median      3Q     Max 
## -0.6428 -0.6428 -0.6428  0.8018  2.2744 
## 
## Random effects:
##  Groups   Name        Variance Std.Dev.
##  CZ_nr    (Intercept) 0.000000 0.00000 
##  Residual             0.002677 0.05174 
## Number of obs: 37, groups:  CZ_nr, 8
## 
## Fixed effects:
##             Estimate Std. Error t value
## (Intercept) 0.033260   0.008507    3.91
## optimizer (nloptwrap) convergence code: 0 (OK)
## boundary (singular) fit: see help('isSingular')

Code

2025-09-29