In diesem HTML-Dokument, welches automatisch über R Markdown generiert wurde, wird die Arbeit mit dem Statistikprogramm “R” für die Bachelorarbeit “Die Herkunft als Ursache der Arbeitsmarktintegration von Frauen mit Migrationsbio-grafie in Deutschland. Eine quantitative Analyse der Mikrozensus Daten von 2023 auf Basis der Assimilationstheorie.” präsentiert. Dafür werden verwendete packages von “R”, die deskriptiven Statistiken zu dem Einkommen und den Cultural Zones und der Code für die Nullmodelle vorgestellt.
Die Referenzen der verwendeten packages und deren Autoren*innen
lme4 Bates, D., Maechler, M., Bolker, B., & Walker, S. (2022). Lme4: Linear Mixed-Effects Models using ’Eigen’ and S4 (Version 1.1-31) [Computer software]. https://cran.r-project.org/web/packages/lme4
readxl Wickham, H. 2022. readxl: readxl: Read Excel Files (Version 1.4.5) [Computer software]. https://cran.r-project.org/web/packages/readxl/
tidyverse Wickham, H. 2022. Tidyverse: Easily Install and Load the ”Tidyverse” (Version 1.3.2) [Computer software]. https://cran.r-project.org/web/packages/tidyverse
Die deskriptive Statistik zu den Variablen Einkommen und “Cultural Zone” zusätzliche Angaben der deskriptiven Statistik wie Standardabweichung, Fallzahl und Varianz befinden sich in den Nullmodellen. uDurch ist die Variable der Frauen mit Migrationsbiografie, die ein Einkommen unter dem Durchschnitt Deutschlands haben. Durch ist die Variable der Frauen mit Migrationsbiografie, die ein Einkommen im Durchschnitt Deutschlands haben. ueDurch ist die Variable der Frauen mit Migrationsbiografie, die ein Einkommen über dem Durchschnitt Deutschlands haben. CZ_nr sind die Nummern der “Cultural Zones”, die nach der Ähnlichkeit zu Deutschland sortiert wurden, beispielsweise hat laut Theorie “Prostant Europe” als Zone die höchste Ähnlichkeit zu Deutschland und hat somit die Nummer “1”. Die Funktion “summary” fasst die deskriptive Statistik zusammen für die Variablen.
Der Datensatz “dat.xlsx”, welcher sich in dem Anhang der Bachelorarbeit befindet, wird als “wvs” eingelesen.
summary(wvs$uDurch)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0000 0.4906 0.6875 0.6060 0.7791 0.9346
summary(wvs$Durch)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00000 0.00000 0.00000 0.02895 0.06397 0.13115
summary(wvs$ueDurch)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00000 0.00000 0.00000 0.03326 0.07475 0.15094
summary(wvs$CZ_nr)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 3.000 6.000 5.297 7.000 8.000
Die Nullmodelle für die Mehrebenenregression lauten m2, m2b und m2c. m2 ist das Modell für Frauen die ein Nettoeinkommen unter dem Durchschnitt Deutschlands haben. m2b ist das Modell für Frauen die ein Nettoeinkommen im Durchschnitt Deutschlands haben. m2c ist das Modell für Frauen die ein Nettoeinkommen über dem Durchschnitt Deutschlands haben. Die Modelle werden über die Funktion “lmer” erstellt und mit “summary” zusammengefasst.
m2 <- lmer(uDurch ~ 1 + (1 | CZ_nr), data = wvs)
summary(m2)
## Linear mixed model fit by REML ['lmerMod']
## Formula: uDurch ~ 1 + (1 | CZ_nr)
## Data: wvs
##
## REML criterion at convergence: -0.3
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -2.1773 -0.3310 0.2288 0.6155 1.9794
##
## Random effects:
## Groups Name Variance Std.Dev.
## CZ_nr (Intercept) 0.02328 0.1526
## Residual 0.04318 0.2078
## Number of obs: 37, groups: CZ_nr, 8
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 0.54414 0.07037 7.733
m2b <- lmer(Durch ~ 1 + (1 | CZ_nr), data = wvs)
summary(m2b)
## Linear mixed model fit by REML ['lmerMod']
## Formula: Durch ~ 1 + (1 | CZ_nr)
## Data: wvs
##
## REML criterion at convergence: -124.3
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -1.2298 -0.5082 -0.2957 0.7184 2.0821
##
## Random effects:
## Groups Name Variance Std.Dev.
## CZ_nr (Intercept) 0.0005765 0.02401
## Residual 0.0014245 0.03774
## Number of obs: 37, groups: CZ_nr, 8
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 0.02694 0.01165 2.312
m2c <- lmer(ueDurch ~ 1 + (1 | CZ_nr), data = wvs)
## boundary (singular) fit: see help('isSingular')
summary(m2c)
## Linear mixed model fit by REML ['lmerMod']
## Formula: ueDurch ~ 1 + (1 | CZ_nr)
## Data: wvs
##
## REML criterion at convergence: -107.5
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -0.6428 -0.6428 -0.6428 0.8018 2.2744
##
## Random effects:
## Groups Name Variance Std.Dev.
## CZ_nr (Intercept) 0.000000 0.00000
## Residual 0.002677 0.05174
## Number of obs: 37, groups: CZ_nr, 8
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 0.033260 0.008507 3.91
## optimizer (nloptwrap) convergence code: 0 (OK)
## boundary (singular) fit: see help('isSingular')