Ponderación: 6% de la nota final del curso.
En esta tarea usarán un subconjunto de los datos provistos por Kazuo
Yamaguchi en su artículo “Models for comparing mobility tables:
toward parsimony and substance” (ASR 1987) para estudiar movilidad
social intergeneracional. Este subconjunto de datos corresponde una
tabla de contingencia que clasifican a padres e hijos según su clase
social en USA(ctable).
En estos datos, las ocupaciones tanto de los padres como de los hijos se clasifican en cinco categorías: no manuales superiores e inferiores (UpNM, LoNM), manuales superiores e inferiores (UpM, LoM) y agrícolas (Farm).
Esta clasificación permite analizar la movilidad social intergeneracional en términos de categorías ocupacionales.
## Warning: package 'vcd' was built under R version 4.4.1
print(ctable)
## Father
## Son UpNM LoNM UpM LoM Farm
## UpNM 1275 1055 1043 1159 666
## LoNM 364 597 587 791 496
## UpM 274 394 1045 1323 1031
## LoM 272 443 951 2046 1632
## Farm 17 31 47 52 646
ctable_sum <- addmargins(ctable, c(1,2))
print(ctable_sum)
## Father
## Son UpNM LoNM UpM LoM Farm Sum
## UpNM 1275 1055 1043 1159 666 5198
## LoNM 364 597 587 791 496 2835
## UpM 274 394 1045 1323 1031 4067
## LoM 272 443 951 2046 1632 5344
## Farm 17 31 47 52 646 793
## Sum 2202 2520 3673 5371 4471 18237
joint_tabla <- ctable/sum(ctable)
ctable_s <- apply(joint_tabla, 1, sum)
ctable_f <- apply(joint_tabla, 2, sum)
joint_tabla_ind <- ctable_s %*% t(ctable_f)
rownames(joint_tabla_ind) <- rownames (ctable)
ctable_independencia <- sum(ctable)*(joint_tabla_ind)
print(ctable_independencia)
## UpNM LoNM UpM LoM Farm
## UpNM 627.62494 718.2629 1046.8966 1530.8690 1274.3465
## LoNM 342.30795 391.7421 570.9796 834.9391 695.0313
## UpM 491.06399 561.9806 819.1090 1197.7769 997.0695
## LoM 645.25350 738.4372 1076.3016 1573.8676 1310.1400
## Farm 95.74963 109.5772 159.7132 233.5473 194.4126
mi_chi2 <- sum((ctable - ctable_independencia)^2 / ctable_independencia)
print(mi_chi2)
## [1] 3557.902
df <- (5-1)*(5-1)
chi2_final <- 1- pchisq(mi_chi2,df)
print(chi2_final)
## [1] 0
Conclusión: El valor obtenido al ser 0, hace que se rechace la Hipótesis nula (H0), por lo tanto, no son independientes, son variables dependientes