Problema:

Ponderación: 6% de la nota final del curso.

Introducción:

En esta tarea usarán un subconjunto de los datos provistos por Kazuo Yamaguchi en su artículo “Models for comparing mobility tables: toward parsimony and substance” (ASR 1987) para estudiar movilidad social intergeneracional. Este subconjunto de datos corresponde una tabla de contingencia que clasifican a padres e hijos según su clase social en USA(ctable).

En estos datos, las ocupaciones tanto de los padres como de los hijos se clasifican en cinco categorías: no manuales superiores e inferiores (UpNM, LoNM), manuales superiores e inferiores (UpM, LoM) y agrícolas (Farm).

Esta clasificación permite analizar la movilidad social intergeneracional en términos de categorías ocupacionales.

## Warning: package 'vcd' was built under R version 4.4.1
print(ctable)
##       Father
## Son    UpNM LoNM  UpM  LoM Farm
##   UpNM 1275 1055 1043 1159  666
##   LoNM  364  597  587  791  496
##   UpM   274  394 1045 1323 1031
##   LoM   272  443  951 2046 1632
##   Farm   17   31   47   52  646

1.1. Calcula paso a paso un test de \(\chi^2\) para esta tabla de contingencia.

ctable_sum <- addmargins(ctable, c(1,2))
print(ctable_sum)
##       Father
## Son     UpNM  LoNM   UpM   LoM  Farm   Sum
##   UpNM  1275  1055  1043  1159   666  5198
##   LoNM   364   597   587   791   496  2835
##   UpM    274   394  1045  1323  1031  4067
##   LoM    272   443   951  2046  1632  5344
##   Farm    17    31    47    52   646   793
##   Sum   2202  2520  3673  5371  4471 18237
joint_tabla <- ctable/sum(ctable)

ctable_s <- apply(joint_tabla, 1, sum)
ctable_f <- apply(joint_tabla, 2, sum)

joint_tabla_ind <- ctable_s %*% t(ctable_f)
rownames(joint_tabla_ind) <- rownames (ctable)

ctable_independencia <- sum(ctable)*(joint_tabla_ind) 
print(ctable_independencia)
##           UpNM     LoNM       UpM       LoM      Farm
## UpNM 627.62494 718.2629 1046.8966 1530.8690 1274.3465
## LoNM 342.30795 391.7421  570.9796  834.9391  695.0313
## UpM  491.06399 561.9806  819.1090 1197.7769  997.0695
## LoM  645.25350 738.4372 1076.3016 1573.8676 1310.1400
## Farm  95.74963 109.5772  159.7132  233.5473  194.4126
mi_chi2 <- sum((ctable - ctable_independencia)^2 / ctable_independencia) 
print(mi_chi2)
## [1] 3557.902
df <- (5-1)*(5-1)

chi2_final <- 1- pchisq(mi_chi2,df)
print(chi2_final)
## [1] 0

1.2. Elabora una interpretación breve de los resultados.

Conclusión: El valor obtenido al ser 0, hace que se rechace la Hipótesis nula (H0), por lo tanto, no son independientes, son variables dependientes