Ejemplo ACS: caso housetasks

Para la próxima actividad en clase, consideraremos una tabla de contingencia en la cual, se almacenan las frecuencias de ejecución de 13 tareas del hogar de una pareja, las tareas las pueden ejecutar individualmente, alternando o juntos.

library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(FactoMineR)
## Warning: package 'FactoMineR' was built under R version 4.0.3
library(ggplot2)
data("housetasks")
housetasks
##            Wife Alternating Husband Jointly
## Laundry     156          14       2       4
## Main_meal   124          20       5       4
## Dinner       77          11       7      13
## Breakfeast   82          36      15       7
## Tidying      53          11       1      57
## Dishes       32          24       4      53
## Shopping     33          23       9      55
## Official     12          46      23      15
## Driving      10          51      75       3
## Finances     13          13      21      66
## Insurance     8           1      53      77
## Repairs       0           3     160       2
## Holidays      0           1       6     153
class(housetasks)
## [1] "data.frame"

Diagrama de Barras

# 1. convert the data as a table
dt <- as.table(as.matrix(housetasks))
# 2. Graph
barplot(dt,beside=TRUE,col=rainbow(10))

Prueba Chi cuadrado (asociación entre variables)

chisq.test(housetasks)
## 
##  Pearson's Chi-squared test
## 
## data:  housetasks
## X-squared = 1944.5, df = 36, p-value < 2.2e-16

Con base en los resultados de la prueba chi cuadrado, se observa que existe asociación estadística a un nivel de significancia del 5%, esto por que el p valor es mucho más pequeño que la siginificancia. De esta forma, se concluye que las actividades del hogar dependen del género.

Aplicación del ACS

Se utiliza la función CA() de la librería FactoMineR, dicha función realiza un ACS de un data.frame(). En la siguiente Figura, se observa la representación simultánea de las filas y columnas de la tabla de contingencia

res.ACS2 <- CA(housetasks)

Al observar la representación simultánea se aprecia que el porcentaje de varianza explicado es del 88.6%. Además, se oberva las actividades que realiza frecuente la esposa, el esposo, ambos y que se alternan; en donde se observa que en las parejas la esposa realiza actividades de cocina cómo el desayuno, la cena, etc. En las parejas el esposo realiza actvidades cómo manejar y reparar cosas. Las actividades que realizan ambos son finanzas, compras, fiestas, etc.

Gráficos con factoextra (mejoras en la visualización)

fviz_ca_biplot(res.ACS2)

Contribucciones por fila

fviz_contrib(res.ACS2, choice = "row", axes = 1)

res.ACS2$row$contrib
##                 Dim 1      Dim 2       Dim 3
## Laundry    18.2867003  5.5638913  7.96842443
## Main_meal  12.3888433  4.7355230  1.85868941
## Dinner      5.4713982  1.3210221  2.09692603
## Breakfeast  3.8249284  3.6986131  3.06939857
## Tidying     1.9983518  2.9656441  0.48873403
## Dishes      0.4261663  2.8441170  3.63429434
## Shopping    0.1755248  2.5151584  2.22335679
## Official    0.5207837  0.7956201 36.94038942
## Driving     8.0778371  7.6468564 18.59638635
## Finances    0.8750075  5.5585460  0.06175066
## Insurance   6.1470616  4.0203590  5.25263863
## Repairs    40.7300940 15.8806509 16.59639139
## Holidays    1.0773030 42.4539986  1.21261994

Las contribucciones más altas para el eje 1 son Lavandería, Reparar, Comida principal. Es decir, que el eje 1 se caracterizar por representar estas actividades.

Cosenos por fila

fviz_cos2(res.ACS2, choice = "row", axes = 1)

res.ACS2$row$cos2
##                 Dim 1      Dim 2       Dim 3
## Laundry    0.73998741 0.18455213 0.075460467
## Main_meal  0.74160285 0.23235928 0.026037873
## Dinner     0.77664011 0.15370323 0.069656660
## Breakfeast 0.50494329 0.40023001 0.094826699
## Tidying    0.43981243 0.53501508 0.025172490
## Dishes     0.11811778 0.64615253 0.235729693
## Shopping   0.06365362 0.74765514 0.188691242
## Official   0.05304464 0.06642648 0.880528877
## Driving    0.43201860 0.33522911 0.232752289
## Finances   0.16067678 0.83666958 0.002653634
## Insurance  0.57601197 0.30880208 0.115185951
## Repairs    0.70673575 0.22587147 0.067392778
## Holidays   0.02979239 0.96235977 0.007847841
fviz_ca_row(res.ACS2, col.row = "cos2",
             gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"), 
             repel = TRUE)

Contribucciones por columna

fviz_contrib(res.ACS2, choice = "col", axes = 1)

res.ACS2$col$contrib
##                 Dim 1     Dim 2      Dim 3
## Wife        44.462018 10.312237 10.8220753
## Alternating  0.103739  2.782794 82.5492464
## Husband     54.233879 17.786612  6.1331792
## Jointly      1.200364 69.118357  0.4954991

Cosenos cuadrado por columna

fviz_cos2(res.ACS2, choice = "col", axes = 1)