Ejemplo ACS: caso housetasks

Para la próxima actividad en clase, consideraremos una tabla de contingencia en la cual, se almacenan las frecuencias de ejecución de 13 tareas del hogar de una pareja, las tareas las pueden ejecutar individualmente, alternando o juntos.

library(factoextra)
## Loading required package: ggplot2
## Welcome! Related Books: `Practical Guide To Cluster Analysis in R` at https://goo.gl/13EFCZ
library(FactoMineR)
library(ggplot2)
data("housetasks")
housetasks
##            Wife Alternating Husband Jointly
## Laundry     156          14       2       4
## Main_meal   124          20       5       4
## Dinner       77          11       7      13
## Breakfeast   82          36      15       7
## Tidying      53          11       1      57
## Dishes       32          24       4      53
## Shopping     33          23       9      55
## Official     12          46      23      15
## Driving      10          51      75       3
## Finances     13          13      21      66
## Insurance     8           1      53      77
## Repairs       0           3     160       2
## Holidays      0           1       6     153
class(housetasks)
## [1] "data.frame"

Diagrama de Barras

# 1. convert the data as a table
dt <- as.table(as.matrix(housetasks))
# 2. Graph
barplot(dt,beside=TRUE,col=rainbow(10))

Prueba Chi cuadrado (asociación entre variables)

chisq.test(housetasks)
## 
##  Pearson's Chi-squared test
## 
## data:  housetasks
## X-squared = 1944.5, df = 36, p-value < 2.2e-16

Con base en los resultados de la prueba chi cuadrado, se observa que existe asociación estadística a un nivel de significancia del 5%, esto por que el p valor es mucho más pequeño que la siginificancia. De esta forma, se concluye que las actividades del hogar dependen del género.

Aplicación del ACS

Se utiliza la función CA() de la librería FactoMineR, dicha función realiza un ACS de un data.frame(). En la siguiente Figura, se observa la representación simultánea de las filas y columnas de la tabla de contingencia

res.ACS2 <- CA(housetasks)

Al observar la representación simultánea se aprecia que el porcentaje de varianza explicado es del 88.6%. Además, se oberva las actividades que realiza frecuente la esposa, el esposo, ambos y que se alternan; en donde se observa que en las parejas la esposa realiza actividades de cocina cómo el desayuno, la cena, etc. En las parejas el esposo realiza actvidades cómo manejar y reparar cosas. Las actividades que realizan ambos son finanzas, compras, fiestas, etc.

Gráficos con factoextra (mejoras en la visualización)

fviz_ca_biplot(res.ACS2)

Contribucciones por fila

fviz_contrib(res.ACS2, choice = "row", axes = 1)

Cosenos por fila

fviz_cos2(res.ACS2, choice = "row", axes = 1)

Contribucciones por columna

fviz_contrib(res.ACS2, choice = "col", axes = 1)

Cosenos cuadrado por columna

fviz_cos2(res.ACS2, choice = "col", axes = 1)