Para la próxima actividad en clase, consideraremos una tabla de contingencia en la cual, se almacenan las frecuencias de ejecución de 13 tareas del hogar de una pareja, las tareas las pueden ejecutar individualmente, alternando o juntos.
library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(FactoMineR)
## Warning: package 'FactoMineR' was built under R version 4.0.3
library(ggplot2)
data("housetasks")
housetasks
## Wife Alternating Husband Jointly
## Laundry 156 14 2 4
## Main_meal 124 20 5 4
## Dinner 77 11 7 13
## Breakfeast 82 36 15 7
## Tidying 53 11 1 57
## Dishes 32 24 4 53
## Shopping 33 23 9 55
## Official 12 46 23 15
## Driving 10 51 75 3
## Finances 13 13 21 66
## Insurance 8 1 53 77
## Repairs 0 3 160 2
## Holidays 0 1 6 153
class(housetasks)
## [1] "data.frame"
# 1. convert the data as a table
dt <- as.table(as.matrix(housetasks))
# 2. Graph
barplot(dt,beside=TRUE,col=rainbow(10))
chisq.test(housetasks)
##
## Pearson's Chi-squared test
##
## data: housetasks
## X-squared = 1944.5, df = 36, p-value < 2.2e-16
Con base en los resultados de la prueba chi cuadrado, se observa que existe asociación estadística a un nivel de significancia del 5%, esto por que el p valor es mucho más pequeño que la siginificancia. De esta forma, se concluye que las actividades del hogar dependen del género.
Se utiliza la función CA() de la librería FactoMineR, dicha función realiza un ACS de un data.frame(). En la siguiente Figura, se observa la representación simultánea de las filas y columnas de la tabla de contingencia
res.ACS2 <- CA(housetasks)
Al observar la representación simultánea se aprecia que el porcentaje de varianza explicado es del 88.6%. Además, se oberva las actividades que realiza frecuente la esposa, el esposo, ambos y que se alternan; en donde se observa que en las parejas la esposa realiza actividades de cocina cómo el desayuno, la cena, etc. En las parejas el esposo realiza actvidades cómo manejar y reparar cosas. Las actividades que realizan ambos son finanzas, compras, fiestas, etc.
fviz_ca_biplot(res.ACS2)
fviz_contrib(res.ACS2, choice = "row", axes = 1)
res.ACS2$row$contrib
## Dim 1 Dim 2 Dim 3
## Laundry 18.2867003 5.5638913 7.96842443
## Main_meal 12.3888433 4.7355230 1.85868941
## Dinner 5.4713982 1.3210221 2.09692603
## Breakfeast 3.8249284 3.6986131 3.06939857
## Tidying 1.9983518 2.9656441 0.48873403
## Dishes 0.4261663 2.8441170 3.63429434
## Shopping 0.1755248 2.5151584 2.22335679
## Official 0.5207837 0.7956201 36.94038942
## Driving 8.0778371 7.6468564 18.59638635
## Finances 0.8750075 5.5585460 0.06175066
## Insurance 6.1470616 4.0203590 5.25263863
## Repairs 40.7300940 15.8806509 16.59639139
## Holidays 1.0773030 42.4539986 1.21261994
Las contribucciones más altas para el eje 1 son Lavandería, Reparar, Comida principal. Es decir, que el eje 1 se caracterizar por representar estas actividades.
fviz_cos2(res.ACS2, choice = "row", axes = 1)
res.ACS2$row$cos2
## Dim 1 Dim 2 Dim 3
## Laundry 0.73998741 0.18455213 0.075460467
## Main_meal 0.74160285 0.23235928 0.026037873
## Dinner 0.77664011 0.15370323 0.069656660
## Breakfeast 0.50494329 0.40023001 0.094826699
## Tidying 0.43981243 0.53501508 0.025172490
## Dishes 0.11811778 0.64615253 0.235729693
## Shopping 0.06365362 0.74765514 0.188691242
## Official 0.05304464 0.06642648 0.880528877
## Driving 0.43201860 0.33522911 0.232752289
## Finances 0.16067678 0.83666958 0.002653634
## Insurance 0.57601197 0.30880208 0.115185951
## Repairs 0.70673575 0.22587147 0.067392778
## Holidays 0.02979239 0.96235977 0.007847841
fviz_ca_row(res.ACS2, col.row = "cos2",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE)
fviz_contrib(res.ACS2, choice = "col", axes = 1)
res.ACS2$col$contrib
## Dim 1 Dim 2 Dim 3
## Wife 44.462018 10.312237 10.8220753
## Alternating 0.103739 2.782794 82.5492464
## Husband 54.233879 17.786612 6.1331792
## Jointly 1.200364 69.118357 0.4954991
fviz_cos2(res.ACS2, choice = "col", axes = 1)