PRUEBA DE INDEPENDENCIA PARA VARIABLES CUALITATIVAS

Chi-Cuadrado

Condiciones:

Resumen de los datos

##       p20         p02             p50      
##  Min.   :1   Min.   :1.000   Min.   :1.00  
##  1st Qu.:1   1st Qu.:1.000   1st Qu.:1.00  
##  Median :1   Median :1.000   Median :1.00  
##  Mean   :1   Mean   :1.457   Mean   :1.02  
##  3rd Qu.:1   3rd Qu.:2.000   3rd Qu.:1.00  
##  Max.   :1   Max.   :2.000   Max.   :2.00

Estructura de las variables

## tibble [2,308 x 3] (S3: tbl_df/tbl/data.frame)
##  $ p20: dbl+lbl [1:2308] 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,...
##    ..@ label        : chr "Trabajó la semana pasada"
##    ..@ format.spss  : chr "F1.0"
##    ..@ display_width: int 9
##    ..@ labels       : Named num [1:2] 1 2
##    .. ..- attr(*, "names")= chr [1:2] " Si" " No"
##  $ p02: dbl+lbl [1:2308] 1, 2, 2, 1, 2, 2, 1, 2, 1, 1, 1, 1, 2, 2, 1, 2, 1, 1,...
##    ..@ label        : chr "Sexo"
##    ..@ format.spss  : chr "F1.0"
##    ..@ display_width: int 6
##    ..@ labels       : Named num [1:2] 1 2
##    .. ..- attr(*, "names")= chr [1:2] " Hombre" " Mujer"
##  $ p50: dbl+lbl [1:2308] 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1,...
##    ..@ label        : chr "Número de trabajos"
##    ..@ format.spss  : chr "F1.0"
##    ..@ display_width: int 9
##    ..@ labels       : Named num [1:2] 1 2
##    .. ..- attr(*, "names")= chr [1:2] " Uno" " Más de uno"

EJEMPLO

Supongamos que se quiere estudiar la posible asociación entre el sexo de una persona y el número de trabajos que esta posee.

##    Cell Contents 
## |-------------------------|
## |                   Count | 
## |-------------------------|
## 
## ===================================
##           Número de trabajos
## Sexo       uno   mas de uno   Total
## -----------------------------------
## Hombre    1229           24    1253
## -----------------------------------
## Mujer     1033           22    1055
## -----------------------------------
## Total     2262           46    2308
## ===================================

HIPÓTESIS

\(H_o:\) No hay asociación entre las variables, es decir si una persona posee un solo trabajo y el hecho de que esta sea hombre son independientes o no estan asociados.

\(H_a:\) Si hay asociación entre las variables, es decir si una persona posee un solo trabajo y el hecho de que esta sea hombre estan asociados.

## - Proporcion de los datos
##         Número de trabajos
## Sexo       uno mas de uno
##   Hombre 0.532      0.010
##   Mujer  0.448      0.010
## - Valores observados
##         Número de trabajos
## Sexo      uno mas de uno
##   Hombre 1229         24
##   Mujer  1033         22
## - Valores esperados
##         Número de trabajos
## Sexo          uno mas de uno
##   Hombre 1228.027   24.97314
##   Mujer  1033.973   21.02686

Test Chi-Cuadrado

chisq.test(tabla_01)
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  tabla_01
## X-squared = 0.020009, df = 1, p-value = 0.8875

Conclusión:

Existen diferencias significativas para No rechazar la Ho es decir, no existe una asociación entre el sexo de una persona y el número de trabajos que esta posee ya que son independientes o no estan asociados, de manera significativa (Chi2=0.020, gl = 1, p-value >0.05).