Chi-Cuadrado
Condiciones:
La muestra debe ser tomadas al azar.
Variables medidas deben ser independientes.
Los datos deben ser reportados en frecuencias absolutas (no porcentajes).
Valores / categorias de variables deben ser mutuamente excluyentes.
Frecuencias observadas no deben ser pequeñas.
Resumen de los datos
## p20 p02 p50
## Min. :1 Min. :1.000 Min. :1.00
## 1st Qu.:1 1st Qu.:1.000 1st Qu.:1.00
## Median :1 Median :1.000 Median :1.00
## Mean :1 Mean :1.457 Mean :1.02
## 3rd Qu.:1 3rd Qu.:2.000 3rd Qu.:1.00
## Max. :1 Max. :2.000 Max. :2.00
Estructura de las variables
## tibble [2,308 x 3] (S3: tbl_df/tbl/data.frame)
## $ p20: dbl+lbl [1:2308] 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,...
## ..@ label : chr "Trabajó la semana pasada"
## ..@ format.spss : chr "F1.0"
## ..@ display_width: int 9
## ..@ labels : Named num [1:2] 1 2
## .. ..- attr(*, "names")= chr [1:2] " Si" " No"
## $ p02: dbl+lbl [1:2308] 1, 2, 2, 1, 2, 2, 1, 2, 1, 1, 1, 1, 2, 2, 1, 2, 1, 1,...
## ..@ label : chr "Sexo"
## ..@ format.spss : chr "F1.0"
## ..@ display_width: int 6
## ..@ labels : Named num [1:2] 1 2
## .. ..- attr(*, "names")= chr [1:2] " Hombre" " Mujer"
## $ p50: dbl+lbl [1:2308] 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1,...
## ..@ label : chr "Número de trabajos"
## ..@ format.spss : chr "F1.0"
## ..@ display_width: int 9
## ..@ labels : Named num [1:2] 1 2
## .. ..- attr(*, "names")= chr [1:2] " Uno" " Más de uno"
EJEMPLO
Supongamos que se quiere estudiar la posible asociación entre el sexo de una persona y el número de trabajos que esta posee.
## Cell Contents
## |-------------------------|
## | Count |
## |-------------------------|
##
## ===================================
## Número de trabajos
## Sexo uno mas de uno Total
## -----------------------------------
## Hombre 1229 24 1253
## -----------------------------------
## Mujer 1033 22 1055
## -----------------------------------
## Total 2262 46 2308
## ===================================
HIPÓTESIS
\(H_o:\) No hay asociación entre las variables, es decir si una persona posee un solo trabajo y el hecho de que esta sea hombre son independientes o no estan asociados.
\(H_a:\) Si hay asociación entre las variables, es decir si una persona posee un solo trabajo y el hecho de que esta sea hombre estan asociados.
## - Proporcion de los datos
## Número de trabajos
## Sexo uno mas de uno
## Hombre 0.532 0.010
## Mujer 0.448 0.010
## - Valores observados
## Número de trabajos
## Sexo uno mas de uno
## Hombre 1229 24
## Mujer 1033 22
## - Valores esperados
## Número de trabajos
## Sexo uno mas de uno
## Hombre 1228.027 24.97314
## Mujer 1033.973 21.02686
Test Chi-Cuadrado
chisq.test(tabla_01)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_01
## X-squared = 0.020009, df = 1, p-value = 0.8875
Conclusión:
Existen diferencias significativas para No rechazar la Ho es decir, no existe una asociación entre el sexo de una persona y el número de trabajos que esta posee ya que son independientes o no estan asociados, de manera significativa (Chi2=0.020, gl = 1, p-value >0.05).