CHI-CUADRADO

\[ \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} \]

Donde:

Es una prueba estadistica para determinar si existe una relación entre dos o más variables de tipo categoricos, compara valores observados con los que enrealidad se espera bajo la suposición de que la Hipotesis nula no hay relación y la Hipotesis alterna si tiene relación.

Esto es una prueba de tipo parametrica lo cual indica que tiene normalidad sin la necesidad de utilizar shapiro puesto que esta es solo para variables cuantitativas

# Crear tabla de contingencia
tabla <- matrix(c(30, 10, 20, 40), 
                nrow = 2, 
                byrow = TRUE)

# Asignar nombres a filas y columnas
dimnames(tabla) <- list(
  Genero = c("Hombre", "Mujer"),
  Bebida = c("Cafe", "Te")
)

# Mostrar la tabla
tabla
##         Bebida
## Genero   Cafe Te
##   Hombre   30 10
##   Mujer    20 40
barplot(tabla, beside = TRUE, col = c("steelblue", "orange"),
        legend = rownames(tabla), 
        main = "Preferencia de bebida por género")

“Vemos que los hombres prefieren más el café, mientras que las mujeres tienen mayor preferencia por el té, lo cual es consistente con los resultados estadísticos.”

H0(Hipotesis Nula) No hay relación entre genero y preferencia

H1(Hipotesis Alterna) Hay relación estre genero y prefenrencia

# Prueba chi-cuadrado
resultado <- chisq.test(tabla)

# Mostrar resultado
resultado
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  tabla
## X-squared = 15.042, df = 1, p-value = 0.0001052

En conclusión como el P es menor a 0.05 no aceptamos la hipotesis nula y aceptamos la hipotesis alterna, esto es una evidencia significativa de que el genero y preferencia de bebida estan relacionados