El presente documento tiene como propósito aplicar los principales conceptos de la estadística inferencial a través de diferentes ejercicios prácticos. A partir de conjuntos de datos simulados o recolectados en contextos reales, se busca analizar relaciones y diferencias entre variables mediante el uso de pruebas de hipótesis como la Chi-cuadrado y el ANOVA.
\(H_0\): El nivel de desarrollo y la postura frente al acuerdo son independientes.
\(H_1\): El nivel de desarrollo y la postura frente al acuerdo no son independientes.
Nivel de significancia: \(α = 0.05\)
Se usa una prueba Chi-cuadrado de independencia:
tabla <- matrix(c(25, 5, 20, 10, 15, 15), nrow = 3, byrow = TRUE)
rownames(tabla) <- c("Alto", "Medio", "Bajo")
colnames(tabla) <- c("A favor", "En contra")
tabla
## A favor En contra
## Alto 25 5
## Medio 20 10
## Bajo 15 15
prueba <- chisq.test(tabla)
print(prueba)
##
## Pearson's Chi-squared test
##
## data: tabla
## X-squared = 7.5, df = 2, p-value = 0.02352
El valor \(p\) obtenido fue \(p = 0.02352\).
Como \(p < 0.05\), se rechaza \(H_0\). Por lo tanto, sí existe una asociación significativa entre el nivel de desarrollo económico y la postura frente al acuerdo internacional sobre cambio climático.
Hipótesis:
Nivel de significancia: \(\alpha = 0.05\)
tabla_psico <- matrix(c(30, 20, 15, 35), nrow = 2, byrow = TRUE)
rownames(tabla_psico) <- c("Alto", "Bajo")
colnames(tabla_psico) <- c("Terapia Cognitivo-Conductual", "Terapia Humanista")
tabla_psico
## Terapia Cognitivo-Conductual Terapia Humanista
## Alto 30 20
## Bajo 15 35
prueba_chi_psico <- chisq.test(tabla_psico)
prueba_chi_psico
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_psico
## X-squared = 7.9192, df = 1, p-value = 0.004891
El valor p obtenido fue \(p = 0.004891\).
Como \(p < 0.05\), se rechaza \(H_0\). Los resultados indican una relación significativa entre el nivel de ansiedad y la preferencia por el tipo de terapia, por lo que la elección de la terapia depende del nivel de ansiedad del paciente.
Nivel de significancia: \(\alpha = 0.05\)
tabla_voto <- matrix(c(20, 15, 15,
10, 20, 20,
20, 15, 15),
nrow = 3, byrow = TRUE)
rownames(tabla_voto) <- c("Básico", "Medio", "Superior")
colnames(tabla_voto) <- c("Izquierda", "Centro", "Derecha")
tabla_voto
## Izquierda Centro Derecha
## Básico 20 15 15
## Medio 10 20 20
## Superior 20 15 15
prueba_voto <- chisq.test(tabla_voto)
prueba_voto
##
## Pearson's Chi-squared test
##
## data: tabla_voto
## X-squared = 6, df = 4, p-value = 0.1991
Con base en el análisis realizado, ¿cuál es la conclusión más adecuada al nivel de significancia \(α=0.05\)?
a) Existe suficiente evidencia para afirmar que el nivel educativo influye en la preferencia política.
b) No existe suficiente evidencia para
afirmar que el nivel educativo influye en la preferencia
política.
c) El nivel educativo y la preferencia política son dependientes.
d) El valor p es menor que 0.05, por lo tanto, se rechaza la hipótesis nula.
Dado que el valor \(p = 0.1991\) es mayor que \(0.05\), no se rechaza la hipótesis nula (\(H_0\)).
Por lo tanto la respuesta correcta es la b.
Nivel de significancia: \(\alpha = 0.05\)
set.seed(123)
salud <- rnorm(15, mean = 70, sd = 10)
educacion <- rnorm(15, mean = 60, sd = 12)
servicios <- rnorm(15, mean = 65, sd = 15)
estres <- c(salud, educacion, servicios)
grupo <- factor(rep(c("Salud", "Educacion", "Servicios"), each = 15))
datos <- data.frame(Estres = estres, Grupo = grupo)
# Prueba de normalidad Shapiro-Wilk
shapiro_salud <- shapiro.test(salud)
shapiro_educacion <- shapiro.test(educacion)
shapiro_servicios <- shapiro.test(servicios)
# ANOVA
modelo_anova <- aov(Estres ~ Grupo, data = datos)
summary(modelo_anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## Grupo 2 1838 919.0 6.685 0.00302 **
## Residuals 42 5774 137.5
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Con base en el análisis realizado, ¿cuál es la conclusión correcta respecto a las medias de estrés entre los trabajadores?
a) Se rechaza \(H_0\) Existen diferencias significativas en
el nivel promedio de estrés entre los grupos.
b) No se rechaza \(H_1\) No existen diferencias significativas en el nivel promedio de estrés entre los grupos.
c) No se cumple el supuesto de normalidad, por lo tanto, no se puede aplicar ANOVA.
d) El nivel promedio de estrés es igual en todos los trabajadores, sin necesidad de realizar pruebas.
El valor \(p = 0.00302 < 0.05\), por lo tanto, se rechaza la hipótesis nula (\(H_0\)).
Por lo tanto la respuesta correcta es la a.
Nivel de significancia: \(\alpha = 0.05\)
set.seed(123)
mercosur <- rnorm(15, mean = 65, sd = 10) # Media alta
alianza_pacifico <- rnorm(15, mean = 70, sd = 12) # Media aún mayor
caricom <- rnorm(15, mean = 60, sd = 15) # Media más baja
confianza <- c(mercosur, alianza_pacifico, caricom)
bloque <- factor(rep(c("Mercosur", "Alianza_Pacifico", "CARICOM"), each = 15))
datos_conf <- data.frame(Confianza = confianza, Bloque = bloque)
# Pruebas de normalidad por grupo
shapiro_mercosur <- shapiro.test(mercosur)
shapiro_alianza <- shapiro.test(alianza_pacifico)
shapiro_caricom <- shapiro.test(caricom)
# ANOVA
modelo_anova_conf <- aov(Confianza ~ Bloque, data = datos_conf)
res_anova_conf <- summary(modelo_anova_conf)
# Mostrar resultados
shapiro_mercosur
##
## Shapiro-Wilk normality test
##
## data: mercosur
## W = 0.94967, p-value = 0.5192
shapiro_alianza
##
## Shapiro-Wilk normality test
##
## data: alianza_pacifico
## W = 0.97293, p-value = 0.8988
shapiro_caricom
##
## Shapiro-Wilk normality test
##
## data: caricom
## W = 0.97037, p-value = 0.8634
res_anova_conf
## Df Sum Sq Mean Sq F value Pr(>F)
## Bloque 2 57 28.69 0.209 0.813
## Residuals 42 5774 137.49
Con base en un análisis ANOVA sobre el nivel de confianza en organismos internacionales según el bloque regional al que pertenece el país (Mercosur, Alianza del Pacífico, CARICOM), ¿cuál es la conclusión correcta respecto a las medias de confianza?
a) Se rechaza \(H_0\) Existen diferencias significativas en el nivel promedio de confianza entre los bloques regionales.
b) No se rechaza \(H_0\) No existen diferencias significativas
en el nivel promedio de confianza entre los bloques
regionales.
c) Como todos los países tienen relaciones internacionales, las medias deben ser iguales sin necesidad de hacer pruebas.
d) La prueba ANOVA no es útil para comparar niveles de confianza entre bloques políticos.
Como \(p > 0.05\), no hay evidencia suficiente para rechazar la hipótesis nula (\(H_0\)). Esto significa que no se detectan diferencias significativas en el nivel promedio de confianza ciudadana entre los tres bloques regionales.
Por lo tanto la respuesta correcta es la b