Introducción

El presente documento tiene como propósito aplicar los principales conceptos de la estadística inferencial a través de diferentes ejercicios prácticos. A partir de conjuntos de datos simulados o recolectados en contextos reales, se busca analizar relaciones y diferencias entre variables mediante el uso de pruebas de hipótesis como la Chi-cuadrado y el ANOVA.

Problema 1:

Hipotesis

  • \(H_0\): El nivel de desarrollo y la postura frente al acuerdo son independientes.

  • \(H_1\): El nivel de desarrollo y la postura frente al acuerdo no son independientes.

  • Nivel de significancia: \(α = 0.05\)

Se usa una prueba Chi-cuadrado de independencia:

tabla <- matrix(c(25, 5, 20, 10, 15, 15), nrow = 3, byrow = TRUE)
rownames(tabla) <- c("Alto", "Medio", "Bajo")
colnames(tabla) <- c("A favor", "En contra")
tabla
##       A favor En contra
## Alto       25         5
## Medio      20        10
## Bajo       15        15
prueba <- chisq.test(tabla)
print(prueba)
## 
##  Pearson's Chi-squared test
## 
## data:  tabla
## X-squared = 7.5, df = 2, p-value = 0.02352

Resultado:

El valor \(p\) obtenido fue \(p = 0.02352\).

Conclusión:

Como \(p < 0.05\), se rechaza \(H_0\). Por lo tanto, sí existe una asociación significativa entre el nivel de desarrollo económico y la postura frente al acuerdo internacional sobre cambio climático.

Problema 2:

Hipótesis:

Nivel de significancia: \(\alpha = 0.05\)

tabla_psico <- matrix(c(30, 20, 15, 35), nrow = 2, byrow = TRUE)
rownames(tabla_psico) <- c("Alto", "Bajo")
colnames(tabla_psico) <- c("Terapia Cognitivo-Conductual", "Terapia Humanista")
tabla_psico
##      Terapia Cognitivo-Conductual Terapia Humanista
## Alto                           30                20
## Bajo                           15                35
prueba_chi_psico <- chisq.test(tabla_psico)
prueba_chi_psico
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  tabla_psico
## X-squared = 7.9192, df = 1, p-value = 0.004891

Resultado:

El valor p obtenido fue \(p = 0.004891\).

Conclusión:

Como \(p < 0.05\), se rechaza \(H_0\). Los resultados indican una relación significativa entre el nivel de ansiedad y la preferencia por el tipo de terapia, por lo que la elección de la terapia depende del nivel de ansiedad del paciente.

Problema 3:

Hipótesis:

  • \(H_0\): El nivel educativo y la preferencia política son independientes.
  • \(H_1\): El nivel educativo y la preferencia política no son independientes.

Nivel de significancia: \(\alpha = 0.05\)

tabla_voto <- matrix(c(20, 15, 15,
                       10, 20, 20,
                       20, 15, 15),
                     nrow = 3, byrow = TRUE)
rownames(tabla_voto) <- c("Básico", "Medio", "Superior")
colnames(tabla_voto) <- c("Izquierda", "Centro", "Derecha")
tabla_voto
##          Izquierda Centro Derecha
## Básico          20     15      15
## Medio           10     20      20
## Superior        20     15      15
prueba_voto <- chisq.test(tabla_voto)
prueba_voto
## 
##  Pearson's Chi-squared test
## 
## data:  tabla_voto
## X-squared = 6, df = 4, p-value = 0.1991

Con base en el análisis realizado, ¿cuál es la conclusión más adecuada al nivel de significancia \(α=0.05\)?

  • a) Existe suficiente evidencia para afirmar que el nivel educativo influye en la preferencia política.

  • b) No existe suficiente evidencia para afirmar que el nivel educativo influye en la preferencia política.

  • c) El nivel educativo y la preferencia política son dependientes.

  • d) El valor p es menor que 0.05, por lo tanto, se rechaza la hipótesis nula.

Resultado:

Dado que el valor \(p = 0.1991\) es mayor que \(0.05\), no se rechaza la hipótesis nula (\(H_0\)).

Por lo tanto la respuesta correcta es la b.

Problema 4:

Hipótesis:

  • \(H_0\): Las medias de estrés son iguales en los tres grupos.
  • \(H_1\): Al menos una media difiere entre los grupos.

Nivel de significancia: \(\alpha = 0.05\)

set.seed(123)

salud <- rnorm(15, mean = 70, sd = 10)
educacion <- rnorm(15, mean = 60, sd = 12)
servicios <- rnorm(15, mean = 65, sd = 15)

estres <- c(salud, educacion, servicios)
grupo <- factor(rep(c("Salud", "Educacion", "Servicios"), each = 15))

datos <- data.frame(Estres = estres, Grupo = grupo)

# Prueba de normalidad Shapiro-Wilk
shapiro_salud <- shapiro.test(salud)
shapiro_educacion <- shapiro.test(educacion)
shapiro_servicios <- shapiro.test(servicios)

# ANOVA
modelo_anova <- aov(Estres ~ Grupo, data = datos)
summary(modelo_anova)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## Grupo        2   1838   919.0   6.685 0.00302 **
## Residuals   42   5774   137.5                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Con base en el análisis realizado, ¿cuál es la conclusión correcta respecto a las medias de estrés entre los trabajadores?

  • a) Se rechaza \(H_0\) Existen diferencias significativas en el nivel promedio de estrés entre los grupos.

  • b) No se rechaza \(H_1\) No existen diferencias significativas en el nivel promedio de estrés entre los grupos.

  • c) No se cumple el supuesto de normalidad, por lo tanto, no se puede aplicar ANOVA.

  • d) El nivel promedio de estrés es igual en todos los trabajadores, sin necesidad de realizar pruebas.

Resultado:

El valor \(p = 0.00302 < 0.05\), por lo tanto, se rechaza la hipótesis nula (\(H_0\)).

Por lo tanto la respuesta correcta es la a.

Problema 5:

Hipótesis:

  • \(H_0\): Las medias de confianza son iguales en los tres bloques ( \(\mu_{Mercosur} = \mu_{Alianza} = \mu_{CARICOM}\) ).
  • \(H_1\): Al menos una media difiere.

Nivel de significancia: \(\alpha = 0.05\)

set.seed(123)

mercosur <- rnorm(15, mean = 65, sd = 10)           # Media alta
alianza_pacifico <- rnorm(15, mean = 70, sd = 12)  # Media aún mayor
caricom <- rnorm(15, mean = 60, sd = 15)           # Media más baja

confianza <- c(mercosur, alianza_pacifico, caricom)
bloque <- factor(rep(c("Mercosur", "Alianza_Pacifico", "CARICOM"), each = 15))
datos_conf <- data.frame(Confianza = confianza, Bloque = bloque)

# Pruebas de normalidad por grupo
shapiro_mercosur <- shapiro.test(mercosur)
shapiro_alianza <- shapiro.test(alianza_pacifico)
shapiro_caricom <- shapiro.test(caricom)

# ANOVA
modelo_anova_conf <- aov(Confianza ~ Bloque, data = datos_conf)
res_anova_conf <- summary(modelo_anova_conf)

# Mostrar resultados
shapiro_mercosur
## 
##  Shapiro-Wilk normality test
## 
## data:  mercosur
## W = 0.94967, p-value = 0.5192
shapiro_alianza
## 
##  Shapiro-Wilk normality test
## 
## data:  alianza_pacifico
## W = 0.97293, p-value = 0.8988
shapiro_caricom
## 
##  Shapiro-Wilk normality test
## 
## data:  caricom
## W = 0.97037, p-value = 0.8634
res_anova_conf
##             Df Sum Sq Mean Sq F value Pr(>F)
## Bloque       2     57   28.69   0.209  0.813
## Residuals   42   5774  137.49

Con base en un análisis ANOVA sobre el nivel de confianza en organismos internacionales según el bloque regional al que pertenece el país (Mercosur, Alianza del Pacífico, CARICOM), ¿cuál es la conclusión correcta respecto a las medias de confianza?

  • a) Se rechaza \(H_0\) Existen diferencias significativas en el nivel promedio de confianza entre los bloques regionales.

  • b) No se rechaza \(H_0\) No existen diferencias significativas en el nivel promedio de confianza entre los bloques regionales.

  • c) Como todos los países tienen relaciones internacionales, las medias deben ser iguales sin necesidad de hacer pruebas.

  • d) La prueba ANOVA no es útil para comparar niveles de confianza entre bloques políticos.

Resultado:

Como \(p > 0.05\), no hay evidencia suficiente para rechazar la hipótesis nula (\(H_0\)). Esto significa que no se detectan diferencias significativas en el nivel promedio de confianza ciudadana entre los tres bloques regionales.

Por lo tanto la respuesta correcta es la b