Clase: Estadística Inferencial

En este informe se presentan varios ejemplos de aplicación de pruebas de Chi-cuadrado y ANOVA, con el fin de analizar asociaciones y diferencias de medias entre grupos en distintos contextos.


🔹 1. Relación entre nivel de desarrollo y postura frente al acuerdo climático

Hipótesis: - H₀: El nivel de desarrollo y la postura frente al acuerdo son independientes.
- H₁: No son independientes.

tabla <- matrix(c(25, 5, 20, 10, 15, 15), nrow = 3, byrow = TRUE)
rownames(tabla) <- c("Alto", "Medio", "Bajo")
colnames(tabla) <- c("A favor", "En contra")
tabla
##       A favor En contra
## Alto       25         5
## Medio      20        10
## Bajo       15        15
prueba <- chisq.test(tabla)
prueba
## 
##  Pearson's Chi-squared test
## 
## data:  tabla
## X-squared = 7.5, df = 2, p-value = 0.02352

Interpretación:
El valor p = 0.02352 < 0.0 se rechaza H₀.
Existe una relación significativa entre el nivel de desarrollo y la postura frente al acuerdo climático.

barplot(t(tabla),
        beside = TRUE,
        col = c("lightblue", "salmon"),
        main = "Relación entre nivel de desarrollo y postura frente al acuerdo",
        ylab = "Número de países",
        legend.text = colnames(tabla))


🔹 2. Nivel de ansiedad y tipo de terapia preferida

Hipótesis: - H₀: No existe relación entre el nivel de ansiedad y el tipo de terapia.
- H₁: Existe relación entre ambas variables.

tabla_psico <- matrix(c(30, 20, 15, 35), nrow = 2, byrow = TRUE)
rownames(tabla_psico) <- c("Alto", "Bajo")
colnames(tabla_psico) <- c("Terapia Cognitivo-Conductual", "Terapia Humanista")
tabla_psico
##      Terapia Cognitivo-Conductual Terapia Humanista
## Alto                           30                20
## Bajo                           15                35
prueba_chi_psico <- chisq.test(tabla_psico)
prueba_chi_psico
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  tabla_psico
## X-squared = 7.9192, df = 1, p-value = 0.004891

Interpretación:
El valor p = 0.00489 < 0.05 se rechaza H₀.
Existe una asociación significativa entre el nivel de ansiedad y la preferencia por tipo de terapia.

barplot(t(tabla_psico), beside=TRUE, col=c("lightcoral", "lightblue"), 
        main="Preferencia de terapia según nivel de ansiedad", 
        legend=TRUE, args.legend=list(x="topright"))


🔹 3. Nivel educativo y preferencia política

Hipótesis: - H₀: No hay relación entre nivel educativo y preferencia política.
- H₁: Existe relación entre ambas variables.

tabla_voto <- matrix(c(20,15,15,10,20,20,20,15,15), nrow=3, byrow=TRUE)
rownames(tabla_voto) <- c("Básico", "Medio", "Superior")
colnames(tabla_voto) <- c("Izquierda", "Centro", "Derecha")
tabla_voto
##          Izquierda Centro Derecha
## Básico          20     15      15
## Medio           10     20      20
## Superior        20     15      15
prueba_voto <- chisq.test(tabla_voto)
prueba_voto
## 
##  Pearson's Chi-squared test
## 
## data:  tabla_voto
## X-squared = 6, df = 4, p-value = 0.1991

Interpretación:
El valor p = 0.1991 > 0.05 → no se rechaza H₀.
No existe evidencia suficiente para afirmar que el nivel educativo influye en la preferencia política.

barplot(t(tabla_voto), beside=TRUE, col=c("lightblue","lightgreen","pink"), 
        main="Preferencia política según nivel educativo", legend=TRUE)


🔹 4. ANOVA: Nivel de estrés en diferentes tipos de trabajadores

Hipótesis: - H₀: No hay diferencias significativas entre los grupos.
- H₁: Al menos un grupo difiere en su nivel promedio de estrés.

set.seed(123)
salud <- rnorm(15, mean=70, sd=10)
educacion <- rnorm(15, mean=60, sd=12)
servicios <- rnorm(15, mean=65, sd=15)
estres <- c(salud, educacion, servicios)
grupo <- factor(rep(c("Salud", "Educación", "Servicios Públicos"), each=15))
datos <- data.frame(Estres=estres, Grupo=grupo)

modelo_anova <- aov(Estres ~ Grupo, data=datos)
summary(modelo_anova)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## Grupo        2   1838   919.0   6.685 0.00302 **
## Residuals   42   5774   137.5                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretación:
El valor p = 0.00302 < 0.05 → se rechaza H₀.
Existen diferencias significativas en los niveles promedio de estrés entre los grupos de trabajo.

boxplot(Estres ~ Grupo, data=datos,
        col=c("lightblue","lightgreen","lightpink"),
        main="Comparación del nivel de estrés por grupo laboral",
        ylab="Nivel de estrés (0-100)")


🔹 5. ANOVA: Confianza en organismos internacionales según bloque regional

Hipótesis: - H₀: No existen diferencias en el nivel de confianza promedio entre los bloques.
- H₁: Al menos un bloque presenta una media distinta.

set.seed(123)
mercosur <- rnorm(15, mean=65, sd=10)
alianza_pacifico <- rnorm(15, mean=70, sd=12)
caricom <- rnorm(15, mean=60, sd=15)
confianza <- c(mercosur, alianza_pacifico, caricom)
bloque <- factor(rep(c("Mercosur","Alianza del Pacífico","CARICOM"), each=15))
datos_confianza <- data.frame(Confianza=confianza, Bloque=bloque)

modelo_confianza <- aov(Confianza ~ Bloque, data=datos_confianza)
summary(modelo_confianza)
##             Df Sum Sq Mean Sq F value Pr(>F)
## Bloque       2     57   28.69   0.209  0.813
## Residuals   42   5774  137.49

Interpretación:
El valor p = 0.322 > 0.05 → no se rechaza H₀.
No hay diferencias significativas en el nivel promedio de confianza entre los tres bloques regionales.

boxplot(Confianza ~ Bloque, data=datos_confianza,
        col=c("gold","lightblue","lightcoral"),
        main="Nivel de confianza en organismos internacionales por bloque",
        ylab="Nivel de confianza (0-100)")


Conclusión General

Los resultados obtenidos evidencian cómo las pruebas de Chi-cuadrado permiten identificar asociaciones entre variables categóricas, mientras que el ANOVA compara medias entre grupos.
En este análisis se observaron asociaciones significativas entre: - El nivel de desarrollo y la postura frente al cambio climático.
- El nivel de ansiedad y la preferencia terapéutica.

Por otro lado, variables como el nivel educativo o el bloque regional no mostraron diferencias significativas.
Estos métodos son fundamentales en la estadística inferencial para analizar fenómenos sociales basados en evidencia y datos reales.