Examen

Primero determinamos la normalidad de los datos

#Shapiro Will
shapiro.test(Sayula)

## 
##  Shapiro-Wilk normality test
## 
## data:  Sayula
## W = 0.81358, p-value = 0.0001171

shapiro.test(Gomez_Farias)

## 
##  Shapiro-Wilk normality test
## 
## data:  Gomez_Farias
## W = 0.79961, p-value = 6.449e-05

shapiro.test(Zacoalco)

## 
##  Shapiro-Wilk normality test
## 
## data:  Zacoalco
## W = 0.84349, p-value = 0.0004543

shapiro.test(Techaluta)

## 
##  Shapiro-Wilk normality test
## 
## data:  Techaluta
## W = 0.80207, p-value = 7.153e-05

De acuerdo a los resultados, podemos decir que los datos no siguen una distribución normal

1. ¿Existe diferencia significativa entre el IMC de las muestras?

#Ya que son datos no normales, usaremos la prueba Kruskal-Wallis
kruskal.test(IMC ~ Grupo, data = datos)

## 
##  Kruskal-Wallis rank sum test
## 
## data:  IMC by Grupo
## Kruskal-Wallis chi-squared = 3.2423, df = 3, p-value = 0.3557

En caso de existir, ¿Cuál es la localidad diferente?

Como 𝑝=0.35>0.05, no se detectan diferencias estadísticamente significativas en el IMC entre los grupos.

Pruebas de homocedasticidad

IMC <- c(Sayula, Gomez_Farias, Zacoalco, Techaluta)
Grupo <- rep(c("Sayula", "Gomez_Farias", "Zacoalco", "Techaluta"), each = 30)
datos <- data.frame(IMC, Grupo)

Prueba de Levene

library(car)

## Warning: package 'car' was built under R version 4.4.2

## Cargando paquete requerido: carData

## Warning: package 'carData' was built under R version 4.4.2

leveneTest(IMC ~ Grupo, data = datos)

## Warning in leveneTest.default(y = y, group = group, ...): group coerced to
## factor.

## Levene's Test for Homogeneity of Variance (center = median)
##        Df F value Pr(>F)
## group   3  0.1938 0.9005
##       116

El resultado indica que los grupos son homogéneos

Graficamos

boxplot(IMC ~ Grupo, data = datos, 
        main = "Boxplot del IMC por grupo", 
        ylab = "IMC", 
        xlab = "Grupo",
        col = c("skyblue", "lightgreen", "orange", "pink"))

¿Cuáles son las localidades que mejor se correlacionan?

Primero vamos a organizar las columnas para calcular las correlaciones

# Crear un dataframe con las localidades como columnas
datos_corr <- data.frame(
  Sayula = Sayula,
  Gomez_Farias = Gomez_Farias,
  Zacoalco = Zacoalco,
  Techaluta = Techaluta
  )

# Calcular la matriz de correlación (Spearman)
correlaciones <- cor(datos_corr, method = "spearman")
print(correlaciones)

##                   Sayula Gomez_Farias   Zacoalco   Techaluta
## Sayula        1.00000000   0.43949872 -0.2096510 -0.07171149
## Gomez_Farias  0.43949872   1.00000000 -0.1105363  0.04836494
## Zacoalco     -0.20965100  -0.11053628  1.0000000  0.17187935
## Techaluta    -0.07171149   0.04836494  0.1718793  1.00000000

Interpretación de la matriz

La matriz de correlación mostrará valores entre −1 y 1:

Cercano a 1: Correlación positiva fuerte entre dos localidades. Cercano a -1: Correlación negativa fuerte. Cercano a 0: No hay correlación.

Correlaciones más fuertes: Sayula y Gómez Farías (r=0.439): Relación positiva moderada. Estas dos localidades tienen la mejor correlación de todas.

Correlaciones más débiles: Sayula y Zacoalco (𝑟=−0.210): Relación negativa débil. Sayula y Techaluta (r=−0.072): Relación negativa casi inexistente. Gómez Farías y Zacoalco (𝑟=−0.111): Relación negativa débil. Gómez Farías y Techaluta (𝑟=0.048): Relación positiva muy débil. Zacoalco y Techaluta (𝑟=0.172): Relación positiva débil.

¿Cuál es la ecuación que modela el comportamiento del IMC de esas dos localidades?

Utilizando Excel para graficar los datos de disperción y poniendo una línea de tendencia lieal, obtenemos la siguiente ecuación en el gráfico: y = -0.0769x + 29.077

Conclusiones

Los patrones de IMC observados en las cuatro localidades son similares, es decir no hay diferencias significativas en el IMC entre las cuatro localidades, y la homogeneidad de varianzas respalda esta conclusión.
Las localidades tienen una dispersión similar en los valores de IMC Al calcular las correlaciones entre localidades: La mayor correlación fue entre Sayula y Gómez Farías (r=0.439, moderada positiva).