Se realizó una investigación para conocer el Índice de Masa Corporal (IMC) de cuatro poblaciones distintas ubicadas en el Sur de Jalisco, una vez creado el estudio y el diseño, el tamaño de muestra arrojo la cantidad de 30 personas.
Sayula <- c (25,25,29,27,25,29,29,29,25,29,29,29,25,25,29,29,31,31,29,27,25,25,27,29,31,29,31,29,25,29)
Gomez_Farias <- c (29,25,25,29,25,29,29,29,27,29,31,25,25,25,29,25,29,31,29,25,27,25,25,25,25,29,29,27,27,29)
Zacoalco <- c(29,29,29,29,29,27,27,25,29,25,31,29,25,29,27,29,25,25,29,27,27,27,25,31,25,29,29,25,27,25)
Techaluta <- c(27,31,27,25,27,25,29,27,27,25,29,29,25,25,25,25,25,29,29,25,29,27,25,25,31,29,25,25,31,25)
# Crear dataframe
IMC <- c(Sayula, Gomez_Farias, Zacoalco, Techaluta)
Grupo <- rep(c("Sayula", "Gomez_Farias", "Zacoalco", "Techaluta"), each = 30)
datos <- data.frame(IMC, Grupo)
#Shapiro Will
shapiro.test(Sayula)
##
## Shapiro-Wilk normality test
##
## data: Sayula
## W = 0.81358, p-value = 0.0001171
shapiro.test(Gomez_Farias)
##
## Shapiro-Wilk normality test
##
## data: Gomez_Farias
## W = 0.79961, p-value = 6.449e-05
shapiro.test(Zacoalco)
##
## Shapiro-Wilk normality test
##
## data: Zacoalco
## W = 0.84349, p-value = 0.0004543
shapiro.test(Techaluta)
##
## Shapiro-Wilk normality test
##
## data: Techaluta
## W = 0.80207, p-value = 7.153e-05
De acuerdo a los resultados, podemos decir que los datos no siguen una distribución normal
#Ya que son datos no normales, usaremos la prueba Kruskal-Wallis
kruskal.test(IMC ~ Grupo, data = datos)
##
## Kruskal-Wallis rank sum test
##
## data: IMC by Grupo
## Kruskal-Wallis chi-squared = 3.2423, df = 3, p-value = 0.3557
Como 𝑝=0.35>0.05, no se detectan diferencias estadísticamente significativas en el IMC entre los grupos.
IMC <- c(Sayula, Gomez_Farias, Zacoalco, Techaluta)
Grupo <- rep(c("Sayula", "Gomez_Farias", "Zacoalco", "Techaluta"), each = 30)
datos <- data.frame(IMC, Grupo)
Prueba de Levene
library(car)
## Warning: package 'car' was built under R version 4.4.2
## Cargando paquete requerido: carData
## Warning: package 'carData' was built under R version 4.4.2
leveneTest(IMC ~ Grupo, data = datos)
## Warning in leveneTest.default(y = y, group = group, ...): group coerced to
## factor.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 0.1938 0.9005
## 116
El resultado indica que los grupos son homogéneos
Graficamos
boxplot(IMC ~ Grupo, data = datos,
main = "Boxplot del IMC por grupo",
ylab = "IMC",
xlab = "Grupo",
col = c("skyblue", "lightgreen", "orange", "pink"))
Primero vamos a organizar las columnas para calcular las correlaciones
# Crear un dataframe con las localidades como columnas
datos_corr <- data.frame(
Sayula = Sayula,
Gomez_Farias = Gomez_Farias,
Zacoalco = Zacoalco,
Techaluta = Techaluta
)
# Calcular la matriz de correlación (Spearman)
correlaciones <- cor(datos_corr, method = "spearman")
print(correlaciones)
## Sayula Gomez_Farias Zacoalco Techaluta
## Sayula 1.00000000 0.43949872 -0.2096510 -0.07171149
## Gomez_Farias 0.43949872 1.00000000 -0.1105363 0.04836494
## Zacoalco -0.20965100 -0.11053628 1.0000000 0.17187935
## Techaluta -0.07171149 0.04836494 0.1718793 1.00000000
Interpretación de la matriz
La matriz de correlación mostrará valores entre −1 y 1:
Cercano a 1: Correlación positiva fuerte entre dos localidades. Cercano a -1: Correlación negativa fuerte. Cercano a 0: No hay correlación.
Correlaciones más fuertes: Sayula y Gómez Farías (r=0.439): Relación positiva moderada. Estas dos localidades tienen la mejor correlación de todas.
Correlaciones más débiles: Sayula y Zacoalco (𝑟=−0.210): Relación negativa débil. Sayula y Techaluta (r=−0.072): Relación negativa casi inexistente. Gómez Farías y Zacoalco (𝑟=−0.111): Relación negativa débil. Gómez Farías y Techaluta (𝑟=0.048): Relación positiva muy débil. Zacoalco y Techaluta (𝑟=0.172): Relación positiva débil.
Utilizando Excel para graficar los datos de disperción y poniendo una línea de tendencia lieal, obtenemos la siguiente ecuación en el gráfico: y = -0.0769x + 29.077
Los patrones de IMC observados en las cuatro localidades son similares, es decir no hay diferencias significativas en el IMC entre las cuatro localidades, y la homogeneidad de varianzas respalda esta conclusión.
Las localidades tienen una dispersión similar en los valores de IMC Al calcular las correlaciones entre localidades: La mayor correlación fue entre Sayula y Gómez Farías (r=0.439, moderada positiva).