R Markdown

    **Elegí el ejercicio 2**

Se realizó una investigación para conocer el Índice de Masa Corporal (IMC) de cuatro poblaciones distintas ubicadas en el Sur de Jalisco, una vez creado el estudio y el diseño, el tamaño de muestra arrojo la cantidad de 30 personas. Los resultados se presentan en al Tabla 2. Hice lo siguiente: Primero caracteríce los grupos e hice estadística descriptiva y las pruebas de normalidad Tuxpan=(c(27,25,23,23,30,24,20,25,26,27,32,24,22,28,25,22,23,26,26,30,25,21,25,25,25,23,29,26,26,24)) mean(Tuxpan) sd(Tuxpan) xb=mean(Tuxpan) s=sd(Tuxpan) skewness(Tuxpan) kurtosis(Tuxpan) qqnorm(Tuxpan) qqline(Tuxpan) hist(Tuxpan, freq = F, col = “blue”, xlab = “Balance”, main = ““, xlim = c(xb-4s, xb+4s), ylim = c(0, .055),) curve(dnorm(x, mean = xb, sd = s), col = 2, lwd = 2, add = TRUE) ks.test(Tuxpan,”pnorm”, mean = mean(Tuxpan), sd = sd(Tuxpan)) shapiro.test(Tuxpan) Tamazula=(c(25,18,25,19,24,26,25,25,24,26,24,22,26,21,25,23,25,26,20,23,20,26,23,30,31,24,27,27,26,23)) mean(Tamazula) sd(Tamazula) xb=mean(Tamazula) s=sd(Tamazula) skewness(Tamazula) kurtosis(Tamazula) qqnorm(Tamazula) qqline(Tamazula) hist(Tamazula, freq = F, col = “blue”, xlab = “Balance”, main = ““, xlim = c(xb-4s, xb+4s), ylim = c(0, .055),) curve(dnorm(x, mean = xb, sd = s), col = 2, lwd = 2, add = TRUE) ks.test(Tamazula,”pnorm”, mean = mean(Tamazula), sd = sd(Tamazula)) shapiro.test(Tamazula) Zapotlan=(c(25,26,27,30,21,29,31,27,22,26,19,21,23,26,26,25,27,28,21,26,23,28,20,25,28,26,19,23,29,26)) mean(Zapotlan) sd(Zapotlan) xb=mean(Zapotlan) s=sd(Zapotlan) skewness(Zapotlan) kurtosis(Zapotlan) qqnorm(Zapotlan) qqline(Zapotlan) hist(Zapotlan, freq = F, col = “blue”, xlab = “Balance”, main = ““, xlim = c(xb-4s, xb+4s), ylim = c(0, .055),) curve(dnorm(x, mean = xb, sd = s), col = 2, lwd = 2, add = TRUE) ks.test(Zapotlan,”pnorm”, mean = mean(Zapotlan), sd = sd(Zapotlan)) shapiro.test(Zapotlan) Zapotiltic=(c(24,23,30,28,27,25,24,20,24,21,29,23,26,21,21,17,23,20,25,21,24,21,30,24,23,20,25,29,27,27)) mean(Zapotiltic) sd(Zapotiltic) xb=mean(Zapotiltic) s=sd(Zapotiltic) skewness(Zapotiltic) kurtosis(Zapotiltic) qqnorm(Zapotiltic) qqline(Zapotiltic) hist(Zapotiltic, freq = F, col = “blue”, xlab = “Balance”, main = ““, xlim = c(xb-4s, xb+4s), ylim = c(0, .055),) curve(dnorm(x, mean = xb, sd = s), col = 2, lwd = 2, add = TRUE) ks.test(Zapotiltic,”pnorm”, mean = mean(Zapotiltic), sd = sd(Zapotiltic)) shapiro.test(Zapotiltic) Posteriormente hice las pruebas de homocedasticidad Lista_pueblos <- list( Tuxpan = Tuxpan, Tamazula = Tamazula, Zapotlan = Zapotlan, Zapotiltic = Zapotiltic ) Datos_pre <- stack(Lista_pueblos) leveneTest(values ~ ind, data = Datos_pre)

                          **Como se distriubuyeron los datos normales, apliqué ANOVA, la prueba de ANOVA se ejecuta cuando los grupos independientes a comparar son 3 o más**

modelo_anova <- aov(values ~ ind, data = Datos_pre) residuos <- residuals(modelo_anova) plot(modelo_anova, which =1) boxplot(residuos ~ Datos_pre$ind, main= “Dispersión de Residuos por Pueblo”, xlab = “Pueblos”, ylab = “Residuos (Errores)”, col = “green”) abline(h = 0, col = “red”, lty = 2) plot(modelo_anova, which = 3) summary(modelo_anova)
boxplot(values ~ ind, data = Datos_pre, main = “comparativa de IMC por pueblo”, xlab = “Pueblos”, ylab = “IMC (kg/m2)”, col = “blue”, sub = “p-valor = 0.36 (no significativo”) Los resultados fueron no significativos, por tal motivo no realicé una prueba post hoc, de igual manera no hice modelos de regresión por que el ANOVA me había dado no significativo. Justificación Al realizar las pruebas de normalidad, los resultados no fueron significativos, por tal motivo utilicé la prueba de ANOVA. Al no ser significativo no hice pruebas post hoc, por ende, tampoco realice pruebas de regresión. De hecho, simplemente al observar las medias de cada pueblo, son casi similares, desde ese punto me daba una idea de que las diferencias no iban a ser estadísticamente significativas.