This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
#Aquí escribimos los datos EXACTAMENTE como en la tabla del Problema 2. #Es MUY importante que cada vector tenga 40 observaciones. Tuxpan <- c( 56.8737368, 40.7698416, 34.9827086, 50.8355469, 41.2537837, 40.2525028, 65.3747110, 40.6326716, 36.0229159, 55.6802978, 44.9378375, 32.8781015, 46.1086300, 50.4452281, 40.9593530, 41.6345346, 37.9669790, 39.1720231, 37.7627429, 44.8698892, 59.2819332, 44.8865784, 42.5794541, 55.9904173, 48.1450523, 52.4785672, 38.7085992, 47.6627382, 41.6629199, 44.6555849, 53.5387106, 48.4698056, 41.0937399, 33.2555782, 52.7472865, 57.3657006, 45.8509702, 45.0599645, 49.0262527, 53.3509364 ) Tamazula <- c( 58.6473969, 43.2169280, 55.4072675, 55.1836955, 49.0183583, 34.6711157, 54.2726910, 51.3757685, 35.8199167, 54.0492464, 41.3403494, 33.8059680, 44.0301709, 33.3204797, 37.0820770, 39.8810470, 56.5439540, 38.0335722, 49.9438237, 50.9543632, 42.9717828, 51.6120643, 49.7289283, 42.4745530, 65.2507287, 51.4034081, 44.0938264, 35.9519389, 50.4145509, 44.9594471, 54.9179230, 48.5450117, 37.7063906, 50.3505497, 55.6435178, 33.6993024, 54.0533027, 32.5121572, 40.0921134, 42.1821595 ) Zapotlan <- c( 50.5484376, 41.2865801, 44.8989293, 44.7219599, 37.1048144, 39.6589302, 48.4723704, 51.7048055, 42.9704641, 42.0561763, 48.1717096, 45.3950860, 54.8849629, 49.1389663, 41.8670924, 48.6294856, 43.7558218, 39.2483479, 48.9180592, 68.3610550, 45.6176666, 44.2583904, 39.7623033, 49.0499359, 38.4076837, 55.6258009, 56.4470018, 47.9137315, 47.7522689, 59.6450399, 45.6973020, 44.2257941, 47.4923717, 42.7755866, 41.2537837, 54.9350215, 42.3853043, 51.8693695, 51.4906013, 46.8519601 ) Zapotiltic <- c( 51.4588963, 32.2569530, 40.7045035, 36.8008976, 38.2624193, 55.3743620, 62.7798134, 44.6307557, 46.3406785, 52.7306974, 39.2605715, 63.9356721, 62.3617369, 50.4259559, 54.7101944, 51.1628922, 34.1099575, 55.5567520, 53.4259333, 47.4600118, 51.6835142, 35.2859341, 60.4507794, 44.3903854, 48.4954898, 50.5880552, 42.1766662, 44.0453140, 57.8112075, 56.0521174, 38.8246507, 58.9920954, 52.7280780, 48.5972076, 41.2596227, 56.7607775, 42.0423520, 56.5937579, 53.4419586, 50.3399177 ) #Unimos todo en un solo data.frame. datos <- data.frame( Tuxpan = Tuxpan, Tamazula = Tamazula, Zapotlan = Zapotlan, Zapotiltic = Zapotiltic ) dim(datos) summary(datos) #Boxplot por localidad. #Sirve para ver diferencias en la mediana, dispersión y posibles outliers. boxplot(datos, main = “Boxplot del IMC por localidad”, ylab = “IMC”) #Promedio por localidad (para una primera comparación de medias). colMeans(datos) #Hacemos un QQ-plot por cada localidad. par(mfrow = c(2, 2)) # Para ver las 4 gráficas juntas for (i in 1:4) { qqnorm(datos[[i]], main = paste(“QQ-plot de”, names(datos)[i]), ylab = “Cuantiles muestrales”) qqline(datos[[i]]) } par(mfrow = c(1, 1)) # Shapiro-Wilk por localidad. #H0: los datos siguen distribución normal. #Si p > 0.05 → NO rechazo H0 → normalidad aceptable. shapiro.test(datos\(Tuxpan) shapiro.test(datos\)Tamazula) shapiro.test(datos\(Zapotlan) shapiro.test(datos\)Zapotiltic) #Convertimos a formato largo: #- IMC: todos los valores #- Localidad: factor que indica de qué municipio es cada dato datos_largos <- data.frame( IMC = c(datos\(Tuxpan, datos\)Tamazula, datos\(Zapotlan, datos\)Zapotiltic), Localidad = factor(rep(c(“Tuxpan”, “Tamazula”, “Zapotlan”, “Zapotiltic”), each = nrow(datos))) ) dim(datos_largos) table(datos_largos\(Localidad) stats::bartlett.test(IMC ~ Localidad, data = datos_largos) stats::fligner.test(IMC ~ Localidad, data = datos_largos) #Ajustamos el modelo ANOVA. #H0: las medias de IMC son iguales en los 4 municipios.H1: al menos una media es distinta. modelo_anova <- aov(IMC ~ Localidad, data = datos_largos) summary(modelo_anova) kruskal.test(IMC ~ Localidad, data = datos_largos) #Gráfico de dispersión entre todas las localidades. pairs(datos, main = "Relación entre IMC de las localidades", pch = 19) #Ajustamos un modelo de regresión lineal: #Y = IMC de Zapotiltic #X = IMC de Tamazula modelo_reg <- lm(Zapotiltic ~ Tamazula, data = datos) summary(modelo_reg) #Gráfica de la relación y la recta de regresión plot(datos\)Tamazula, datos$Zapotiltic, xlab = “IMC Tamazula”, ylab = “IMC Zapotiltic”, main = “Regresión lineal: Zapotiltic ~ Tamazula”, pch = 19) abline(modelo_reg, col = “red”, lwd = 2) #Gráficos de diagnóstico estándar del modelo de regresión. #Se revisa: #- Residuos vs ajustados (homocedasticidad) #- QQ-plot de residuos (normalidad) #- Scale-Location (varianza constante) #- Residuos vs leverage (puntos influyentes) par(mfrow = c(2, 2)) plot(modelo_reg) par(mfrow = c(1, 1)) #Conclusiones #Las pruebas de normalidad (Shapiro-Wilk) y los QQ-plots muestran que las distribuciones de IMC por municipio son razonablemente normales (con algunas pequeñas desviaciones). #Las pruebas de homocedasticidad (Bartlett y Fligner-Killeen) indican que las varianzas entre municipios son similares. #Tanto el ANOVA como la prueba de Kruskal-Wallis dan un valor p > 0.05, por lo que no hay evidencia estadística de diferencias significativas en el IMC promedio entre Tuxpan, Tamazula, Zapotlán y Zapotiltic. #as correlaciones entre localidades son en general bajas; el par con mayor correlación (en valor absoluto) suele ser Tamazula–Zapotiltic, con una correlación negativa moderada. #El modelo de regresión lineal entre Tamazula y Zapotiltic muestra una relación débil (R² bajo), por lo que no es un buen modelo predictivo, aunque describe una tendencia general. #En conjunto, los resultados sugieren que el comportamiento del IMC entre estas cuatro localidades es bastante similar, sin diferencias marcadas a nivel estadístico.