`` # Enunciado del problema Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con métodos diferentes.
Después de un mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado de 9 km. Los tiempos empleados fueron los siguientes:
| Método I | Método II | Método III |
|---|---|---|
| 15 | 14 | 13 |
| 16 | 13 | 12 |
| 14 | 15 | 11 |
| 15 | 16 | 14 |
| 17 | 14 | 11 |
A un nivel de confianza del 95%, ¿puede considerarse que los tres métodos producen resultados equivalentes? O, por el contrario, ¿hay algún método superior a los demás?
# Cargar librerías necesarias
library(ggplot2)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# Datos del ejercicio
tiempos <- data.frame(
Metodo = rep(c("Metodo_I", "Metodo_II", "Metodo_III"), each = 5),
Tiempo = c(15, 16, 14, 15, 17, 14, 13, 15, 16, 14, 13, 12, 11, 14, 11)
)
# Resumen de los datos
cat("\n### Resumen de los Datos\n")
##
## ### Resumen de los Datos
summary(tiempos)
## Metodo Tiempo
## Length:15 Min. :11
## Class :character 1st Qu.:13
## Mode :character Median :14
## Mean :14
## 3rd Qu.:15
## Max. :17
# Análisis de varianza
anova_result <- aov(Tiempo ~ Metodo, data = tiempos)
cat("\n### Resultado del ANOVA\n")
##
## ### Resultado del ANOVA
summary(anova_result)
## Df Sum Sq Mean Sq F value Pr(>F)
## Metodo 2 26.8 13.400 9.349 0.00357 **
## Residuals 12 17.2 1.433
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# 1. Boxplot para visualizar las diferencias entre métodos
ggplot(tiempos, aes(x = Metodo, y = Tiempo, fill = Metodo)) +
geom_boxplot() +
labs(title = "Distribución de tiempos por método de entrenamiento",
x = "Método de Entrenamiento",
y = "Tiempo (minutos)") +
theme_minimal()
# 2. Graficar medias con intervalos de confianza
media_confianza <- tiempos %>%
group_by(Metodo) %>%
summarise(Media = mean(Tiempo),
SD = sd(Tiempo),
IC = qt(0.975, df = n() - 1) * SD / sqrt(n()))
ggplot(media_confianza, aes(x = Metodo, y = Media)) +
geom_point(size = 4, color = "blue") +
geom_errorbar(aes(ymin = Media - IC, ymax = Media + IC), width = 0.2) +
labs(title = "Media de tiempos con intervalos de confianza",
x = "Método de Entrenamiento",
y = "Tiempo Promedio (minutos)") +
theme_minimal()
# 3. Diagrama de dispersión de los tiempos
ggplot(tiempos, aes(x = Metodo, y = Tiempo, color = Metodo)) +
geom_jitter(width = 0.2, size = 3) +
labs(title = "Dispersión de los tiempos por método",
x = "Método de Entrenamiento",
y = "Tiempo (minutos)") +
theme_minimal()
# 4. Visualización de los residuos del modelo ANOVA
residuos <- resid(anova_result)
ajustados <- fitted(anova_result)
# Residuos vs valores ajustados
ggplot(data.frame(Ajustados = ajustados, Residuos = residuos), aes(x = Ajustados, y = Residuos)) +
geom_point() +
geom_hline(yintercept = 0, linetype = "dashed", color = "red") +
labs(title = "Residuos vs valores ajustados",
x = "Valores Ajustados",
y = "Residuos") +
theme_minimal()
# Histograma de los residuos
ggplot(data.frame(Residuos = residuos), aes(x = Residuos)) +
geom_histogram(binwidth = 0.5, fill = "blue", color = "black") +
labs(title = "Distribución de los residuos",
x = "Residuos",
y = "Frecuencia") +
theme_minimal()
El análisis de varianza (ANOVA) realizado muestra que:
Con base en estos resultados, el Método III es el más efectivo para mejorar el rendimiento en el recorrido cronometrado de 9 km. ```