`` # Enunciado del problema Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con métodos diferentes.

Después de un mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado de 9 km. Los tiempos empleados fueron los siguientes:

Método I Método II Método III
15 14 13
16 13 12
14 15 11
15 16 14
17 14 11

A un nivel de confianza del 95%, ¿puede considerarse que los tres métodos producen resultados equivalentes? O, por el contrario, ¿hay algún método superior a los demás?

# Cargar librerías necesarias
library(ggplot2)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# Datos del ejercicio
tiempos <- data.frame(
  Metodo = rep(c("Metodo_I", "Metodo_II", "Metodo_III"), each = 5),
  Tiempo = c(15, 16, 14, 15, 17, 14, 13, 15, 16, 14, 13, 12, 11, 14, 11)
)

# Resumen de los datos
cat("\n### Resumen de los Datos\n")
## 
## ### Resumen de los Datos
summary(tiempos)
##     Metodo              Tiempo  
##  Length:15          Min.   :11  
##  Class :character   1st Qu.:13  
##  Mode  :character   Median :14  
##                     Mean   :14  
##                     3rd Qu.:15  
##                     Max.   :17
# Análisis de varianza
anova_result <- aov(Tiempo ~ Metodo, data = tiempos)
cat("\n### Resultado del ANOVA\n")
## 
## ### Resultado del ANOVA
summary(anova_result)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## Metodo       2   26.8  13.400   9.349 0.00357 **
## Residuals   12   17.2   1.433                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# 1. Boxplot para visualizar las diferencias entre métodos
ggplot(tiempos, aes(x = Metodo, y = Tiempo, fill = Metodo)) +
  geom_boxplot() +
  labs(title = "Distribución de tiempos por método de entrenamiento",
       x = "Método de Entrenamiento",
       y = "Tiempo (minutos)") +
  theme_minimal()

# 2. Graficar medias con intervalos de confianza
media_confianza <- tiempos %>%
  group_by(Metodo) %>%
  summarise(Media = mean(Tiempo),
            SD = sd(Tiempo),
            IC = qt(0.975, df = n() - 1) * SD / sqrt(n()))

ggplot(media_confianza, aes(x = Metodo, y = Media)) +
  geom_point(size = 4, color = "blue") +
  geom_errorbar(aes(ymin = Media - IC, ymax = Media + IC), width = 0.2) +
  labs(title = "Media de tiempos con intervalos de confianza",
       x = "Método de Entrenamiento",
       y = "Tiempo Promedio (minutos)") +
  theme_minimal()

# 3. Diagrama de dispersión de los tiempos
ggplot(tiempos, aes(x = Metodo, y = Tiempo, color = Metodo)) +
  geom_jitter(width = 0.2, size = 3) +
  labs(title = "Dispersión de los tiempos por método",
       x = "Método de Entrenamiento",
       y = "Tiempo (minutos)") +
  theme_minimal()

# 4. Visualización de los residuos del modelo ANOVA
residuos <- resid(anova_result)
ajustados <- fitted(anova_result)

# Residuos vs valores ajustados
ggplot(data.frame(Ajustados = ajustados, Residuos = residuos), aes(x = Ajustados, y = Residuos)) +
  geom_point() +
  geom_hline(yintercept = 0, linetype = "dashed", color = "red") +
  labs(title = "Residuos vs valores ajustados",
       x = "Valores Ajustados",
       y = "Residuos") +
  theme_minimal()

# Histograma de los residuos
ggplot(data.frame(Residuos = residuos), aes(x = Residuos)) +
  geom_histogram(binwidth = 0.5, fill = "blue", color = "black") +
  labs(title = "Distribución de los residuos",
       x = "Residuos",
       y = "Frecuencia") +
  theme_minimal()

Conclusiones finales

El análisis de varianza (ANOVA) realizado muestra que:

Recomendación

Con base en estos resultados, el Método III es el más efectivo para mejorar el rendimiento en el recorrido cronometrado de 9 km. ```