# Crear el data frame
datos <- data.frame(
  Tipo_desayuno = factor(rep(c("Sin desayuno", "Desayuno ligero", "Desayuno completo"), 
                            each = 5),
                        levels = c("Sin desayuno", "Desayuno ligero", "Desayuno completo")),
  Puntuacion = c(8, 7, 9, 13, 10,    # Sin desayuno
                 14, 16, 12, 17, 11, # Desayuno ligero
                 10, 12, 16, 15, 12) # Desayuno completo
)
# Ver las primeras filas del data frame
kable(head(datos))
Tipo_desayuno Puntuacion
Sin desayuno 8
Sin desayuno 7
Sin desayuno 9
Sin desayuno 13
Sin desayuno 10
Desayuno ligero 14
resumen <- datos %>% 
  group_by(Tipo_desayuno) %>% 
  summarise(       
          Promedio = mean(Puntuacion),
          Desviacion_estandar = sd(Puntuacion),
          n = n()
          )

# Usamos kable para que se vea bonito en el HTML final
kable(resumen, caption = "Estadísticas descriptivas por tipo de desayuno")
Estadísticas descriptivas por tipo de desayuno
Tipo_desayuno Promedio Desviacion_estandar n
Sin desayuno 9.4 2.302173 5
Desayuno ligero 14.0 2.549510 5
Desayuno completo 13.0 2.449490 5
# Gráfico de cajas para visualizar las diferencias
boxplot(Puntuacion ~ Tipo_desayuno, data = datos, 
        main = "Influencia del Desayuno en el Rendimiento",
        xlab = "Tipo de Desayuno", ylab = "Puntuación",
        col = c("#ffcccb", "#add8e6", "#90ee90"))

# Realizar el análisis de varianza (ANOVA)
# Formula: Variable Numérica (Dependiente) ~ Factor (Independiente)
modelo_anova <- aov(Puntuacion ~ Tipo_desayuno, data = datos)

summary(modelo_anova)
##               Df Sum Sq Mean Sq F value Pr(>F)  
## Tipo_desayuno  2  58.53  29.267   4.933 0.0273 *
## Residuals     12  71.20   5.933                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Opcional: pruebas post-hoc (Tukey HSD) si el ANOVA es significativo
# Verificamos si el p-valor (Pr(>F)) es menor a 0.05
if(summary(modelo_anova)[[1]]$'Pr(>F)'[1] < 0.05) {
  tukey_result <- TukeyHSD(modelo_anova)
  print(tukey_result)
} else {
  print("El ANOVA no fue significativo, no se requieren pruebas post-hoc.")
}
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Puntuacion ~ Tipo_desayuno, data = datos)
## 
## $Tipo_desayuno
##                                   diff        lwr      upr     p adj
## Desayuno ligero-Sin desayuno       4.6  0.4899889 8.710011 0.0284289
## Desayuno completo-Sin desayuno     3.6 -0.5100111 7.710011 0.0886624
## Desayuno completo-Desayuno ligero -1.0 -5.1100111 3.110011 0.7963670

Conclusión

“El análisis de varianza (ANOVA) mostró que el tipo de desayuno tiene un efecto significativo en el rendimiento académico (F = 4.93; gl = 2, 12; p = 0.027), trabajando con un nivel de confianza del 95% (\(\alpha\) = 0.05).Específicamente, los estudiantes con desayuno ligero obtuvieron calificaciones significativamente más altas (M=14.0) que aquellos que no desayunaron (M=9.4). Aunque el desayuno completo también mostró mejores promedios, la diferencia estadística más fuerte se encuentra entre desayunar ligero y no desayunar.