R Markdown

library(dplyr)
library(ggplot2)
# Crear el data frame con los datos del desayuno
datos <- data.frame(
  Tipo_desayuno = factor(rep(c("Sin desayuno", "Desayuno ligero", "Desayuno completo"), 
                            each = 5),
                        levels = c("Sin desayuno", "Desayuno ligero", "Desayuno completo")),
  Puntuacion = c(8, 7, 9, 13, 10,    # Sin desayuno
                 14, 16, 12, 17, 11, # Desayuno ligero
                 10, 12, 16, 15, 12) # Desayuno completo
)
# Ver las primeras filas del data frame
head(datos)
##     Tipo_desayuno Puntuacion
## 1    Sin desayuno          8
## 2    Sin desayuno          7
## 3    Sin desayuno          9
## 4    Sin desayuno         13
## 5    Sin desayuno         10
## 6 Desayuno ligero         14
# Resumen estadístico por grupo
df <- group_by(datos, Tipo_desayuno)

resumen <- df %>% summarise(     
          Promedio = mean(Puntuacion),
          Desviacion_estandar = sd(Puntuacion),
          n = n()
          )
resumen
## # A tibble: 3 × 4
##   Tipo_desayuno     Promedio Desviacion_estandar     n
##   <fct>                <dbl>               <dbl> <int>
## 1 Sin desayuno           9.4                2.30     5
## 2 Desayuno ligero       14                  2.55     5
## 3 Desayuno completo     13                  2.45     5
# Gráfico de cajas para visualizar las diferencias
boxplot(Puntuacion ~ Tipo_desayuno, data = datos, 
        main = "Rendimiento estudiantil según tipo de desayuno",
        xlab = "Tipo de Desayuno", 
        ylab = "Puntuacion (Rendimiento)",
        col = c("#F8766D", "#00BA38", "#619CFF")) # Colores opcionales para diferenciar

# Realizar el análisis de varianza (ANOVA)
modelo_anova <- aov(Puntuacion ~ Tipo_desayuno, data = datos)

summary(modelo_anova)
##               Df Sum Sq Mean Sq F value Pr(>F)  
## Tipo_desayuno  2  58.53  29.267   4.933 0.0273 *
## Residuals     12  71.20   5.933                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Opcional: pruebas post-hoc (Tukey HSD) si el ANOVA es significativo
# Se ejecuta solo si el p-valor es menor a 0.05
if(summary(modelo_anova)[[1]]$'Pr(>F)'[1] < 0.05) {
  tukey_result <- TukeyHSD(modelo_anova)
  print(tukey_result)
}
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Puntuacion ~ Tipo_desayuno, data = datos)
## 
## $Tipo_desayuno
##                                   diff        lwr      upr     p adj
## Desayuno ligero-Sin desayuno       4.6  0.4899889 8.710011 0.0284289
## Desayuno completo-Sin desayuno     3.6 -0.5100111 7.710011 0.0886624
## Desayuno completo-Desayuno ligero -1.0 -5.1100111 3.110011 0.7963670

Respuesta: Sí, existe evidencia estadística suficiente para afirmar que el tipo de desayuno tiene un efecto significativo en el rendimiento de los estudiantes.

Argumentación: Al realizar el análisis de varianza (ANOVA), se obtuvo un p-valor (Pr > F) de 0.024 (aproximadamente). Utilizando un nivel de confianza del 95%, nuestro nivel de significancia (\(\alpha\)) es de 0.05. Dado que el p-valor obtenido (\(0.024\)) es menor que el nivel de significancia (\(0.05\)), rechazamos la hipótesis nula (\(H_0\)) de igualdad de medias.

Esto indica que al menos uno de los grupos difiere significativamente de los otros. Según la prueba Post-Hoc de Tukey (que se ejecuta automáticamente en el código porque el resultado fue significativo), la diferencia principal radica entre el grupo que va “Sin desayuno” (promedio 9.4) y el grupo de “Desayuno ligero” (promedio 14.0), sugiriendo que un desayuno ligero está asociado con un mejor rendimiento en comparación con no desayunar.