Derek Corcoran
"21/03, 2018"
ggplot(msleep, aes(x = order, y = sleep_total)) + geom_boxplot() + geom_jitter() + theme(axis.text.x=element_text(angle=90, vjust=0.5))
ggplot(msleep, aes(x = vore, y = sleep_total)) + geom_boxplot() + geom_jitter()
msleepclean <- msleep %>% filter(!is.na(vore))
bartlett.test(sleep_total ~ vore, data = msleepclean)
statistic | p.value | parameter | method |
---|---|---|---|
6.159716 | 0.104093 | 3 | Bartlett test of homogeneity of variances |
¿Que es un residual?
\[ Observado - Predicho \]
Tenemos que ajustar el modelo
ANOVA.sleep <- aov(sleep_total ~ vore, data = msleepclean)
Residuales <- ANOVA.sleep$residuals
library(broom)
Resultados <- augment(ANOVA.sleep)
hist(Residuales)
hist(Resultados$.resid)
qqnorm(Residuales)
qqnorm(Resultados$.resid)
shapiro.test(Residuales)
shapiro.test(Resultados$.resid)
Shapiro-Wilk normality test
data: Residuales
W = 0.96123, p-value = 0.02035
Dado que valores son menores a 0.05, la distribución no es normal , se recomienda usar Kruskal-Wallis
Aumenta posibilidad de errores de tipo 1
Df Sum Sq Mean Sq F value Pr(>F)
vore 3 133.7 44.57 2.235 0.0914 .
Residuals 72 1435.7 19.94
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
¿Que es el error? ¿Por qué al cuadrado?? Actividad shiny
\[ Observado(puntos) - Predicho(linea) \]
¿Que modelo predice mejor los valores de y el 1 o el 2?
Simul$Error1 <- Simul$y - Simul$Modelo1
Simul$Error2 <- Simul$y - Simul$Modelo2
sum(Simul$Error1)
[1] 316.4115
sum(Simul$Error2)
[1] -20.30171
¿Que pasó?
Simul$Error1 <- (Simul$y - Simul$Modelo1)^2
Simul$Error2 <- (Simul$y - Simul$Modelo2)^2
sum(Simul$Error1)
[1] 1195.373
sum(Simul$Error2)
[1] 9909.772