require("tidyverse")
require("ggthemes")
df <- read.csv("Resumen notas ODON210-2017.csv", header = TRUE, sep=";")
str(df)
'data.frame': 992 obs. of 13 variables:
$ N : int 1 2 3 4 5 6 7 8 9 10 ...
$ Nombre : Factor w/ 49 levels "","\xb5LVAREZ VEL\xb5SQUEZ FERNANDO EMILIO",..: 3 4 2 5 6 7 8 9 10 11 ...
$ Docente : Factor w/ 5 levels "","Dr.Aguilera",..: 3 4 4 3 2 3 4 2 4 2 ...
$ X1prueba: num 5.2 5.4 3.8 5.5 4.5 5.4 4 4.4 5.1 5.2 ...
$ Revelado: num 7 7 7 7 7 7 7 7 5.4 7 ...
$ X : logi NA NA NA NA NA NA ...
$ X.1 : logi NA NA NA NA NA NA ...
$ X.2 : logi NA NA NA NA NA NA ...
$ X.3 : logi NA NA NA NA NA NA ...
$ X.4 : logi NA NA NA NA NA NA ...
$ X.5 : logi NA NA NA NA NA NA ...
$ X.6 : logi NA NA NA NA NA NA ...
$ X.7 : logi NA NA NA NA NA NA ...
summary(df)
N Nombre Docente X1prueba
Min. : 1 :944 :944 Min. :0
1st Qu.:13 <b5>LVAREZ VEL<b5>SQUEZ FERNANDO EMILIO : 1 Dr.Aguilera: 12 1st Qu.:4
Median :24 ACEVEDO TAVIE JUAN SEBASTI<b5>N : 1 Dr.Araya : 12 Median :5
Mean :24 ALARC<e0>N PE<a5>A SEBASTI<b5>N ANDR<90>S: 1 Dr.Santana : 12 Mean :5
3rd Qu.:36 ARIAS ESPINOZA MARJORY ARACELLI : 1 Dr.Uribe : 12 3rd Qu.:5
Max. :48 ARZOLA LAGOS IGNACIO ANDR<90>S : 1 Max. :7
NA's :944 (Other) : 43 NA's :944
Revelado X X.1 X.2 X.3 X.4
Min. :5 Mode:logical Mode:logical Mode:logical Mode:logical Mode:logical
1st Qu.:7 NA's:992 NA's:992 NA's:992 NA's:992 NA's:992
Median :7
Mean :7
3rd Qu.:7
Max. :7
NA's :944
X.5 X.6 X.7
Mode:logical Mode:logical Mode:logical
NA's:992 NA's:992 NA's:992
df %>%
group_by(Docente) %>%
summarise(n=n(), Prom = mean(X1prueba), DE = sd(X1prueba), mediana=median(X1prueba)) %>%
ungroup()
df %>%
group_by(Docente) %>%
summarise(n=n(), Prom = mean(Revelado), DE = sd(Revelado)) %>%
ungroup()
df %>%
ggplot(aes(x=Docente, y=X1prueba)) +
geom_boxplot() +
theme_economist() +
ggtitle("Boxplot 1 prueba por Docente")
Dos alumnos no rindieron la prueba. # Existe diferencia entre docentes en la primera prueba ??
diferenciaEntreDocentes <- aov(df$X1prueba~df$Docente)
diferenciaEntreDocentes
Call:
aov(formula = df$X1prueba ~ df$Docente)
Terms:
df$Docente Residuals
Sum of Squares 2.9 70.3
Deg. of Freedom 3 44
Residual standard error: 1.26
Estimated effects may be unbalanced
944 observations deleted due to missingness
summary(diferenciaEntreDocentes)
Df Sum Sq Mean Sq F value Pr(>F)
df$Docente 3 2.9 0.958 0.6 0.62
Residuals 44 70.3 1.598
944 observations deleted due to missingness
La diferencia entre grupos no difiere de la variabilidad individual. No existe diferencia. # Grafico boxplot para prueba práctica de revelado
df %>%
ggplot(aes(x=Docente, y=Revelado)) +
geom_boxplot() +
theme_economist() +
ggtitle("Boxplot prueba practica Revelado")
diferenciaEntreDocentes <- aov(df$Revelado~df$Docente)
diferenciaEntreDocentes
Call:
aov(formula = df$Revelado ~ df$Docente)
Terms:
df$Docente Residuals
Sum of Squares 3.24 14.88
Deg. of Freedom 3 44
Residual standard error: 0.582
Estimated effects may be unbalanced
944 observations deleted due to missingness
summary(diferenciaEntreDocentes)
Df Sum Sq Mean Sq F value Pr(>F)
df$Docente 3 3.24 1.080 3.19 0.033 *
Residuals 44 14.88 0.338
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
944 observations deleted due to missingness
R: La diferencia entre grupos es mayor que la variabilidad individual # Analisis de Tukey
TukeyHSD(diferenciaEntreDocentes)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = df$Revelado ~ df$Docente)
$`df$Docente`
diff lwr upr p adj
Dr.Araya-Dr.Aguilera -0.4 -1.0339 0.2339 0.344
Dr.Santana-Dr.Aguilera -0.6 -1.2339 0.0339 0.069
Dr.Uribe-Dr.Aguilera 0.0 -0.6339 0.6339 1.000
Dr.Santana-Dr.Araya -0.2 -0.8339 0.4339 0.834
Dr.Uribe-Dr.Araya 0.4 -0.2339 1.0339 0.344
Dr.Uribe-Dr.Santana 0.6 -0.0339 1.2339 0.069
Al parecer no existe diferencia, chequear resultados una ves que se rellenen los alumnos que no asisten a evaluaciones.