Ho= μ1=μ2=μ3=μ4 Las medias son iguales HA= μ1≠μn Alguna de las medias es diferente
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.4 v dplyr 1.0.7
## v tidyr 1.1.4 v stringr 1.4.0
## v readr 2.0.2 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(ggpubr)
library(rstatix)
##
## Attaching package: 'rstatix'
## The following object is masked from 'package:stats':
##
## filter
Id<-c(1,2,3,4,5,6,7,8,9)
T1<-c(16,12,12,15,18,13,18,15,20)
T2<-c(8,9,10,13,12,13,16,9,9)
T3<-c(8,9,10,7,12,8,10,6,11)
T4<-c(12,10,8,11,12,10,13,6,8)
df<-data.frame(Id=Id,T1=T1,T2=T2,T3=T3,T4=T4)
df
## Id T1 T2 T3 T4
## 1 1 16 8 8 12
## 2 2 12 9 9 10
## 3 3 12 10 10 8
## 4 4 15 13 7 11
## 5 5 18 12 12 12
## 6 6 13 13 8 10
## 7 7 18 16 10 13
## 8 8 15 9 6 6
## 9 9 20 9 11 8
df <- df %>% gather(key="time",value="score",T1,T2,T3,T4) %>% convert_as_factor(Id,time)
df
## Id time score
## 1 1 T1 16
## 2 2 T1 12
## 3 3 T1 12
## 4 4 T1 15
## 5 5 T1 18
## 6 6 T1 13
## 7 7 T1 18
## 8 8 T1 15
## 9 9 T1 20
## 10 1 T2 8
## 11 2 T2 9
## 12 3 T2 10
## 13 4 T2 13
## 14 5 T2 12
## 15 6 T2 13
## 16 7 T2 16
## 17 8 T2 9
## 18 9 T2 9
## 19 1 T3 8
## 20 2 T3 9
## 21 3 T3 10
## 22 4 T3 7
## 23 5 T3 12
## 24 6 T3 8
## 25 7 T3 10
## 26 8 T3 6
## 27 9 T3 11
## 28 1 T4 12
## 29 2 T4 10
## 30 3 T4 8
## 31 4 T4 11
## 32 5 T4 12
## 33 6 T4 10
## 34 7 T4 13
## 35 8 T4 6
## 36 9 T4 8
df %>% group_by(time) %>% get_summary_stats(score,type="mean_sd")
## # A tibble: 4 x 5
## time variable n mean sd
## <fct> <chr> <dbl> <dbl> <dbl>
## 1 T1 score 9 15.4 2.83
## 2 T2 score 9 11 2.65
## 3 T3 score 9 9 1.94
## 4 T4 score 9 10 2.29
df
## Id time score
## 1 1 T1 16
## 2 2 T1 12
## 3 3 T1 12
## 4 4 T1 15
## 5 5 T1 18
## 6 6 T1 13
## 7 7 T1 18
## 8 8 T1 15
## 9 9 T1 20
## 10 1 T2 8
## 11 2 T2 9
## 12 3 T2 10
## 13 4 T2 13
## 14 5 T2 12
## 15 6 T2 13
## 16 7 T2 16
## 17 8 T2 9
## 18 9 T2 9
## 19 1 T3 8
## 20 2 T3 9
## 21 3 T3 10
## 22 4 T3 7
## 23 5 T3 12
## 24 6 T3 8
## 25 7 T3 10
## 26 8 T3 6
## 27 9 T3 11
## 28 1 T4 12
## 29 2 T4 10
## 30 3 T4 8
## 31 4 T4 11
## 32 5 T4 12
## 33 6 T4 10
## 34 7 T4 13
## 35 8 T4 6
## 36 9 T4 8
bxp<-ggboxplot(df,x="time",y="score", add="point")
bxp
df %>% group_by(time) %>% identify_outliers(score)
## [1] time Id score is.outlier is.extreme
## <0 rows> (or 0-length row.names)
df %>% group_by(time) %>% shapiro_test(score)
## # A tibble: 4 x 4
## time variable statistic p
## <fct> <chr> <dbl> <dbl>
## 1 T1 score 0.933 0.511
## 2 T2 score 0.896 0.231
## 3 T3 score 0.978 0.951
## 4 T4 score 0.947 0.653
ggqqplot(df,"score",facet.by="time")
res.aov<-anova_test(data=df,dv=score,wid=Id,within=time)
get_anova_table(res.aov)
## ANOVA Table (type III tests)
##
## Effect DFn DFd F p p<.05 ges
## 1 time 3 24 17.331 3.34e-06 * 0.532
pwc<-df %>% pairwise_t_test(score~time,paired=TRUE,p.adjust.method="bonferroni")
pwc
## # A tibble: 6 x 10
## .y. group1 group2 n1 n2 statistic df p p.adj p.adj.signif
## * <chr> <chr> <chr> <int> <int> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 score T1 T2 9 9 3.77 8 0.005 0.033 *
## 2 score T1 T3 9 9 7.43 8 0.0000743 0.000446 ***
## 3 score T1 T4 9 9 5.16 8 0.000866 0.005 **
## 4 score T2 T3 9 9 1.97 8 0.084 0.504 ns
## 5 score T2 T4 9 9 1.28 8 0.237 1 ns
## 6 score T3 T4 9 9 -1.2 8 0.264 1 ns
pwc <- pwc %>% add_xy_position(x="time")
bxp+
stat_pvalue_manual(pwc) +
labs(
subtitle = get_test_label(res.aov,detailed=TRUE),
caption=get_pwc_label(pwc)
)
En las cajas y bigotes se observa que en el trnascurrir el tiempo se dan variaciones significativas en los recuerdos de la historia asignada para el estudio, en la que se presenta una disminución en t3, pero finalmente los recuerdos entre T2 y T4 presentan particularmente semejanza. No existen outliers en los datos obtenidos ynsegún la prueba de Shapiro los mismos presentan un comportamiento normal, con un valor de p >0.05, al 95% de confianza. Con el ANOVA se demuestra un efecto significativo del tiempo con p<0.05 al 95% de confianza. En la prueba de comparación de medias de Bonferroni, se observa una diferencia significativa de los niveles críticos asociados a cada comparación donde únicamente existen diferencias significativas entre T1 (hora) y el resto de momentos o niveles. En la sección de Reporte con los diagramas de cajas y bigotes, se explica mejor las diferencias significativas entre T1 y los otro niveles. Con los datos obtenidos p<0.05 podemos rechazar la hipótesis nula de igualdad de medias y concluir que la calidad del recuerdo no es la misma en los cuatro momentos temporales definidos por el factor tiempo.