Problema 1, taller 5

Hipótesis

Ho= μ1=μ2=μ3=μ4 Las medias son iguales HA= μ1≠μn Alguna de las medias es diferente

library(tidyverse)

## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --

## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.4     v dplyr   1.0.7
## v tidyr   1.1.4     v stringr 1.4.0
## v readr   2.0.2     v forcats 0.5.1

## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

library(ggpubr)
library(rstatix)

## 
## Attaching package: 'rstatix'

## The following object is masked from 'package:stats':
## 
##     filter

Id<-c(1,2,3,4,5,6,7,8,9)
T1<-c(16,12,12,15,18,13,18,15,20)
T2<-c(8,9,10,13,12,13,16,9,9)
T3<-c(8,9,10,7,12,8,10,6,11)
T4<-c(12,10,8,11,12,10,13,6,8)
df<-data.frame(Id=Id,T1=T1,T2=T2,T3=T3,T4=T4)
df

##   Id T1 T2 T3 T4
## 1  1 16  8  8 12
## 2  2 12  9  9 10
## 3  3 12 10 10  8
## 4  4 15 13  7 11
## 5  5 18 12 12 12
## 6  6 13 13  8 10
## 7  7 18 16 10 13
## 8  8 15  9  6  6
## 9  9 20  9 11  8

df <- df %>% gather(key="time",value="score",T1,T2,T3,T4) %>% convert_as_factor(Id,time)
df

##    Id time score
## 1   1   T1    16
## 2   2   T1    12
## 3   3   T1    12
## 4   4   T1    15
## 5   5   T1    18
## 6   6   T1    13
## 7   7   T1    18
## 8   8   T1    15
## 9   9   T1    20
## 10  1   T2     8
## 11  2   T2     9
## 12  3   T2    10
## 13  4   T2    13
## 14  5   T2    12
## 15  6   T2    13
## 16  7   T2    16
## 17  8   T2     9
## 18  9   T2     9
## 19  1   T3     8
## 20  2   T3     9
## 21  3   T3    10
## 22  4   T3     7
## 23  5   T3    12
## 24  6   T3     8
## 25  7   T3    10
## 26  8   T3     6
## 27  9   T3    11
## 28  1   T4    12
## 29  2   T4    10
## 30  3   T4     8
## 31  4   T4    11
## 32  5   T4    12
## 33  6   T4    10
## 34  7   T4    13
## 35  8   T4     6
## 36  9   T4     8

REsumen Estadístico

df %>% group_by(time) %>% get_summary_stats(score,type="mean_sd")

## # A tibble: 4 x 5
##   time  variable     n  mean    sd
##   <fct> <chr>    <dbl> <dbl> <dbl>
## 1 T1    score        9  15.4  2.83
## 2 T2    score        9  11    2.65
## 3 T3    score        9   9    1.94
## 4 T4    score        9  10    2.29

df

##    Id time score
## 1   1   T1    16
## 2   2   T1    12
## 3   3   T1    12
## 4   4   T1    15
## 5   5   T1    18
## 6   6   T1    13
## 7   7   T1    18
## 8   8   T1    15
## 9   9   T1    20
## 10  1   T2     8
## 11  2   T2     9
## 12  3   T2    10
## 13  4   T2    13
## 14  5   T2    12
## 15  6   T2    13
## 16  7   T2    16
## 17  8   T2     9
## 18  9   T2     9
## 19  1   T3     8
## 20  2   T3     9
## 21  3   T3    10
## 22  4   T3     7
## 23  5   T3    12
## 24  6   T3     8
## 25  7   T3    10
## 26  8   T3     6
## 27  9   T3    11
## 28  1   T4    12
## 29  2   T4    10
## 30  3   T4     8
## 31  4   T4    11
## 32  5   T4    12
## 33  6   T4    10
## 34  7   T4    13
## 35  8   T4     6
## 36  9   T4     8

Visualización

bxp<-ggboxplot(df,x="time",y="score", add="point")
bxp

Supuestos del Modelo

df %>% group_by(time) %>% identify_outliers(score)

## [1] time       Id         score      is.outlier is.extreme
## <0 rows> (or 0-length row.names)

Normalidad

df %>% group_by(time) %>% shapiro_test(score)

## # A tibble: 4 x 4
##   time  variable statistic     p
##   <fct> <chr>        <dbl> <dbl>
## 1 T1    score        0.933 0.511
## 2 T2    score        0.896 0.231
## 3 T3    score        0.978 0.951
## 4 T4    score        0.947 0.653

ggqqplot(df,"score",facet.by="time")

Calculo de ANOVA

res.aov<-anova_test(data=df,dv=score,wid=Id,within=time)
get_anova_table(res.aov)

## ANOVA Table (type III tests)
## 
##   Effect DFn DFd      F        p p<.05   ges
## 1   time   3  24 17.331 3.34e-06     * 0.532

Comparaciones de Media

pwc<-df %>% pairwise_t_test(score~time,paired=TRUE,p.adjust.method="bonferroni")
pwc

## # A tibble: 6 x 10
##   .y.   group1 group2    n1    n2 statistic    df         p    p.adj p.adj.signif
## * <chr> <chr>  <chr>  <int> <int>     <dbl> <dbl>     <dbl>    <dbl> <chr>       
## 1 score T1     T2         9     9      3.77     8 0.005     0.033    *           
## 2 score T1     T3         9     9      7.43     8 0.0000743 0.000446 ***         
## 3 score T1     T4         9     9      5.16     8 0.000866  0.005    **          
## 4 score T2     T3         9     9      1.97     8 0.084     0.504    ns          
## 5 score T2     T4         9     9      1.28     8 0.237     1        ns          
## 6 score T3     T4         9     9     -1.2      8 0.264     1        ns

Reporte

pwc <- pwc %>% add_xy_position(x="time")
  bxp+
  stat_pvalue_manual(pwc) +
    labs(
         subtitle = get_test_label(res.aov,detailed=TRUE),
         caption=get_pwc_label(pwc)
         )

Conclusión

En las cajas y bigotes se observa que en el trnascurrir el tiempo se dan variaciones significativas en los recuerdos de la historia asignada para el estudio, en la que se presenta una disminución en t3, pero finalmente los recuerdos entre T2 y T4 presentan particularmente semejanza. No existen outliers en los datos obtenidos ynsegún la prueba de Shapiro los mismos presentan un comportamiento normal, con un valor de p >0.05, al 95% de confianza. Con el ANOVA se demuestra un efecto significativo del tiempo con p<0.05 al 95% de confianza. En la prueba de comparación de medias de Bonferroni, se observa una diferencia significativa de los niveles críticos asociados a cada comparación donde únicamente existen diferencias significativas entre T1 (hora) y el resto de momentos o niveles. En la sección de Reporte con los diagramas de cajas y bigotes, se explica mejor las diferencias significativas entre T1 y los otro niveles. Con los datos obtenidos p<0.05 podemos rechazar la hipótesis nula de igualdad de medias y concluir que la calidad del recuerdo no es la misma en los cuatro momentos temporales definidos por el factor tiempo.