library(readxl)
library(DT)

Tratamiento estadístico de los datos

Al ser esta investigación con un diseño de 4 grupos, es necesario realizar comparaciones entre grupos por cada instrumento utilizado.

El meta análisis propuesto por Breaver y Braver (1988) señala que hay que seguir una secuencia de actividades para determinar si el tratamiento tiene un efecto o no sobre los grupos.

BOXPLOT

library(readxl)
datos <- read_excel("IsaacTacha.xlsx",sheet = "Hoja1", range = "B1:D61")

datos%>%DT::datatable()
library(ggplot2)
library(plotly)
ggplot(datos , aes(x=Pretest, y=Scores, color=Treatment))+
  geom_boxplot()+
  ggtitle('BoxPlot of Posttest Scores')

De acuerdo con el diseño explicativo secuencial DEXPLIS implementado, primero se hace un análisis de los datos de orden cuantitativo. En este sentido, la anterior figura muestra un diagrama estadístico descriptivo de los datos con el uso de boxplots, donde se puede ver que los grupos que trabajaron (——–), obtuvieron un mayor rendimiento académico, frente a los grupos que trabajaron el tema con una metodología de aprendizaje tradicional.

Grupo 1

summary(datos$Scores[1:15])
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   4.773   4.773   5.000   4.924   5.000   5.000
sd(datos$Scores[1:15])
## [1] 0.1108977

grupo 2

summary(datos$Scores[16:30])
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   4.318   4.659   4.773   4.742   4.773   5.000
sd(datos$Scores[16:30])
## [1] 0.1895021

GRUPO 3

summary(datos$Scores[31:45])
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.273   2.614   2.955   2.848   2.955   3.409
sd(datos$Scores[31:45])
## [1] 0.3081281

GRUPO 4

summary(datos$Scores[46:60])
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.500   3.182   3.409   3.318   3.409   4.091
sd(datos$Scores[46:60])
## [1] 0.4277836
library(EDA)
library(PASWR)
## Loading required package: lattice
## 
## Attaching package: 'PASWR'
## The following object is masked from 'package:EDA':
## 
##     EDA
EDA(datos$Scores[1:15])

## Size (n)  Missing  Minimum   1st Qu     Mean   Median   TrMean   3rd Qu 
##   15.000    0.000    4.773    4.773    4.924    5.000    4.924    5.000 
##      Max    Stdev      Var  SE Mean   I.Q.R.    Range Kurtosis Skewness 
##    5.000    0.111    0.012    0.029    0.227    0.227   -1.693   -0.638 
## SW p-val 
##    0.000
with(data=datos, expr=tapply(Scores, Treatment, mean))
## Con Tratamiento Sin tratamiento 
##        4.833333        3.083333
with(data=datos, expr=tapply(Scores, Treatment, sd))
## Con Tratamiento Sin tratamiento 
##       0.1783898       0.4373036
with(data=datos, expr=tapply(Scores, Pretest, mean))
## Con Pretest Sin Pretest 
##    3.886364    4.030303
with(data=datos, expr=tapply(Scores, Treatment, sd))
## Con Tratamiento Sin tratamiento 
##       0.1783898       0.4373036
with(data=datos, expr=tapply(Scores, list(Treatment, Pretest), mean))
##                 Con Pretest Sin Pretest
## Con Tratamiento    4.924242    4.742424
## Sin tratamiento    2.848485    3.318182

A partir de la representación gráfica y el calculo de las medias se puede intuir que puede existir una diferencia en el efecto de la nota dependiendo de la intervención y el pretest

##.

ggplot(data = datos, aes(x = Pretest, y = Scores, colour =Treatment  , group =Treatment )) + 
  stat_summary(fun = mean, geom = "point") +
  stat_summary(fun = mean, geom = "line") + 
  labs(y = "mean (Scores)") +
  ggtitle('Interaction Plot of Posttest Score')

La anterior figura muestra el comportamiento de la media de los posttest scores de los grupos considerados a partir de las diferentes combinaciones de niveles que asumen los factores. Así mismo, se puede identificar que el grupo que contó con pretest y contó con el tratamiento mediado por () obtuvo una media superior a la media de los otros grupos. También, se puede resaltar que el incremento de los scores en el posttest entre los grupos con tratamiento y sin tratamiento son crecientes para el pretest. Para determinar si hay interacción entre los factores se debe realizar mediante el ANOVA.

ggplot(data = datos, aes(x = Treatment, y = Scores, colour =Pretest  , group =Pretest )) + 
  stat_summary(fun = mean, geom = "point") +
  stat_summary(fun = mean, geom = "line") + 
  labs(y = "mean(Scores)") +
  ggtitle('Interaction Plot of Posttest Score')

De acuerdo con el postulado de Braver y Braver (1988), el diseño experimental 4G de Solomon permite dos estimaciones independientes del mismo efecto experimental por lo cual es posible aplicar una prueba ANOVA 2X2 con interacción. También proponen una secuencia condicional para el análisis estadístico de los datos, que permita establecer si el tratamiento tiene un efecto o no sobre los grupos. En primer lugar, debe de realizarse un análisis ANOVA 2x2 con interacción para comprobar si existe significancia estadística entre de los factores (Test A). Luego, si en el análisis de varianza los resultados no son estadísticamente significativos, se procede a realizar un análisis de efectos principales que involucre el grupo experimental y el grupo control (Test D). Si se encuentra significancia estadística, se concluye que el tratamiento es efectivo

Realizamos la estimación del modelo ANOVA de dos vías:

El modelo ANOVA de dos vías evalúa, además de los efectos de los factores sobre la variable independiente, los efectos de la interacción entre ellas. La hipótesis nula

\[H_0 : \ \ \ \ \text{No hay interacción entre los factores}.\]

Estamos ante un ANOVA de dos vías (varios factores entre sujetos).

  • De dos vías (two-way ANOVA o ANOVA de dos factores): examina la igualdad de las medias de la población para un resultado cuantitativo y dos variables categóricas o factores.

    • La variable dependiente (resultado) es cuantitativa: variable en la que deseamos comparar los grupos. En nuestro caso, la variable dependiente es Nota.

    • Factores (o variables independientes): variables categóricas que definen los grupos que deseamos comparar. En nuestro caso, test (test con dos niveles) y tratamiento (tratamiento con dos niveles).

Entre sujetos (between subjects): donde cada factor varía entre los sujetos y cada factor se mide solo una vez para un mismo sujeto. En nuestro caso, la variable edad se mide una vez en cada sujeto, y la edad varía de un sujeto a otro; y cada sujeto pertenece a un solo grupo o nivel de la variable tipoDiet.

anova <- aov(Scores ~ Pretest *Treatment, data = datos)
summary(anova)
##                   Df Sum Sq Mean Sq F value   Pr(>F)    
## Pretest            1   0.31    0.31   3.811   0.0559 .  
## Treatment          1  45.94   45.94 563.389  < 2e-16 ***
## Pretest:Treatment  1   1.59    1.59  19.522 4.61e-05 ***
## Residuals         56   4.57    0.08                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

En el caso del Test A (Interacción entre los factores) se realizó un ANOVA de 2x2, como se muestra en la anterior tabla . Se obtuvo un valor de significancia de 4.61e-05, por lo que se procedió a realizar el Test D donde el valor de significancia fue < 2e-16. Dado que el resultado del Test D es significativo, se concluye que el tratamiento es efectivo

Interpretación:

  • La variable Intervencion tiene un efecto significativo (0.0000431).

  • La variable Pretest es significativa ( p valor 0.021368 ).

  • Respecto a la interacción no hay evidencia estadística suficiente para rechazar la hipótesis nula (0.084758 mayor a

Al obtener un valor con significancia estádistica msyor .05, se continua con los pasos propuestos por Braver y Braver,

library(lsr)
etaSquared(anova)
##                        eta.sq eta.sq.part
## Pretest           0.005930185  0.06372462
## Treatment         0.876566735  0.90958834
## Pretest:Treatment 0.030373717  0.25849294
plot(anova, which = 1:1)

#modificar=anova$residuals
#class(modificar)
#b=as.vector(modificar)
#qqnorm(b)
#edit(b)
plot(anova, which = 2:2)

par(mfrow=c(1,2))
plot(anova,which=1:4)

library(ggplot2)
# Solution 1
qplot(sample = anova$residuals)

library(nortest)
hist(anova$residuals)

shapiro.test(anova$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  anova$residuals
## W = 0.92454, p-value = 0.001173

Supuestos básicos del ANOVA Para un ANOVA de dos vías se debe comprobar el supuesto de independencia, el supuesto de normalidad y el supuesto de homocedasticidad. Estos supuestos se deben comprobar para el factor Pretest y para el factor Treatment. Esto es, se comprueba la normalidad para todos los niveles de cada factor, y se comprueba la homocedasticidad para ambos factores.

Comprobación de supuestos para el factor Pretest:

SUPUESTO DE NORMALIDAD: Para contrastar la normalidad usamos el test de Shapiro-Wilk, con la función shapiro.test( ).

datos
## # A tibble: 60 x 3
##    Scores Pretest     Treatment      
##     <dbl> <chr>       <chr>          
##  1   5    Con Pretest Con Tratamiento
##  2   5    Con Pretest Con Tratamiento
##  3   5    Con Pretest Con Tratamiento
##  4   4.77 Con Pretest Con Tratamiento
##  5   5    Con Pretest Con Tratamiento
##  6   5    Con Pretest Con Tratamiento
##  7   5    Con Pretest Con Tratamiento
##  8   4.77 Con Pretest Con Tratamiento
##  9   5    Con Pretest Con Tratamiento
## 10   5    Con Pretest Con Tratamiento
## # ... with 50 more rows