ANOVA

Introducción

Gonzalo J. Muñoz

2019-04-02

El análisis de varianza (ANOVA) se refiere a una familia de técnicas estadísticas para evaluar el efecto1 Sólo es apropiado hablar de “efecto” cuando el diseño de investigación es experimental. Cuando el diseño es no-experimental hablamos de asociación de uno o más factores sobre una única variable dependiente continua. Ya que se centra en una única variable dependiente pertenece a las técnicas de análisis estadísticas univariadas.

Una ilustración

El dueño de un restaurant quiere saber si sus clientes estarían más contentos con el servicio si hubiese un grupo de música en vivo. Astutamente, diseña un experimento donde algunos días tiene un grupo de música en vivo, otros días tiene música envasada (usando la música del mismo grupo) y otros días no pone música de ningún tipo (¡mi condición preferida!). La variable independiente en este caso es el tipo de música y la variable dependiente corresponde al nivel de satisfacción de los clientes con el restaurant.2 Discusión: ¿Cuáles son algunas limitaciones de este estudio?

Los resultados del experimento se muestran más abajo.

Nivel de satisfacción con el restaurant para los distintos tipos de música.

sujeto condicion satisfaccion
s1 Música en vivo 3
s2 Música en vivo 4
s3 Música en vivo 1
s4 Música en vivo 2
s5 Música en vivo 0
s6 Música en vivo 2
s7 Música envasada 6
s8 Música envasada 2
s9 Música envasada 4
s10 Música envasada 3
s11 Música envasada 4
s12 Música envasada 5
s13 Sin música 7
s14 Sin música 7
s15 Sin música 5
s16 Sin música 5
s17 Sin música 8
s18 Sin música 4

Cada fila representa un caso. Los primeros 6 casos corresponden a comensales que fueron el día con música en vivo, los siguientes 6 fueron el día con música envasada, y los últimos 6 fueron el día sin música. En psicología experimental, los diseños donde cada participante es asignado a una condición distinta se llaman entre-sujetos o between-subjects3 También se puede decir que los participantes están anidados en los distintos niveles de la VI. Más adelante veremos el caso de un diseño intra-sujetos o within-subjects donde los participantes son expuestos a los distintos niveles de la VI.

A primera vista, pareciera que quienes estuvieron expuestos a la condición sin música están más satisfechos con el restaurant y que los que tuvieron música en vivo fueron los más insatisfechos. Quienes tuvieron música envasada están de alguna manera “a medio camino” entre los otros dos.

Podemos obtener la media y desviación estándar para cada grupo usando la función describeBy del paquete psych como se muestra a continuación.4 Para instalar el paquete psych o cualquier paquete de R se puede usar install.packages=(). En este caso install.packages=("psych"). Luego, la función library(psych) o require(psych) se debe usar para “activar” el paquete y sus funciones..5 Nótese que para instalar un paquete el nombre del paquete debe ir entre comillas, pero para llamarlo va sin las comillas

require(psych)
## Loading required package: psych
describeBy(df[,"satisfaccion"],condicion)
## 
##  Descriptive statistics by group 
## group: Música en vivo
##    vars n mean   sd median trimmed  mad min max range skew kurtosis   se
## X1    1 6    2 1.41      2       2 1.48   0   4     4    0    -1.58 0.58
## -------------------------------------------------------- 
## group: Música envasada
##    vars n mean   sd median trimmed  mad min max range skew kurtosis   se
## X1    1 6    4 1.41      4       4 1.48   2   6     4    0    -1.58 0.58
## -------------------------------------------------------- 
## group: Sin música
##    vars n mean   sd median trimmed  mad min max range skew kurtosis   se
## X1    1 6    6 1.55      6       6 1.48   4   8     4    0    -1.96 0.63

Las medias y desviaciones estándar para cada condición aparecen bajo la columna mean y sd respectivamente. Podemos visualizar la data usando el siguiente gráfico6 Este gráfico se construyó usando el paquete ggplot2. En mi experiencia, para hacer gráficos en formato APA es más sencillo usar excel por lo que no revisaremos en este curso los detalles acerca de este paquete.. Como es usual, el eje vertical representa la variable dependiente (Y) y la horizontal muestra los niveles de la variable independiente o factor (X). Además de los datos individuales, se incluye un punto de color negro que indica la media para los tres grupos. Las barras de error representan la desviación estándar de cada grupo.

Para determinar si existen diferencias entre los grupos usaremos ANOVA.7 Distintas variaciones de ANOVA se pueden implementar con R. Más detalles sobre cómo implementar los distintos análisis se encuentran en http://www.cookbook-r.com/Statistical_analysis/ANOVA/ o en la ayuda de R a la que se puede acceder usando ?aov Los resultados de nuestro primer análisis usando ANOVA se encuentran a continuación.8 Alternativamente podemos correr este mismo análisis usando
model<-lm(satisfaccion~condicion,df) anova(model)

aov1<-aov(satisfaccion~condicion,data=df)

La función aov utiliza como VD la variable satisfaccion y como variable independiente la variable condicion. La data en este caso tiene la estructura de un data.frame y se llama df (aunque podría tener cualquier otro nombre). Los resultados del análisis los guardamos como un objeto que llamaremos aov1.

Por último, summary(aov1) escupe el resultado del análisis:

summary(aov1)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## condicion    2     48  24.000   11.25 0.00104 **
## Residuals   15     32   2.133                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Para interpretar los resultados hay que mirar el valor p (“Pr(>F)”“) asociado al valor de la razón F (”F value“”) que es el estadístico de contraste para ANOVA. En este caso, asumiendo un valor para \(\alpha\) de .05, tenemos que el valor observado de F (i.e., 11.25) es estadísticamente significativo. Esto quiere decir que existen diferencias estadísticamente significativas entre las medias de al menos dos de las condiciones. Luego, para identificar entre qué condiciones hay diferencias estadísticamente significativas es necesario hacer lo que se conoce como test post-hoc9 Si tenemos una hipótesis sobre la dirección de las diferencias podemos hacer comparaciones a priori, pero este tema lo revisaremos más adelante. Existen distintos test post-hoc dependiendo de las comparaciones que son relevantes desde un punto de vista sustantivo. En este caso, asumiremos que sólo nos interesa saber si existen diferencias entre pares de medias. Como tenemos 3 grupos existen \(a(a-1)/2 = 3(3-1)/2=3\) comparaciones.10 Los niveles de un factor se designan con letras minúsculas. En este caso, el factor A tiene los niveles a1, a2 y a3. Luego usaremos el test de Tukey para hacer las comparaciones de interés.

TukeyHSD(aov1)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = satisfaccion ~ condicion, data = df)
## 
## $condicion
##                                diff        lwr      upr     p adj
## Música envasada-Música en vivo    2 -0.1903792 4.190379 0.0760902
## Sin música-Música en vivo         4  1.8096208 6.190379 0.0007194
## Sin música-Música envasada        2 -0.1903792 4.190379 0.0760902

En este caso, los resultados del test post-hoc indican que la diferencias se encuentran entre la condición sin música y la condición con música en vivo, pero que no existen diferencias estadísticamente significativas entre la condición música envasada y las otras condiciones.

Así hemos completado nuestro primer ANOVA. Finalmente, podemos reportar los resultados obtenidos de la siguiente manera.

En promedio, el nivel de satisfacción con el restaurant fue mayor en la condición sin música (M = 5.00, DE = 1.55), seguido de la condición con música envasada (M = 4.00, DE = 1.41) y música en vivo (M = 2.00, DE = 1.41). Los resultados de ANOVA de un factor sugieren la presencia de diferencias estadísticamente significativas en el nivel de satisfacción con el restaurant en relación a las distintas condiciones, F(2, 15) = 6.56, p < .05. Específicamente, el resultado de las comparaciones post-hoc mediante el método de Tukey indicó que las diferencias se encuentran entre la condición sin música y la condición con música en vivo.