Supóngase un estudio clínico que analiza la eficacia de un medicamento teniendo en cuenta dos factores, el sexo (masculino y femenino) y la juventud (joven, adulto). Se quiere analizar si el efecto es diferente entre alguno de los niveles de cada variable por si sola o en combinación.
Este estudio implica comprobar si el efecto medio del fármaco es significativamente distinto entre alguno de los siguientes grupos: hombres, mujeres, jóvenes, adultos, hombres jóvenes, hombres adultos, mujeres jóvenes y mujeres adultas.
library(readxl)
dt <- read_excel("C:/Users/ADMIN/Desktop/Estadistica/dt.xlsx")
library(ggplot2)
ggplot(dt, aes(x = age, y = result)) +
geom_boxplot() +
theme_bw()
library(ggplot2)
ggplot(dt, aes(x = sex, y = result)) +
geom_boxplot() +
theme_bw()
library(ggplot2)
ggplot(dt, aes(x = age, y = result, colour = sex)) +
geom_boxplot() +
theme_bw()
with(dt,expr = tapply(result, sex, mean))
## hombre mujer
## 9.926813 10.223833
with(dt,expr = tapply(result, sex, sd))
## hombre mujer
## 0.3165900 0.4042511
with(dt,expr = tapply(result, age, mean))
## adulto joven
## 10.03357 10.11708
with(dt,expr = tapply(result, age, sd))
## adulto joven
## 0.3571436 0.4238184
with(dt,expr = tapply(result, list(sex,age), mean))
## adulto joven
## hombre 9.885311 9.989067
## mujer 10.255958 10.202417
with(dt,expr = tapply(result, list(sex,age), sd))
## adulto joven
## hombre 0.2135597 0.4471224
## mujer 0.4304169 0.4109823
¿ existe una diferencia en el efecto del fármaco dependiendo de la edad y también del sexo?
Si, ya que sobre la edad podemos decir que si hay un efecto. Si tenemos solo en cuenta la edad, de joven tiene mas efecto que de adulto el fármaco. Por otro lado, en el fator del sexo vemos que tiene mayor efecto el farmaco sobre la mujer y si vemos el ultimo gráfico podemos ver que tiene mayor efecto sobre una mujer adulta.
¿El efecto parece ser mayor en mujeres que en hombres y en adultos que en jóvenes?
En mujeres si parece ser mayor, pero en adultos que es jovenes solo si se tiene en cuenta la mujer. si tenemos en cuenta solo la edad esto no seria cierto.
Es posible identificar posibles interacciones de los dos factores de forma gráfica mediante lo que se conocen como “gráficos de interacción”.
¿como se interpreta un grafico de interaccion ?
Se interpreta a partir de las líneas que describen los datos para cada uno de los niveles, si estas son paralelas nos dice que que el comportamiento es similar sin importar el nivel del factor,por lo cual, no hay interacción.
library(ggplot2)
ggplot(dt, aes(x = age, y = result, colour = sex, group = sex)) +
stat_summary(fun = mean, geom = "point") +
stat_summary(fun = mean, geom = "line") +
labs(y = 'mean (result)') +
theme_bw()
library(ggplot2)
ggplot(dt, aes(x = sex, y = result, colour = age, group = age)) +
stat_summary(fun = mean, geom = "point") +
stat_summary(fun = mean, geom = "line") +
labs(y = 'mean (result)') +
theme_bw()
Como podemos ver las lineas no son paralelas, por lo cual, hay una clara interacción entre los dos factores. Podemos observar que el farmaco tiene mayor efecto en una mujer adulta que en una joven y su efecto sobre el hombre es contraria, pues tiene mayor efecto cuando este es joven que cuando es adulto.
Si bien la significancia se tendrá que confirmar con el ANOVA. La distribución de las observaciones de cada nivel parece simétrica con la presencia de un único valor atípico. A priori parece que se satisfacen las condiciones necesarias para un ANOVA, aunque habrá que confirmarlas estudiando los residuos.
anova_2vias <- aov(formula = result ~ sex*age, dt)
summary(anova_2vias)
## Df Sum Sq Mean Sq F value Pr(>F)
## sex 1 0.662 0.6617 4.724 0.039 *
## age 1 0.005 0.0045 0.032 0.859
## sex:age 1 0.045 0.0445 0.318 0.578
## Residuals 26 3.642 0.1401
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
interprete el resultado
El análisis de varianza no encuentra diferencias significativas en el efecto del fármaco entre jovenes y adultos (Factor age) y tampoco entre sexo y edad, por cual se puede interpretar que la interacción es por el factor del sexo, es decir, entre hombres y mujeres.
library(lsr)
etaSquared(anova_2vias)
## eta.sq eta.sq.part
## sex 0.141036554 0.144245655
## age 0.001042723 0.001244658
## sex:age 0.010231898 0.012080906
De los datos anteriores se puede interpretar que hubo interacción mas alta de parte del factor del sexo (hombres y mujeres), en comparación con la edad y la interacción netre edad sexo.
par(mfrow = c(1,2))
plot(anova_2vias)