Para resolver este ejercicio tendrán que apelar a lo que aprendieron en las clases anteriores pero también (y no menor) a la lógica y a la buena amiga internet (animense a googlear los nombres de los test, sus interpretaciones y todo lo que los pueda ayudar a completar el ejercicio wikipedia es un buen inicio)


Base: Cobayas

Esta base contiene la longitud de los odontoblastos (células responsables del crecimiento de los dientes) en 60 cobayas. Cada animal recibió uno de los tres niveles de dosis de vitamina C (0,5, 1 y 2 mg/día) mediante uno de los dos métodos de administración, zumo de naranja o ácido ascórbico (una forma de vitamina C y codificada como VC)

Las variables son:

len Longitud del diente

supp Tipo de suplemento (VC o OJ)

dose Dosis en miligramos/día

La base se ve así:

head(data)
##    len supp dose
## 1  4.2   VC  0.5
## 2 11.5   VC  0.5
## 3  7.3   VC  0.5
## 4  5.8   VC  0.5
## 5  6.4   VC  0.5
## 6 10.0   VC  0.5

Y está estructurada así:

str(data)
## 'data.frame':    60 obs. of  3 variables:
##  $ len : num  4.2 11.5 7.3 5.8 6.4 10 11.2 11.2 5.2 7 ...
##  $ supp: Factor w/ 2 levels "OJ","VC": 2 2 2 2 2 2 2 2 2 2 ...
##  $ dose: num  0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 ...

Veamos una estadistica de resumen de esta base:

summary(data)
##       len        supp         dose      
##  Min.   : 4.20   OJ:30   Min.   :0.500  
##  1st Qu.:13.07   VC:30   1st Qu.:0.500  
##  Median :19.25           Median :1.000  
##  Mean   :18.81           Mean   :1.167  
##  3rd Qu.:25.27           3rd Qu.:2.000  
##  Max.   :33.90           Max.   :2.000

1. Respondamos preguntas simples:

  1. ¿Cuantas variables tiene la base?
  2. ¿Que tipos de variables son?
  3. ¿Que tipo de distribuciones siguen estas variables?

2. Se realiza este test:

#correlacion de Pearson
cor.test(data$len, data$dose)
## 
##  Pearson's product-moment correlation
## 
## data:  data$len and data$dose
## t = 10.25, df = 58, p-value = 1.233e-14
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.6892521 0.8777169
## sample estimates:
##       cor 
## 0.8026913

Veamos este desafío:

  1. ¿Como interpretaría este resultado?
  2. ¿Como describiría el metodo en la seccion materiales y métodos?
  3. ¿Es esta una hipotesis de causalidad? Fundamente

Vamos a incluir un grafiquito para ayudarnos a intepretar

ggplot(data, aes(x=len, y=dose))+
  geom_point()

  1. ¿Se animan a explicar este gráfico?
  2. ¿Dirían que la correlación es una buena idea en este caso?

3. Los investigadores deciden hacer un ANOVA de una vía para alcanzar su propósito:

data$dose<-as.factor(data$dose)

res.aov <- aov(len ~ dose, data = data)
summary(res.aov)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## dose         2   2426    1213   67.42 9.53e-16 ***
## Residuals   57   1026      18                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Respondamos el desafío:

  1. ¿Como interpretaría este resultado?
  2. ¿Como describiría el metodo en la seccion materiales y métodos?
  3. ¿Es esta una hipotesis de causalidad? Fundamente
  4. ¿Que quiere decir esta p?
  5. ¿Como es la hipótesis nula y alternativa de este test?
  6. ¿Todos los grupos son distintos?

Vamos a incluir un grafiquito para ayudarnos a intepretar:

ggplot(data, aes(y=len, x=dose))+
  geom_boxplot()

  1. ¿Se animan a explicar este gráfico?
  2. ¿Ahora es más claro el resultado? ¿Que dosis es mejor que cual? ¿Puede fundamentarlo?

Es probable que necesites un poco mas de datos

TukeyHSD(res.aov)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = len ~ dose, data = data)
## 
## $dose
##         diff       lwr       upr    p adj
## 1-0.5  9.130  5.901805 12.358195 0.00e+00
## 2-0.5 15.495 12.266805 18.723195 0.00e+00
## 2-1    6.365  3.136805  9.593195 4.25e-05
  1. ¿Y ahora que dirías?.¿Se animarían a escribir la seccion de materiales y métodos? ¿Como interpretarían ños resultados?