Para resolver este ejercicio tendrán que apelar a lo que aprendieron en las clases anteriores pero también (y no menor) a la lógica y a la buena amiga internet (animense a googlear los nombres de los test, sus interpretaciones y todo lo que los pueda ayudar a completar el ejercicio wikipedia es un buen inicio)
Esta base contiene la longitud de los odontoblastos (células responsables del crecimiento de los dientes) en 60 cobayas. Cada animal recibió uno de los tres niveles de dosis de vitamina C (0,5, 1 y 2 mg/día) mediante uno de los dos métodos de administración, zumo de naranja o ácido ascórbico (una forma de vitamina C y codificada como VC)
Las variables son:
len Longitud del diente
supp Tipo de suplemento (VC o OJ)
dose Dosis en miligramos/día
La base se ve así:
head(data)
## len supp dose
## 1 4.2 VC 0.5
## 2 11.5 VC 0.5
## 3 7.3 VC 0.5
## 4 5.8 VC 0.5
## 5 6.4 VC 0.5
## 6 10.0 VC 0.5
Y está estructurada así:
str(data)
## 'data.frame': 60 obs. of 3 variables:
## $ len : num 4.2 11.5 7.3 5.8 6.4 10 11.2 11.2 5.2 7 ...
## $ supp: Factor w/ 2 levels "OJ","VC": 2 2 2 2 2 2 2 2 2 2 ...
## $ dose: num 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 ...
Veamos una estadistica de resumen de esta base:
summary(data)
## len supp dose
## Min. : 4.20 OJ:30 Min. :0.500
## 1st Qu.:13.07 VC:30 1st Qu.:0.500
## Median :19.25 Median :1.000
## Mean :18.81 Mean :1.167
## 3rd Qu.:25.27 3rd Qu.:2.000
## Max. :33.90 Max. :2.000
#correlacion de Pearson
cor.test(data$len, data$dose)
##
## Pearson's product-moment correlation
##
## data: data$len and data$dose
## t = 10.25, df = 58, p-value = 1.233e-14
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.6892521 0.8777169
## sample estimates:
## cor
## 0.8026913
Vamos a incluir un grafiquito para ayudarnos a intepretar
ggplot(data, aes(x=len, y=dose))+
geom_point()
data$dose<-as.factor(data$dose)
res.aov <- aov(len ~ dose, data = data)
summary(res.aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## dose 2 2426 1213 67.42 9.53e-16 ***
## Residuals 57 1026 18
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Vamos a incluir un grafiquito para ayudarnos a intepretar:
ggplot(data, aes(y=len, x=dose))+
geom_boxplot()
Es probable que necesites un poco mas de datos
TukeyHSD(res.aov)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = len ~ dose, data = data)
##
## $dose
## diff lwr upr p adj
## 1-0.5 9.130 5.901805 12.358195 0.00e+00
## 2-0.5 15.495 12.266805 18.723195 0.00e+00
## 2-1 6.365 3.136805 9.593195 4.25e-05