Ver el video que demuestra como instalar paquetes enlace
library(googlesheets4)
library(ggplot2)
Hoja4 del archivo aov1 )Para leer la base de datos directamente desde el archivo en Drive * Copiar el siguiente código, tal y como está * y luego pegarlo en la consola de R (ejecutarlo)
gs4_deauth()
ss= "https://docs.google.com/spreadsheets/d/1-be0wPZgFEKIGsQZyrVZgWq-P1XitcAMzMJqdGaTe14/edit?usp=sharing"
hoja= "Hoja4"
rango = "A1:B41"
caso1 <- read_sheet(ss,
sheet= hoja,
range= rango,
col_names= TRUE
)
caso1$x <- as.factor(caso1$x)
summary(caso1)
## y x
## Min. :1021 A:10
## 1st Qu.:1238 B:10
## Median :1417 C:10
## Mean :1415 D:10
## 3rd Qu.:1557
## Max. :1924
head(caso1); tail(caso1)
## # A tibble: 6 x 2
## y x
## <dbl> <fct>
## 1 1436. A
## 2 1038. A
## 3 1021. A
## 4 1609. A
## 5 1509. A
## 6 1493. A
## # A tibble: 6 x 2
## y x
## <dbl> <fct>
## 1 1790. D
## 2 1213. D
## 3 1851. D
## 4 1386. D
## 5 1111. D
## 6 1561. D
hist(caso1$y)
shapiro.test(caso1$y)
##
## Shapiro-Wilk normality test
##
## data: caso1$y
## W = 0.97635, p-value = 0.5565
variable respuesta ? Variable predictora ?
plot( y ~ x, data=caso1)
points(y ~ x, cex=0.8, pch=20,col=6, data=caso1)
aov(y~x) o t.test(y~x)aov.1 <- aov(y ~ x, data=caso1)
summary(aov.1)
## Df Sum Sq Mean Sq F value Pr(>F)
## x 3 99957 33319 0.615 0.61
## Residuals 36 1951067 54196
Ver instrucciones de la tarea en Classroom
===============================================================
Caso2 (Hoja5 del archivo aov1 Para leer la base de datos directamente desde el archivo en Drive * Copiar el siguiente código, tal y como está *
gs4_deauth()
ss= "https://docs.google.com/spreadsheets/d/1-be0wPZgFEKIGsQZyrVZgWq-P1XitcAMzMJqdGaTe14/edit?usp=sharing"
hoja= "Hoja5"
rango = "A1:B142"
caso2 <- read_sheet(ss,
sheet= hoja,
range= rango,
col_names= TRUE
)
caso2$x <- as.factor(caso2$x)
===============================================================
Caso3 (Hoja5 del archivo aov1 Para leer la base de datos directamente desde el archivo en Drive * Copiar el siguiente código, tal y como está *
gs4_deauth()
ss= "https://docs.google.com/spreadsheets/d/1-be0wPZgFEKIGsQZyrVZgWq-P1XitcAMzMJqdGaTe14/edit?usp=sharing"
hoja= "Milk"
rango = "A1:B321"
Milk <- read_sheet(ss,
sheet= hoja,
range= rango,
col_names= TRUE
)
Milk$raza <- as.factor(Milk$raza)
===============================================================
caso4 (pesos del archivo aov1 Para leer la base de datos directamente desde el archivo en Drive * Copiar el siguiente código, tal y como está *
gs4_deauth()
ss= "https://docs.google.com/spreadsheets/d/1-be0wPZgFEKIGsQZyrVZgWq-P1XitcAMzMJqdGaTe14/edit?usp=sharing"
hoja= "pesos"
rango = "A1:B371"
pesos <- read_sheet(ss,
sheet= hoja,
range= rango,
col_names= TRUE
)
pesos$dieta <- as.factor(pesos$dieta)
En este caso, el marco teórico nos da indicios para predecir que el grupo con la dieta B deberia de provocar ganancias de peso mayores que la dieta A (alternative= "less")
t.test(lb ~ dieta, alternative= "less", data= pesos)
##
## Welch Two Sample t-test
##
## data: lb by dieta
## t = -2.1806, df = 359, p-value = 0.01493
## alternative hypothesis: true difference in means between group dieta_A and group dieta_B is less than 0
## 95 percent confidence interval:
## -Inf -1.625604
## sample estimates:
## mean in group dieta_A mean in group dieta_B
## 102.7600 109.4291
aov()aov.pesos <- aov(lb~dieta, data=pesos)
summary(aov.pesos)
## Df Sum Sq Mean Sq F value Pr(>F)
## dieta 1 4087 4087 4.751 0.0299 *
## Residuals 368 316541 860
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
===============================================================
caso5 (bacteria del archivo dataF )
Se está midiendo “inhibición de crecimiento” bacteriano (Y), con dos distintos extractos de plantas y un control (antibiótico, ANT). Se midieron otros factores, pero por ahora, para este ejercicio tomaremos solo los factores PLANTA y `.
Para leer la base de datos directamente desde el archivo en Drive * Copiar el siguiente código, tal y como está *
gs4_deauth()
ss= "https://docs.google.com/spreadsheets/d/1IEyFalrwxaVTvKNfQZbNqiWTAXfcOnX_uEDDT-PjvrE/edit?usp=sharing"
hoja= "data"
rango = "A1:F322"
bact <- read_sheet(ss,
sheet= hoja,
range= rango,
col_names= TRUE
)
bact$PLANTA <- as.factor(bact$PLANTA)
bact$BACTERIA <- as.factor(bact$BACTERIA)
planta y tipo de bacteriaaov.planta <- aov(bact$Y ~ bact$PLANTA)
summary(aov.planta)
## Df Sum Sq Mean Sq F value Pr(>F)
## bact$PLANTA 2 13058 6529 90.59 <2e-16 ***
## Residuals 318 22920 72
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
aov.bacteria <- aov(bact$Y ~ bact$BACTERIA)
summary(aov.bacteria)
## Df Sum Sq Mean Sq F value Pr(>F)
## bact$BACTERIA 1 381 381.1 3.416 0.0655 .
## Residuals 319 35597 111.6
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
planta y tipo de bacteria, aproximados como variables predictoras en modelos lineales [lm(y~x)]ml.planta <- lm(bact$Y ~ bact$PLANTA)
summary(ml.planta)
##
## Call:
## lm(formula = bact$Y ~ bact$PLANTA)
##
## Residuals:
## Min 1Q Median 3Q Max
## -14.459 -4.129 -3.174 3.951 30.436
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 19.015 1.189 15.995 < 2e-16 ***
## bact$PLANTALA -15.841 1.395 -11.353 < 2e-16 ***
## bact$PLANTALG -4.556 1.395 -3.265 0.00121 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8.49 on 318 degrees of freedom
## Multiple R-squared: 0.363, Adjusted R-squared: 0.3589
## F-statistic: 90.59 on 2 and 318 DF, p-value: < 2.2e-16
ml.bacteria <- lm(bact$Y ~ bact$BACTERIA)
summary(ml.bacteria)
##
## Call:
## lm(formula = bact$Y ~ bact$BACTERIA)
##
## Residuals:
## Min 1Q Median 3Q Max
## -11.9670 -9.6608 -0.8208 4.8792 26.2630
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 11.967 1.016 11.773 <2e-16 ***
## bact$BACTERIAAS -2.306 1.248 -1.848 0.0655 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 10.56 on 319 degrees of freedom
## Multiple R-squared: 0.01059, Adjusted R-squared: 0.007492
## F-statistic: 3.416 on 1 and 319 DF, p-value: 0.06551