packages

Instalar paquetes

Ver el video que demuestra como instalar paquetes enlace

cargar packages

library(googlesheets4)
library(ggplot2)

Leyendo datos

1. Caso1 (Hoja4 del archivo aov1 )

Para leer la base de datos directamente desde el archivo en Drive * Copiar el siguiente código, tal y como está * y luego pegarlo en la consola de R (ejecutarlo)

gs4_deauth()
ss= "https://docs.google.com/spreadsheets/d/1-be0wPZgFEKIGsQZyrVZgWq-P1XitcAMzMJqdGaTe14/edit?usp=sharing"
hoja= "Hoja4"
rango = "A1:B41"
caso1 <- read_sheet(ss,
                    sheet= hoja,
                    range= rango,
                    col_names= TRUE
                    )
caso1$x <- as.factor(caso1$x)

Paso 2. Explorar datos

summary(caso1)
##        y        x     
##  Min.   :1021   A:10  
##  1st Qu.:1238   B:10  
##  Median :1417   C:10  
##  Mean   :1415   D:10  
##  3rd Qu.:1557         
##  Max.   :1924
head(caso1); tail(caso1)
## # A tibble: 6 x 2
##       y x    
##   <dbl> <fct>
## 1 1436. A    
## 2 1038. A    
## 3 1021. A    
## 4 1609. A    
## 5 1509. A    
## 6 1493. A
## # A tibble: 6 x 2
##       y x    
##   <dbl> <fct>
## 1 1790. D    
## 2 1213. D    
## 3 1851. D    
## 4 1386. D    
## 5 1111. D    
## 6 1561. D
hist(caso1$y)

test de normalidad

shapiro.test(caso1$y)
## 
##  Shapiro-Wilk normality test
## 
## data:  caso1$y
## W = 0.97635, p-value = 0.5565

Modelo

variable respuesta ? Variable predictora ?

plot( y ~ x, data=caso1)
points(y ~ x, cex=0.8, pch=20,col=6, data=caso1)

Paso 3. Análisis aov(y~x) o t.test(y~x)

aov.1 <- aov(y ~ x, data=caso1)
summary(aov.1)
##             Df  Sum Sq Mean Sq F value Pr(>F)
## x            3   99957   33319   0.615   0.61
## Residuals   36 1951067   54196

Paso 4. Conclusión

Ver instrucciones de la tarea en Classroom

===============================================================

1. Leyendo

Caso2 (Hoja5 del archivo aov1 Para leer la base de datos directamente desde el archivo en Drive * Copiar el siguiente código, tal y como está *

gs4_deauth()
ss= "https://docs.google.com/spreadsheets/d/1-be0wPZgFEKIGsQZyrVZgWq-P1XitcAMzMJqdGaTe14/edit?usp=sharing"
hoja= "Hoja5"
rango = "A1:B142"
caso2 <- read_sheet(ss,
                    sheet= hoja,
                    range= rango,
                    col_names= TRUE
                    )
caso2$x <- as.factor(caso2$x)

* REPETIR PASOS del 2 - 4 *

===============================================================

1. Leyendo

Caso3 (Hoja5 del archivo aov1 Para leer la base de datos directamente desde el archivo en Drive * Copiar el siguiente código, tal y como está *

gs4_deauth()
ss= "https://docs.google.com/spreadsheets/d/1-be0wPZgFEKIGsQZyrVZgWq-P1XitcAMzMJqdGaTe14/edit?usp=sharing"
hoja= "Milk"
rango = "A1:B321"

Milk <- read_sheet(ss,
                    sheet= hoja,
                    range= rango,
                    col_names= TRUE
                    )

Milk$raza <- as.factor(Milk$raza)

* REPETIR PASOS del 2 - 4 * reemaplazando los nombres de archivo y variables

===============================================================

1. Leyendo

caso4 (pesos del archivo aov1 Para leer la base de datos directamente desde el archivo en Drive * Copiar el siguiente código, tal y como está *

gs4_deauth()
ss= "https://docs.google.com/spreadsheets/d/1-be0wPZgFEKIGsQZyrVZgWq-P1XitcAMzMJqdGaTe14/edit?usp=sharing"
hoja= "pesos"
rango = "A1:B371"
pesos <- read_sheet(ss,
                    sheet= hoja,
                    range= rango,
                    col_names= TRUE
                    )
pesos$dieta <- as.factor(pesos$dieta)

Analizando con prueba de t

En este caso, el marco teórico nos da indicios para predecir que el grupo con la dieta B deberia de provocar ganancias de peso mayores que la dieta A (alternative= "less")

t.test(lb ~ dieta, alternative= "less", data= pesos)
## 
##  Welch Two Sample t-test
## 
## data:  lb by dieta
## t = -2.1806, df = 359, p-value = 0.01493
## alternative hypothesis: true difference in means between group dieta_A and group dieta_B is less than 0
## 95 percent confidence interval:
##       -Inf -1.625604
## sample estimates:
## mean in group dieta_A mean in group dieta_B 
##              102.7600              109.4291

Analizando con aov()

aov.pesos <- aov(lb~dieta, data=pesos)
summary(aov.pesos)
##              Df Sum Sq Mean Sq F value Pr(>F)  
## dieta         1   4087    4087   4.751 0.0299 *
## Residuals   368 316541     860                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

===============================================================

1. Leyendo

caso5 (bacteria del archivo dataF )

Se está midiendo “inhibición de crecimiento” bacteriano (Y), con dos distintos extractos de plantas y un control (antibiótico, ANT). Se midieron otros factores, pero por ahora, para este ejercicio tomaremos solo los factores PLANTA y `.

Para leer la base de datos directamente desde el archivo en Drive * Copiar el siguiente código, tal y como está *

gs4_deauth()
ss= "https://docs.google.com/spreadsheets/d/1IEyFalrwxaVTvKNfQZbNqiWTAXfcOnX_uEDDT-PjvrE/edit?usp=sharing"
hoja= "data"
rango = "A1:F322"
bact <- read_sheet(ss,
                    sheet= hoja,
                    range= rango,
                    col_names= TRUE
                    )
bact$PLANTA <- as.factor(bact$PLANTA)
bact$BACTERIA <- as.factor(bact$BACTERIA)

Paso 3. Análisis

AOVs con los factores planta y tipo de bacteria

aov.planta <- aov(bact$Y ~ bact$PLANTA)
summary(aov.planta)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## bact$PLANTA   2  13058    6529   90.59 <2e-16 ***
## Residuals   318  22920      72                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
aov.bacteria <- aov(bact$Y ~ bact$BACTERIA)
summary(aov.bacteria)
##                Df Sum Sq Mean Sq F value Pr(>F)  
## bact$BACTERIA   1    381   381.1   3.416 0.0655 .
## Residuals     319  35597   111.6                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Los factores planta y tipo de bacteria, aproximados como variables predictoras en modelos lineales [lm(y~x)]

ml.planta <- lm(bact$Y ~ bact$PLANTA)
summary(ml.planta)
## 
## Call:
## lm(formula = bact$Y ~ bact$PLANTA)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -14.459  -4.129  -3.174   3.951  30.436 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     19.015      1.189  15.995  < 2e-16 ***
## bact$PLANTALA  -15.841      1.395 -11.353  < 2e-16 ***
## bact$PLANTALG   -4.556      1.395  -3.265  0.00121 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.49 on 318 degrees of freedom
## Multiple R-squared:  0.363,  Adjusted R-squared:  0.3589 
## F-statistic: 90.59 on 2 and 318 DF,  p-value: < 2.2e-16
ml.bacteria <- lm(bact$Y ~ bact$BACTERIA)
summary(ml.bacteria)
## 
## Call:
## lm(formula = bact$Y ~ bact$BACTERIA)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -11.9670  -9.6608  -0.8208   4.8792  26.2630 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)       11.967      1.016  11.773   <2e-16 ***
## bact$BACTERIAAS   -2.306      1.248  -1.848   0.0655 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 10.56 on 319 degrees of freedom
## Multiple R-squared:  0.01059,    Adjusted R-squared:  0.007492 
## F-statistic: 3.416 on 1 and 319 DF,  p-value: 0.06551