Ejercicio 1

El siguiente conjunto de datos corresponde a la biomasa total (TDM) de plántulas de Genipa amaerica a dos condiciones de luz (alta y baja), y dentro de cada condición de luz se aplicó dos niveles de nitrógeno (sin y con nitrógeno). Los investigadores quieren determinar la importancia del nitrógeno dentro de cada condición de luz y comparar el efecto general de la luz en el crecimiento.

datos<- read.table("C:/Users/nanit/Desktop/database.txt", header = T)
datos
##     luz nitrogeno   TDM
## 1  Baja        N- 0.537
## 2  Baja        N- 0.362
## 3  Baja        N- 0.353
## 4  Baja        N- 0.345
## 5  Baja        N- 0.342
## 6  Baja        N- 0.342
## 7  Baja        N- 0.336
## 8  Baja        N- 0.328
## 9  Baja        N- 0.310
## 10 Baja        N- 0.310
## 11 Baja        N- 0.284
## 12 Baja        N- 0.229
## 13 Baja        N- 0.219
## 14 Baja        N+ 1.008
## 15 Baja        N+ 0.702
## 16 Baja        N+ 0.669
## 17 Baja        N+ 0.638
## 18 Baja        N+ 0.574
## 19 Baja        N+ 0.552
## 20 Baja        N+ 0.544
## 21 Baja        N+ 0.542
## 22 Baja        N+ 0.536
## 23 Baja        N+ 0.534
## 24 Baja        N+ 0.439
## 25 Baja        N+ 0.435
## 26 Baja        N+ 0.433
## 27 Baja        N+ 0.408
## 28 Baja        N+ 0.295
## 29 Alta        N- 0.827
## 30 Alta        N- 0.609
## 31 Alta        N- 0.609
## 32 Alta        N- 0.529
## 33 Alta        N- 0.520
## 34 Alta        N- 0.508
## 35 Alta        N- 0.465
## 36 Alta        N- 0.451
## 37 Alta        N- 0.450
## 38 Alta        N- 0.445
## 39 Alta        N- 0.440
## 40 Alta        N- 0.402
## 41 Alta        N- 0.367
## 42 Alta        N- 0.295
## 43 Alta        N- 0.208
## 44 Alta        N+ 2.102
## 45 Alta        N+ 1.898
## 46 Alta        N+ 1.896
## 47 Alta        N+ 1.880
## 48 Alta        N+ 1.823
## 49 Alta        N+ 1.804
## 50 Alta        N+ 1.798
## 51 Alta        N+ 1.702
## 52 Alta        N+ 1.658
## 53 Alta        N+ 1.579
## 54 Alta        N+ 1.533
## 55 Alta        N+ 1.491
## 56 Alta        N+ 1.421
## 57 Alta        N+ 1.335
## 58 Alta        N+ 1.175
datos$luz <- as.factor(datos$luz)
datos$nitrogeno <- as.factor(datos$nitrogeno)
data.frame(datos)
##     luz nitrogeno   TDM
## 1  Baja        N- 0.537
## 2  Baja        N- 0.362
## 3  Baja        N- 0.353
## 4  Baja        N- 0.345
## 5  Baja        N- 0.342
## 6  Baja        N- 0.342
## 7  Baja        N- 0.336
## 8  Baja        N- 0.328
## 9  Baja        N- 0.310
## 10 Baja        N- 0.310
## 11 Baja        N- 0.284
## 12 Baja        N- 0.229
## 13 Baja        N- 0.219
## 14 Baja        N+ 1.008
## 15 Baja        N+ 0.702
## 16 Baja        N+ 0.669
## 17 Baja        N+ 0.638
## 18 Baja        N+ 0.574
## 19 Baja        N+ 0.552
## 20 Baja        N+ 0.544
## 21 Baja        N+ 0.542
## 22 Baja        N+ 0.536
## 23 Baja        N+ 0.534
## 24 Baja        N+ 0.439
## 25 Baja        N+ 0.435
## 26 Baja        N+ 0.433
## 27 Baja        N+ 0.408
## 28 Baja        N+ 0.295
## 29 Alta        N- 0.827
## 30 Alta        N- 0.609
## 31 Alta        N- 0.609
## 32 Alta        N- 0.529
## 33 Alta        N- 0.520
## 34 Alta        N- 0.508
## 35 Alta        N- 0.465
## 36 Alta        N- 0.451
## 37 Alta        N- 0.450
## 38 Alta        N- 0.445
## 39 Alta        N- 0.440
## 40 Alta        N- 0.402
## 41 Alta        N- 0.367
## 42 Alta        N- 0.295
## 43 Alta        N- 0.208
## 44 Alta        N+ 2.102
## 45 Alta        N+ 1.898
## 46 Alta        N+ 1.896
## 47 Alta        N+ 1.880
## 48 Alta        N+ 1.823
## 49 Alta        N+ 1.804
## 50 Alta        N+ 1.798
## 51 Alta        N+ 1.702
## 52 Alta        N+ 1.658
## 53 Alta        N+ 1.579
## 54 Alta        N+ 1.533
## 55 Alta        N+ 1.491
## 56 Alta        N+ 1.421
## 57 Alta        N+ 1.335
## 58 Alta        N+ 1.175
str(datos)
## 'data.frame':    58 obs. of  3 variables:
##  $ luz      : Factor w/ 2 levels "Alta","Baja": 2 2 2 2 2 2 2 2 2 2 ...
##  $ nitrogeno: Factor w/ 2 levels "N-","N+": 1 1 1 1 1 1 1 1 1 1 ...
##  $ TDM      : num  0.537 0.362 0.353 0.345 0.342 0.342 0.336 0.328 0.31 0.31 ...
  1. ¿Qué diseño de análisis de varianza es necesario aplicar para responder la pregunta de los investigadores?

Se aplicaría un ANOVA factorial de dos factores con repeticiones.

  1. ¿Se encontró diferencias estadísticamente significativas entre los niveles de luz (α = 0,05)?
modelo <- aov(TDM ~ luz * nitrogeno , data = datos)
summary (modelo)
##               Df Sum Sq Mean Sq F value   Pr(>F)    
## luz            1  5.635   5.635   188.9  < 2e-16 ***
## nitrogeno      1  7.682   7.682   257.4  < 2e-16 ***
## luz:nitrogeno  1  3.430   3.430   114.9 5.48e-15 ***
## Residuals     54  1.611   0.030                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Respuesta

Se encontraron diferencias estadísticamente significativas entre lo diferentes niveles de luz al 95 % de confianza (F=188.9 , df= 1,1,1; p<0.05)

  1. ¿Cuál de los niveles de luz (alta o baja) mostraron diferencias estadísticamente significativas entre los niveles de nitrógeno (α = 0,05)?
TukeyHSD(modelo)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = TDM ~ luz * nitrogeno, data = datos)
## 
## $luz
##                 diff        lwr        upr p adj
## Baja-Alta -0.6237857 -0.7147897 -0.5327817     0
## 
## $nitrogeno
##            diff       lwr       upr p adj
## N+-N- 0.7278162 0.6368122 0.8188201     0
## 
## $`luz:nitrogeno`
##                        diff         lwr         upr     p adj
## Baja:N--Alta:N- -0.14446154 -0.31798126  0.02905818 0.1343285
## Alta:N+-Alta:N-  1.19800000  1.03079221  1.36520779 0.0000000
## Baja:N+-Alta:N-  0.07893333 -0.08827445  0.24614112 0.5973839
## Alta:N+-Baja:N-  1.34246154  1.16894182  1.51598126 0.0000000
## Baja:N+-Baja:N-  0.22339487  0.04987515  0.39691459 0.0065348
## Baja:N+-Alta:N+ -1.11906667 -1.28627445 -0.95185888 0.0000000

Respuesta

Se encontraron diferencias entre los niveles de luz alta y baja y la presencia y ausencia de nitrógeno, y entre los niveles de luz alta y baja y la presencia de nitrogeno en ambas condiciones (p<0.05)

  1. Elaborar una conclusión estadística
summary.lm(modelo)
## 
## Call:
## aov(formula = TDM ~ luz * nitrogeno, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.49800 -0.09965 -0.00997  0.07655  0.45407 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          0.47500    0.04460  10.650 7.02e-15 ***
## luzBaja             -0.14446    0.06546  -2.207   0.0316 *  
## nitrogenoN+          1.19800    0.06308  18.993  < 2e-16 ***
## luzBaja:nitrogenoN+ -0.97461    0.09090 -10.721 5.48e-15 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1727 on 54 degrees of freedom
## Multiple R-squared:  0.9122, Adjusted R-squared:  0.9074 
## F-statistic: 187.1 on 3 and 54 DF,  p-value: < 2.2e-16

El analisis estadistico demostró que existe una diferencia entre los diferentes niveles de luz y la biomasa total de las plántulas (F: 187.1, df: 3,54,24; p<0.05). Además, los investigadores determinaron la importancia del nitrógeno entre las dos concidiones de luz y la presencia y ausencia de nitrogeno.

Ejercicio 2

Un grupo de técnicos de alimentos quieren determinar los niveles de maltodextrosa remanentes durante la fermentación de alcohol, ellos aplicaron tres tratamientos distintos de fermentación y cuatro niveles de concentración de un ácido. Los ensayos fueron repetidos tres veces para cada una de las combinaciones tratamiento de fermentación X concentración de ácido.

library(readxl)
data<- read_excel("C:/Users/nanit/Desktop/malto.xlsx")
data
## # A tibble: 36 x 3
##    maltodex trat  concentracion_ac
##       <dbl> <chr> <chr>           
##  1       12 A     1ac             
##  2       12 A     1ac             
##  3       13 A     1ac             
##  4       24 A     2ac             
##  5       23 A     2ac             
##  6       25 A     2ac             
##  7       10 A     3ac             
##  8        9 A     3ac             
##  9       11 A     3ac             
## 10       18 A     4ac             
## # ... with 26 more rows
data$trat <- as.factor(data$trat)
data$concentracion_ac <- as.factor(data$concentracion_ac)
data.frame(data)
##    maltodex trat concentracion_ac
## 1        12    A              1ac
## 2        12    A              1ac
## 3        13    A              1ac
## 4        24    A              2ac
## 5        23    A              2ac
## 6        25    A              2ac
## 7        10    A              3ac
## 8         9    A              3ac
## 9        11    A              3ac
## 10       18    A              4ac
## 11       17    A              4ac
## 12       19    A              4ac
## 13       21    B              1ac
## 14       22    B              1ac
## 15       23    B              1ac
## 16       26    B              2ac
## 17       27    B              2ac
## 18       29    B              2ac
## 19       24    B              3ac
## 20       22    B              3ac
## 21       24    B              3ac
## 22       16    B              4ac
## 23       17    B              4ac
## 24       18    B              4ac
## 25       20    C              1ac
## 26       18    C              1ac
## 27       19    C              1ac
## 28       16    C              2ac
## 29       12    C              2ac
## 30       15    C              2ac
## 31       19    C              3ac
## 32       18    C              3ac
## 33       19    C              3ac
## 34       18    C              4ac
## 35       20    C              4ac
## 36       17    C              4ac
str(data)
## tibble [36 x 3] (S3: tbl_df/tbl/data.frame)
##  $ maltodex        : num [1:36] 12 12 13 24 23 25 10 9 11 18 ...
##  $ trat            : Factor w/ 3 levels "A","B","C": 1 1 1 1 1 1 1 1 1 1 ...
##  $ concentracion_ac: Factor w/ 4 levels "1ac","2ac","3ac",..: 1 1 1 2 2 2 3 3 3 4 ...

¿Qué diseño de análisis de varianza es necesario aplicar para responder la pregunta de los investigadores?

Se aplicaría un ANOVA factorial de dos factores con repeticiones

  1. ¿Se encontró diferencias estadísticamente significativas de la concentración de maltodextrosa entre los tratamientos (α = 0,05)?
modelo2 <- aov(maltodex ~ trat * concentracion_ac , data = data)
summary (modelo2)
##                       Df Sum Sq Mean Sq F value   Pr(>F)    
## trat                   2  262.9  131.44   92.78 5.09e-12 ***
## concentracion_ac       3  123.6   41.21   29.09 3.65e-08 ***
## trat:concentracion_ac  6  435.1   72.52   51.19 1.66e-12 ***
## Residuals             24   34.0    1.42                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Respuesta

Se encontraron diferencias estadísticamente significativas entre las concentraciones de maltodextrosa y los tratamientos al 95 % de confianza (F=92.78 , df= 2,3,6; p<0.05)

  1. ¿Se encontró diferencias estadísticamente significativas de la concentración de maltodextrosa entre los niveles de acidez (α = 0,05)?
modelo2 <- aov(maltodex ~ trat * concentracion_ac , data = data)
summary (modelo2)
##                       Df Sum Sq Mean Sq F value   Pr(>F)    
## trat                   2  262.9  131.44   92.78 5.09e-12 ***
## concentracion_ac       3  123.6   41.21   29.09 3.65e-08 ***
## trat:concentracion_ac  6  435.1   72.52   51.19 1.66e-12 ***
## Residuals             24   34.0    1.42                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Respuesta

Se encontraron diferencias estadísticamente significativas entre las concentraciones de maltodextrosa y los niveles de acidez al 95 % de confianza (F=29.09, df= 2,3,6; p<0.05)

  1. ¿Se encontró interacción entre los tratamientos de fermentación y concentración del ácido para las concentraciones de maltodextrosa (α = 0,05)?
modelo2 <- aov(maltodex ~ trat * concentracion_ac , data = data)
summary (modelo2)
##                       Df Sum Sq Mean Sq F value   Pr(>F)    
## trat                   2  262.9  131.44   92.78 5.09e-12 ***
## concentracion_ac       3  123.6   41.21   29.09 3.65e-08 ***
## trat:concentracion_ac  6  435.1   72.52   51.19 1.66e-12 ***
## Residuals             24   34.0    1.42                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Respuesta

Se encontró interacción entre los tratamientos de fermentación y concentración del ácido para las concentraciones de ácido al 95 % de confianza(F=51.19, df= 2,3,6; p<0.05)

  1. Elaborar una conclusión estadística
summary.lm(modelo2)
## 
## Call:
## aov(formula = maltodex ~ trat * concentracion_ac, data = data)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -2.333 -1.000  0.000  0.750  1.667 
## 
## Coefficients:
##                           Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                12.3333     0.6872  17.948 2.06e-15 ***
## tratB                       9.6667     0.9718   9.947 5.45e-10 ***
## tratC                       6.6667     0.9718   6.860 4.28e-07 ***
## concentracion_ac2ac        11.6667     0.9718  12.005 1.24e-11 ***
## concentracion_ac3ac        -2.3333     0.9718  -2.401 0.024457 *  
## concentracion_ac4ac         5.6667     0.9718   5.831 5.17e-06 ***
## tratB:concentracion_ac2ac  -6.3333     1.3744  -4.608 0.000112 ***
## tratC:concentracion_ac2ac -16.3333     1.3744 -11.884 1.53e-11 ***
## tratB:concentracion_ac3ac   3.6667     1.3744   2.668 0.013460 *  
## tratC:concentracion_ac3ac   2.0000     1.3744   1.455 0.158566    
## tratB:concentracion_ac4ac -10.6667     1.3744  -7.761 5.37e-08 ***
## tratC:concentracion_ac4ac  -6.3333     1.3744  -4.608 0.000112 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.19 on 24 degrees of freedom
## Multiple R-squared:  0.9603, Adjusted R-squared:  0.9421 
## F-statistic: 52.73 on 11 and 24 DF,  p-value: 4.474e-14

Los investigadores pudeden determinar que los niveles de maltodextrosa son diferentes con la aplicación de tres tratamientos de fermentación y los cuatro niveles de concentración a partir del modelo empleado (F: 52.73,df: 11, 24; p<0.05). Además, se identificó una interacción estadísticamente significativa entre los tratamientos y las concentraciones de ácido, la cual debe ser tomada en cuenta en el modelo.