library(readxl)
Aminoacidos <- read_excel("C:/Users/sanch/OneDrive/Documentos/Universidad/Bioestadistica/Proyecto Bioesta/Data/Aminoacidos.xlsx")
View(Aminoacidos)
str(Aminoacidos)
## tibble [24 x 3] (S3: tbl_df/tbl/data.frame)
## $ Sexo : chr [1:24] "M" "M" "M" "M" ...
## $ Especie : chr [1:24] "E1" "E1" "E1" "E1" ...
## $ Aminoacido: num [1:24] 21.5 19.6 20.9 22.8 14.8 15.6 13.5 16.4 14.5 17.4 ...
Aminoacidos$Sexo=factor(Aminoacidos$Sexo)
Aminoacidos$Especie=factor(Aminoacidos$Especie)
str(Aminoacidos)
## tibble [24 x 3] (S3: tbl_df/tbl/data.frame)
## $ Sexo : Factor w/ 2 levels "H","M": 2 2 2 2 1 1 1 1 2 2 ...
## $ Especie : Factor w/ 3 levels "E1","E2","E3": 1 1 1 1 1 1 1 1 2 2 ...
## $ Aminoacido: num [1:24] 21.5 19.6 20.9 22.8 14.8 15.6 13.5 16.4 14.5 17.4 ...
anova<- aov(Aminoacido~Especie + Sexo, data = Aminoacidos)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## Especie 2 55.26 27.63 12.30 0.000328 ***
## Sexo 1 138.72 138.72 61.78 1.53e-07 ***
## Residuals 20 44.91 2.25
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
shapiro.test(anova$residuals) #normales
##
## Shapiro-Wilk normality test
##
## data: anova$residuals
## W = 0.95058, p-value = 0.2789
tapply(Aminoacidos$Aminoacido, Aminoacidos$Especie, length) #balanceados
## E1 E2 E3
## 8 8 8
bartlett.test(Aminoacidos$Aminoacido, Aminoacidos$Especie, Aminoacidos$Sexo) #homocedasticos
##
## Bartlett test of homogeneity of variances
##
## data: Aminoacidos$Aminoacido and Aminoacidos$Especie
## Bartlett's K-squared = 1.0294, df = 2, p-value = 0.5977
#De acuerdo al modelo se encontraron diferencias estadisticamnete significativas en la media de hemolinfa entre las especies (F = 12.30 , gl = 20, P<0.05).
#b) Pruebe la hipótesis que no hay diferencia en la media de hemolinfa entre la macho/hembra.
#El modelo anterioror indica que existen diferencias estadisticamente significativas entre la concentración de aminoacidos por sexo (F = 61.78 , gl = 20, P<0.05).
#c) Si la hipótesis nula de la pregunta a) se rechaza, elabore una prueba que le permita determinar diferencias entre especies.
library(agricolae)
## Warning: package 'agricolae' was built under R version 3.6.3
(duncan = duncan.test(anova, "Especie", group = T))
## $statistics
## MSerror Df Mean CV
## 2.245417 20 16.22917 9.2332
##
## $parameters
## test name.t ntr alpha
## Duncan Especie 3 0.05
##
## $duncan
## Table CriticalRange
## 2 2.949998 1.562878
## 3 3.096506 1.640497
##
## $means
## Aminoacido std r Min Max Q25 Q50 Q75
## E1 18.1375 3.482994 8 13.5 22.8 15.40 18.00 21.05
## E2 14.4250 2.333452 8 11.4 17.8 12.55 14.50 15.60
## E3 16.1250 2.942181 8 12.0 20.3 14.25 15.35 18.70
##
## $comparison
## NULL
##
## $groups
## Aminoacido groups
## E1 18.1375 a
## E3 16.1250 b
## E2 14.4250 c
##
## attr(,"class")
## [1] "group"
Se encontraron diferencias estadisticamente significativas con un 95% de confianza entre las especies, la especie 1 fue la que tuvo la mayor concentracion (18.1375) y la que tuvo menor fue la especie 2 (14.4250)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.6.3
grafico <- ggplot(anova, aes(Especie, Aminoacido, colour = Especie)) + geom_point() + geom_boxplot() + geom_jitter(shape = 15) + labs(y = "Concentracion de aminoacido (mg/mL)", x = "Especies")
grafico
ggplot(anova,aes(Sexo, Especie, colour = Sexo ))+ geom_point() + geom_boxplot()+ geom_jitter(shape=16) + labs(y="Concentración de aminoácidos en hemolinfa (mg/100 mL)", x="Sexo macho (M) o hembra (H)")
#f) Entregue la conclusión del estudio a partir de la evidencia estadística.
#Se encontraron diferencias estadisticamente significativas en la concentracion de hemolinfa entre las especies (F = 12.30 , gl = 20, P<0.05) y segun el sexo (F = 61.78 , gl = 20, P<0.05).
##Ejercicio 2
Plantas <- read_excel("C:/Users/sanch/OneDrive/Documentos/Universidad/Bioestadistica/Proyecto Bioesta/Data/Plantas.xlsx")
View(Plantas)
str(Plantas)
## tibble [24 x 3] (S3: tbl_df/tbl/data.frame)
## $ Bloque : num [1:24] 1 2 3 4 5 6 1 2 3 4 ...
## $ Variedad: chr [1:24] "V1" "V1" "V1" "V1" ...
## $ Talla : num [1:24] 19.8 16.7 17.7 18.2 20.3 15.5 21.9 19.8 21 21.4 ...
Plantas$Bloque=factor(Plantas$Bloque)
Plantas$Variedad=factor(Plantas$Variedad)
str(Plantas)
## tibble [24 x 3] (S3: tbl_df/tbl/data.frame)
## $ Bloque : Factor w/ 6 levels "1","2","3","4",..: 1 2 3 4 5 6 1 2 3 4 ...
## $ Variedad: Factor w/ 4 levels "V1","V2","V3",..: 1 1 1 1 1 1 2 2 2 2 ...
## $ Talla : num [1:24] 19.8 16.7 17.7 18.2 20.3 15.5 21.9 19.8 21 21.4 ...
anova2<- aov(Plantas$Talla~Plantas$Variedad + Plantas$Bloque)
summary(anova2)
## Df Sum Sq Mean Sq F value Pr(>F)
## Plantas$Variedad 3 188.54 62.85 144.437 2.74e-11 ***
## Plantas$Bloque 5 19.79 3.96 9.098 0.000386 ***
## Residuals 15 6.53 0.44
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
shapiro.test(anova2$residuals) #normales
##
## Shapiro-Wilk normality test
##
## data: anova2$residuals
## W = 0.97116, p-value = 0.6958
bartlett.test(Plantas$Talla, Plantas$Variedad, Plantas$Bloque) #homocedasticos
##
## Bartlett test of homogeneity of variances
##
## data: Plantas$Talla and Plantas$Variedad
## Bartlett's K-squared = 5.5672, df = 3, p-value = 0.1347
#se utiliza el mismo modelo del principio
Se encontraron diferencias estadsiticamente significativas entre en las tallas maximas de entre todas las variedades de plantas (F = 144.437 , gl = 15, P<0.05) y entre las camas donde se encontraban las plantas (F = 9.098 , gl = 15, P<0.05)
##Ejercicio 3
library(readxl)
Fertilizantes <- read_excel("C:/Users/sanch/OneDrive/Documentos/Universidad/Bioestadistica/Proyecto Bioesta/Data/Fertilizantes.xlsx")
View(Fertilizantes)
str(Fertilizantes)
## tibble [25 x 4] (S3: tbl_df/tbl/data.frame)
## $ Semillas : chr [1:25] "A" "E" "C" "B" ...
## $ Tierra : chr [1:25] "A" "A" "A" "A" ...
## $ Fertilizante: num [1:25] 1 2 3 4 5 1 2 3 4 5 ...
## $ Rendimiento : num [1:25] 42 45 41 56 47 47 54 46 52 49 ...
Fertilizantes$Semillas=factor(Fertilizantes$Semillas)
Fertilizantes$Tierra=factor(Fertilizantes$Tierra)
Fertilizantes$Fertilizante=factor(Fertilizantes$Fertilizante)
str(Fertilizantes)
## tibble [25 x 4] (S3: tbl_df/tbl/data.frame)
## $ Semillas : Factor w/ 5 levels "A","B","C","D",..: 1 5 3 2 4 3 2 1 4 5 ...
## $ Tierra : Factor w/ 5 levels "A","B","C","D",..: 1 1 1 1 1 2 2 2 2 2 ...
## $ Fertilizante: Factor w/ 5 levels "1","2","3","4",..: 1 2 3 4 5 1 2 3 4 5 ...
## $ Rendimiento : num [1:25] 42 45 41 56 47 47 54 46 52 49 ...
anova3<- aov(Rendimiento~Semillas+Tierra+Fertilizante, data = Fertilizantes)
summary(anova3)
## Df Sum Sq Mean Sq F value Pr(>F)
## Semillas 4 286.16 71.54 12.836 0.000271 ***
## Tierra 4 109.36 27.34 4.906 0.014105 *
## Fertilizante 4 17.76 4.44 0.797 0.549839
## Residuals 12 66.88 5.57
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
shapiro.test(anova3$residuals) #normales
##
## Shapiro-Wilk normality test
##
## data: anova3$residuals
## W = 0.97691, p-value = 0.8178
bartlett.test(Fertilizantes$Rendimiento, Fertilizantes$Semillas, Fertilizantes$Tierra, Fertilizantes$Fertilizante) #homocedasticos
##
## Bartlett test of homogeneity of variances
##
## data: Fertilizantes$Rendimiento and Fertilizantes$Semillas
## Bartlett's K-squared = 3.8253, df = 4, p-value = 0.4302
#Se encontraron diferencias significativas entre el rendimiento las semillas y la tierra, mas no el fertilizante.
qf(0.03, 4, 12)
## [1] 0.1264667
Para cada uno de los componentes el valor teorico al 97% de confianza del modelo estadistico es de 0.1264667 por lo que se producen diferencias estadisticamente significativas en la productividad anual segun el tipo de semilla (F = 13.902) y el tratamiento aplicado (F = 5.137).
Se encontraron diferencias estadisticamente significativas en la productividad anual segun el tipo de semilla (F = 13.902, gl = 12, P<0.05) y el tratamiento aplicado (F = 5.137, gl = 12, P<0.05). Por otro lado, para el fertilizante no se encontraron diferencias estadisticamente significativas en la productividad anual (F = 0.804 , gl = 12, P>0.05)