Resuelva los siguientes ejercicios presente en html.Asuma todos los supuestos estadísticos para pruebas paramétricas, sin embargo, de igual forma deben probarlos.
###########FASE V ANALISIS DE VARIANZA - Parte II#########
#Ejercicio 1 #######
#Se realizó un estudio de los aminoácidos presentes en la hemolinfa de milpies. Se colectó una muestra en 4 hembras y 4 machos en tres especies distintas. Las concentraciones se registraron en mg/100 mL en el siguiente cuadro:
#a) Pruebe la hipótesis que no hay diferencia en la media de hemolinfa entre las especies.
#b) Pruebe la hipótesis que no hay diferencia en la media de hemolinfa entre la macho/hembra.
#c) Si la hipótesis nula de la pregunta a) se rechaza, elabore una prueba que le permita determinar diferencias entre especies.
#d) Establecer si existen diferencias estadísticamente significativas en la interacción al Alpha=0.05.
#e) Elabore un gráfico que le permita analizar los resultados obtenidos de la hemolinfa de los milpies.
#f) Entregue la conclusión del estudio a partir de la evidencia estadística.
#Paso 1 Cargar base de datos
library(readxl)
milpies <- read_excel("C:/Users/Usuario/Desktop/Proyectos/U.N.A/I Ciclo 2021/Bioestadistica II/Bioesta2/Lab/Fase V Parte II/milpies.xlsx",
col_types = c("text", "numeric", "numeric",
"numeric"))
View(milpies)
#Paso 2 Unir vectores
valores <-c(milpies$Especie1,milpies$Especie2,milpies$Especie3)
#Paso 3 Factores
sexo <- gl(2,4,label=c("Macho","Hembra"))
especies <- gl(3,8,label=c("Especie1","Especie2","Especie3"))
#Paso 4 Crear data.frame
tabla1 <-data.frame(valores, especies, sexo)
tabla1
## valores especies sexo
## 1 21.5 Especie1 Macho
## 2 19.6 Especie1 Macho
## 3 20.9 Especie1 Macho
## 4 22.8 Especie1 Macho
## 5 14.8 Especie1 Hembra
## 6 15.6 Especie1 Hembra
## 7 13.5 Especie1 Hembra
## 8 16.4 Especie1 Hembra
## 9 14.5 Especie2 Macho
## 10 17.4 Especie2 Macho
## 11 15.0 Especie2 Macho
## 12 17.8 Especie2 Macho
## 13 12.1 Especie2 Hembra
## 14 11.4 Especie2 Hembra
## 15 12.7 Especie2 Hembra
## 16 14.5 Especie2 Hembra
## 17 16.0 Especie3 Macho
## 18 20.3 Especie3 Macho
## 19 18.5 Especie3 Macho
## 20 19.3 Especie3 Macho
## 21 14.4 Especie3 Hembra
## 22 14.7 Especie3 Hembra
## 23 13.8 Especie3 Hembra
## 24 12.0 Especie3 Hembra
#Paso 5 Extrater vectores de interes
sexo<- tabla1$sexo
especies<- tabla1$especies
#a)########
#Pruebe la hipótesis que no hay diferencia en la media de hemolinfa entre las especies.
#Paso 1 Aplicar AOV##
hemolinfa<- aov(valores~especies + sexo, data = tabla1)
summary(hemolinfa)
## Df Sum Sq Mean Sq F value Pr(>F)
## especies 2 55.26 27.63 12.30 0.000328 ***
## sexo 1 138.72 138.72 61.78 1.53e-07 ***
## Residuals 20 44.91 2.25
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Paso 2 Probar normalidad
shapiro.test(hemolinfa$residuals) #p-value = 0.2789 simetrico
##
## Shapiro-Wilk normality test
##
## data: hemolinfa$residuals
## W = 0.95058, p-value = 0.2789
#Paso 3 Probar homocedasticidad
bartlett.test(valores, tabla1$sexo) #p-value = 0.09376 homo
##
## Bartlett test of homogeneity of variances
##
## data: valores and tabla1$sexo
## Bartlett's K-squared = 2.8086, df = 1, p-value = 0.09376
bartlett.test(valores, tabla1$especies)#p-value = 0.5977 homo
##
## Bartlett test of homogeneity of variances
##
## data: valores and tabla1$especies
## Bartlett's K-squared = 1.0294, df = 2, p-value = 0.5977
#Paso 4 Aplicar ANDEVA##
hemolinfa<- aov(valores~especies + sexo, data = tabla1)
summary(hemolinfa)
## Df Sum Sq Mean Sq F value Pr(>F)
## especies 2 55.26 27.63 12.30 0.000328 ***
## sexo 1 138.72 138.72 61.78 1.53e-07 ***
## Residuals 20 44.91 2.25
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Paso 5 Respuesta
#Se determinaron diferencias estadisticamnete significativas para la media de hemolinfa entre las especies (F = 12.30 , gl = 20, P<0.05)
#b)########
#Repsuesta
# Se determinaron diferencias estadisticamnete significativas en la media de hemolinfa para el sexo (F = 61.78 , gl = 20, P<0.05).
#c)########
#Si la hipótesis nula de la pregunta a) se rechaza, elabore una prueba que le permita determinar diferencias entre especies.
library(agricolae)
## Warning: package 'agricolae' was built under R version 3.6.3
(duncan = duncan.test(hemolinfa,"especies", group = T))
## $statistics
## MSerror Df Mean CV
## 2.245417 20 16.22917 9.2332
##
## $parameters
## test name.t ntr alpha
## Duncan especies 3 0.05
##
## $duncan
## Table CriticalRange
## 2 2.949998 1.562878
## 3 3.096506 1.640497
##
## $means
## valores std r Min Max Q25 Q50 Q75
## Especie1 18.1375 3.482994 8 13.5 22.8 15.40 18.00 21.05
## Especie2 14.4250 2.333452 8 11.4 17.8 12.55 14.50 15.60
## Especie3 16.1250 2.942181 8 12.0 20.3 14.25 15.35 18.70
##
## $comparison
## NULL
##
## $groups
## valores groups
## Especie1 18.1375 a
## Especie3 16.1250 b
## Especie2 14.4250 c
##
## attr(,"class")
## [1] "group"
#d)########
#Establecer si existen diferencias estadísticamente significativas en la interacción al Alpha=0.05.
#Respuesta
#Se evidenciaron diferencias estadisticamente significativas entre las especies, la especie 1 (18.1375) y especie 2 (14.4250)
#e)########
#Elabore un gráfico que le permita analizar los resultados obtenidos de la hemolinfa de los milpies.
#Especies
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.6.3
ggplot(hemolinfa,aes(especies, valores, colour = especies ))+ geom_point() + geom_boxplot()+ geom_jitter(shape=1) + labs(y="Concentración de aminoácidos en hemolinfa (mg/100 mL)", x="Especies")
#Sexo
ggplot(hemolinfa,aes(sexo, valores, colour = sexo ))+ geom_point() + geom_boxplot()+ geom_jitter(shape=1) + labs(y="Concentración de aminoácidos en hemolinfa (mg/100 mL)", x="Sexo macho (M) o hembra (H)")
#f)########
#Entregue la conclusión del estudio a partir de la evidencia estadística.
#Respuesta
#Se encontraron obeservaron diferebncias estadisticamente significativas en la concentracion de hemolinfa entre el sexo (F = 61.78 , gl = 20, P<0.05) y para las especies (F = 12.30 , gl = 20, P<0.05)
#Ejercicio 2 #######
#En un invernadero se colocaron camas las cuales se consideran como bloques. En cada bloque, se colocó una planta de cuatro variedades. Se anotó la información sobre la talla máxima de las plantas (cm) después de un periodo de 20 días. Los datos se registraron en el siguiente cuadro
#a) Determine si existen diferencias al 97% entre las tallas máximas de las cuatro variedades de plantas en el invernadero.
#b) Entregue la conclusión del estudio a partir de la evidencia estadística.
#Paso 1 Cargar base de datos
library(readxl)
invernadero <- read_excel("C:/Users/Usuario/Desktop/Proyectos/U.N.A/I Ciclo 2021/Bioestadistica II/Bioesta2/Lab/Fase V Parte II/invernadero.xlsx",
col_types = c("text", "numeric", "numeric",
"numeric", "numeric"))
View(invernadero)
#Paso 2 Unir vectores
valores2<- c(invernadero$Variedad1, invernadero$Variedad2, invernadero$Variedad3, invernadero$Variedad4)
#Paso 3 Factores
bloque <- gl(6,1,label=c(1,2,3,4,5,6))
variedad <- gl(4,6,label=c("variedad1","variedad2","variedad3", "variedad4"))
#Paso 4 Crear data.frame
tabla2<-data.frame(valores2, variedad, bloque)
tabla2
## valores2 variedad bloque
## 1 19.8 variedad1 1
## 2 16.7 variedad1 2
## 3 17.7 variedad1 3
## 4 18.2 variedad1 4
## 5 20.3 variedad1 5
## 6 15.5 variedad1 6
## 7 21.9 variedad2 1
## 8 19.8 variedad2 2
## 9 21.0 variedad2 3
## 10 21.4 variedad2 4
## 11 22.1 variedad2 5
## 12 20.8 variedad2 6
## 13 16.4 variedad3 1
## 14 15.4 variedad3 2
## 15 14.8 variedad3 3
## 16 15.6 variedad3 4
## 17 16.4 variedad3 5
## 18 14.6 variedad3 6
## 19 14.7 variedad4 1
## 20 13.5 variedad4 2
## 21 12.8 variedad4 3
## 22 13.7 variedad4 4
## 23 14.6 variedad4 5
## 24 12.9 variedad4 6
#a)#######
#Determine si existen diferencias al 97% entre las tallas máximas de las cuatro variedades de plantas en el invernadero.
#Paso 1 Aplicar AOV##
pinvernadero<- aov(valores2~variedad + bloque, data = tabla2)
summary(pinvernadero)
## Df Sum Sq Mean Sq F value Pr(>F)
## variedad 3 188.54 62.85 144.437 2.74e-11 ***
## bloque 5 19.79 3.96 9.098 0.000386 ***
## Residuals 15 6.53 0.44
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Paso 2 Probar normalidad
shapiro.test(pinvernadero$residuals) #p-value = 0.6958
##
## Shapiro-Wilk normality test
##
## data: pinvernadero$residuals
## W = 0.97116, p-value = 0.6958
#Paso 3 Probar homocedasticidad
bartlett.test(valores2, tabla2$variedad)
##
## Bartlett test of homogeneity of variances
##
## data: valores2 and tabla2$variedad
## Bartlett's K-squared = 5.5672, df = 3, p-value = 0.1347
bartlett.test(valores2, tabla2$bloque)
##
## Bartlett test of homogeneity of variances
##
## data: valores2 and tabla2$bloque
## Bartlett's K-squared = 0.27583, df = 5, p-value = 0.9981
#Paso 4 Aplicar ANDEVA##
pinvernadero<- aov(valores2~variedad + bloque, data = tabla2)
summary(pinvernadero)
## Df Sum Sq Mean Sq F value Pr(>F)
## variedad 3 188.54 62.85 144.437 2.74e-11 ***
## bloque 5 19.79 3.96 9.098 0.000386 ***
## Residuals 15 6.53 0.44
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Paso 5 Respuesta
# Se encontraron diferencias estadisticamnete significativas entre las tallas máximas de las cuatro variedades de plantas en el invernadero(F = 144.437 , gl = 15, P<0.05)
#b)#######
#Entregue la conclusión del estudio a partir de la evidencia estadística.
#Ejercicio 3########
#En la Escuela de Ciencias Biológicas se está realizando un estudio que pretende analizar 5 tipos de fertilizante, 5 tipos de manejo de la tierra (tratamiento) y 5 tipos de semillas distintas. El modelo utilizado se observa a continuación:
#Paso 1 Cargar vectores
#Tratamientos
tratA <-c(42, 45, 42, 56, 47)
tratB <-c(47, 54, 46, 52, 49)
tratC <-c(55, 52, 57, 49, 45)
tratD <-c(51, 44, 47, 50, 54)
tratE <-c(44, 50, 48, 43, 46)
#Semillas
s1 <-c("A", "E", "C", "B", "D")
s2 <-c("C", "B", "A", "D", "E")
s3 <-c("B", "C", "D", "E", "A")
s4 <-c("D", "A", "E", "C", "B")
s5 <-c("E", "D", "B", "A", "C")
#Paso 2 Unir vectores
valores3<- c(tratA, tratB, tratC, tratD, tratE)
semillas<- c(s1, s2, s3, s4, s5)
#Paso 3 Factores
fertilizante <- gl(5,1,label=c("f1","f2","f3", "f4", "f5"))
tratamientos <- gl(5,5,label=c("tratA","tratB","tratC", "tratD", "tratE"))
#Paso 4 Crear data.frame
tabla3<-data.frame(valores3, tratamientos,semillas, fertilizante)
tabla3
## valores3 tratamientos semillas fertilizante
## 1 42 tratA A f1
## 2 45 tratA E f2
## 3 42 tratA C f3
## 4 56 tratA B f4
## 5 47 tratA D f5
## 6 47 tratB C f1
## 7 54 tratB B f2
## 8 46 tratB A f3
## 9 52 tratB D f4
## 10 49 tratB E f5
## 11 55 tratC B f1
## 12 52 tratC C f2
## 13 57 tratC D f3
## 14 49 tratC E f4
## 15 45 tratC A f5
## 16 51 tratD D f1
## 17 44 tratD A f2
## 18 47 tratD E f3
## 19 50 tratD C f4
## 20 54 tratD B f5
## 21 44 tratE E f1
## 22 50 tratE D f2
## 23 48 tratE B f3
## 24 43 tratE A f4
## 25 46 tratE C f5
#a)#######
# Determine si existen diferencias estadísticamente significativas en la aplicación del fertilizante, tratamiento y tipo de semilla en la productividad anual (prod). Utilice una significancia al 95%.
#Paso 1 Aplicar AOV##
productividad<- aov(valores3~semillas + tratamientos + fertilizante, data = tabla3)
summary(productividad)
## Df Sum Sq Mean Sq F value Pr(>F)
## semillas 4 283.6 70.9 13.902 0.000186 ***
## tratamientos 4 104.8 26.2 5.137 0.012023 *
## fertilizante 4 16.4 4.1 0.804 0.545744
## Residuals 12 61.2 5.1
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Paso 2 Probar normalidad
shapiro.test(productividad$residuals) #p-value = 0.6006
##
## Shapiro-Wilk normality test
##
## data: productividad$residuals
## W = 0.96823, p-value = 0.6006
#Paso 3 Probar homocedasticidad
bartlett.test(valores3, tabla3$semilla) #p-value = 0.5003 homo
##
## Bartlett test of homogeneity of variances
##
## data: valores3 and tabla3$semilla
## Bartlett's K-squared = 3.355, df = 4, p-value = 0.5003
bartlett.test(valores3, tabla3$tratamientos) #p-value = 0.6895 homo
##
## Bartlett test of homogeneity of variances
##
## data: valores3 and tabla3$tratamientos
## Bartlett's K-squared = 2.2523, df = 4, p-value = 0.6895
#Paso 4 Aplicar ANDEVA##
productividad<- aov(valores3~semillas + tratamientos + fertilizante, data = tabla3)
summary(productividad)
## Df Sum Sq Mean Sq F value Pr(>F)
## semillas 4 283.6 70.9 13.902 0.000186 ***
## tratamientos 4 104.8 26.2 5.137 0.012023 *
## fertilizante 4 16.4 4.1 0.804 0.545744
## Residuals 12 61.2 5.1
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Paso 5 Respuesta
# Se encontraron diferencias significativas entre el tratamiento y la productividad de la semilla
#El fertilizante no mostro diferencia estdisticamnete significativa
#b)######
#Calcule el valor teórico al 97% para cada uno de los componentes del modelo estadístico. Indique con el lenguaje estadístico adecuado si es posible establecer diferencias estadísticamente significativas.
#Paso 1 Aplicar prueba
qf(0.97, 4, 12) #3.885627
## [1] 3.885627
#Paso 2 Respuesta
#Para componentedel mopdelo el valor teorico al 97% de confianza fue 0.1264667
#Existen diferencias estadisticamente significativas en tratamiento aplicado (F = 5.137) y la productividad anual segun el tipo de semilla (F = 13.902)
#c)######
#Entregue la conclusión del estudio a partir de la evidencia estadística
#Existen diferencias estadisticas significativas en la productividad anual segun el tipo de semilla (F = 13.902, gl = 12, P<0.05) y para el tratamiento aplicado (F = 5.137, gl = 12, P<0.05)
#Para el fertilizante no se encontraron diferencias estadisticas en la productividad anual (F = 0.804 , gl = 12, P>0.05)