\[Respuesta: Cannabinoide (UDC) \] \[1Factor(3niveles): Genotipo (gen1, gen2, gen3)\] \[H_0: \mu_{gen_1} = \mu_{gen2} = \mu_{gen3}\] \[ H_a: H_0 \ es \ falsa: Hipotésis \ de \ investigación \\ Diseño:Factorial\ simple\ en\ arreglo\ completamente\ al\ azar\]
set.seed(123)
udc = c(rnorm(n = 24, mean = 5, sd = 0.20),
rnorm(n = 24, mean = 5.6, sd = 0.22),
rnorm(n = 24, mean = 5.8, sd = 0.18))
genotipo = gl(n = 3, k = 24, length = 72, c("gen1", "gen2", "gen3"))
df1 = data.frame(genotipo, udc)
head(df1)
## genotipo udc
## 1 gen1 4.887905
## 2 gen1 4.953965
## 3 gen1 5.311742
## 4 gen1 5.014102
## 5 gen1 5.025858
## 6 gen1 5.343013
xy = expand.grid(x = 1:8, y = 1:9)
aleat = sample(1:72, 72, FALSE)
df1$cord_x = xy$x[aleat]
df1$cord_y = xy$y[aleat]
ggplot(df1)+
aes(cord_x, cord_y, fill = udc)+
geom_tile(color = "black", width=0.8, height=0.8)+
geom_text(aes(label = genotipo), color = "white", size = 5)
##Estadítica descriptiva
ggplot(df1)+
aes(genotipo, udc, fill = genotipo)+
geom_boxplot()+
geom_hline(yintercept = 5.2)
library(dplyr)
df1 %>%
group_by(genotipo) %>%
summarise(media = mean(udc),
desv = sd(udc),
cv = 100*desv/media)
## # A tibble: 3 x 4
## genotipo media desv cv
## <fct> <dbl> <dbl> <dbl>
## 1 gen1 5.00 0.192 3.84
## 2 gen2 5.61 0.206 3.68
## 3 gen3 5.81 0.173 2.98
\[Modelo: y_{ij} = \mu + \tau_i + \epsilon_{ij}\\ i =1,2,3; \ ;j=1,2, \dots,24\] \[ y_{ij} = cannabinoide \\ \epsilon_{ij} = parte\ no\ genotipica(invernadero, ambiente, error\ experimental) = Residuales \] Técnica estadistica: Análisis de varianza \[ Sólo\ se\ puede\ tomar\ p\ valor\ si\ el\ experimento\ se\ repite\ muchas\ veces\]
mod1 = aov(udc ~ genotipo, data = df1)
s_mod1 = summary(mod1)
p_valor= s_mod1[[1]][1,5]
ifelse(p_valor<0.05, "Rechazo H0", "No rechazo H0")
## [1] "Rechazo H0"
#Prueba de tukey - comparación de medias
TukeyHSD(mod1, "genotipo")
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = udc ~ genotipo, data = df1)
##
## $genotipo
## diff lwr upr p adj
## gen2-gen1 0.6130266 0.48104534 0.7450080 0.0000000
## gen3-gen1 0.8118158 0.67983454 0.9437972 0.0000000
## gen3-gen2 0.1987892 0.06680789 0.3307705 0.0016615
#Conclusión: Estadisticamente todos los genotipos son diferentes respecto al contenido de canabinoides
# Revisando suspuestos del modelo
# Normalidad de residuales
shapiro.test(mod1$residuals)
##
## Shapiro-Wilk normality test
##
## data: mod1$residuals
## W = 0.9931, p-value = 0.9652
# Igualadad de varianzas
bartlett.test(mod1$residuals, df1$genotipo)
##
## Bartlett test of homogeneity of variances
##
## data: mod1$residuals and df1$genotipo
## Bartlett's K-squared = 0.69893, df = 2, p-value = 0.7051
dist_matrix <- as.matrix(dist(cbind(df1$cord_x,df1$cord_y)))#;dist_matrix
which.max(dist_matrix) # Es la posición de la máxima
## [1] 1332
max(dist_matrix) # Mayor valor
## [1] 10.63015
min(dist_matrix) # Menor valor
## [1] 0
dim(dist_matrix)
## [1] 72 72
dist_matrix_inv <- 1 / dist_matrix # Element wise
diag(dist_matrix_inv) <- 0
which.max(dist_matrix_inv) # Es la posición de la máxima
## [1] 3
max(dist_matrix_inv) # Mayor valor
## [1] 1
min(dist_matrix_inv) # Menor valor
## [1] 0
#Dependencia espacial (debe haber independencia)
Moran.I(mod1$residuals, dist_matrix_inv)
## $observed
## [1] -0.01394638
##
## $expected
## [1] -0.01408451
##
## $sd
## [1] 0.01352458
##
## $p.value
## [1] 0.9918516