Clase presencial 1

\[Respuesta: Cannabinoide (UDC) \] \[1Factor(3niveles): Genotipo (gen1, gen2, gen3)\] \[H_0: \mu_{gen_1} = \mu_{gen2} = \mu_{gen3}\] \[ H_a: H_0 \ es \ falsa: Hipotésis \ de \ investigación \\ Diseño:Factorial\ simple\ en\ arreglo\ completamente\ al\ azar\]

set.seed(123)
udc = c(rnorm(n = 24, mean = 5, sd = 0.20),
        rnorm(n = 24, mean = 5.6, sd = 0.22),
        rnorm(n = 24, mean = 5.8, sd = 0.18))
genotipo = gl(n = 3, k = 24, length = 72, c("gen1", "gen2", "gen3"))

df1 = data.frame(genotipo, udc)
head(df1)

##   genotipo      udc
## 1     gen1 4.887905
## 2     gen1 4.953965
## 3     gen1 5.311742
## 4     gen1 5.014102
## 5     gen1 5.025858
## 6     gen1 5.343013

xy = expand.grid(x = 1:8, y = 1:9)
aleat = sample(1:72, 72, FALSE)
df1$cord_x = xy$x[aleat]
df1$cord_y = xy$y[aleat]

ggplot(df1)+
  aes(cord_x, cord_y, fill = udc)+
  geom_tile(color = "black", width=0.8, height=0.8)+
  geom_text(aes(label = genotipo), color = "white", size = 5)

##Estadítica descriptiva

ggplot(df1)+
  aes(genotipo, udc, fill = genotipo)+
  geom_boxplot()+
  geom_hline(yintercept = 5.2)

library(dplyr)
df1 %>% 
  group_by(genotipo) %>% 
  summarise(media = mean(udc),
            desv = sd(udc),
            cv = 100*desv/media)

## # A tibble: 3 x 4
##   genotipo media  desv    cv
##   <fct>    <dbl> <dbl> <dbl>
## 1 gen1      5.00 0.192  3.84
## 2 gen2      5.61 0.206  3.68
## 3 gen3      5.81 0.173  2.98

Estadística inferencial

\[Modelo: y_{ij} = \mu + \tau_i + \epsilon_{ij}\\ i =1,2,3; \ ;j=1,2, \dots,24\] \[ y_{ij} = cannabinoide \\ \epsilon_{ij} = parte\ no\ genotipica(invernadero, ambiente, error\ experimental) = Residuales \] Técnica estadistica: Análisis de varianza \[ Sólo\ se\ puede\ tomar\ p\ valor\ si\ el\ experimento\ se\ repite\ muchas\ veces\]

mod1 = aov(udc ~ genotipo, data = df1)
s_mod1 = summary(mod1)
p_valor= s_mod1[[1]][1,5]
ifelse(p_valor<0.05, "Rechazo H0", "No rechazo H0")

## [1] "Rechazo H0"

#Prueba de tukey -  comparación de medias
TukeyHSD(mod1, "genotipo")

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = udc ~ genotipo, data = df1)
## 
## $genotipo
##                diff        lwr       upr     p adj
## gen2-gen1 0.6130266 0.48104534 0.7450080 0.0000000
## gen3-gen1 0.8118158 0.67983454 0.9437972 0.0000000
## gen3-gen2 0.1987892 0.06680789 0.3307705 0.0016615

#Conclusión: Estadisticamente todos los genotipos son diferentes respecto al contenido de canabinoides

# Revisando suspuestos del modelo

# Normalidad de residuales
shapiro.test(mod1$residuals)

## 
##  Shapiro-Wilk normality test
## 
## data:  mod1$residuals
## W = 0.9931, p-value = 0.9652

# Igualadad de varianzas
bartlett.test(mod1$residuals, df1$genotipo)

## 
##  Bartlett test of homogeneity of variances
## 
## data:  mod1$residuals and df1$genotipo
## Bartlett's K-squared = 0.69893, df = 2, p-value = 0.7051

Matriz de distacia

dist_matrix <- as.matrix(dist(cbind(df1$cord_x,df1$cord_y)))#;dist_matrix
which.max(dist_matrix) # Es la posición de la máxima

## [1] 1332

max(dist_matrix) # Mayor valor

## [1] 10.63015

min(dist_matrix) # Menor valor

## [1] 0

dim(dist_matrix)

## [1] 72 72

Inversa de la distancia

dist_matrix_inv <- 1 / dist_matrix # Element wise
diag(dist_matrix_inv) <- 0
which.max(dist_matrix_inv) # Es la posición de la máxima

## [1] 3

max(dist_matrix_inv) # Mayor valor

## [1] 1

min(dist_matrix_inv) # Menor valor

## [1] 0

#Dependencia espacial (debe haber independencia)
Moran.I(mod1$residuals, dist_matrix_inv)

## $observed
## [1] -0.01394638
## 
## $expected
## [1] -0.01408451
## 
## $sd
## [1] 0.01352458
## 
## $p.value
## [1] 0.9918516

Clase presencial 1

Julián Serna

9/5/2022

Estadística inferencial

Matriz de distacia

Inversa de la distancia