Review hyphotesis tests

Se desea comparar 2 genotipos de papa en cuanto al rendimiento comercial de cada uno de ellos. Se estableció un experimento donde se sembraron 250 plantas de cada genotipo, de las cuales se obtuvo un rendimiento promedio de 2.54 kg/pl (genotipo 1) y 2.72 kg/pl (genotipo 2).¿Los datos proveen evidencia de que el genotipo 2 es superior al genotipo 1 en cuando a rendimiento?

\[\Large{H_0:\mu_{1}=\mu_{2}} \\ \Large{H_1:\mu_{1} \neq \mu_{2}}\]

# Seed
set.seed(123)

rto_g1= rnorm(n = 250,mean = 2.54,sd = 0.15)
rto_g2= rnorm(n = 250,mean = 2.72,sd = 0.17)

cat("G1 mean:",mean(rto_g1),"\n")
## G1 mean: 2.538716
cat("G2 mean:",mean(rto_g2))
## G2 mean: 2.733216

Density

library(ggplot2)
# data frame
df=data.frame(rto = c(rto_g1,rto_g2),
              gn = gl(2,250,500,c("G1","G2")))
# density plot
ggplot(df,aes(x=rto,fill=gn))+
  geom_density(alpha=0.4)+
  geom_vline(xintercept = c(mean(rto_g1),mean(rto_g2)))

### Two samples independent t-test

cat("G1 var:",var(rto_g1),"\n")
## G1 var: 0.01996994
cat("G2 var:",var(rto_g2))
## G2 var: 0.0290465

Variance test

\[\Large{H_0:\sigma^2_1 = \sigma^2_2 }\\\Large{ H_1:\sigma^2_1 \neq \sigma^2_2 }\]

var.test(rto_g1,rto_g2)
## 
##  F test to compare two variances
## 
## data:  rto_g1 and rto_g2
## F = 0.68752, num df = 249, denom df = 249, p-value = 0.003234
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.5359818 0.8818925
## sample estimates:
## ratio of variances 
##          0.6875161
# Varianzas desiguales
t.test(x = rto_g1,y = rto_g2,alternative = "t",mu = 0,var.equal = F)
## 
##  Welch Two Sample t-test
## 
## data:  rto_g1 and rto_g2
## t = -13.891, df = 481.49, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.2220134 -0.1669868
## sample estimates:
## mean of x mean of y 
##  2.538716  2.733216

Nota : Los datos proveen evidencia de que los genotipos difieren en rendimiento promedio

Ejercicio propuesto

Se siembran 2 hectáreas de palma, la primera hectárea es sembrada a 7m x 7m, y la segunda es 7m x 9m. El rendimiento de la primera hectárea fue 22.5 ton/ha/año, y del segundo 24.2 ton/ha/año. Use para el simulador de R una desviación estandar de 1 ton/ha/año para el lote 1 y 1.2 ton/ha/año. ¿Proveen los datos evidencia estadística de que el lote 2 es superior en rendieminto al lote 1?

Introduccion a la simulacion

set.seed(123)
#Simulacion 
sim_1 = replicate(n = 200,
        expr = c(rnorm(n = 250,mean = 2.54,sd = 0.15),
                 rnorm(n = 250,mean = 2.72,sd = 0.17)))

df_sim= data.frame(sim_1)
df_sim$gn = df$gn
#Simulacion  
sim_split= split(df_sim,df_sim$gn)

sim_g1= sim_split$G1
sim_g2= sim_split$G2
# Medias por cada simulación 
m_g1 = colMeans(sim_g1[,-201])
m_g2 = colMeans(sim_g2[,-201])
# Diferencia 
dife = m_g2-m_g1
hist(dife)
abline(v=quantile(dife,c(0.025,0.975)))