Pruebas de hipotesis

Problema 1:

Se desea comparar 2 genotipos de papa con base en el rendimiento (biomasa de tuberculos). Un ensayo utilizó 2 variedades (criolla y pastusa) involucrando 180 plantas de la primera variedad y 200 de la segunda. Los datos de rendimiento en la cosecha se presentan en los siguientes vectores.

set.seed(2023)
criolla = rnorm(n = 180, mean = 2.8, sd = 0.2)
pastusa = rnorm(n = 200, mean = 3.0, sd = 0.21)

# criolla
# pastusa
par(mfrow=c(1,2))
hist(criolla, col="lightblue")
abline(v=mean(criolla), col="red", lwd=3)
hist(pastusa, col="lightblue")
abline(v=mean(pastusa), col="red", lwd=3)

par(mfrow=c(1,2))
boxplot(criolla, main="criolla", ylab="Rto (kg/planta)")
boxplot(pastusa, main="pastusa", ylab="Rto (kg/planta)")

summary(criolla)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.387   2.706   2.824   2.826   2.943   3.347
summary(pastusa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.318   2.850   3.002   2.988   3.111   3.961
library(psych)
## Warning: package 'psych' was built under R version 4.2.2
psych::describe(criolla)
##    vars   n mean  sd median trimmed  mad  min  max range skew kurtosis   se
## X1    1 180 2.83 0.2   2.82    2.82 0.18 2.39 3.35  0.96 0.13     0.07 0.01
psych::describe(pastusa)
##    vars   n mean   sd median trimmed mad  min  max range skew kurtosis   se
## X1    1 200 2.99 0.21      3    2.98 0.2 2.32 3.96  1.64  0.4     1.83 0.01

Disgresion

medA = 3.5; sdA = 0.35
medB = 3.2; sdB = 0.20
# ¿cual seleccionar?
# coeficiente de variacion cv = 100 * sd/mean
cvA = 100 * sdA/medA
cvB = 100 * sdB/medB

cvA;cvB
## [1] 10
## [1] 6.25
100 * sd(criolla)/mean(criolla)
## [1] 6.93881
100 * sd(pastusa)/mean(pastusa)
## [1] 6.961218

conclusion desde el analisis descriptivo

  • Ambos coeficientes de variación son bajos
  • Se puede omitir el problema de diferente variabilidad
  • Selecciono la variedad de mayor rendimiento promedio

Analisis inferencial a traves de pruebas de hipotesis

\[H_0: \mu_{pastusa} = \mu_{criolla} \\ H_a: \mu_{pastusa} \neq \mu_{criolla}\]

Prueba t-student para comparar dos muestras independientes

  • Modalidad 1: Varianzas iguales
  • Modalidad 2: Varianzas desiguales

Prueba para comparación de dos varianzas

\[H_0:\sigma^2_{pastusa} = \sigma^2_{criolla}\\ H_a: \sigma^2_{pastusa} \neq \sigma^2_{criolla}\]

var(criolla)
## [1] 0.03844791
var(pastusa)
## [1] 0.04326944
vt=var.test(pastusa, criolla)
vt$p.value
## [1] 0.4201075
ifelse(vt$p.value < 0.025, "Rechazo Ho","No rechazo Ho")
## [1] "No rechazo Ho"

prueba t-student para comparar las dos medias con varianzas iguales

pt = t.test(pastusa, criolla, alternative = "t",
       var.equal = TRUE)
ifelse(pt$p.value<0.025, "Rechazo Ho","No rechazo Ho")
## [1] "Rechazo Ho"

Conclusion final: Los datos proporcionan evidencia estadistica a favor de la hipotesis nula, es decir, que estadíasticamente se consideran ambas variedades como de igual rendimiento. Cualquiera de las dos variedades es buena.