Pruebas de hipotesis

Problema 1:

Se desea comparar dos genotipos de papa con base en el rendimiento (biomasa de tuberculos). Un ensayo utilizo dos variedades (criolla y pastusa) involucrando 180 plantas de la primera variedad y 200 de la segunda. Los datos de rendimiento en la cosecha se presentan en los siguientes vectores

options(digits = 3)
criolla = rnorm(n = 180, mean = 2.8, sd = 0.2)
pastusa = rnorm(n = 200, mean = 3.0, sd = 0.21)

# criolla
# pastusa
par(mfrow=c(1,2))
hist(criolla, col='darkblue')
abline(v=mean(criolla), col='red', lwd=3)
hist(pastusa, col='darkcyan')
abline(v=mean(pastusa), col='red', lwd=3)

par(mfrow=c(1,2))
boxplot(criolla, main='Criolla', ylab='Rto (Kg/planta)')
boxplot(pastusa, main='Pastusa', ylab='Rto (Kg/planta)')

summary(criolla)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.29    2.63    2.78    2.78    2.93    3.20
summary(pastusa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.39    2.83    2.96    2.98    3.13    3.67
library(psych)
## Warning: package 'psych' was built under R version 4.2.2
psych::describe(criolla)
##    vars   n mean  sd median trimmed  mad  min max range skew kurtosis   se
## X1    1 180 2.78 0.2   2.78    2.78 0.22 2.29 3.2  0.91 -0.1    -0.66 0.02
psych::describe(pastusa)
##    vars   n mean   sd median trimmed  mad  min  max range skew kurtosis   se
## X1    1 200 2.98 0.23   2.96    2.98 0.22 2.39 3.67  1.28 0.16     0.16 0.02

Digresion

# https://meet.google.com/rtd-tbzh-swq
medA = 3.5; sdA = 0.35
medB = 3.2; sdB = 0.20
# ¿Cual seleccionar?
# Coeficiente de Variacion cv = 100 * sd/mean
cvA = 100 * sdA/medA
cvB = 100 * sdB/medB

cvA; cvB
## [1] 10
## [1] 6.25
100 * sd(criolla) / mean(criolla)
## [1] 7.25
100 * sd(pastusa) / mean(pastusa)
## [1] 7.62

Conclusion desde el analisis descriptivo

  • Ambos coeficiente de variación bajos (<20%)
  • Se puede omitir el problema de diferente variabilidad
  • Se selecciona la variedad de mayor rendimiento promedio

Analisis inferencial a traves de pruebas de hipotesis

\[H_0: \mu_{pastusa} = \mu_{criolla} \\ H_a: \mu_{pastusa} \neq \mu_{criolla}\]

Prueba t-Student para comparar dos muestras independientes

  • Modalidad 1: Varianzas iguales
  • Modalidad 2: Varianzas desiguales

Prueba para comparación de dos varianzas

\[H_0: \sigma^2_{pastusa} = \sigma^2_{criolla} \\ H_a: \sigma^2_{pastusa} \neq \sigma^2_{criolla}\]

var(pastusa)
## [1] 0.0515
var(criolla)
## [1] 0.0407
vt = var.test(pastusa, criolla)
vt$p.value
## [1] 0.109
ifelse(vt$p.value < 0.025, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "No Rechazo Ho"

prueba t-Student para comparar las dos medias con varianzas iguales

pt = t.test(pastusa, criolla,
            alternative = 't',
            var.equal = TRUE)

ifelse(pt$p.value < 0.025, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "Rechazo Ho"

Conclusión final: los datos proporcionan evidencia estadística a favor de la hipótesis nula, es decir, que estadísticamente se consideran ambas variedades como de igual rendimiento. Cualquiera de las variedades es igual de buena