Pruebas de hipotesis

Problema 1:

Se desea comparar dos genotipos de papa con base al rendimiento (biomasa de tubérculos).Un ensayo utilizó dos variedades (criolla y pastusa) involucrando 180 plantas de la primera variedad y 200 de la segunda. Los datos de rendimiento de la cosecha se presenta en los siguientes vectores

options(digits = 3)
Criolla = rnorm(n = 180, mean = 2.8, sd = 0.2)
Pastusa = rnorm(n = 200, mean = 3.0, sd = 0.21)

# Criolla
# Pastusa
par(mfrow=c(1,2))
hist(Criolla, col = 'darkblue')
abline(v=mean(Criolla), col='red', lwd=3)
hist(Pastusa, col = 'darkcyan')
abline(v=mean(Pastusa), col='red', lwd=3)

par(mfrow=c(1,2))
boxplot(Criolla, main='Criolla', ylab='Rto (Kg/planta)')
boxplot(Pastusa, main='Pastusa', ylab='Rto (Kg/planta)')

summary(Criolla)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.27    2.68    2.85    2.82    2.95    3.32
summary(Pastusa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.38    2.85    2.98    2.98    3.12    3.45
library(psych)
## Warning: package 'psych' was built under R version 4.2.2
psych::describe(Criolla)
##    vars   n mean   sd median trimmed  mad  min  max range  skew kurtosis   se
## X1    1 180 2.82 0.19   2.85    2.82 0.19 2.27 3.32  1.05 -0.14    -0.11 0.01
psych::describe(Pastusa)
##    vars   n mean   sd median trimmed  mad  min  max range  skew kurtosis   se
## X1    1 200 2.98 0.21   2.98    2.98 0.21 2.38 3.45  1.07 -0.16    -0.04 0.01

Disgresion

medA = 3.5; sdA = 0.35
medB = 3.2; sdB = 0.20
# ¿Cuál seleccionar?
# Coeficiente de variación cv= 100 *sd/mean
cvA = 100 * sdA/medA
cvB = 100 * sdB/medB

cvA;cvB
## [1] 10
## [1] 6.25
100 * sd(Criolla)/mean(Criolla)
## [1] 6.83
100 * sd(Pastusa)/mean(Pastusa)
## [1] 7.07

Conclusión desde el análisis descriptivo

  • Ambos coeficientes de variación bajos (<20%)
  • Se puede omitir el problema de diferente variabilidad
  • Selecciono la variedad de mayor rendimiento

Análisis inferencial a través de pruebas de hipótesis

\[H_o: \mu_{Pastusa} = \mu_{Criolla} \\ H_a: \mu_{Pastusa} \neq \mu_{Criolla}\]

Prueba t-Student para comparar dos muestras independientes

  • Modalidad 1: varianzas iguales
  • Modalidda 2: varianzas desiguales

Prueba para comparación de dos varianzas

\[H_o: \sigma^2_{Pastusa} = \sigma^2_{Criolla} \\ H_a: \sigma^2_{Pastusa} \neq \sigma^2_{Criolla}\]

var(Pastusa)
## [1] 0.0444
var(Criolla)
## [1] 0.0371
vt = var.test(Pastusa, Criolla)
vt$p.value
## [1] 0.218
ifelse(vt$p.value < 0.025, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "No Rechazo Ho"

Prueba t-Student para comparar las dos medias con varianzas iguales

pt = t.test(Pastusa, Criolla, alternative = 't', var.equal = TRUE)

ifelse(pt$p.value < 0.025, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "Rechazo Ho"

Conclusión final: Los datos proporcionan evidencia estadística a favor de la hipótesis nula, es decir, que estadísticamente se consideran ambas variedades como de igual rendimiento, por lo que cualquiera de las variedades es igual de buena.