Pruebas de hipotesis

problema 1:

Se desea comparar dos genotipos de papa con base en el rendimiento (biomasa de tuberculos). Un ensayo utilizo dos variedades (criolla y pastusa) involucrando 180 platas de la primera variedad y 200 de la segunda. Los datos de rendimiento en la cosecha se presentan en los siguientes vectores.
options(digits = 3)
Criolla = rnorm(n = 180, mean = 2.8, sd = 0.2)
Pastusa = rnorm(n = 200, mean = 3.0, sd = 0.21)

# Criolla
# Pastusa
par(mfrow=c(1,2))
hist(Criolla, col='darkblue')
abline(v=mean(Criolla), col='red', lwd=3)
hist(Pastusa, col='darkcyan')
abline(v=mean(Pastusa), col='red', lwd=3)

par(mfrow=c(1,2))
boxplot(Criolla, main='Criolla', ylab='Rto (kg/planta)')
boxplot(Pastusa, main='Pastusa', ylab='Rto (Kg/planta)')

summary(Criolla)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.35    2.68    2.82    2.81    2.93    3.25
summary(Pastusa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.47    2.86    3.02    3.00    3.15    3.50
library(psych)
## Warning: package 'psych' was built under R version 4.2.2
psych::describe(Criolla)
##    vars   n mean   sd median trimmed  mad  min  max range  skew kurtosis   se
## X1    1 180 2.81 0.18   2.82    2.81 0.18 2.35 3.25  0.91 -0.16    -0.43 0.01
psych::describe(Pastusa)
##    vars   n mean   sd median trimmed  mad  min max range  skew kurtosis   se
## X1    1 200    3 0.21   3.02    3.01 0.22 2.47 3.5  1.03 -0.18    -0.41 0.01

Disgresion

medA = 3.5; sdA = 0.35
medB = 3.2; sdB = 0.20
# ¿Cual seleccionar?
# Coeficiente de variacion cv = 100 * sd/mean
cvA = 100 * sdA/medA
cvB = 100 * sdB/medB

cvA;cvB
## [1] 10
## [1] 6.25
100 * sd(Criolla) / mean(Criolla)
## [1] 6.43
100 * sd(Pastusa) / mean(Pastusa)
## [1] 6.89

Conclusion desde el analisis descriptivo

  • Ambos coeficientes de variacion bajos (<20%)
  • Se puede omitir el problema de diferente variabilidad
  • Se selecciona la variedad de mayor rendimiento promedio

Analisis inferencial a traves de pruebas de hipotesis

\[H_o: \mu_{Pastusa} = \mu_{Criolla} \\ H_a: \mu_{Pastusa} \neq \mu_{Criolla}\]

Prueba t-student para comparar dos muestras independientes

  • Modalidad 1: varianzas iguales
  • Modalidad 2: varianzas desiguales

Prueba para comparacion de dos varianzas

\[H_o: \sigma^2_{Pastusa} = \sigma^2_{Criolla} \\ H_a: \sigma^2_{Pastusa} \neq \mu_{Criolla}\]

var(Pastusa)
## [1] 0.0429
var(Criolla)
## [1] 0.0326
vt = var.test(Pastusa, Criolla)
vt$p.value
## [1] 0.0607
ifelse(vt$p.value < 0.025, 'Rechazo Ho' , 'No Rechazo Ho')
## [1] "No Rechazo Ho"

Prueba t-Student para comparar las dos medias con varianzas iguales

pt = t.test(Pastusa, Criolla, alternative = 't', var.equal = TRUE)

ifelse(pt$p.value < 0.025, 'Rechazo Ho' , 'No Rechazo Ho')
## [1] "Rechazo Ho"

Conclusion final: Los datos proporcionan evidencia estadistica a favor de la hipotesis nula, es decir, que estadisticamente se consideran ambas variedades como de igual rendimiento. Cualquiera de las variedades es igual de buena.