Pruebas de hipotesis

Problema 1:

Se desea comparar dos genotipos de papa con base al rendimiento (biomasa de tuberculos). Un ensayo utilizo dos variedades (criolla y pastusa) involucrando 180 plantas de la primer variedad y 200 de la segunda. Los datos de rendimiento de la cosecha se presentan en los siguientes vectores

options(digits = 3)
criolla = rnorm(n = 180, mean =2.8, sd = 0.2)
pastusa = rnorm(n = 200, mean = 3.0, sd= 0.21)

#criolla
#pastusa

par(mfrow=c(1,2))
hist(criolla, col='red')
abline(v=mean(criolla), col='green', lwd=3)
hist(pastusa, col='red')
abline(v=mean(pastusa), col='green', lwd=3)

boxplot(criolla, main='criolla', ylab='Rto(kg/planta)')
boxplot(pastusa, main='pastusa', ylab='Rto(kg/planta)')

summary(criolla)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.24    2.67    2.77    2.78    2.89    3.38
summary(pastusa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.23    2.89    3.01    3.02    3.15    3.59
library(psych)
## Warning: package 'psych' was built under R version 4.2.2
psych::describe(criolla)
##    vars   n mean   sd median trimmed  mad  min  max range  skew kurtosis   se
## X1    1 180 2.78 0.19   2.77    2.78 0.17 2.24 3.38  1.14 -0.02     0.54 0.01
psych::describe(pastusa)
##    vars   n mean   sd median trimmed  mad  min  max range skew kurtosis   se
## X1    1 200 3.02 0.21   3.01    3.02 0.19 2.23 3.59  1.36 0.02      0.3 0.01

###Disgresion

medA = 3.5; sdA = 0.35
medB = 3.2; sdB = 0.20
 # coeficiente de vRIcion cv = 100*sd/mean
cvA = 100*sdA/medA
cvB = 100*sdB/medB

cvA; cvB
## [1] 10
## [1] 6.25
cvcriolla = 100*sd(criolla)/mean(criolla)
cvpastusa = 100*sd(pastusa)/mean(pastusa)

Conclusion desde el analisis descriptivo

  • Ambos coeficiente de variacion bajos (<20%)
  • Se puede omitir el problema de diferente variabilidad
  • Se selecciona la variedad de mayor rendimiento promedio

Analisis inferencial a traves de pruebas de hipotesis

\[H_0: \mu_{pastusa} = \mu_{criolla}\\ H_a: \mu_{pastusa} \neq \mu_{criolla}\]

Prueba t-Student para comparar dos muestras independientes

  • Modalidad 1: Varianzas iguales
  • Modalidad 2: Varianzas desiguales

Prueba para comparar dos varianzas

\[H_0: \sigma^2_{pastusa} = \sigma^2_{criolla}\\ H_a: \sigma^2_{pastusa} \neq \sigma^2_{criolla}\]

#var(pastusa)
#var(criolla)
vt = var.test(pastusa, criolla)
vt$p.value
## [1] 0.115
ifelse(vt$p.value < 0.025, 'Rechazo Ho', 'No rechazo Ho')
## [1] "No rechazo Ho"

prueba t-Student para comparar las dos medias con varianzas iguales

pt = t.test(pastusa, criolla, alternative = 't', var.equal = TRUE)

ifelse(pt$p.value < 0.025, 'Rechazo Ho', 'No rechazo Ho')
## [1] "Rechazo Ho"

Conclusion final: Los datos proporcionan evidencia estadistica a favor de la hipotesis nula, es decir, que estadisticamente se consideran ambas variedades como de igual rendimiento, cualquiera de las variedades es igual de buena.