Pruebas de hipotesis

Problema 1:

Se desea comparar 2 genotipos de papa con base al rendimiento (biomasa de tobérculos). Un ensayo usó 2 variedades (criolla y pastusa) involucrando 180 plantas de la primera variedad y 200 de la segunda. Los datos de rendimiento de la cosecha se presenta en los siguientes vectores.

options(digits = 3)
criolla = rnorm(n=180, mean = 2.8, sd=0.2)
pastusa= rnorm(n=200, mean = 3.0, sd = 0.21)

#criolla
#pastusa
par(mfrow=c(1,2))
hist(criolla, col='blue')
abline(v=mean(criolla), col='red' , lwd=3)
hist(pastusa)
abline(v=mean(pastusa), col='red' , lwd=3)

par(mfrow=c(1,2))
boxplot(criolla, xlab= 'Criolla', ylab = 'Rto (Kg/planta)')
boxplot(pastusa, xlab= 'Pastusa', ylab= 'Rto (Kg/planta)')

summary(criolla)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.25    2.68    2.83    2.82    2.95    3.64
summary(pastusa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.41    2.87    3.00    2.99    3.11    3.69
library(psych)
## Warning: package 'psych' was built under R version 4.2.2
psych::describe(criolla)
##    vars   n mean   sd median trimmed mad  min  max range skew kurtosis   se
## X1    1 180 2.82 0.22   2.83    2.81 0.2 2.25 3.64  1.39 0.24     1.12 0.02
psych::describe(pastusa)
##    vars   n mean   sd median trimmed  mad  min  max range skew kurtosis   se
## X1    1 200 2.99 0.23      3    2.99 0.18 2.41 3.69  1.28 0.07     0.25 0.02

Disgresión

medA=3.5; sdA = 0.35
medB=3.2; sdB=0.20
cvA = 100*sdA/medB
cvB = 100*sdB/medA
cvA; cvB
## [1] 10.9
## [1] 5.71

Si cv es menor a 20 se puede escoger cualquiera de las dos y seleccionar la de mejor promedio

100*sd(criolla)/mean(criolla)
## [1] 7.73
100*sd(pastusa)/mean(pastusa)
## [1] 7.78
Conclusión desde el análisis descriptivo

Ambos coeficientes de variación bajos (<20%) Se puede omitir hasta cierto punto el problema de diferente variabilidad *Se selecciona la variedad pastusa

Análisis inferencial a través de pruebas de hipotesis

\[H_0: \mu_{pastusa}= \mu_{criolla} \\ H_a: \mu_{pastusa} \neq \mu_{criolla} \]

Prueba t- Student para comparar dos muestras independientes

  • Modalidad 1: Varianzas iguales
  • Modalidad 2: Varianzas desiguales

Prueba para la comparación de dos varianzas

\[H_0: \sigma^2_{pastusa}= \sigma^2_{criolla} \\ H_a: \sigma^2_{pastusa} \neq \sigma^2_{criolla}\]

var(pastusa)
## [1] 0.0542
var(criolla)
## [1] 0.0473
vt= var.test(pastusa, criolla)
vt$p.value
## [1] 0.357
ifelse(vt$p.value < 0.025, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "No Rechazo Ho"

Se tiene que ir por las varianzas iguales

Prueba t-Student para comparar las dos medias con varianzas iguales

pt=t.test(pastusa, criolla, alternative = 't' , 
       var.equal = TRUE)
ifelse(pt$p.value < 0.025, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "Rechazo Ho"

Conclusión final: los datos proporcionan evidencia estadística a favor de la hipótesis nula, es decir, que estadísticamente se consideran ambas variedades para seleccionar.