#Prueba de hipótesis

Problema 1:

Se desea comparar dos genotipos de papa con base al rendimiento (biomasa de tubérculos). Un ensayo utilizó dos variedades (criolla y pastusa), involucrando 180 plantas de la primera variedad y 200 de la segunda. Los datos de rendimiento en la cosecha se presentan en los siguientes vectores

#Variables

options(digits=3)
criolla = rnorm(n=180, mean=2.8, sd=0.2)
pastusa = rnorm(n=200, mean=3.0, sd=0.21)
#criolla
#pastusa

#Histograms

par(mfrow=c(1,2))
hist(criolla, col='darkcyan')
abline(v=mean(criolla), col='pink', lwd=3 )
hist(pastusa, col='darkcyan')
abline(v=mean(pastusa), col='pink', lwd=3 )

#Bloxplot

par(mfrow=c(1,2))
boxplot(criolla, col='darkcyan', xlab ='Criolla', ylab='Rto(kg/planta)')
boxplot(pastusa, col='darkcyan', xlab = 'Pastusa', ylab= 'Rto(kg/planta)')

#Summary

summary(criolla)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.16    2.66    2.81    2.79    2.94    3.23
summary(pastusa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.55    2.84    2.99    2.99    3.13    3.55

Resumen básico, no es suficiente para tomar decisiones.

library(psych)
psych::describe(criolla)
##    vars   n mean  sd median trimmed  mad  min  max range  skew kurtosis   se
## X1    1 180 2.79 0.2   2.81     2.8 0.21 2.16 3.23  1.07 -0.32    -0.02 0.01
psych::describe(criolla)
##    vars   n mean  sd median trimmed  mad  min  max range  skew kurtosis   se
## X1    1 180 2.79 0.2   2.81     2.8 0.21 2.16 3.23  1.07 -0.32    -0.02 0.01

Se pone énfasis en la desviación estándar (sd), es decir, que tan dispersos están los datos. En este caso, ambas variedades tienen dispersiones iguales.

#Disgresion

medA=3.5; sdA=0.35
medB=3.2; sdB=0.20
CvA = 100*sdA/medA
CvB = 100*sdB/medB
CvA;CvB
## [1] 10
## [1] 6.25

En este caso, hay una mabiguedad de decisiones. Por ende, se calcula el coeficiente de variación, obtenido los resultados vemos que no superan el 20%, por ende nos vamos por promedio y así escogemos el A.

#Coeficiente de variación en criolla y pastusa

100*sd(criolla)/mean(criolla)
## [1] 7.19
100*sd(pastusa)/mean(pastusa)
## [1] 6.61

#Conclusión desde el análisis descriptivo

#Análisis inferencial a través de pruebas de hipótesis

\[H_0: \mu_{pastusa} = \mu_{criolla}\\ H_a: \mu_{pastusa} \neq \mu_{criolla}\]

#Prueba t-student para comparar dos promedios independientes

Modalidad 1: varianzas iguales Modalidad 2: Varianzas desiguales

#Prueba para la comparación de dos varianzas

\[H_0: \sigma^2_{pastusa} = \sigma^2_{criolla} \\ H_a: \sigma^2_{pastusa} \neq \sigma^2_{criolla}\]

#Calcular varianza

var(pastusa)
## [1] 0.039
var(criolla)
## [1] 0.0402
vt=var.test(pastusa, criolla)
vt$p.value
## [1] 0.836
ifelse(vt$p.value < 0.025, 'Rechaza Ho', 'No rechazo Ho')
## [1] "No rechazo Ho"

Para que una varianza sea mayor a la otra, debe ser por lo menos 4 veces mayor una que otra.

En este caso se usa el nivel de significancia de 0.025 en vez de 0.05, porque en este caso tenemos dos pruebas.

#Prueba t para comparar las dos medias con varianzas iguales

pt= t.test(pastusa, criolla, alternative = 't', 
       var.equal = TRUE)
ifelse(pt$p.value< 0.025,'Rechaza Ho', 'No rechazo Ho')
## [1] "Rechaza Ho"

#Conclusión

Conclusión final: Los datos proporcionan evidencia estadística a favor de la hipótesis nula. Es decir, que estadítica se consideran ambas variedades como de igual rendimiento.