#Prueba de hipótesis
Se desea comparar dos genotipos de papa con base al rendimiento (biomasa de tubérculos). Un ensayo utilizó dos variedades (criolla y pastusa), involucrando 180 plantas de la primera variedad y 200 de la segunda. Los datos de rendimiento en la cosecha se presentan en los siguientes vectores
#Variables
options(digits=3)
criolla = rnorm(n=180, mean=2.8, sd=0.2)
pastusa = rnorm(n=200, mean=3.0, sd=0.21)
#criolla
#pastusa
#Histograms
par(mfrow=c(1,2))
hist(criolla, col='darkcyan')
abline(v=mean(criolla), col='pink', lwd=3 )
hist(pastusa, col='darkcyan')
abline(v=mean(pastusa), col='pink', lwd=3 )
#Bloxplot
par(mfrow=c(1,2))
boxplot(criolla, col='darkcyan', xlab ='Criolla', ylab='Rto(kg/planta)')
boxplot(pastusa, col='darkcyan', xlab = 'Pastusa', ylab= 'Rto(kg/planta)')
#Summary
summary(criolla)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.16 2.66 2.81 2.79 2.94 3.23
summary(pastusa)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.55 2.84 2.99 2.99 3.13 3.55
Resumen básico, no es suficiente para tomar decisiones.
library(psych)
psych::describe(criolla)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 180 2.79 0.2 2.81 2.8 0.21 2.16 3.23 1.07 -0.32 -0.02 0.01
psych::describe(criolla)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 180 2.79 0.2 2.81 2.8 0.21 2.16 3.23 1.07 -0.32 -0.02 0.01
Se pone énfasis en la desviación estándar (sd), es decir, que tan dispersos están los datos. En este caso, ambas variedades tienen dispersiones iguales.
#Disgresion
medA=3.5; sdA=0.35
medB=3.2; sdB=0.20
CvA = 100*sdA/medA
CvB = 100*sdB/medB
CvA;CvB
## [1] 10
## [1] 6.25
En este caso, hay una mabiguedad de decisiones. Por ende, se calcula el coeficiente de variación, obtenido los resultados vemos que no superan el 20%, por ende nos vamos por promedio y así escogemos el A.
#Coeficiente de variación en criolla y pastusa
100*sd(criolla)/mean(criolla)
## [1] 7.19
100*sd(pastusa)/mean(pastusa)
## [1] 6.61
#Conclusión desde el análisis descriptivo
#Análisis inferencial a través de pruebas de hipótesis
\[H_0: \mu_{pastusa} = \mu_{criolla}\\ H_a: \mu_{pastusa} \neq \mu_{criolla}\]
#Prueba t-student para comparar dos promedios independientes
Modalidad 1: varianzas iguales Modalidad 2: Varianzas desiguales
#Prueba para la comparación de dos varianzas
\[H_0: \sigma^2_{pastusa} = \sigma^2_{criolla} \\ H_a: \sigma^2_{pastusa} \neq \sigma^2_{criolla}\]
#Calcular varianza
var(pastusa)
## [1] 0.039
var(criolla)
## [1] 0.0402
vt=var.test(pastusa, criolla)
vt$p.value
## [1] 0.836
ifelse(vt$p.value < 0.025, 'Rechaza Ho', 'No rechazo Ho')
## [1] "No rechazo Ho"
Para que una varianza sea mayor a la otra, debe ser por lo menos 4 veces mayor una que otra.
En este caso se usa el nivel de significancia de 0.025 en vez de 0.05, porque en este caso tenemos dos pruebas.
#Prueba t para comparar las dos medias con varianzas iguales
pt= t.test(pastusa, criolla, alternative = 't',
var.equal = TRUE)
ifelse(pt$p.value< 0.025,'Rechaza Ho', 'No rechazo Ho')
## [1] "Rechaza Ho"
#Conclusión
Conclusión final: Los datos proporcionan evidencia estadística a favor de la hipótesis nula. Es decir, que estadítica se consideran ambas variedades como de igual rendimiento.