Prueba de hipotesis

Problema 1: Se desea comparar dos genetipos de pasa en base al rendimiento (biomasa de tuberculos). Un ensayo utilizo dos variedades (Criolla y Pastuza) involucrando 180 plantas de la primera variedad y 200 de la segunda. Los datos de rendimienos de la cosecha se presentan en los siguientes vectores

options(digits = 3)
Criolla = rnorm(n = 180, mean = 2.8, sd = 0.2)
Pastuza = rnorm(n = 200, mean = 3.0, sd = 0.2)

Criolla
##   [1] 3.22 2.81 3.03 2.58 3.19 2.95 2.94 2.57 3.07 2.75 2.64 2.72 2.65 3.04 2.71
##  [16] 2.96 3.00 2.49 2.86 2.81 3.05 2.94 2.77 2.95 2.67 2.76 2.75 2.65 2.87 2.80
##  [31] 2.87 2.57 2.72 2.87 2.93 2.83 2.74 2.56 2.66 2.63 2.85 2.96 3.04 2.33 3.12
##  [46] 2.62 2.66 2.80 2.84 2.78 2.64 2.80 2.83 2.79 2.60 2.57 3.01 2.53 2.74 2.55
##  [61] 3.04 3.08 2.74 2.87 2.95 2.70 2.70 2.85 2.87 2.60 2.53 2.78 2.94 2.69 2.86
##  [76] 2.68 2.74 2.78 3.00 2.54 2.89 3.35 2.55 2.55 2.73 3.03 2.59 2.73 2.37 2.86
##  [91] 2.62 2.89 2.72 2.65 2.90 2.89 2.87 2.49 2.68 2.75 2.71 2.78 2.62 2.50 2.83
## [106] 2.61 2.88 2.62 2.97 2.50 2.88 2.52 3.01 2.82 2.76 2.90 2.90 2.94 2.55 2.92
## [121] 2.77 2.75 3.16 2.79 2.60 2.85 2.72 3.31 3.03 3.03 2.98 2.98 2.73 2.86 3.19
## [136] 2.96 2.61 2.99 2.76 2.40 2.81 2.43 2.94 3.04 3.20 2.94 2.71 2.82 2.48 3.07
## [151] 2.86 2.87 2.94 2.82 2.70 2.65 2.67 3.16 2.89 2.53 2.87 2.72 2.37 2.68 2.84
## [166] 2.90 2.74 2.56 2.88 2.73 2.79 2.88 2.67 2.91 2.75 2.73 2.91 2.69 2.90 2.75
Pastuza
##   [1] 2.30 3.03 3.22 3.03 2.69 3.09 2.96 2.86 3.07 2.54 2.89 3.02 3.10 3.14 3.02
##  [16] 3.09 2.88 2.58 2.75 3.32 3.08 2.76 2.96 2.81 2.80 3.14 2.99 3.35 3.30 3.08
##  [31] 3.06 2.75 2.58 2.88 2.98 3.04 2.90 2.76 3.08 2.82 2.92 2.96 3.48 2.92 2.98
##  [46] 3.14 2.72 2.97 2.88 2.94 2.85 3.16 3.00 2.80 2.91 2.83 3.24 2.91 3.30 3.30
##  [61] 3.23 2.93 3.16 3.31 3.24 3.10 3.19 2.58 3.29 3.03 3.22 3.16 3.06 3.33 2.91
##  [76] 3.30 2.88 3.15 3.37 3.03 3.09 3.20 2.93 3.16 2.94 3.15 3.27 3.09 3.38 2.91
##  [91] 2.83 2.77 3.18 2.83 2.84 2.84 3.10 2.90 2.95 2.94 2.83 2.60 3.00 3.28 3.14
## [106] 2.91 3.33 3.37 3.07 3.12 2.85 2.50 2.77 3.07 2.65 3.16 3.00 3.04 2.93 2.86
## [121] 2.49 2.94 2.71 3.25 3.18 3.19 3.10 2.93 3.23 3.04 3.02 3.01 3.23 3.17 2.77
## [136] 3.18 2.60 2.93 2.90 3.13 2.61 3.12 3.06 2.73 2.76 3.16 2.85 2.94 2.98 3.07
## [151] 2.92 3.26 2.85 2.75 3.05 2.70 3.03 3.27 2.66 2.88 2.83 2.98 3.05 3.16 3.00
## [166] 2.95 3.23 2.86 2.81 3.05 2.73 3.05 2.76 3.02 3.10 2.84 2.94 3.05 2.98 3.14
## [181] 3.26 3.16 2.84 2.81 3.09 3.03 2.77 2.78 2.88 3.07 3.39 3.16 2.87 3.06 3.15
## [196] 3.13 2.72 3.13 3.11 2.91

Criolla

Pastuza

par(mfrow = c(1,2))
hist(Criolla, col="red")
abline(v=mean(Criolla), col="Purple", lwd = 3)
hist(Pastuza, col="green")
abline(v=mean(Pastuza), col="Purple", lwd = 3)

par(mfrow = c(1,2))
boxplot(Criolla, xlab="Criolla", ylab="Rendimiendo (kg/planta)", col="purple")
boxplot(Pastuza, Xlab="Pastuza", ylab="Rendimiendo (kg/planta)", col="red")

summary(Criolla)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.33    2.67    2.79    2.80    2.91    3.35
summary(Pastuza)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.30    2.85    3.01    2.99    3.14    3.48
library(psych)
## Warning: package 'psych' was built under R version 4.2.2
psych::describe(Criolla)
##    vars   n mean   sd median trimmed  mad  min  max range skew kurtosis   se
## X1    1 180  2.8 0.19   2.79    2.79 0.18 2.33 3.35  1.02 0.16     0.01 0.01
psych::describe(Pastuza)
##    vars   n mean  sd median trimmed  mad min  max range  skew kurtosis   se
## X1    1 200 2.99 0.2   3.01       3 0.21 2.3 3.48  1.17 -0.31     0.01 0.01

Disgresión

medA=3.5;sdA= 0.35
medB=3.2;sdB=0.20
#¿Cúal seleccionar?
#Coeficiente de variación cv = 100 * sd / mean

cvA = 100 * sdA/medA
cvB = 100 * sdB/medB

cvA
## [1] 10
cvB
## [1] 6.25
#Sí el coeficiente es menor a 20 ambos datos se escoge por promedio, sí no se escoge el que tenga un coeficiente menor

Coeficiente de variación para papa Criolla y Pastuza

100 * sd(Criolla)/mean(Criolla)
## [1] 6.7
100 * sd(Pastuza)/mean(Pastuza)
## [1] 6.74

Conclusión de analisis descriptivo

  • Coeficiente de variación en ambos casos (<20%)
  • Puedo omitir el problema de diferente variabilidad
  • Se selecciona la variabilidad de mayor rendimiento promedio: Pastuza

Analisis inferencial a traves de pruebas de hipotesis

\[H_0: \mu_{patusa} = \mu_{criolla} \\ H_a: \mu_{patusa} \neq \mu_{criolla}\]

Prueba t-student para comparar dos muestras independientes

Modalidad 1: Varianza iguales Modalidad 2: Varianzas desigualas

Prueba para comparación de dos varianzas

\[H_0: \sigma^2_{pastusa} = \sigma^2_{criolla} \\ H_a: \sigma^2_{pastusa} \neq \sigma^2_{criolla}\]

var(Criolla)
## [1] 0.0351
var(Pastuza)
## [1] 0.0406
vt=var.test(Criolla, Pastuza )
vt$p.value
## [1] 0.315
ifelse(vt$p.value<0.025, 'Rechazo Ho', 'No rechazo Ho')
## [1] "No rechazo Ho"

Prueba t-student para comparar las dos medias con varianzas iguales

pt=t.test(Criolla,Pastuza, 
       alternative = 't',
       var.equal = TRUE)
ifelse(pt$p.value <0.025, 'rechazo Ho', 'No rechazo')
## [1] "rechazo Ho"

Conclusión final: Los datos proporcionan evidencia estadistica a favor de la hipostesis nula, es decir, que estadisticamente se consideran ambas variables como de igual rendimiento. Cualquiera de las dos variedades es igual de buena.