problema 1: se desea comparar genotipos de papa con base al redimiento (biomasa de tuberculos). Un ensayo utilizó dos variedades (criolla y pastusa) involucrando 180 plantas de la primera variedad y 200 de las segunda. Los datos de rendimineto en la cosecha se presenta en los siguientes vectores

options (digits = 3)
criolla = rnorm(n = 180, mean = 2.8, sd = 0.2)
pastusa = rnorm(n = 200, mean = 3.0, sd = 0.21)

criolla
##   [1] 3.00 2.76 2.70 2.83 2.53 2.72 2.82 2.70 2.76 2.80 2.80 2.84 3.30 2.44 2.48
##  [16] 2.64 2.43 2.88 3.15 2.90 2.83 2.87 2.43 2.97 2.51 2.95 2.93 2.76 2.88 2.54
##  [31] 3.03 3.01 2.99 2.97 2.80 2.65 2.84 2.79 2.75 2.89 3.44 2.80 2.96 2.74 2.69
##  [46] 2.96 3.03 2.72 2.70 2.69 2.69 2.88 2.79 3.00 2.71 3.05 2.76 2.80 2.63 2.80
##  [61] 3.19 3.31 2.49 2.73 2.61 2.93 2.88 2.77 2.89 2.63 2.73 2.96 2.67 3.09 2.47
##  [76] 2.72 2.79 2.57 2.97 2.38 3.04 2.78 2.47 2.89 2.57 2.76 2.78 2.99 2.73 2.79
##  [91] 2.61 2.82 3.18 2.84 2.75 2.63 2.66 2.56 3.12 3.02 2.82 2.68 2.83 2.78 2.97
## [106] 3.12 2.89 2.72 2.85 2.98 2.98 2.58 2.68 2.84 2.79 2.87 2.87 2.60 2.78 2.31
## [121] 2.78 2.79 2.85 2.96 2.77 2.92 2.49 2.73 3.05 3.09 2.65 2.89 2.40 2.71 2.93
## [136] 2.66 2.85 2.51 2.28 2.56 2.97 3.07 2.95 2.76 2.95 2.91 2.91 2.91 2.73 2.74
## [151] 2.68 2.56 2.49 2.77 2.77 2.71 2.47 2.60 2.95 2.89 2.88 2.76 2.81 2.90 2.29
## [166] 2.83 2.73 2.73 3.06 2.73 3.03 2.81 3.24 3.07 2.86 2.92 2.82 2.75 2.72 2.84
pastusa
##   [1] 3.01 3.32 3.01 2.98 3.00 2.86 3.14 2.64 2.92 3.07 3.36 2.79 2.91 3.12 2.64
##  [16] 2.70 3.34 3.13 3.16 3.18 3.24 3.21 2.71 3.27 2.49 3.14 2.91 2.51 2.68 2.92
##  [31] 2.98 3.14 3.16 3.30 2.86 3.57 2.90 3.05 2.64 3.35 2.89 3.44 2.72 2.85 3.02
##  [46] 2.99 3.15 2.95 2.80 3.08 3.06 3.12 2.80 2.90 3.45 3.11 3.08 3.18 3.31 3.03
##  [61] 3.26 3.11 3.25 3.01 2.78 2.72 3.16 3.08 3.16 3.18 3.53 3.15 3.51 3.30 3.07
##  [76] 3.21 3.32 3.22 2.96 2.97 2.74 2.62 2.93 2.73 2.33 2.74 2.99 2.84 3.27 3.29
##  [91] 2.99 2.68 3.10 3.10 3.12 3.49 2.78 3.09 2.98 3.52 3.00 3.16 3.45 2.87 3.01
## [106] 3.09 2.98 2.98 2.85 2.98 2.69 2.87 2.98 2.73 3.11 2.56 2.78 3.14 2.97 3.02
## [121] 3.10 3.06 2.91 3.42 2.57 2.65 3.20 2.70 3.09 2.85 3.01 2.87 3.27 3.01 3.32
## [136] 2.86 2.87 3.08 3.11 2.91 3.37 3.29 2.83 2.89 2.91 2.84 2.69 2.82 3.20 3.33
## [151] 2.82 3.13 2.83 3.15 2.96 2.88 2.89 3.07 3.05 3.44 3.21 3.05 3.09 3.04 2.74
## [166] 3.12 3.23 3.07 3.05 2.59 2.77 2.79 2.77 3.14 3.29 2.91 3.09 2.62 3.13 3.08
## [181] 2.98 3.28 3.20 2.91 3.38 2.86 3.27 3.14 2.89 2.93 3.08 3.37 2.84 2.90 3.24
## [196] 2.70 3.00 2.61 3.08 3.27
par (mfrow = c(1,2))
hist(criolla)
abline (v = mean(criolla), col = 'red', lwd = 3)
hist(pastusa)
abline (v = mean(pastusa), col = 'red', lwd = 3)

par (mfrow = c(1,2))
boxplot(criolla, xlab='criolla', ylab='Rto (kg/planta)')
boxplot(pastusa, xlab='pastusa', ylab='Rto (kg/planta)')

summary(criolla)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.28    2.70    2.79    2.80    2.92    3.44
summary(pastusa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.33    2.86    3.02    3.02    3.16    3.57
library(psych)
## Warning: package 'psych' was built under R version 4.2.2
psych::describe(criolla)
##    vars   n mean  sd median trimmed  mad  min  max range skew kurtosis   se
## X1    1 180  2.8 0.2   2.79     2.8 0.16 2.28 3.44  1.16 0.01     0.52 0.01
psych::describe(pastusa)
##    vars   n mean   sd median trimmed  mad  min  max range  skew kurtosis   se
## X1    1 200 3.02 0.23   3.02    3.02 0.22 2.33 3.57  1.24 -0.07    -0.25 0.02

Disgresión

medA = 3.5; sdA = 0.35
medB = 3.2; sdB = 0.20
# ¿Cual seleccionar?
# Coeficiente de Variación cv = 100 * sd/mean
cvA = 100 * sdA/medA
cvB = 100 * sdB/medB
cvA;cvB
## [1] 10
## [1] 6.25

#Ahora en cv en Criolla y Pastusa

100 * sd(criolla) / mean(criolla)
## [1] 6.97
100 * sd(pastusa) / mean(pastusa)
## [1] 7.61

Conclusión desde el análisis descriptivo

  • Ambos coeficientes de variación son bajos
  • Se puede omitir hasta cierto punto el problema de diferente variablidad
  • Selecciono la variedad de mayor rendimiento promedio

Análisis Inferencial a Traves de Pruebas de Hipótesis

\[H_0: \m_{pastusa} = \mu_{criolla}\\ H_a: \mu_{pastusa} \neq \mu_{criolla}\]

prueba t-student para comparar dos promedios independientes

Modalidad 1: varianzas iguales Modalidad 2: varianzas desiguales

Prueba para la comparación de dos varianzas

\[H_0: \sigma^2_{pastusa} = \sigma^2_{criolla}\\ H_a: \sigma^2_{pastusa} \neq \sigma^2_{criolla}\]

var(pastusa)
## [1] 0.0528
var(criolla)
## [1] 0.0381
vt = var.test(pastusa, criolla)
vt$p.value
## [1] 0.0262
ifelse(vt$p.value < 0.025, 'Rechazo HO', 'No Rechazo Ho')
## [1] "No Rechazo Ho"

Prueba t-student para comparar las dos medias con varianzas iguales

pt = t.test(pastusa, criolla, alternative = 't', var.equal = TRUE)

ifelse(pt$p.value<0.025, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "Rechazo Ho"

Conclusión final: los datos proporcionan evidencia estadística a favor de la hipótesis nula, es decir, que estadísticamente se consideran ambas variedades como de igual rendimiento. Cualquiera de las variedades es igual de buena.