#Pruebas de Hipotesis

Problema 1

Se desea comparar 2 tipos de papa con base al rendimiento (Biomasa de tuberculos), un ensayo utilizó 2 variades (criolla y pastodsa) involucrando 180 plantas de la primera variedad y 200 de la segunda. Los datos de rendimiento en la cosecha se presenta en los siguientes vectores

options(digits=3)
criolla= rnorm(n=180, mean =2.8, sd= 0.2)
pastusa= rnorm(n=200, mean=3.0,  sd=0.21)
par(mfrow=c(1,2))
hist(criolla)
abline(v=mean(criolla), col="red", ldw=3)
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...): "ldw" is
## not a graphical parameter
hist(pastusa)
abline(v=mean(pastusa), col= "red", ldw=3)
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...): "ldw" is
## not a graphical parameter

par(mfrow=c(1,2))
boxplot(criolla, main="Criolla", ylab="Rto (Kg/planta)")
boxplot(pastusa, main="Criolla", ylab="Rto (Kg/planta)")

summary(criolla)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.27    2.69    2.82    2.81    2.92    3.33
summary(pastusa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.31    2.89    3.02    3.01    3.15    3.55
library(psych)
## Warning: package 'psych' was built under R version 4.2.2
psych::describe(criolla)
##    vars   n mean   sd median trimmed  mad  min  max range  skew kurtosis   se
## X1    1 180 2.81 0.18   2.82    2.81 0.17 2.27 3.33  1.05 -0.19     0.08 0.01
psych::describe(pastusa)
##    vars   n mean   sd median trimmed mad  min  max range  skew kurtosis   se
## X1    1 200 3.01 0.22   3.02    3.02 0.2 2.31 3.55  1.24 -0.59     0.76 0.02

Disgresion

medA = 3.5; sdA = 0.35
medB = 3.2; sdB = 0.20
# Cual seleccionar?
#Coeficiente de variación cv = 100* sd/mean
cvA = 100 * sdA/medA
cvB = 100 * sdB/medB

cvA; cvB
## [1] 10
## [1] 6.25
100 * sd(criolla) / mean(criolla)
## [1] 6.32
100 * sd(pastusa) / mean(pastusa)
## [1] 7.35

Conclusion desde el analisis descriptivo

Ambos de coeficiente de variación bajos (<20%) Se puede omitir el problema de diferente variabilidad *Se selecciona la variedad de mayor rendimiento promedio

Analisis inferencial a traves de hipotesis

\[H_0: \mu_{patusa} = \mu_{criolla} \\ H_a: \mu_{patusa} \neq \mu_{criolla}\]

Prueba t-student para comparar dos muestras independientes

Modalidad 1: Varianzas iguales Modalidad 2: varianzas desiguales

Prueba de comparación de dos varianzas

\[H_0: \sigma^2_{pastusa} = \sigma^2_{criolla} \\ H_a: \sigma^2_{pastusa} \neq \sigma^2_{criolla}\]

var(pastusa)
## [1] 0.0489
var(criolla)
## [1] 0.0314
vt= var.test(pastusa, criolla)
vt$p.value
## [1] 0.00265
ifelse(vt$p.value < 0.025, "Rechazo Ho", "No rechazo Ho")
## [1] "Rechazo Ho"

Prueba t-Student para comparar las dos medias con varianzas iguales

pt = t.test(pastusa, criolla,
       alternative = "t", 
       var.equal = TRUE)

ifelse(pt$p.value < 0.025, "Rechazo Ho", "No rechazo")
## [1] "Rechazo Ho"

Conclusion final: Los datos proporcionan la evidencia estadistica a favor de la hipotesis nula, es decir, que estadisticamente se consideran ambas variedades como de igual rendimiento. Cualquiera de las variedades es igual de buena