#Caso 2: Prueba de hipótesis para dos muestras pareadas (O correlacionadas)
#Muestras pareada –> Existe algún tipo de relación entre lo que se mide
library(readxl)
datosx <- read_excel("C:/Users/stefa/Downloads/datoss.xlsx",
col_types = c("numeric", "numeric", "skip",
"skip", "skip"))
#View(datosx)
set.seed(123)
cra = rnorm(n=80, mean=2.8, sd=0.2)
hist(cra, col='darkcyan', xlim = c(2.2, 3.4), ylim = c(0,20))
abline(v=mean(cra), col='pink', lwd=3 )
#La curva normal no está acotada, son mejores los porcentajes que están acotados de 1-100,el problema está en que se están usando dichos porcentaje en curvas asintóticas (-infinito<x<infinito).
#La variable puede ser porcentual y aún así usarse en la curva.
plot(datosx$CRA60,
datosx$CRA80,
xlab = 'CRA 60', ylab = 'CRA 80')
#La retención de agua a los 80 está bastante relacionado a los 60. Lo que significa que ambas variables están correlacionadas.
##Coeficiente de correlación
cor(datosx$CRA60, datosx$CRA80)
## [1] 0.9997815
#Entre más se acerca a 1, más correlacionadas están las variables.
Ejemplos en algunas áreas * Suelos: Si se mide la Mo de los primero 20cm y luego a 40cm, posiblemente se encuentre correlación entre ambas medidas, a mayor profundidad habrá menor MO. \(H_0: \mu_{20} = \mu_{40}\)
Frutales: Se quiere medir el diámetro de durazno en dos fechas, seguramente estará correlacionados ya que a mayor número de días se espera tener mayor diámetro. \(H_0: \mu_{70_{ddd}} = \mu_{100_{ddd}}\)
Microbiología: Al medir el diámetro medio a colonias creciendo en agar, se puede estar interesado en comparar un diámetro inicial y uno final, al realizar una medición posterior y se encuentre un patrón similar. \(H_0: \mu_{10días} = \mu_{20días}\)
Ecología: Al medi el oxígeno disuelto en agua, el cuál depende de la temperatura de la laguna y la profundidad de la medida, por lo cuál es probable que a una profundidad se encuentre una concentración diferente a una profundidad mayor, seguramente estarán correlacionadas. \(H_0: \mu_{Oxígeno_{50cm}} = \mu_{Oxígeno_{100cm}}\)
Café: En la maduración de granos de café, cuando se mide el color existen diferentes espacios de color, entre las cuáles pueden estar LAB o RGB con los que a su vez se pueden calcular índices, (por ejemplo \(GLI=\frac{2*G-(R+B)}{2*G+R+B}\)) que permiten en los granos de café determinar el grado de maduración del grano; si está más verde (inmaduro) o rojo (maduro). \(H_0: \mu_{GLI_{50cm}} = \mu_{GLI_{100cm}}\)
\(H_0: \mu_{CRA_{60}} = \mu_{CRA_{80}}\)
#En este caso, ya que ambos son iguales, se elige CRA 60 porque requiere un menor coste.
#Prueba 3
#t-student para 2 muestras pareadas
prueba3 = t.test(datosx$CRA60,
datosx$CRA80,
alternative = 't', # t = two.sided
mu = 0,
paired = TRUE)
ifelse(prueba3$p.value<0.05, 'Rechazo Ho', 'No rechazo Ho')
## [1] "Rechazo Ho"
El CRA 60 estadísticamente no es igual al CRA 80.
boxplot(datosx)