#Caso 2: Prueba de hipótesis para dos muestras pareadas (O correlacionadas)

#Muestras pareada –> Existe algún tipo de relación entre lo que se mide

library(readxl)
datosx <- read_excel("C:/Users/stefa/Downloads/datoss.xlsx", 
    col_types = c("numeric", "numeric", "skip", 
        "skip", "skip"))
#View(datosx)
set.seed(123)

cra = rnorm(n=80, mean=2.8, sd=0.2)
hist(cra, col='darkcyan', xlim = c(2.2, 3.4), ylim = c(0,20))
abline(v=mean(cra), col='pink', lwd=3 )

#La curva normal no está acotada, son mejores los porcentajes que están acotados de 1-100,el problema está en que se están usando dichos porcentaje en curvas asintóticas (-infinito<x<infinito).

#La variable puede ser porcentual y aún así usarse en la curva.

plot(datosx$CRA60,
     datosx$CRA80,
     xlab = 'CRA 60', ylab = 'CRA 80')

#La retención de agua a los 80 está bastante relacionado a los 60. Lo que significa que ambas variables están correlacionadas.

##Coeficiente de correlación

cor(datosx$CRA60, datosx$CRA80)
## [1] 0.9997815

#Entre más se acerca a 1, más correlacionadas están las variables.

Ejemplos en algunas áreas * Suelos: Si se mide la Mo de los primero 20cm y luego a 40cm, posiblemente se encuentre correlación entre ambas medidas, a mayor profundidad habrá menor MO. \(H_0: \mu_{20} = \mu_{40}\)

\(H_0: \mu_{CRA_{60}} = \mu_{CRA_{80}}\)

#En este caso, ya que ambos son iguales, se elige CRA 60 porque requiere un menor coste.

#Prueba 3
#t-student para 2 muestras pareadas

prueba3 = t.test(datosx$CRA60,
       datosx$CRA80,
       alternative = 't', # t = two.sided
       mu = 0,
       paired = TRUE)

ifelse(prueba3$p.value<0.05, 'Rechazo Ho', 'No rechazo Ho')
## [1] "Rechazo Ho"

El CRA 60 estadísticamente no es igual al CRA 80.

boxplot(datosx)