\[Prueba\ T-Dos\ muestras \ ¿dependientes/independientes?\]

Se propuso un plan de fertilización en papa criolla tal como se muestra a continuación:

fertilizacion <- data.frame("N"= 100,"P2o3"=50, "K2O"=100, "CaO"=30, "MgO"=24, "S"=200, "Fe"=0, "Mn"=0, "Cu"=0.30, "Zn"=200, "B"=1.2)
fertilizacion
##     N P2o3 K2O CaO MgO   S Fe Mn  Cu  Zn   B
## 1 100   50 100  30  24 200  0  0 0.3 200 1.2

y se midió a los 45 y 77 días después de la siembra el peso de tubérculos (Kg/ha) más raíces encontrando los siguientes datos:

d45 = sort(c(69, 66, 72, 68, 65, 66, 67, 68, 69, 65, 66, 68, 64, 67, 60, 68))
d77 = sort(c(873, 850, 832, 834, 843, 840, 855, 790, 905, 910, 920, 840, 832, 800, 759, 812))

Determinar al 95% de nivel de confianza, si se incrementó la medida de rendimiento en las dos evaluaciones registradas. Haga una representación gráfica(graficos exploratorios, y adicionales que usted crea necesarios) para ilustrar el comportamiento de ambas medidas. Calcule el cambio relativo porcentual promedio entre ambos tiempos de evaluación. Calcule el coeficiente de correlación de Pearson y Sperman entre ambas medidas,(diferencias por que , cual usar). Explique sus resultados.

Hipotesis (escribirla)

\[H^{n}=El promedio del peso de los tuberculos es igual para los días 45 y 77.\] \[H^{a}=El promedio del peso de los tuberculos es diferente en los dias 45 y 77.\]

Medidas=data.frame(dias=rep(c("d45","d77"), c(16,16)), "peso de tuberculos" =c(d45,d77))
head(Medidas)
##   dias peso.de.tuberculos
## 1  d45                 60
## 2  d45                 64
## 3  d45                 65
## 4  d45                 65
## 5  d45                 66
## 6  d45                 66

primero haré la prueba t- student para determinar el 95 % de confianza para aprobar hipotesís nula o alterna.

var.test(x=d45,y=d77, ratio = 1)
## 
##  F test to compare two variances
## 
## data:  d45 and d77
## F = 0.0037014, num df = 15, denom df = 15, p-value = 3.661e-15
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.001293236 0.010593640
## sample estimates:
## ratio of variances 
##        0.003701362
t.test(x=d45,y=d77,alternative="t",var.equal=F,conf.level=0.95)
## 
##  Welch Two Sample t-test
## 
## data:  d45 and d77
## t = -71.308, df = 15.111, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -799.8886 -753.4864
## sample estimates:
## mean of x mean of y 
##   66.7500  843.4375

##Comprobamos si hay normalidad con shapiro (Spearman)

tapply(Medidas$peso.de.tuberculos,Medidas$dias, shapiro.test)
## $d45
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.93561, p-value = 0.2987
## 
## 
## $d77
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.95785, p-value = 0.623

#como se observa los datos son normales por shapiro test ya que el p-valor es mayor a 0.05

Podemos usar el T-test sin ningun problema (sus p-valor estan por encima del 5%) ## Primero debemos revisar correlacion entre variables por Person.

cr=cor.test(d45, d77, conf.level = 0.95, alterative='t');cr
## 
##  Pearson's product-moment correlation
## 
## data:  d45 and d77
## t = 10.171, df = 14, p-value = 7.567e-08
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.8280228 0.9788371
## sample estimates:
##       cor 
## 0.9385112
ifelse(cr$p.value<0.05,'Correlacion NO nula','Correlacion nula')
## [1] "Correlacion NO nula"

como la correlacion no es nula se utiliza
\[t.studen para muestras pariadas (pariedad = T)\]

cr2= t.test(d45, d77, alternative = "t", mu = 0, conf.level = 0.95, paired = T);cr2
## 
##  Paired t-test
## 
## data:  d45 and d77
## t = -75.747, df = 15, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -798.5428 -754.8322
## sample estimates:
## mean of the differences 
##               -776.6875

Yo utilizaria el metodo de Spearman porque primero me comprueba la correlación con un e menor (-08), luego para hallar la diferencia siguiendo el método de la pariedad me da el resultado que comparo con el método del la preuba t-student y el resultado se asemeja más, por esto para mi es más confiable.

library(ggplot2)
ggplot(Medidas, aes(y=peso.de.tuberculos,x=dias, fill=dias))+
  geom_violin()+
  geom_boxplot()+
  geom_jitter()+
  theme_bw()

##Cambio relativo porcentual promedio entre ambos tiempos de evaluación.

tapply(Medidas$peso.de.tuberculos,Medidas$dias, mean)
##      d45      d77 
##  66.7500 843.4375

Tenemos el promedio del peso de los turbeculos en los días 45 y 77. Luego, vamos a calcular el porcentaje promedio del cambio relativo entre los dos tiempos, se restan las dos medias y se dividen por el promedio de del día 45, se divide en 100 para sacr el porcentaje.

car=round(((843.4375-66.7500)/843.4375)*100)
paste("El cambio porcentual es",car,"%")
## [1] "El cambio porcentual es 92 %"
Medidas2=data.frame("d45"=d45,"d77"=d77)
head(Medidas2)
##   d45 d77
## 1  60 759
## 2  64 790
## 3  65 800
## 4  65 812
## 5  66 832
## 6  66 832
library(PerformanceAnalytics)
## Loading required package: xts
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## 
## Attaching package: 'PerformanceAnalytics'
## The following object is masked from 'package:graphics':
## 
##     legend
chart.Correlation(Medidas2,histogram = T, method = "pearson")