\[Prueba\ T-Dos\ muestras \ ¿dependientes/independientes?\]
Se propuso un plan de fertilización en papa criolla tal como se muestra a continuación:
fertilizacion <- data.frame("N"= 100,"P2o3"=50, "K2O"=100, "CaO"=30, "MgO"=24, "S"=200, "Fe"=0, "Mn"=0, "Cu"=0.30, "Zn"=200, "B"=1.2)
fertilizacion
## N P2o3 K2O CaO MgO S Fe Mn Cu Zn B
## 1 100 50 100 30 24 200 0 0 0.3 200 1.2
y se midió a los 45 y 77 días después de la siembra el peso de tubérculos (Kg/ha) más raíces encontrando los siguientes datos:
d45 = sort(c(69, 66, 72, 68, 65, 66, 67, 68, 69, 65, 66, 68, 64, 67, 60, 68))
d77 = sort(c(873, 850, 832, 834, 843, 840, 855, 790, 905, 910, 920, 840, 832, 800, 759, 812))
Determinar al 95% de nivel de confianza, si se incrementó la medida de rendimiento en las dos evaluaciones registradas. Haga una representación gráfica(graficos exploratorios, y adicionales que usted crea necesarios) para ilustrar el comportamiento de ambas medidas. Calcule el cambio relativo porcentual promedio entre ambos tiempos de evaluación. Calcule el coeficiente de correlación de Pearson y Sperman entre ambas medidas,(diferencias por que , cual usar). Explique sus resultados.
Hipotesis (escribirla)
\[H^{n}=El promedio del peso de los tuberculos es igual para los días 45 y 77.\] \[H^{a}=El promedio del peso de los tuberculos es diferente en los dias 45 y 77.\]
Medidas=data.frame(dias=rep(c("d45","d77"), c(16,16)), "peso de tuberculos" =c(d45,d77))
head(Medidas)
## dias peso.de.tuberculos
## 1 d45 60
## 2 d45 64
## 3 d45 65
## 4 d45 65
## 5 d45 66
## 6 d45 66
var.test(x=d45,y=d77, ratio = 1)
##
## F test to compare two variances
##
## data: d45 and d77
## F = 0.0037014, num df = 15, denom df = 15, p-value = 3.661e-15
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.001293236 0.010593640
## sample estimates:
## ratio of variances
## 0.003701362
t.test(x=d45,y=d77,alternative="t",var.equal=F,conf.level=0.95)
##
## Welch Two Sample t-test
##
## data: d45 and d77
## t = -71.308, df = 15.111, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -799.8886 -753.4864
## sample estimates:
## mean of x mean of y
## 66.7500 843.4375
##Comprobamos si hay normalidad con shapiro (Spearman)
tapply(Medidas$peso.de.tuberculos,Medidas$dias, shapiro.test)
## $d45
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.93561, p-value = 0.2987
##
##
## $d77
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.95785, p-value = 0.623
#como se observa los datos son normales por shapiro test ya que el p-valor es mayor a 0.05
Podemos usar el T-test sin ningun problema (sus p-valor estan por encima del 5%) ## Primero debemos revisar correlacion entre variables por Person.
cr=cor.test(d45, d77, conf.level = 0.95, alterative='t');cr
##
## Pearson's product-moment correlation
##
## data: d45 and d77
## t = 10.171, df = 14, p-value = 7.567e-08
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.8280228 0.9788371
## sample estimates:
## cor
## 0.9385112
ifelse(cr$p.value<0.05,'Correlacion NO nula','Correlacion nula')
## [1] "Correlacion NO nula"
como la correlacion no es nula se utiliza
\[t.studen para muestras pariadas (pariedad = T)\]
cr2= t.test(d45, d77, alternative = "t", mu = 0, conf.level = 0.95, paired = T);cr2
##
## Paired t-test
##
## data: d45 and d77
## t = -75.747, df = 15, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -798.5428 -754.8322
## sample estimates:
## mean of the differences
## -776.6875
Yo utilizaria el metodo de Spearman porque primero me comprueba la correlación con un e menor (-08), luego para hallar la diferencia siguiendo el método de la pariedad me da el resultado que comparo con el método del la preuba t-student y el resultado se asemeja más, por esto para mi es más confiable.
library(ggplot2)
ggplot(Medidas, aes(y=peso.de.tuberculos,x=dias, fill=dias))+
geom_violin()+
geom_boxplot()+
geom_jitter()+
theme_bw()
##Cambio relativo porcentual promedio entre ambos tiempos de evaluación.
tapply(Medidas$peso.de.tuberculos,Medidas$dias, mean)
## d45 d77
## 66.7500 843.4375
Tenemos el promedio del peso de los turbeculos en los días 45 y 77. Luego, vamos a calcular el porcentaje promedio del cambio relativo entre los dos tiempos, se restan las dos medias y se dividen por el promedio de del día 45, se divide en 100 para sacr el porcentaje.
car=round(((843.4375-66.7500)/843.4375)*100)
paste("El cambio porcentual es",car,"%")
## [1] "El cambio porcentual es 92 %"
Medidas2=data.frame("d45"=d45,"d77"=d77)
head(Medidas2)
## d45 d77
## 1 60 759
## 2 64 790
## 3 65 800
## 4 65 812
## 5 66 832
## 6 66 832
library(PerformanceAnalytics)
## Loading required package: xts
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## Attaching package: 'PerformanceAnalytics'
## The following object is masked from 'package:graphics':
##
## legend
chart.Correlation(Medidas2,histogram = T, method = "pearson")