title: “Taller 2” author: “Nicol Dayanna Garavito M.” date: “11/10/2021” output: html_document —

\[Prueba\ T-Dos\ muestras \ ¿Dependientes/Independientes?\]

Se propuso un plan de fertilización en papa criolla tal como se muestra a continuación:

fertilizacion <- data.frame("N"= 100,"P2o3"=50, "K2O"=100, "CaO"=30, "MgO"=24, "S"=200, "Fe"=0, "Mn"=0, "Cu"=0.30, "Zn"=200, "B"=1.2)
fertilizacion
##     N P2o3 K2O CaO MgO   S Fe Mn  Cu  Zn   B
## 1 100   50 100  30  24 200  0  0 0.3 200 1.2

Y se midió a los 45 y 77 días después de la siembra el peso de tubérculos (Kg/ha) más raíces encontrando los siguientes datos:

d45 = sort(c(69, 66, 72, 68, 65, 66, 67, 68, 69, 65, 66, 68, 64, 67, 60, 68), decreasing = F)
d77 = sort(c(873, 850, 832, 834, 843, 840, 855, 790, 905, 910, 920, 840, 832, 800, 759, 812), decreasing = F)
  1. Determinar al 95% de nivel de confianza, si se incrementó la medida de rendimiento en las dos evaluaciones registradas.

HIPOTESIS: El peso de los tuberculos en el día 77 tendrá una diferencia estadisticamente significativa respecto a la medición del día 45

tratamientof= t.test(x= d45,y= d77,
                 alternative = "t",var.equal = T,conf.level = 0.95); tratamientof
## 
##  Two Sample t-test
## 
## data:  d45 and d77
## t = -71.308, df = 30, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -798.9321 -754.4429
## sample estimates:
## mean of x mean of y 
##   66.7500  843.4375

R: La prueba T nos permite conocer el nivel de aceptación o rechazo de la hipotesis de un experimento con el 95% en el nivel de confianza. Está arrojó que el P valor es de 2.2e-16 lo que significa que se rechaza la hipotesis nula ya que las medias de las dos mediciones tienen una diferencia estadisticamente significativa y/o no son iguales.

  1. Haga una representación gráfica (graficos exploratorios y adiconales que usted crea necesarios) para ilustrar el comportamiento de ambas medidas.
library(ggplot2)

nicol<- data.frame(datos= c(d45,d77), Dias = c("Día 45","Día 77"))


ggplot(nicol,aes(datos,fill= Dias))+ 
  geom_histogram(bins = 10) + ggtitle("Histograma D45 VS D77")

boxplot(d45,d77,col =c("blue","purple"),
        xlab="Día de medición",
        ylab="Peso de los tubérculos (Kg/ha)",
        main="Distribución de los datos D45 vs D77")
legend(x="topleft",legend = c("D45","D77"),fill  = c("blue","purple"),title = "Día de medición")
points(mean(d45),col="black",pch=18,cex=1)
points(x=2,mean(d77),col="black",pch=18,cex=1)

library(ggplot2)

nicol<- data.frame(Datos= c(d45,d77), Dias = c("Día 45","Día 77"))


ggplot(nicol,aes(Datos,fill= Dias))+ 
  geom_density () + ggtitle("Histograma D45 VS D77")

  1. Calcule el cambio relativo porcentual promedio entre ambos tiempos de evaluación.
a<-mean(d45)
b<-mean(d77)

c<-(b-a)/100;c
## [1] 7.766875

R: Para el calculo del cambio porcentual entre las medidas obtenidas del dia 45 al día 77 se calculo la tasa. Está arrojo un valor de 7.766875 lo que significa que hubo un crecimiento del 7.76% del día 45 al día 77

  1. Calcule el coeficiente de correlación de Pearson y sperman entre ambas medidas,(diferencias por que, cual usar). Explique sus resultados.
cor.test(x= d45, y= d77, method = "spearman")
## Warning in cor.test.default(x = d45, y = d77, method = "spearman"): Cannot
## compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  d45 and d77
## S = 7.5642, p-value = 5.488e-13
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.9888762
cor.test(x= d45, y= d77, mothod="pearson")
## 
##  Pearson's product-moment correlation
## 
## data:  d45 and d77
## t = 10.171, df = 14, p-value = 7.567e-08
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.8280228 0.9788371
## sample estimates:
##       cor 
## 0.9385112

R: El coeficiente de Spearman por su parte nos permite calcular la correlación entre dos variables, se recomienda urilizarla cuando los datos son extremos o presentan mucha dispersión lo que influye en mayor medida al coeficiente de Pearson. En el coeficiente de Spearman los valores cercanos a 1 indican una correlación fuerte y positiva y los valores que se encuentran cercanos a –1 indican una correlación fuerte y negativa. La correlación de nuestras medidas con el coeficiente de Spearman es de 0.9888762. En el coeficiente de Pearson un valor menor que 0 indica que existe una correlación negativa y un valor mayor que 0 indica que existe una correlación positiva. En el caso de nuestras mediciones el coeficiente de Spearman es de 0.9385112. Como se puede observar, el coeficiente de Spearman arrojó una correlación mayor al coeficiente de Pearson lo que se puede explicar por el nivel de afectación de los datos extremos. En este caso especifico es mejor utilizar el coeficiente de Spearman.