Se desea evaluar 4 dosis de nitrógeno en el cultivo de arroz, se usó como respuesta un índice espectral conocido como ndvi que es el índice de Vegetación de Diferencia Normalizada que es un indicador simple de biomasa fotosintéticamente activa o, en términos simples, un cálculo de la salud de la vegetación. La variabilidad en el suelo obligó al uso de 8 bloques donde los 4 tratamientos fueron aleatorizados. Se Realizó un análisis estadístico descriptivo e inferencial y se concluyó cuál es la mejor dosis recomendada y el papel del bloqueo en este estudio.
##Distribucion de los tratamientos en campo
library(ggplot2)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
set.seed(123)
dosis=c(sample(gl(4,1,4,c(0,10,20,30)),replace = F),
sample(gl(4,1,4,c(0,10,20,30)),replace = F),
sample(gl(4,1,4,c(0,10,20,30)),replace = F),
sample(gl(4,1,4,c(0,10,20,30)),replace = F))
bloque=gl(8,4,32,paste0('B_',1:8))
xy=expand.grid(x=seq(1,2),y=seq(1,2))
datos=data.frame(dosis,xy,bloque)
q=datos %>%
ggplot(aes(x=x,y=y,fill=dosis,label=dosis)) +
geom_tile()+
geom_text()+
facet_wrap(~bloque,nrow=1)+
theme_bw()
ggplotly(q)
set.seed(123)
ndvi_0=runif(8,0.4,0.45)
ndvi_10=runif(8,0.45,0.55)
ndvi_20=runif(8,0.5,0.58)
ndvi_30=runif(8,0.58,0.65)
datos$ndvi[datos$dosis==0]=ndvi_0
datos$ndvi[datos$dosis==10]=ndvi_10
datos$ndvi[datos$dosis==20]=ndvi_20
datos$ndvi[datos$dosis==30]=ndvi_30
head(datos)
q2= datos %>%
ggplot(aes(x=dosis, y = ndvi, fill=dosis))+
geom_boxplot()+
geom_violin(alpha= 0.5)+
theme(legend.position = 'none')+
theme_bw()
ggplotly(q2)
datos %>%
group_by(dosis) %>%
summarise(mean_ndvi=mean(ndvi),
sd_ndvi=sd(ndvi),
var_ndvi=var(ndvi),
cv_ndvi= sd_ndvi/mean_ndvi*100)
\[ H_0 : \mu_{D1}\ =\mu_{D2}\ =\mu_{D3}\ =\mu_{D4} \\H_a : \ H_0\text{Es Falsa} \]
## Analisis de varianza
datos$dosis=as.factor(datos$dosis)
mod=aov(ndvi~bloque+dosis, data=datos)
summary(mod)
## Df Sum Sq Mean Sq F value Pr(>F)
## bloque 7 0.00456 0.00065 1.267 0.313
## dosis 3 0.15403 0.05134 99.763 1.38e-12 ***
## Residuals 21 0.01081 0.00051
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Los datos obtenidos en el analisis de varianza aportan evidencia estadistica suficiente en contra de la hipotesis nula indicando que todos los tratamientos no son iguales.
El diseño utilizado en es un Diseño en Bloques Completos al Azar (DBCA) es un diseño frecuentemente utilizado para minimizar el efecto de la variabilidad, el caso usual consiste en distribuir aleatoriamente una réplica de cada combinación de tratamientos dentro de cada bloque.
La prueba de normalidad (shapiro-wilk normality test) y de igualdad de varianzas (Bartlett test of homogenity of variances) nos dan resultados que nos permiten decidir si podemos o no confiar en resultados de otras pruebas en este caso de Tukey y ANOVA.
shapiro.test(mod$residuals)
##
## Shapiro-Wilk normality test
##
## data: mod$residuals
## W = 0.98649, p-value = 0.9511
Se concluye que los residuos siguen una distrbucion normal debido a que p-value tiene un valor superior a 0.05 lo que esta confirmando los resultados del analisis de varianza
bartlett.test(ndvi ~ dosis, datos)
##
## Bartlett test of homogeneity of variances
##
## data: ndvi by dosis
## Bartlett's K-squared = 2.5713, df = 3, p-value = 0.4625
La prueba de bartlett tambien nos confirma y nos da la confianza de usar la prueba de tukey y anova puesto que no rechaza la hipotesis nula que nos dice que todos los tratamientos son iguales.
Con la prueba de tukey lo que se busca es hacer una comparacion entre las dosis con el fin de definir que tratamiento es mejor, se usa la prueba de tukey puesto que tiene la capacidad de hacer la comparacion entre diferentes variables.
TukeyHSD(mod, "dosis")
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = ndvi ~ bloque + dosis, data = datos)
##
## $dosis
## diff lwr upr p adj
## 10-0 0.07854948 0.046932727 0.11016623 0.0000043
## 20-0 0.11803675 0.086420000 0.14965350 0.0000000
## 30-0 0.19219520 0.160578449 0.22381195 0.0000000
## 20-10 0.03948727 0.007870521 0.07110402 0.0110552
## 30-10 0.11364572 0.082028970 0.14526247 0.0000000
## 30-20 0.07415845 0.042541698 0.10577520 0.0000100
Estadisticamente se recomendaria aplicar la dosis de 30 pues esta tiene la mayor diferencia en NDVI respecto a las demas, pero agronomicamente respecto a costos la diferencia del 20 al 30 no es tan grande por lo que recomendaria el de dosis de 20
efectos = datos %>%
group_by(dosis) %>%
summarise(media_ndvi = mean(ndvi)) %>%
mutate(efecto = media_ndvi - mean(datos$ndvi))
efectos
Se hizo una comparacion entre las medias de ndvi y esto con el efecto que tiene cada dosis sobre el mismo obteniendo un resultado con una tendencia lienal positiva donde la dosis de 30 es la que tiene un mayor efecto sobre el ndvi.
mod_sin_bloque = aov(ndvi ~ dosis, datos)
summary(mod)
## Df Sum Sq Mean Sq F value Pr(>F)
## bloque 7 0.00456 0.00065 1.267 0.313
## dosis 3 0.15403 0.05134 99.763 1.38e-12 ***
## Residuals 21 0.01081 0.00051
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
summary(mod_sin_bloque)
## Df Sum Sq Mean Sq F value Pr(>F)
## dosis 3 0.15403 0.05134 93.52 1.06e-14 ***
## Residuals 28 0.01537 0.00055
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
EB=anova(mod_sin_bloque, mod)
EB
Con los resultados obtenidos se puede decir que el bloqueo no fue eficiente, puesto que el resultado no es para nada signifactivo ya que el resultado es mayor a 0.05
Teniendo en cuenta los resultados obtenidos se llega a la conclusion primero que los resultados son lo suficientemente confiables como lo demostraron las prubeas de normalidad y homocedasticidad, por parte de las pruebas de anova y tukey nos afirman por un lado la de anova que nuestra hipotesis no se rechaza dandonos datos que lo aprueban y por parte de la prueba de tukey nos dio el mejor tratamiento el cual fue el de la dosis de 30 la cual se recomendaria estadisticamente, pero agronomicamente por temas de costos y teniendo en cuenta que no es mucha la diferencia de efectos entre la dosis de 20 y 30 recomendaria la de 20, Por ultimo se llega a la conclusión de que no tiene ninguna eficiencia el haber hecho el bloqueo en este Diseño de experimento.