Problema

Se desea evaluar 4 dosis de nitrógeno en el cultivo de arroz, se usó como respuesta un índice espectral conocido como ndvi que es el índice de Vegetación de Diferencia Normalizada que es un indicador simple de biomasa fotosintéticamente activa o, en términos simples, un cálculo de la salud de la vegetación. La variabilidad en el suelo obligó al uso de 8 bloques donde los 4 tratamientos fueron aleatorizados. Se Realizó un análisis estadístico descriptivo e inferencial y se concluyó cuál es la mejor dosis recomendada y el papel del bloqueo en este estudio.

##Distribucion de los tratamientos en campo

library(ggplot2)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
set.seed(123)
dosis=c(sample(gl(4,1,4,c(0,10,20,30)),replace = F),
        sample(gl(4,1,4,c(0,10,20,30)),replace = F),
        sample(gl(4,1,4,c(0,10,20,30)),replace = F),
        sample(gl(4,1,4,c(0,10,20,30)),replace = F))
bloque=gl(8,4,32,paste0('B_',1:8))
xy=expand.grid(x=seq(1,2),y=seq(1,2))
datos=data.frame(dosis,xy,bloque)


q=datos %>% 
  ggplot(aes(x=x,y=y,fill=dosis,label=dosis)) +
  geom_tile()+
  geom_text()+
  facet_wrap(~bloque,nrow=1)+
  theme_bw()
ggplotly(q)
set.seed(123)
ndvi_0=runif(8,0.4,0.45)
ndvi_10=runif(8,0.45,0.55)
ndvi_20=runif(8,0.5,0.58)
ndvi_30=runif(8,0.58,0.65)

datos$ndvi[datos$dosis==0]=ndvi_0
datos$ndvi[datos$dosis==10]=ndvi_10
datos$ndvi[datos$dosis==20]=ndvi_20
datos$ndvi[datos$dosis==30]=ndvi_30
head(datos)

Analisis Descriptivo

q2= datos %>%
  ggplot(aes(x=dosis, y = ndvi, fill=dosis))+
  geom_boxplot()+
  geom_violin(alpha= 0.5)+
  theme(legend.position = 'none')+
  theme_bw()
ggplotly(q2)
datos %>% 
  group_by(dosis) %>%
  summarise(mean_ndvi=mean(ndvi),
            sd_ndvi=sd(ndvi),
            var_ndvi=var(ndvi),
            cv_ndvi= sd_ndvi/mean_ndvi*100)

\[ H_0 : \mu_{D1}\ =\mu_{D2}\ =\mu_{D3}\ =\mu_{D4} \\H_a : \ H_0\text{Es Falsa} \]

Analisis inferencial

## Analisis de varianza
datos$dosis=as.factor(datos$dosis)
mod=aov(ndvi~bloque+dosis, data=datos)
summary(mod)
##             Df  Sum Sq Mean Sq F value   Pr(>F)    
## bloque       7 0.00456 0.00065   1.267    0.313    
## dosis        3 0.15403 0.05134  99.763 1.38e-12 ***
## Residuals   21 0.01081 0.00051                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Los datos obtenidos en el analisis de varianza aportan evidencia estadistica suficiente en contra de la hipotesis nula indicando que todos los tratamientos no son iguales.

Asignacion

  1. Investigar el modelo de este diseño (Especificarlo addecuadamente)

El diseño utilizado en es un Diseño en Bloques Completos al Azar (DBCA) es un diseño frecuentemente utilizado para minimizar el efecto de la variabilidad, el caso usual consiste en distribuir aleatoriamente una réplica de cada combinación de tratamientos dentro de cada bloque.

  1. Revisión de los supuestos de normalidad e igualdad de varianzas

La prueba de normalidad (shapiro-wilk normality test) y de igualdad de varianzas (Bartlett test of homogenity of variances) nos dan resultados que nos permiten decidir si podemos o no confiar en resultados de otras pruebas en este caso de Tukey y ANOVA.

Prueba de normalidad

shapiro.test(mod$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  mod$residuals
## W = 0.98649, p-value = 0.9511

Se concluye que los residuos siguen una distrbucion normal debido a que p-value tiene un valor superior a 0.05 lo que esta confirmando los resultados del analisis de varianza

Prueba de homocedasticidad

bartlett.test(ndvi ~ dosis, datos)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  ndvi by dosis
## Bartlett's K-squared = 2.5713, df = 3, p-value = 0.4625

La prueba de bartlett tambien nos confirma y nos da la confianza de usar la prueba de tukey y anova puesto que no rechaza la hipotesis nula que nos dice que todos los tratamientos son iguales.

  1. Hacer una comparacion de medias (¿cual tratamiento recomendar?)

Prueba de Tukey para comparacion de medias

Con la prueba de tukey lo que se busca es hacer una comparacion entre las dosis con el fin de definir que tratamiento es mejor, se usa la prueba de tukey puesto que tiene la capacidad de hacer la comparacion entre diferentes variables.

TukeyHSD(mod, "dosis")
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = ndvi ~ bloque + dosis, data = datos)
## 
## $dosis
##             diff         lwr        upr     p adj
## 10-0  0.07854948 0.046932727 0.11016623 0.0000043
## 20-0  0.11803675 0.086420000 0.14965350 0.0000000
## 30-0  0.19219520 0.160578449 0.22381195 0.0000000
## 20-10 0.03948727 0.007870521 0.07110402 0.0110552
## 30-10 0.11364572 0.082028970 0.14526247 0.0000000
## 30-20 0.07415845 0.042541698 0.10577520 0.0000100

Estadisticamente se recomendaria aplicar la dosis de 30 pues esta tiene la mayor diferencia en NDVI respecto a las demas, pero agronomicamente respecto a costos la diferencia del 20 al 30 no es tan grande por lo que recomendaria el de dosis de 20

  1. Calcular el efecto de cada tratamiento
efectos = datos %>%
  group_by(dosis) %>%
  summarise(media_ndvi = mean(ndvi)) %>%
  mutate(efecto = media_ndvi - mean(datos$ndvi))
efectos

Se hizo una comparacion entre las medias de ndvi y esto con el efecto que tiene cada dosis sobre el mismo obteniendo un resultado con una tendencia lienal positiva donde la dosis de 30 es la que tiene un mayor efecto sobre el ndvi.

  1. Si parece que fue eficiente bloquear, ¿En que sentido fue eficiente?
mod_sin_bloque = aov(ndvi ~ dosis, datos)
summary(mod)
##             Df  Sum Sq Mean Sq F value   Pr(>F)    
## bloque       7 0.00456 0.00065   1.267    0.313    
## dosis        3 0.15403 0.05134  99.763 1.38e-12 ***
## Residuals   21 0.01081 0.00051                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
summary(mod_sin_bloque)
##             Df  Sum Sq Mean Sq F value   Pr(>F)    
## dosis        3 0.15403 0.05134   93.52 1.06e-14 ***
## Residuals   28 0.01537 0.00055                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
EB=anova(mod_sin_bloque, mod)
EB

Con los resultados obtenidos se puede decir que el bloqueo no fue eficiente, puesto que el resultado no es para nada signifactivo ya que el resultado es mayor a 0.05

Conclusión

Teniendo en cuenta los resultados obtenidos se llega a la conclusion primero que los resultados son lo suficientemente confiables como lo demostraron las prubeas de normalidad y homocedasticidad, por parte de las pruebas de anova y tukey nos afirman por un lado la de anova que nuestra hipotesis no se rechaza dandonos datos que lo aprueban y por parte de la prueba de tukey nos dio el mejor tratamiento el cual fue el de la dosis de 30 la cual se recomendaria estadisticamente, pero agronomicamente por temas de costos y teniendo en cuenta que no es mucha la diferencia de efectos entre la dosis de 20 y 30 recomendaria la de 20, Por ultimo se llega a la conclusión de que no tiene ninguna eficiencia el haber hecho el bloqueo en este Diseño de experimento.