Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas.Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hacen seis réplicas y los resultados obtenidos se muestran a continuación.

Formule la hipótesis adecuada y el modelo estadístico. modelo estdistico: Arreglo experimental con un solo factor Ho= las 3 marcas de spray matan el mismo numero de moscas. Ha= las 3 marcas de spray matan diferente numero de moscas.

: μA=μB=μC=μD=μ

¿Existe diferencia entre la efectividad promedio de los productos en spray? ¿Hay algún spray mejor? Argumente su respuesta. Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas. Dibuje las gráficas de medias y los diagramas de caja simultáneos, después interprételos.

library(readxl)
datos <-read_excel("/Users/jessiroa/Downloads/Datos ejercicio 2.xlsx")
datos # para visualizar los datos 
conteo_valoresMarca <- table(datos$Marca)
conteo_valoresMarca
## 
## A B C 
## 6 6 6

Dado que el número de observaciones por tratamiento es el mismo, se puede concluir que es un diseño balanceado.

library(summarytools)
summarytools::descr(datos[,1])
## Descriptive Statistics  
## datos$Efectividad  
## N: 18  
## 
##                     Efectividad
## ----------------- -------------
##              Mean         63.67
##           Std.Dev          8.01
##               Min         50.00
##                Q1         58.00
##            Median         64.50
##                Q3         70.00
##               Max         75.00
##               MAD          8.90
##               IQR         11.50
##                CV          0.13
##          Skewness         -0.25
##       SE.Skewness          0.54
##          Kurtosis         -1.33
##           N.Valid         18.00
##         Pct.Valid        100.00
resultados_descriptivos <- aggregate(Efectividad ~ Marca, data = datos, summary)
# Imprimir los resultados descriptivos
print(resultados_descriptivos)
##   Marca Efectividad.Min. Efectividad.1st Qu. Efectividad.Median
## 1     A         62.00000            65.50000           69.50000
## 2     B         50.00000            53.50000           57.00000
## 3     C         51.00000            58.75000           62.50000
##   Efectividad.Mean Efectividad.3rd Qu. Efectividad.Max.
## 1         69.00000            72.75000         75.00000
## 2         59.16667            65.75000         70.00000
## 3         62.83333            67.75000         74.00000

¿Existe diferencia entre la efectividad promedio de los productos en spray? En este caso el ANOVA, el p-valor 0.0931 es mayor que el nivel de significancia ( (a= 0.05), es decir, que se acepta la hipotesis nula So esto signitica que secun los datos y el nivel de signiticancia seleccionado. no se tiene suticiente evidencia para rechazar la hipolesis nos y. por lo tanto no se puede concluir que hay una aferencia o erecto signilicativo entre las marcas de spray.

¿Hay algún spray mejor? Argumente su respuesta.

ANOVA 

```r
# Realizar el ANOVA
modelo_anova <- aov(Efectividad ~ Marca, data = datos)


# Resumen del ANOVA
resumen_anova <- summary(modelo_anova)

# Imprimir el resumen del ANOVA
print(resumen_anova)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## Marca        2  296.3  148.17   2.793 0.0931 .
## Residuals   15  795.7   53.04                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
boxplot(datos$Efectividad ~ datos$Marca, data = datos, col = c("red", "blue", "green","orange"), ylab = "Efectividad", xlab = "Marca")

PRUEBAS POST HOC

TukeyHSD(modelo_anova)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Efectividad ~ Marca, data = datos)
## 
## $Marca
##          diff        lwr       upr     p adj
## B-A -9.833333 -20.755528  1.088861 0.0808333
## C-A -6.166667 -17.088861  4.755528 0.3340612
## C-B  3.666667  -7.255528 14.588861 0.6654850
plot(TukeyHSD(modelo_anova))

library(agricolae)
metodos.Duncan <-duncan.test(modelo_anova, trt = "Marca", group = T, console = T)
## 
## Study: modelo_anova ~ "Marca"
## 
## Duncan's new multiple range test
## for Efectividad 
## 
## Mean Square Error:  53.04444 
## 
## Marca,  means
## 
##   Efectividad      std r       se Min Max   Q25  Q50   Q75
## A    69.00000 5.099020 6 2.973338  62  75 65.50 69.5 72.75
## B    59.16667 8.183316 6 2.973338  50  70 53.50 57.0 65.75
## C    62.83333 8.134290 6 2.973338  51  74 58.75 62.5 67.75
## 
## Alpha: 0.05 ; DF Error: 15 
## 
## Critical Range
##        2        3 
## 8.962607 9.395232 
## 
## Means with the same letter are not significantly different.
## 
##   Efectividad groups
## A    69.00000      a
## C    62.83333     ab
## B    59.16667      b
#out <- duncan.test(model, "virus", main = "yield of sweetpotato, Dealt with different virus")
plot(metodos.Duncan, variation="IQR" )

VERIFICACION DE LOS SUPUESTOS

library(car)
## Loading required package: carData
residuos<-residuals(modelo_anova) #Creando un objeto llamado residuos que contiene los residuos el modelo

par(mfrow=c(1,3)) #Para dividir el área del gráfico en dos partes (una fila y dos columnas)

dplot<-density(residuos) #Creando un objeto llamado dplot que recibe un Density_Plot de los residuos

plot(dplot, #Graficando el objeto dplot
      main="Curva de densidad observada", #Título principal de la gráfica
      xlab = "Residuos", #Etiqueta del eje x
      ylab = "Densidad") #Etiqueta del eje y
polygon(dplot, #Añadiendo el poligono
        col = "green", #Definiendo el color del poligono
        border = "black") #Color del borde del poligono

qqPlot(residuos, #Un gráfico Cuantil-Cuantil de los residuos
       pch =20, #Forma de los puntos
       main="QQ-Plot de los residuos", #Título principal
       xlab = "Cuantiles teóricos",  #Etiqueta eje x
       ylab="Cuantiles observados de los residuos") #Etiqueta eje y
## [1] 17 14
mtext(side=3, at=par("usr")[1], adj=0.7, cex=0.6, col="gray40", line=-21, #Posición del texto
      text=paste("Jessica Roa V  --", #Texto
                 format(Sys.time(), 
                "%d/%m/%Y %H:%M:%S --"), #Fecha y Hora
                 R.version.string)) #Versión de R
boxplot(residuos, col = c("red"), ylab = "residuos", main="Box-plot  de los residuos")

boxplot(residuos ~ datos$Marca, 
        main = "Boxplot de Residuos por Cantidad de CO2", 
        xlab = "Marca",
        col="lightblue",
        ylab = "Residuos")

library(car)
color_1 <-colorRampPalette(c("yellow ", "purple", "lightblue"))


plot(residuos, main = "Prueba de independencia", pch=20,cex = 2, col=color_1(120), ylab = "Residuos", xlab = "Marca de spray")

library(stats)
bartlett.test(residuos ~ datos$Marca) #Esta prueba requiere que el diseño se balanceado (el número de repeticiones debe ser igual para cada tratamiento)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  residuos by datos$Marca
## Bartlett's K-squared = 1.1889, df = 2, p-value = 0.5519
library(stats)
leveneTest(residuos ~ datos$Marca)
## Warning in leveneTest.default(y = y, group = group, ...): group coerced to
## factor.
durbinWatsonTest(modelo_anova) 
##  lag Autocorrelation D-W Statistic p-value
##    1     -0.05414747       2.04919   0.728
##  Alternative hypothesis: rho != 0