Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas.Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hacen seis réplicas y los resultados obtenidos se muestran a continuación.
Formule la hipótesis adecuada y el modelo estadístico. modelo estdistico: Arreglo experimental con un solo factor Ho= las 3 marcas de spray matan el mismo numero de moscas. Ha= las 3 marcas de spray matan diferente numero de moscas.
: μA=μB=μC=μD=μ
¿Existe diferencia entre la efectividad promedio de los productos en spray? ¿Hay algún spray mejor? Argumente su respuesta. Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas. Dibuje las gráficas de medias y los diagramas de caja simultáneos, después interprételos.
library(readxl)
datos <-read_excel("/Users/jessiroa/Downloads/Datos ejercicio 2.xlsx")
datos # para visualizar los datos
conteo_valoresMarca <- table(datos$Marca)
conteo_valoresMarca
##
## A B C
## 6 6 6
Dado que el número de observaciones por tratamiento es el mismo, se puede concluir que es un diseño balanceado.
library(summarytools)
summarytools::descr(datos[,1])
## Descriptive Statistics
## datos$Efectividad
## N: 18
##
## Efectividad
## ----------------- -------------
## Mean 63.67
## Std.Dev 8.01
## Min 50.00
## Q1 58.00
## Median 64.50
## Q3 70.00
## Max 75.00
## MAD 8.90
## IQR 11.50
## CV 0.13
## Skewness -0.25
## SE.Skewness 0.54
## Kurtosis -1.33
## N.Valid 18.00
## Pct.Valid 100.00
resultados_descriptivos <- aggregate(Efectividad ~ Marca, data = datos, summary)
# Imprimir los resultados descriptivos
print(resultados_descriptivos)
## Marca Efectividad.Min. Efectividad.1st Qu. Efectividad.Median
## 1 A 62.00000 65.50000 69.50000
## 2 B 50.00000 53.50000 57.00000
## 3 C 51.00000 58.75000 62.50000
## Efectividad.Mean Efectividad.3rd Qu. Efectividad.Max.
## 1 69.00000 72.75000 75.00000
## 2 59.16667 65.75000 70.00000
## 3 62.83333 67.75000 74.00000
¿Existe diferencia entre la efectividad promedio de los productos en spray? En este caso el ANOVA, el p-valor 0.0931 es mayor que el nivel de significancia ( (a= 0.05), es decir, que se acepta la hipotesis nula So esto signitica que secun los datos y el nivel de signiticancia seleccionado. no se tiene suticiente evidencia para rechazar la hipolesis nos y. por lo tanto no se puede concluir que hay una aferencia o erecto signilicativo entre las marcas de spray.
¿Hay algún spray mejor? Argumente su respuesta.
ANOVA
```r
# Realizar el ANOVA
modelo_anova <- aov(Efectividad ~ Marca, data = datos)
# Resumen del ANOVA
resumen_anova <- summary(modelo_anova)
# Imprimir el resumen del ANOVA
print(resumen_anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## Marca 2 296.3 148.17 2.793 0.0931 .
## Residuals 15 795.7 53.04
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
boxplot(datos$Efectividad ~ datos$Marca, data = datos, col = c("red", "blue", "green","orange"), ylab = "Efectividad", xlab = "Marca")
PRUEBAS POST HOC
TukeyHSD(modelo_anova)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Efectividad ~ Marca, data = datos)
##
## $Marca
## diff lwr upr p adj
## B-A -9.833333 -20.755528 1.088861 0.0808333
## C-A -6.166667 -17.088861 4.755528 0.3340612
## C-B 3.666667 -7.255528 14.588861 0.6654850
plot(TukeyHSD(modelo_anova))
library(agricolae)
metodos.Duncan <-duncan.test(modelo_anova, trt = "Marca", group = T, console = T)
##
## Study: modelo_anova ~ "Marca"
##
## Duncan's new multiple range test
## for Efectividad
##
## Mean Square Error: 53.04444
##
## Marca, means
##
## Efectividad std r se Min Max Q25 Q50 Q75
## A 69.00000 5.099020 6 2.973338 62 75 65.50 69.5 72.75
## B 59.16667 8.183316 6 2.973338 50 70 53.50 57.0 65.75
## C 62.83333 8.134290 6 2.973338 51 74 58.75 62.5 67.75
##
## Alpha: 0.05 ; DF Error: 15
##
## Critical Range
## 2 3
## 8.962607 9.395232
##
## Means with the same letter are not significantly different.
##
## Efectividad groups
## A 69.00000 a
## C 62.83333 ab
## B 59.16667 b
#out <- duncan.test(model, "virus", main = "yield of sweetpotato, Dealt with different virus")
plot(metodos.Duncan, variation="IQR" )
VERIFICACION DE LOS SUPUESTOS
library(car)
## Loading required package: carData
residuos<-residuals(modelo_anova) #Creando un objeto llamado residuos que contiene los residuos el modelo
par(mfrow=c(1,3)) #Para dividir el área del gráfico en dos partes (una fila y dos columnas)
dplot<-density(residuos) #Creando un objeto llamado dplot que recibe un Density_Plot de los residuos
plot(dplot, #Graficando el objeto dplot
main="Curva de densidad observada", #Título principal de la gráfica
xlab = "Residuos", #Etiqueta del eje x
ylab = "Densidad") #Etiqueta del eje y
polygon(dplot, #Añadiendo el poligono
col = "green", #Definiendo el color del poligono
border = "black") #Color del borde del poligono
qqPlot(residuos, #Un gráfico Cuantil-Cuantil de los residuos
pch =20, #Forma de los puntos
main="QQ-Plot de los residuos", #Título principal
xlab = "Cuantiles teóricos", #Etiqueta eje x
ylab="Cuantiles observados de los residuos") #Etiqueta eje y
## [1] 17 14
mtext(side=3, at=par("usr")[1], adj=0.7, cex=0.6, col="gray40", line=-21, #Posición del texto
text=paste("Jessica Roa V --", #Texto
format(Sys.time(),
"%d/%m/%Y %H:%M:%S --"), #Fecha y Hora
R.version.string)) #Versión de R
boxplot(residuos, col = c("red"), ylab = "residuos", main="Box-plot de los residuos")
boxplot(residuos ~ datos$Marca,
main = "Boxplot de Residuos por Cantidad de CO2",
xlab = "Marca",
col="lightblue",
ylab = "Residuos")
library(car)
color_1 <-colorRampPalette(c("yellow ", "purple", "lightblue"))
plot(residuos, main = "Prueba de independencia", pch=20,cex = 2, col=color_1(120), ylab = "Residuos", xlab = "Marca de spray")
library(stats)
bartlett.test(residuos ~ datos$Marca) #Esta prueba requiere que el diseño se balanceado (el número de repeticiones debe ser igual para cada tratamiento)
##
## Bartlett test of homogeneity of variances
##
## data: residuos by datos$Marca
## Bartlett's K-squared = 1.1889, df = 2, p-value = 0.5519
library(stats)
leveneTest(residuos ~ datos$Marca)
## Warning in leveneTest.default(y = y, group = group, ...): group coerced to
## factor.
durbinWatsonTest(modelo_anova)
## lag Autocorrelation D-W Statistic p-value
## 1 -0.05414747 2.04919 0.728
## Alternative hypothesis: rho != 0