Se seleccionaron muestras aleatorias de cada uno de tres tipos de individuos: empleados de una empresa fabricante de plaguicidas con un alto grado de exposición, agricultores expuestos al plaguicida por varias semanas cada año y personas sin exposición conocida al plaguicida. Se hicieron determinaciones de la acetilcolinesterasa en muestras de sangre de cada persona, obteniéndose los siguientes resultados.
¿Proporcionan estos datos evidencia suficiente que indique una diferencia, en promedio, entre los tres grupos de personas?
# Gráfico de caja y bigotesboxplot(data, main ="Distribución de Acetilcolinesterasa en Sangre",names =c("Empleados", "Agricultores", "No Expuestos"), xlab ="Grupos de muestra",ylab ="Nivel en Sangre", ylim =c(4,11), col =c("darkslategray1","darkslategray3","darkslategray"))
# Histograma para cada grupopar(mfrow =c(1,3))hist(data$empleados, main ="Empleados", xlab ="Nivel de acetilcolinesterasa",ylab="Frecuencia", col ="darkslategray1", xlim =c(4,11))hist(data$agricultores, main ="Agricultores", xlab ="Nivel de acetilcolinesterasa", ylab="Frecuencia", col ="darkslategray3", ylim =c(0,5),xlim =c(4,11))hist(data$noexp, main ="No Expuestos", xlab ="Nivel de acetilcolinesterasa",ylab="Frecuencia", col ="darkslategray",ylim =c(0,5),xlim =c(4,11))
par(mfrow =c(1,1))
Descriptivo Numérico
summary(data)
empleados agricultores noexp
Min. :4.100 Min. :4.200 Min. : 4.60
1st Qu.:6.175 1st Qu.:6.275 1st Qu.: 7.00
Median :6.700 Median :6.900 Median : 7.65
Mean :6.760 Mean :6.920 Mean : 7.70
3rd Qu.:7.350 3rd Qu.:7.550 3rd Qu.: 8.35
Max. :9.500 Max. :9.700 Max. :10.80
Hipótesis
Hipótesis Nula H0:
No hay diferencias en los niveles de acetilcolinesterasa promedio entre los tres grupos.
Hipóteis Alternativa H1:
Al menos un grupo tiene una media diferente en los niveles de acetilcolinesterasa.
Supuestos
Normalidad
#la muestra tiene tamaño menr que 30 entonces usaremos shapiro test para comprobar normalidad.shapiro.test(data$empleados) # p>0.05
Shapiro-Wilk normality test
data: data$empleados
W = 0.97778, p-value = 0.9522
shapiro.test(data$agricultores)
Shapiro-Wilk normality test
data: data$agricultores
W = 0.98297, p-value = 0.9791
shapiro.test(data$noexp)
Shapiro-Wilk normality test
data: data$noexp
W = 0.97871, p-value = 0.9579
# con una significancia del 0.05 podemos afirmar que los datos son normales.
media_empleados <-mean(empleados)media_agricultores <-mean(agricultores)media_noexp <-mean(noexp)medias <-c(media_empleados,media_agricultores,media_noexp)# Suma de Cuadrados entre Grupos (SSA)SSA<-sum(10*(medias-media_global)^2) # 10 porque son igual el tamaño de muestra para los tres gruposSSA<-round(SSA,2)
k <-3# Número de gruposN <-30# Tamaño total de la muestra 10 cada uno# Cuadrado Medio entre Grupos (MSA)MSA <-round(SSA / (k -1),2)MSA
[1] 2.53
MSE
# Cuadrado Medio dentro de los Grupos (MSE)MSE <-round(SSE / (N - k),2)MSE
[1] 2.42
Estadístico F
# Estadístico FrF <-round(MSA / MSE,2)rF
[1] 1.05
Tabla ANOVA
Fuente_de_variación<-c("Tratamientos(entre grupos)","Error(dentro de grupos)","Total")Suma_de_cuadrados<-c(SSA,SSE,SST)Grados_de_libertad<-c(k-1,N-k,N-1)Cuadrado_medio<-c(MSA,MSE,"")RazónF<-c(rF,"","")data.frame(Fuente_de_variación,Suma_de_cuadrados,Grados_de_libertad,Cuadrado_medio,RazónF)
Call:
aov(formula = niveles ~ grupo, data = data_leven)
Terms:
grupo Residuals
Sum of Squares 5.05867 65.42000
Deg. of Freedom 2 27
Residual standard error: 1.556587
Estimated effects may be unbalanced