install.packages("modeest")
install.packages("ggplot2")
library(ggplot2)
library(modeest)
peso = c(18.6, 19.2, 19.5, 19.2, 18.9, 19.4, 19, 20, 19.3, 20, 19.1, 18.6, 19.4, 18.7, 21, 19.8, 19, 18.6, 19.6, 19, 19.6, 19.4, 19.8, 19.1, 20, 20.4, 18.8, 19.3, 19.1, 19.1, 18.6, 19.9, 18.8, 18.4, 19, 20.1, 19.7, 19.3, 20.7, 19.6, 19.5, 19.1, 18.5, 19.6, 19.4, 19.6, 20.3, 18.8, 19.2, 20.6, 20, 18.4, 18.9, 19.7, 17.8, 19.4, 18.9, 18.4, 19, 19.7, 20.1, 20.2, 21, 19.7, 20.1, 20, 19.1, 20.4, 19.6, 20.6, 20, 19.7, 20.8, 19.7, 19.7, 20.4, 19.8, 20.5, 20, 20, 20.2, 19.7, 20, 19.6, 19.7, 19.8, 19.9, 20.3, 20.4, 20.2)
#Calculo de la media
media <- mean(peso)
media
## [1] 19.56222
#Histograma
hist(peso, col='lightblue', main='Histograma Peso', xlab="peso kg", ylab="Frecuencia",); abline(v=media, col="red", lwd=2, lty=8)
#Calculo de la Mediana
mediana=median(peso)
mediana
## [1] 19.6
#Calculo de la Moda
library(modeest)
## Warning: package 'modeest' was built under R version 4.4.3
moda=mlv(peso, method = "mfv")
moda
## [1] 19.7 20.0
#Desviación estándar
desv=sd(peso)
desv
## [1] 0.6511145
#Varianza
varianza=var(peso)
varianza
## [1] 0.4239501
#Rango
rango=range(peso)
rango
## [1] 17.8 21.0
#Coeficiente de variación
cv=desv/media*100
cv
## [1] 3.328428
lote1 = c(18.6, 19.2, 19.5, 19.2, 18.9, 19.4, 19, 20, 19.3, 20, 19.1, 18.6, 19.4, 18.7, 21, 19.8, 19, 18.6, 19.6, 19, 19.6, 19.4, 19.8, 19.1, 20, 20.4, 18.8, 19.3, 19.1, 19.1)
lote2 = c(18.6, 19.9, 18.8, 18.4, 19, 20.1, 19.7, 19.3, 20.7, 19.6, 19.5, 19.1, 18.5, 19.6, 19.4, 19.6, 20.3, 18.8, 19.2, 20.6, 20, 18.4, 18.9, 19.7, 17.8, 19.4, 18.9, 18.4, 19, 19.7)
lote3 = c(20.1, 20.2, 21, 19.7, 20.1, 20, 19.1, 20.4, 19.6, 20.6, 20, 19.7, 20.8, 19.7, 19.7, 20.4, 19.8, 20.5, 20, 20, 20.2, 19.7, 20, 19.6, 19.7, 19.8, 19.9, 20.3, 20.4, 20.2)
#Media por lotes
media1<-mean(lote1)
media2<-mean(lote2)
media3<-mean(lote3)
media1
## [1] 19.35
media2
## [1] 19.29667
media3
## [1] 20.04
#Mediana por lote
med1=median(lote1)
med2=median(lote2)
med3=median(lote3)
med1
## [1] 19.25
med2
## [1] 19.35
med3
## [1] 20
#Moda por lote
moda1=mlv(lote1, method = "mfv")
moda2=mlv(lote2, method = "mfv")
moda3=mlv(lote3, method = "mfv")
moda1
## [1] 19.1
moda2
## [1] 18.4 19.6 19.7
moda3
## [1] 19.7
#Medidas de dispresión por lote
desv1=sd(lote1)
desv2=sd(lote2)
desv3=sd(lote3)
desv1
## [1] 0.5550707
desv2
## [1] 0.6900691
desv3
## [1] 0.4013769
var1=var(lote1)
var2=var(lote2)
var3=var(lote3)
var1
## [1] 0.3081034
var2
## [1] 0.4761954
var3
## [1] 0.1611034
cv1=desv1/media1*100
cv2=desv2/media1*100
cv3=desv3/media1*100
cv1
## [1] 2.868582
cv2
## [1] 3.566249
cv3
## [1] 2.074299
#Histogramas
hist(lote1, col='lightblue', main='Histograma Lote 1', xlab="peso kg", ylab="Frecuencia",); abline(v=media, col="red", lwd=2, lty=8)
hist(lote2, col='lightblue', main='Histograma Lote 2', xlab="peso kg", ylab="Frecuencia",); abline(v=media, col="red", lwd=2, lty=8)
hist(lote3, col='lightblue', main='Histograma Lote 3', xlab="peso kg", ylab="Frecuencia",); abline(v=media, col="red", lwd=2, lty=8)
#Diagramas de cajas
boxplot(lote1,
horizontal=TRUE,
lwd=3,
col="red",
xlab="kg",
ylab="Lote 1",
main="Diagrama de Caja Lote 1",
notch=FALSE,
border="black",
outpch=25,
outbg="green",
whiskcol="blue",
whisklty=2,
lty=1)
boxplot(lote2,
horizontal=TRUE,
lwd=3,
col="red",
xlab="kg",
ylab="Lote 2",
main="Diagrama de Caja Lote 2",
notch=FALSE,
border="black",
outpch=25,
outbg="green",
whiskcol="blue",
whisklty=2,
lty=1)
boxplot(lote3,
horizontal=TRUE,
lwd=3,
col="red",
xlab="kg",
ylab="Lote 3",
main="Diagrama de Caja Lote 3",
notch=FALSE,
border="black",
outpch=25,
outbg="green",
whiskcol="blue",
whisklty=2,
lty=1)
RESPUESTAS:
De acuerdo con los 90 datos, el centrado del proceso es adecuado ya que las medidas de tendencia central (media, mediana y moda) se encuentran muy cercanas.
De acuerdo a los datos obtenidos de las medidas de dispersión, la variación en los datos es poca.
Interpretación del Histograma:
La mayoría de los valores de peso en esta muestra se concentran entre 18.5 kg y 20.0 kg, siendo el rango 19.5 kg a 20.0 kg el más frecuente.
Hay muy pocas observaciones con pesos muy bajos (cerca de 17.5 kg) o muy altos (cerca de 21.0 kg).
La distribución indica que los pesos tienden a agruparse alrededor de los 19.5-20.0 kg.
Conclusión: de acuerdo a la información previa, se puede determinar que en términos generales los sacos están por debajo de los 20kg que indica el proveedor.
Análisis por lote:
El Lote 1 parece tener pesos ligeramente más bajos en promedio y una distribución más dispersa, con una tendencia a tener más datos en el rango de 19.0-19.5 kg.
El Lote 2 tiene una distribución más centrada alrededor de 19.5-20.0 kg, con una ligera inclinación hacia pesos un poco más bajos.
El Lote 3 muestra una distribución con una concentración muy fuerte en el rango de 19.5-20.0 kg y una cola pronunciada hacia pesos más altos, lo que sugiere que, aunque su media pueda ser similar o ligeramente inferior, una gran mayoría de sus observaciones se agrupan en el pico más alto. Además, no tiene datos por debajo de 19.0 kg, a diferencia de los otros lotes.
En resumen, los tres lotes tienen distribuciones de peso distintas en términos de su forma, dispersión y la concentración de sus valores más frecuentes, a pesar de que la línea de referencia (media/mediana) se encuentre en una posición similar en los tres casos (alrededor de 19.5 kg).
Basándonos en estos histogramas, no se puede afirmar con certeza que los sacos de arena de los lotes recibidos pesan consistentemente 20 kg según la especificación del proveedor. Si bien el Lote 3 es el que más se aproxima al objetivo, los tres lotes muestran una variabilidad, y en los Lotes 1 y 2, una proporción significativa de los sacos pesa menos de 20 kg.
No, definitivamente no se podrían haber determinado todas estas observaciones y conclusiones solo con la primera gráfica que incluye los 90 sacos.
Análisis de los Diagramas de cajas:
El Lote 3 es el que presenta los pesos más consistentemente cercanos a los 20 kg y la menor variabilidad en su 50% central, con la mediana más cercana a 20 kg.
El Lote 2 es el más “centrado” en términos de mediana pero con una mayor dispersión que el Lote 3.
El Lote 1 es el que tiene los pesos más bajos en general y la presencia de un saco significativamente más pesado (outlier).
Estos diagramas de caja refuerzan la conclusión de los histogramas: los tres lotes no son idénticos en la distribución de sus pesos. El Lote 3 parece ser el más “apropiado” en términos de peso medio y consistencia si el objetivo es de 20 kg por saco, mientras que el Lote 1 y el Lote 2 muestran desviaciones y mayor variabilidad.