a) De acuerdo a los 90 datos, ¿el centrado del proceso es adecuado?
lote<-rep(1:3,each=30)
x1<-c(18.6, 19.2, 19.5, 19.2, 18.9, 19.4, 19.0, 20.0, 19.3, 20.0, 19.1, 18.6, 19.4, 18.7, 21.0, 19.8, 19.0, 18.6, 19.6, 19.0, 19.6, 19.4, 19.8, 19.1, 20.0, 20.4, 18.8, 19.3, 19.1, 19.1)
x2<-c(18.6, 19.9, 18.8, 18.4, 19.0, 20.1, 19.7, 19.3, 20.7, 19.6, 19.5, 19.1, 18.5, 19.6, 19.4, 19.6, 20.3, 18.8, 19.2, 20.6, 20.0, 18.4, 18.9, 19.7, 17.8, 19.4, 18.9, 18.4, 19.0, 19.7)
x3<-c(20.1, 20.2, 21.0, 19.7, 20.1, 20.0, 19.1, 20.4, 19.6, 20.6, 20.0, 19.7, 20.8, 19.7, 19.7, 20.4, 19.8, 20.5, 20.0, 20.0, 20.2, 19.7, 20.0, 19.6, 19.7, 19.8, 19.9, 20.3, 20.4, 20.2)
pesos<-c(x1,x2,x3)
caja<-boxplot(pesos)
df<-data.frame(lote,pesos)
View(df)
media<−tapply(pesos,INDEX=lote,mean)
des<−tapply(pesos,INDEX=lote,sd)
n <− rep(30,3)
a <− des/sqrt(30)
dfdes<−round(rbind(media,des,n,a),2)
rownames(dfdes)<−c("Media","Desviacion","tamaño","Precision")
View(dfdes)
t.test(pesos,alternative="less" ,mu=20)
##
## One Sample t-test
##
## data: pesos
## t = -6.3785, df = 89, p-value = 3.9e-09
## alternative hypothesis: true mean is less than 20
## 95 percent confidence interval:
## -Inf 19.6763
## sample estimates:
## mean of x
## 19.56222
t.test(pesos,mu=20)
##
## One Sample t-test
##
## data: pesos
## t = -6.3785, df = 89, p-value = 7.8e-09
## alternative hypothesis: true mean is not equal to 20
## 95 percent confidence interval:
## 19.42585 19.69860
## sample estimates:
## mean of x
## 19.56222
media=19.56
desv=0.65
precision=0.069
IC=c(19.35632 , 19.76812)
#hist(x1)
plot(density(x1))
De donde podemos ver que 20 \(\notin\) IC por lo tanto podemos concluir que el proceso no esta centrado.
b)¿La variabilidad es poca o mucha? Apoyese en los estadisticos adecuados.
CV<-desv/media*(100)
CV
## [1] 3.323108
Como el coeficiente de variacion es mucho mayor que 1 podemos concluir que presenta demasiada variacion.
c) Obtenga un histograma para los 90 datos, inserte las especificaciones e interpretelo con detalle
hist(pesos)
abline(v=19.2,col='green',lwd='2')
abline(v=20.8,col='green',lwd='2')
md<-20
ds<-0.8
LS<-20.8
LI<-19.2
Cp<-(LS-LI)/(6*ds)
Cp
## [1] 0.3333333
Cpk<-min(((LS-md)/(3*ds)),((md-LI)/(3*ds)))
Cpk
## [1] 0.3333333
Cpm<-Cpk/(sqrt(1-((md-19.56)/ds)^2))
Cpm
## [1] 0.3991229
Notemos que \(C_p\) es \(<0\) entonces se reduce la capacidad del proceso para cumplor con los limites de especificacion es decir va a hacer varios productos con defectos, esto lo podemos evidenciar graficamente ya que en el histograma hay varios puntos fuera. Ademas \(C_{pk}\) es \(<0\) se puede concluir que los defectos se van a producir porque hay productos por debajo del limite inferior de especificacion.
d) De su conclusion general acerca de si los bultos cumplen con el peso especificado
Como se pudo ver en el apartado anterior, usando losindices de capacidad y el histograma de los datos, existen varios bultos que no cumplen con el peso especificado, en su gran mayoria tienen un peso menor. De donde podemos concluir que no no cumplen con el peso especificado.
e) Haga un analisis de cada lote por separado y con apoyo de estadisticos y graficas, señale si hay diferencias grandes entre los lotes
Para lo cual se plantea una prueba de hipotesis con los datos de los lotes anteriores y toda la informacion ya obtenida \(\alpha=0.05\).
#Para el lote 1 y 2
t.test(x1,x2,mean.equal=T)
##
## Welch Two Sample t-test
##
## data: x1 and x2
## t = 0.32985, df = 55.453, p-value = 0.7428
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.2706390 0.3773056
## sample estimates:
## mean of x mean of y
## 19.35000 19.29667
#Para el lote 2 y 3
t.test(x2,x3,mean.equal=T)
##
## Welch Two Sample t-test
##
## data: x2 and x3
## t = -5.1, df = 46.607, p-value = 6.103e-06
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -1.0366114 -0.4500553
## sample estimates:
## mean of x mean of y
## 19.29667 20.04000
#Para el lote 1 y 3
t.test(x1,x3,mean.equal=T)
##
## Welch Two Sample t-test
##
## data: x1 and x3
## t = -5.5173, df = 52.816, p-value = 1.058e-06
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.9408608 -0.4391392
## sample estimates:
## mean of x mean of y
## 19.35 20.04
plot(density(x1))
plot(density(x2))
plot(density(x3))
plot(density(pesos))
Notemos que en el analisis de los lotes 1 y 2 tenemos un p-valor \(=0.7428>\alpha=0.05\),por tanto se aceptaria la hipotesis nula, es decir que las medias de ambos lotes son similares, luego obsercando el grafico de densidades, notamos que practicamente estan descentradas a la izquierda en el mismo punto, por tanto estos lotes no cumplen las especificaciones del problema. De manera similar comparando los lotes 2 y 3 tenemos un p-valor \(=6.103e-06<\alpha=0.05\) por lo tanto rechazamos la hipotesis nula, es decir las medias de los lotes son distintas. Ahora, si analizamos tambien la grafica para los 9’ datos, observamos que esta descentrada a la izquierda, asi, en general podemos decir que el proceso no es el adecuado.
Ahora compararemos los coeficientes de variacion y curtosis, asi
#lote1
xbarra1<−mean(x1)
desv1<−sqrt(sum((x1-xbarra1)^2)/29)
cv1<−desv1/xbarra1
curtosis1<−(30∗31/(29∗28∗27∗desv1^4))∗sum((x1−xbarra1)^4)−(3∗(29 )/(28∗27))
#lote2
xbarra2<−mean(x2)
desv2<−sqrt(sum((x2−xbarra2)^2) /29)
cv2<−desv2/xbarra2
curtosis2<−(30∗31/(29∗28∗27∗desv2^4))∗sum((x2−xbarra2)^4)−(3∗(29 )/(28∗27))
#lote3
xbarra3<−mean(x3)
desv3<−sqrt(sum((x3−xbarra3)^2)/ 29)
cv3<−desv3/xbarra3
curtosis3<−(30∗31/(29∗28∗27∗desv3^4))∗sum((x3−xbarra3)^4)−(3∗(29 )/(28∗27))
Asi obtenemos
cv1
## [1] 0.02868582
curtosis1
## [1] 4.610578
cv2
## [1] 0.03576105
curtosis2
## [1] 2.964245
cv3
## [1] 0.02002879
curtosis3
## [1] 3.68643
Asi, podemos notar que el coeficiente de variacion del lote dos es el mas grande con un 3.57 por ciento, le sigue el lote 1 y luego el lote 3 con 2.86 y 2 por ciento respectivamente. De igual forma en vase a los resultados ya que el valor de curtosis para el lote 1 es mayor a los demas con 4.61, entonces su curva de densidad es la mas alta, y le siguen la de los lotes 3 y 2 con 3.68 y 2.96 respectivamente.
f) ¿Las diferencias encontradas se podrian haber inferido a partir del histograma del inciso c?
hist(pesos)
abline(v=19.2,col='green',lwd='2')
abline(v=20.8,col='green',lwd='2')
Vemos que el centrado no es el adecuado e inclusive presenta un sesgo hacia la izquierda, luego existen datos hacia la derecha del limite de exigencia inferior es decir que existen varios costales que no cumplen con la calidad minima, de la misma manera observamos que existen datos hacia la izquierda del limite superior de exigencia, por tanto se podria decir que si los 90 datos no cumplen las especificaciones en su totalidad, los lotes tenderian a presentar un comportamiento anormal, y esto se verifica mediante el analisis hecho en el inciso c. Por otro lado, tambien podemos analizar la siguiente grafica de cada lote: Vemos claramente que el lote 3 es el que mas centrado esta, mientras que tanto el lote 1 como el lote 2 presentan centrado hacia la izquierda y con mucha variabilidad, ademas como vemos las figuras de las densidades no se parecen a una campana, esto evidencia de que algo esta pasando con el proceso y que tiene un efecto negativo en la calidad.
g) Obtenga un diagrama de caja para cada lote y comparelos
box1<-boxplot(x1)
box2<-boxplot(x2)
box3<-boxplot(x3)
En nuestro primer lote tenemos la presencia de un dato atipico, en este caso que sobrepasa el valor de la barrera interior derecha del diagrama de caja para el primer lote, a diferencia de el diagrama de caja para el lote 2 y 3. Para el primer lote (el caso mas notable), la mediana (doble barra negra horizontal) es cercana al valor del cuartil inferior, ademas que uno su brazo derecho es mas largo, es decir existe una gran posibilidad de la presencia de sesgo en los datos de este lote, para constatar esto calculemos su sesgo y sesgo estandarizado.
#lote 1
xbarra1<-mean(x1)
desv1<−sqrt(sum((x1−xbarra1)^2)/ 29)
sesgo1<−30∗sum(((x1−xbarra1)^3)/ (29∗28∗desv1^3))
sesgo1
## [1] 1.014276
De donde ya que el sesgo es positivo, entonces la cola derecha de la distribucion de los datos es mas larga.
#lote 2
xbarra2<-mean(x2)
desv2<−sqrt(sum((x2−xbarra2)^2)/ 29)
sesgo2<−30∗sum(((x2−xbarra2)^3)/ (29∗28∗desv2^3))
sesgo2
## [1] 0.06465902
#lote 3
xbarra3<-mean(x3)
desv3<−sqrt(sum((x3−xbarra3)^2)/ 29)
sesgo3<−30∗sum(((x3−xbarra3)^3)/ (29∗28∗desv3^3))
sesgo3
## [1] 0.2853588
Notamos que para el lote 2 y 3 la cola derecha de la distribuci´on de sus respectivos datos es mas larga.