Una industria autopartista líder del mercado de repuestos produce una pieza seriada cuya especificación para la dimensión principal es 39±7 milímetros. Cuando el proceso se encuentra controlado la dimensión principal tiene distribución Normal de media 39 mm y un desvío 3.7 mm. El proceso se muestra estable en cuanto a la media, mientras que el desvío suele mostrar cierta tendencia a incrementarse. Actualmente el proceso se controla extrayendo una muestra de cada lote, efectuando una medición de la dimensión crítica de la muestra e infiriendo sobre el desvío estándar. El control es efectuado por un técnico especialista en metrología. El técnico ha conseguido un mejor trabajo y el sector de Calidad le propone a la gerencia de Planta efectuar el control haciendo uso de calibres pasa-no pasa, es decir efectuar un control de procesos “por atributos” asignando la tarea a un operario de más baja calificación. El proceso de control se efectúa actualmente fijando un riesgo máximo del 5% detener el proceso si el desvío es el nominal, mientras que si el desvío se incrementa en un 20% respecto del valor nominal se considera que el porcentaje de defectuosos es inaceptable y por lo tanto la probabilidad de detener la producción y efectuar ajustes en el proceso se fija en un 90%.
Defino la VA:
\(X_i\): dimensión principal de la i-ésima pieza [mm]. \(X_i \sim N(\mu ; \sigma)\) Con \(\mu= 39 mm\) y \(\sigma= 3.7 mm\) teóricos cuando el proceso se encuentra bajo control. Para este proceso, la media se encuentra estable mientras que el desvio usualmente tiene tendencia a incrementarse.
Se presenta la propuesta del Sector de Calidad de efectuar el control haciendo uso de calibres pasa-no pasa, siendo este un control de proceso por aributos, a diferencia del antiguo control (por variables) que consistía en medir la dimensión crítica de cada pieza de la muestra una por una, en el cual requería de un técnico calificado y mayor tiempo para llevar a cabo el control de calidad. En cambio, el muestreo por atributos utilizando el calibre pasa-no pasa, requiere menor tiempo para realizar el control y se le puede asignar un operario de menor calificación lo cual disminuiría el costo de la mano de obra.
Se consideran los siguientes desvíos poblacionales:
\(\sigma_{nominal}=\sigma_0= 3.7 mm\) => \(\alpha=\pi(\sigma_0)=0.05\) (riesgo máximo de detener el proceso erroneamente siendo el desvío el nominal, del 5%)
\(\sigma_{"inaceptable"}=\sigma_1=1,2*\sigma_{nominal}=4.44 mm\) => \(\pi(\sigma_1)=0.9\) (90% de probabilidad de detener la producción y efectuar ajustes en el proceso, siendo el desvío 20% mayor al nominal)
Se realizará un muestreo por atributos a la Binomial, considerando población infinita (N -> infinito). Por atributos, debido a que se utilizará el calibre pasa-no pasa para deternimar si cada respectiva pieza tiene el “atributo”/“éxito” (esta fuera de la especificación con el desvío respectivo) o no tiene el “atributo”/“fracaso” (cumple la especificación con el devío respectivo). A la Binomial, debido a que se contará la cantidad de “éxitos”, en una muestra de tamaño fijo de n piezas.
Defino las VAs:
\(Y_i\) = 1 ; si la pieza es fuera de la especificaión con el desvío respectivo. \(Y_i\) = 0 ; si la pieza es dentro de la especificaión con el desvío respectivo.
=> \(Y_i \sim Ber(p)\)
R: cantidad de piezas fuera de la especificación tomada, de n observadas periodicamente. \(\sim Bin (n; p)\)
Entonces, calculo la proporciones poblacionales con los respectivos desvios, sabiendo que la dimensión crítica de cada pieza sigue una distribución Normal de media poblacional conocida igual a 39 mm:
\(p_0\)=P(la i-ésima pieza esta por fuera de la especificación con \(\sigma_0= 3.7mm\))
\(p_0=P(Y_i=1|\sigma_0)=P((X_i<32)U(X_i>46)|\sigma_0)=1-P(32\leq X_i \leq 46 |\sigma_0)\)
curve(dnorm(x, mean = 39, sd = 3.7), from = 25, to = 54, main = "Proporción poblacional de defectuosos Nominal", xlab = "Dimensión crítica de la i-ésima pieza", ylab = "Función de Densidad")
polygon(x = c(15, seq(from = 25, to = 32, 0.01), 32),
y = c(0, dnorm(seq(25, 32, 0.01), mean = 39, sd = 3.7), 0),
col = "purple")
polygon(x = c(46, seq(from = 46, to = 54, 0.01), 54),
y = c(0, dnorm(seq(46, 54, 0.01), mean = 39, sd = 3.7), 0),
col = "purple")
abline(v = 39, col = "black") #media poblacional de 39 mm
rug(c(32, 46))
grid()
Estandarizando: \(p_0=1 - [\Phi(\frac{46-39}{3.7})-\Phi(\frac{32-39}{3.7})]\) => \(p_0=2*\Phi(\frac{32-39}{3.7})\) => \(p_0=2*\Phi(-1.89)=2-2*\Phi(1.89)\)
2-2*pnorm(1.89)
## [1] 0.05875796
\(p_0=0.0588=p_{nominal}\) Porcentaje nominal de defectuosos del proceso
\(p_1\)=P(la i-ésima pieza esta por fuera de la especificación con \(\sigma_1= 4.44mm\)) \(p_1=P(Y_i=1|\sigma_1)=P((X_i<32)U(X_i>46)|\sigma_1)=1-P(32\leq X_i \leq 46 |\sigma_1)\)
curve(dnorm(x, mean = 39, sd = 4.44), from = 25, to = 54, main = "Proporción poblacional de defectuosos Inaceptable", xlab = "Dimensión crítica de la i-ésima pieza", ylab = "Función de Densidad")
polygon(x = c(15, seq(from = 25, to = 32, 0.01), 32),
y = c(0, dnorm(seq(25, 32, 0.01), mean = 39, sd = 4.44), 0),
col = "red")
polygon(x = c(46, seq(from = 46, to = 54, 0.01), 54),
y = c(0, dnorm(seq(46, 54, 0.01), mean = 39, sd = 4.44), 0),
col = "red")
abline(v = 39, col = "black") #media poblacional de 39 mm
rug(c(32, 46))
grid()
Estandarizando: \(p_1=1 - [\Phi(\frac{46-39}{4.44})-\Phi(\frac{32-39}{4.44})]\) => \(p_1=2*\Phi(\frac{32-39}{4.44})\) => \(p_1=2*\Phi(-1.58)=2-2*\Phi(1.58)\)
2-2*pnorm(1.58)
## [1] 0.1141069
\(p_1=0.1142=p_{"inaceptable"}\) Porcentaje de defectuosos considerado como “inaceptable”
Planteo el ensayo de hipótesis haciendo inferencia sobre la proporción poblacional de defectuosos:
\(H_0) p\leq (p_0=0.0588)\) ; \(H_a)p>(p_0=0.0588)\)
CR: \(\hat{p}\geq\hat{p_c}\) ; \(\hat{p}=\frac{R}{n}\)
=> CR: \(R\geq r_c\)
Condiciones del diseño del ensayo de hipótesis:
\(P(R\geq r_c|p_0)=G_{Bin}(r_c|n;p_0)=\alpha=\pi(p_0)=0.05\)
\(P(R \geq r_c|p_1)=G_{Bin}(r_c|n;p_1)=\pi(p_1)=0.9=1-\beta(p_1)\)
=> \(F_{Bin}(r_c-1|n;p_1)=\beta(p_1)=0.1\)
Considerando como válida la aproximación por Normal de la Binomial, es decir, considero un tamaño de muestra grande, y que la proporcion poblacional no esta en sus extremos: \(R \approx N(n*p; n*p*(1-p))\)
Entonces (corrigiendo por continuidad):
\(G_N (r_c-0.5|p_0)=\alpha=\pi(p_0)\)
\(F_N (r_c-1+0.5|p_1)=\beta(p_1)=1-\pi(p_1)\)
Estandarizando:
\(1 - \Phi(\frac{r_c-0.5-n*p_0}{\sqrt{n*p_0*(1-p_0)}})=\alpha\)
\(\Phi(\frac{r_c-0.5-n*p_1}{\sqrt{n*p_1*(1-p_1)}})=\beta(p_1)\)
Por lo tanto:
\(z_{1-\alpha}=\frac{r_c-0.5-n*p_0}{\sqrt{n*p_0*(1-p_0)}}\)
\(z_{\beta(p_1)}=-z_{1-\beta(p_1)}=\frac{r_c-0.5-n*p_1}{\sqrt{n*p_1*(1-p_1)}}\)
Operando y despejando n:
\(n \cong (\frac{z_{0.95}*\sqrt{n*p_0*(1-p_0)}+z_{0.9}*\sqrt{n*p_1*(1-p_1)}}{p_1-p_0})^2\)
qnorm(0.95)
## [1] 1.644854
qnorm(0.9)
## [1] 1.281552
=> \(n \cong 205.7 \cong 206\) Tamaño de muestra (aproximado)
Por lo tanto: \(z_{1-\alpha}*\sqrt{n*p_0*(1-p_0)}+0.5+n*p_0=r_c\)
=> \(r_c \cong 18.2\) , redondeo este valor hacia arriba para obtener un nivel de significación preferiblemente menor
=> \(r_c \cong 19\) Cantidad de piezas crítica, que estarían fuera de la especificación (aproximado)
Instrucciones Operativas (regla de decisión): Se debe realizar el muestreo periódicamente, separando de la cadena de producción una muestra de n = 206 piezas al azar a lo largo del período considerado.El operario tomara cada una y las evaluará a travez del calibre pasa-no pasa, que discriminará a las que cumplen con la especificación de las que no la cumplen. Luego, al final del período, se contará la cantidad de piezas defectuosas observadas(las cuales no pasaron por el calibre). Si esta cantidad observada es menor al valor crítico de 19 piezas defectuosas, entonces se considerará que el proceso está trabajando bajo condiciones aceptables. En cambio, si la cantidad observada es mayor o igual al valor crítico de 19 piezas defectuosas, entonces se considerará que el proceso presenta una proporción de defectuoso inaceptable, y se deberá parar el proceso, revisarlo y efectuar ajustes en el proceso. Con un riesgo máximo del 5% de parar el proceso erróneamente.
Realizo un diseño del ensayo de hipótesis para un muestreo por variables, efectuando las mediciones de cada pieza una por una, y haciendo inferencia sobre el desvío poblacional:
\(H_0) \sigma \leq (\sigma_0=3.7 mm)\) ; \(H_a)\sigma > (\sigma_0=3.7mm)\)
CR: \(S \geq S_c\)
CR: \(S^2 \geq S_c^2\)
\((\frac{\upsilon*S^2}{\sigma^2})\sim \chi^2(\upsilon)\)
=> CR: \(\chi^2_{\upsilon} \geq \chi^2_{(\upsilon;1-\alpha)}\)
Calculo el tamaño de muestra del ensayo por muestreo por variables n’, el cual será igual a los grados de libertad debido a que la media \(\mu=39 mm\) es conocida, es decir, \(n'=\upsilon\). Condiciones del diseño del ensayo:
\(P(S^2 \geq S_c^2 | \sigma_0=3.7mm)=\alpha=0.05\)
\(P(S^2 \geq S_c^2 | \sigma_1=4.44mm)=\pi(\sigma_1)=0.9=1-\beta(\sigma_1)\)
=> \(P(S^2 \leq S_c^2|\sigma_1=4.44mm)=\beta(\sigma_1)=0.1\)
Entonces:
\(\chi^2_{(\upsilon; 1-\alpha)}=\frac{\upsilon*S_c^2}{\sigma_0^2}\)
\(\chi^2_{(\upsilon; \beta)}=\frac{\upsilon*S_c^2}{\sigma_1^2}\)
Calculo la relación de fractiles de la chi cuadrado, R > 1:
\(R=\frac{\sigma_1^2}{\sigma_0^2}=\frac{\chi^2_{(\upsilon; 1-\alpha)}}{\chi^2_{(\upsilon; \beta)}}=1.44\)
Siendo iguales los grados de libertad de los fractiles, calculo los fractiles por la aproximación:
\(\upsilon \cong \frac{2}{9}*(a+\sqrt{a^2+1})^2\)
con los fractiles de la normal estandar anteriormente obtenidos: \(a=11.9625\)
=> \(n' = \upsilon \cong 127.7 \cong 128\)
=> \(n' = 128\) tamaño de muestra (aproximado) para el muestreo por variables
Se puede realizar este mismo cálculo, realizando una iteración mediante el software, el cual teoricamente daria un valor de los grados de libertad más exacto.
Por lo tanto:
i <- 1
while (TRUE) {
R <- (qchisq(0.95, df = i)/qchisq(0.1, df = i))
if (R <= 1.44) {
R2 <- (qchisq(0.95, df = i-1)/qchisq(0.1, df = i-1))
if (abs(1.44-R) <= abs(1.44-R2)) {
print(c(GL=i, R=R))
#(opción 1)
# i ---> grados de libertad que mejor cumplen aproximadamente la relación del R=1.44 deseada
# R ---> valor de la relación R real con los grados de libertad obtenidos, aproximadamente 1.44
break
}
else {
print(c(GL=i-1, R=R2))
#(opción 2)
# i-1 ---> grados de libertad que mejor cumplen aproximadamente la relación del R=1.44 deseada
# R2 ---> valor de la relación R real con los grados de libertad obtenidos, aproximadamente 1.44
break
}
}
else {
i <- i+1
}
}
## GL R
## 128.00000 1.43932
Como se observa, la iteración mediante el software da el mismo valor que el obtenido anteriormente, por lo tanto la aproximación fue buena.
Finalmente, siendo el costo de la medición de cada pieza con el calibre (por atributos) un 75% menor que el costo de efectuar las mediciones una por una (pot variables): \(c_A=0.25*c_V\) Se calcula la relación entre el costo total del muestreo por atributos (\(C_{total_A}\)) respecto del costo total del muestreo (\(C_{total_V}\)):
\(\frac{C_{total_A}}{C_{total_V}}=\frac{n*0.25*c_V}{n'*c_V}=\frac{206*0.25}{128}=0.4023\)
Por lo tanto, el costo total de muestreo por atributos es un 40.23% del costo total por variables. Entonces, el costo total se reduce un 59.77% al utilizar el calibre pasa-no pasa para un muestreo por atributos, en vez de medir cada pieza en el muestreo por variables.
Es necesario introducir una nueva etapa de limpieza de las piezas en el proceso. Para ello se evalúan dos desengrasantes, el A y el B. El desengrasante B es más caro pero al ser más efectivo el proveedor asegura que son muy pocas piezas en las que se debería repetir la operación. El ingeniero de procesos ha realizado un cálculo de costos y ha concluido que conviene adoptar el nuevo desengrasante si se demuestra que la proporción de piezas que requieren un segundo desengrasado disminuye en al menos 0.08 respecto la proporción del desengrasante actual. Para tomar la decisión se desengrasaron 50 piezas con el producto A, debiéndose repetir la operación de limpieza en 24 de ellas, mientras que con el producto B se desengrasaron 45 piezas, debiéndose someter a una segunda operación a 14 de ellas. En base a la evidencia de la muestra, ¿Cuál es su recomendación?
Se evaluarán dos desengrasantes, el A y el B, teniendo en cuenta que el desengrasante B es más caro pero a su vez al ser más efectivo que el A, su proveedor asegura que serían muy pocas piezas en las que se debería repetir la operación de limpieza, lo cual compensaria su costo mayor de compra al disminuir la cantidad de piezas que se deberían volver a limpiar y así dismunuir el costo de esta operación. Bajo esta lógica, se a dado la información de que conviene adoptar el desengrasante B en caso de que se demuestre que la proporción poblacional de piezas que se tienen que reprocesar usando el desengrasante B disminuye en al menos 0.08 (8%) respecto de la proporción poblacional del desengrasante A.
Para piezas procesadas con el desengrasante A y para procesadas con el B, se tomaron las siguientes respectivas muestras aleatorias, y se observaron las siguientes cantidades de piezas a reprocesar:
\(n_A=50\) —> \(r_{A(obs)}=24\)
\(n_B=45\) —> \(r_{B(obs)}=14\)
Defino las siguientes VAs:
\(Y_Ai=1\), si la i-ésima pieza con desengrasante A debe repetir la operación. \(Y_Ai=0\), si la i-ésima pieza con desengrasante A no debe repetir la operación.
\(Y_Bi=1\), si la i-ésima pieza con desengrasante B debe repetir la operación. \(Y_Bi=0\), si la i-ésima pieza con desengrasante B no debe repetir la operación.
\(R_A\): cantidad de piezas con desengrasante A que deben repetir la operación de nA observadas.
=> \(R_A \sim Bin (n_A; p_A)\)
\(R_B\): cantidad de piezas con desengrasante B que deben repetir la operación de nB observadas.
=> \(R_B \sim Bin (n_B; p_B)\)
Defino la diferencia entre proporciones: \(\delta =p_A - p_B\)
=> \(\hat{\delta}=\hat{p_A}-\hat{p_B}\)
siendo el estimador puntual: \(\hat{p_k=\frac{R_k}{n_k}\)
=>\(\delta_0 =p_{A0} - p_{B0}=0.08\)
Planteo el ensayo de hipótesis de comparación de poporciones poblacionales:
\(H_0)\delta \leq(\delta_0=0.08)\) ; \(H_a)\delta > (\delta_0=0.08)\)
CR:\(\hat{\delta} \geq \hat{\delta_c}\)
Suponiendo que \(\delta_0 \neq 0\) (debido a que supongo \(p_A \neq p_B\)) y aproximado por Normal, considerando tamaños de muestras grandes y que los valores de las proporciones poblacionales no son extremos:
\(R_A \approx N(n_A*p_A; n_A*p_A*(1-p_A))\) y \(R_B \approx N(n_B*p_B; n_B*p_B*(1-p_B))\)
Entonces, siendo combinación lineal de estas dos variables, el estimador puntual de la diferancia de proporciones (\(\hat{\delta}\)) va a seguir aproximadamente una distribución Normal.
Por lo tanto, estandarizo \(\hat{\delta}\), y como los tamaños de muestra son considerados grandes, aporximo las proporciones poblacionales a sus estimadores puntuales en el desvío, obteniendo el siguiente estadistico: \(Z=\frac{(\hat{p_A}-\hat{p_B})-\mu_{\hat{\delta}}}{\sigma_{\hat{\delta}}}\)
=> \(Z=\frac{(\hat{p_A}-\hat{p_B})-(p_A - p_B)}{\sqrt{\frac{\hat{p_A}*(1-\hat{p_A})}{n_A-1}+\frac{\hat{p_B}*(1-\hat{p_B})}{n_B-1}}}\)
=> CR: \(Z \geq z_{1-\alpha}\)
Tomando un riesgo máximo del 5%: \(z_{1-\alpha}=z_{0.95}=1.6449\)
Calculo los estimadores puntuales con las cantidades observadas:
\(\hat{p_{A(obs)}}=\frac{r_{A(obs)}}{n_A}\) y \(\hat{p_{B(obs)}}=\frac{r_{B(obs)}}{n_B}\)
=> \(\hat{p_{A(obs)}}=0.48\) y \(\hat{p_{B(obs)}}=0.3111\)
Por lo tanto el estadístico observado (con \(\hat{\delta_0}=0.08\)) es:
\(z_{obs}=\frac{(0.48-0.3111)-0.08}{\sqrt{\frac{0.48*(1-0.48)}{50-1}+\frac{0.3111*(1-0.3111)}{45-1}}}\)
=> \(z_{obs}=0.8906\)
=> \(z_{obs}=0.8906 < 1.6449=z_{1-\alpha}\)
=> No rechazo la hipótesis nula
Debido a que no hay evidencia estadística de que el uso del desengrasante B determine una reducción significatica de la proporción de piezas que se tengan que someter a una segunda operación de limpieza (con un riesgo de error de tipo I del 5%), se recomienda NO implementar el desengrasante B, el cual conlleva un mayor costo de compra, y SI implementar el desengrasante A, el cual es más económico.
Una de las piezas que se producen requiere una operación de pintado, en la cual es fundamental obtener un acabado libre de defectos superficiales. En la operación de pintado hay dos tipos de defectos: ampollas y arrugas. Cuando el proceso se encuentra bajo control las ampollas aparecen con un promedio de 1 cada 500 cm2 de superficie, mientras que las arrugas lo hacen a razón de 1 cada 800 cm2 de superficie. Ambos tipos de fallas son independientes y es prácticamente imposible que se presenten ambos defectos simultáneamente. El proceso se controla tomando una muestra aleatoria de 46 piezas y se declara en falla si se encuentran c=7 o más defectos de pintura en total. Es muy costoso detener el proceso de pintura innecesariamente. Cada pieza tiene 25 cm2 de superficie con pintura.
Las fallas/defectos superficiales (de ambos tipo) arriban de forma aleatoria en el continuo (superficie pintada de la pieza), por lo tanto se puede modelizas la aparición de fallas mediante Procesos de Poisson.
El Proceso de Poisson para la aparición de ampollas tendrá una intensidad de fallas de \(\lambda_1\), mientras que el Proceso de Poisson para la aparición de arrugas tendrá una intensidad de fallas de \(\lambda_2\). Siendo que la aparición de los dos tipos de falla son independientes entre si y es practicamente imposible que se presenten simultaneamente, entonces se puede realizar una Superposición de Procesos de Poisson, teniendo un solo proceso de aparición de fallas con una intensidad de \(\lambda=\lambda_1 + \lambda_2\)
Se realiza un muestreo a la Poisson, contando la cantidad de cada tipo de defecto superficial en cada pieza, cada una con una superficie pintada de \(t_j=25cm^2\).
Entonces, defino las siguientes variables:
\(R_1j\): Cantidad de defectos superficiales por ampollas observadas en una superficie pintada de tj=25cm^2; en la j-ésima pieza.
=> \(R_1j \sim Poi(m=\lambda_1*t_j)\)
\(R_2j\): Cantidad de defectos superficiales por arrugas observadas en una superficie pintada de tj=25cm^2; en la j-ésima pieza.
=> \(R_2j \sim Poi(m=\lambda_2*t_j)\)
\(R_j\): Cantidad de defectos superficiales de ambos tipos observados en una superficie pintada de tj=25cm^2; en la j-ésima pieza.
=> \(R_j \sim Poi(m=\lambda*t_j)\) siendo \(\lambda= \lambda_1 + \lambda_2\)
Dado que se realiza el control de proceso tomando un muestra aleatoria de 46 piezas, se define la VA:
\((R=\displaystyle{\sum^{46}_{j=1}R_j})\): Cantidad de defectos superficiales totales observados en las 46 piezas tomadas como muestra aleatoria.
Siendo una suma de VA idénticamente distribuidas e independientes, con distribució de Poisson:
=> \(R\sim Poi(m=\lambda*\displaystyle{\sum^{46}_{j=1}t_j})\)
con \(\lambda=\lambda_1+\lambda_2\) y \(t_j=25cm^2\)
Por lo tanto: \(R\sim Poi(m=(\lambda_1+\lambda_2)*1150cm^2)\)
Ensayo de hipótesis de inferencia sobre la intensidad de fallas:
\(H_0)\lambda \leq \lambda_0\) ; \(H_a)\lambda > \lambda_0\)
Siendo \(\lambda_0\) la intensidad de falla de la superposición de procesos cuando el proceso se encuentra bajo control: \(\lambda_0=\lambda_{01}+\lambda_{02}=\frac{1}{500cm^2}+\frac{1}{800cm^2}=\frac{13}{4000cm^2}\)
CR: \(\hat{\lambda} \geq \hat{\lambda_c}\) con \(\hat{\lambda}=\frac{R}{1150cm^2}\)
=> CR: \(R \geq r_c\)
Analizo si el valor de \(r_c\) dado, c=7, es apropiado o no:
\(P(R \geq (c=7)|\lambda_0)=G_{Poi}(c=7 | m=\lambda_0*1150)\)
Por la relación de Molina:
\(G_{Poi}(c=7 | m=\lambda_0*1150)=F_{\gamma}(1150 | \alpha=7; \beta=\frac{1}{\lambda_0})\)
Entonces, multiplicando por (\(2*\lambda_0\)) realizando un cambio de escala de la VA Gamma y uso la relación entre la Gamma y la Chi Cuadrado: \(\gamma(\alpha=r; \beta=2)\sim \chi^2(\upsilon=2*r)\)
\(F_{\gamma}(2*\lambda_0*1150 | \alpha=c=7; \beta=2)=F_{\chi^2}(2*\frac{13}{4000}*1150 | \upsilon=2*7)\)
Interpolando en la tabla 6 de fractiles de la Chi Cuadrado se puede obtener un valor aproximado: => \(F_{\chi^2}(7.475| \upsilon=14) \cong 0.0871\)
Haciendo uso del software:
ppois(7-1, lambda = ((13/4000)*1150), lower.tail = FALSE)
## [1] 0.08515151
=> \(G_{Poi}(c=7 | m=\lambda_0*1150)=0.0852\)
Por lo tanto, con \(r_c=c=7\) se tiene un \(\alpha=0.0852\), es decir, un nivel de significación del ensayo del 8.52%. Debido a que estáentre el 5% y 10%, se considera un nivel leve de significación. Entonces, aunque este \(\alpha\) no esta por fuera de lo habitualmente utilizado en los ensayos de hipótesis, considero más apropiado disminuirlo para así tener una probabilidad máxima de error de tipo I menor que la obtenida con c=7 (de valor 0.0852), y esto, se lograría aumentando el valor crítico de la cantidad de fallas totales ya que se requerirían más evidencias para poder rechazar la hipótesis nula, y por ende para poder tomar una decisión concluyente como lo es la ya mencionada, que conllevaría a tener que parar el proceso y hacer una revisión, lo cual implica ciertos costos económicos.
Entonces, para obtener un valor crítico de la cantidad de fallas totales, planteo un nivel de significación menor, del 5%, osea, \(\alpha=0.05\) (moderado):
\(G_{Poi}(r_c | m=\lambda_0*1150)=\alpha=0.05\)
=> \(F_{\chi^2}(7.475|\upsilon=2*r_c)=\alpha\)
=> \(\chi^2_{(2*r_c; 0.05)}=7.475\)
Si interpolo en la tabla 6, obtengo que los grados de libertad son \(2*r_c=\upsilon \cong 15.31\) => \(r_c \cong 7.655\), y redondiando para arriba para tener un alfa aún menor, obtengo: \(r_c=8\) (con \(\alpha \cong 0.05\))
Tambien se podría hacer una iteración mediante el software para obtener un valor crítico posiblemente mas exacto respecto del fractil, del siguiente modo:
i<-1
while (TRUE) {
chi<-qchisq(0.05, df = i)
if (chi>=7.475) {
chi2<-qchisq(0.05, df = i-1)
if (abs(7.475-chi)<=abs(7.475-chi2)) {
print(c(GL = i, rc = (i/2)))
break
}
else {
print(c(GL = (i-1), rc = ((i-1)/2)))
break
}
}
else {
i<-i+1
}
}
## GL rc
## 15.0 7.5
Entonces, para la iteración, los grados de libertad que más se acercan a los necesarios para obtener el fractil necesario son \(\upsilon=15\). Por lo tanto: \(r_c=7.5\) y redondiando para arriba para obteenr un alfa aún menor, se llega al mismo valor hayado por interpolación:
\(r_c=8\) (para \(\alpha \cong 0.05\)) Cantidad de defectos superficiales totales (encontrados en 46 piezas) mínimos necesarios para considerar en fallo la operación de pintado
Como se observa en el siguiente gráfico de la función de probabilidad de la VA discreta con distribución de Poisson, con una cantidad de piezas crítica (rc) de 7 (la propuesta inicialmente), se tiene una mayor región de rechazo de la hipótesis nula (en naranja), lo cual implica parar el proceso y revisarlo, y por ende una probabilidad máxima de cometer error de tipo I (alfa) de 0.0852. En cambio, al aumentar el valor de rc, se disminuye la región de rechazo y entonces la probabilidad máxima de cometer error de tipo I (alfa) tambien será menor. Así a partir de proponer un alfa menor de valor 0.05, se llega a tener la región de rechazo menor, y por ende un rc mayor de valor 8, el cual es un valor crítico más apropiado.
x<-c(seq(0, 12, 1))
y<-dpois(x, lambda = ((13/4000)*1150))
plot(x, y, type = "h", main = "Región Crítica del ensayo de hipótesis", xlab = "Cantidad de fallas totales", ylab = "Función de Probabilidad")
points(c(seq(0, 6, 1)), dpois(c(seq(0, 6, 1)), lambda = ((13/4000)*1150)), col = "black", lwd = 4)
points(c(seq(7, 12, 1)), dpois(c(seq(7, 12, 1)), lambda = ((13/4000)*1150)), col = "orange", lwd = 8)
points(c(seq(8, 12, 1)), dpois(c(seq(8, 12, 1)), lambda = ((13/4000)*1150)), col = "blue", lwd = 4)
text(9, 0.08, "para rc=c=7", col = "orange", font = 4)
text(9, 0.065, "para rc=8", col = "blue", font = 4)
grid()
Uso el nivel de significación del 5%, correspondiente al valor crítico \(r_c=8\).
Siendo \(\lambda_0=\frac{13}{4000}\) la intensidad de fallas cuando el proceso se encuentra bajo control. Entonces, si esta tasa se dubplica:
\(\lambda_1=2*\lambda_0=\frac{26}{4000cm^2}=0.0065\)
Calculo la probabilidad de detener el proceso (rechazo de H0) para el valor de \(lambda_1\), siendo esta la función de potencia evaluada en este punto:
\(\pi(\lambda_1)=G_{Poi}(r_c=8 | m=\lambda_1*1150cm^2=7.475)\)
Aplicando la relación de Molina:
\(G_{Poi}(r_c=8 | m=\frac{26}{4000cm^2}*1150)=F_{\gamma}(1150|\alpha=r_c=8; \beta=\frac{1}{\lambda_1}=\frac{4000}{26})\)
Siendo el parámetro alfa de la gamma <0.5, se puede usar Wilson-Hilferty como una buena aproximación:
\(\pi(\lambda_1) \cong \Phi(-0.07)=1-\Phi(0.07)\)
1-pnorm(0.07)
## [1] 0.4720968
=> \(\pi(\lambda_1) \cong 0.4721\)
Sino tambien se puede calcular la probabilidad directamente con el software para un calculo más preciso:
ppois(8-1, lambda = 7.475, lower.tail = FALSE)
## [1] 0.4716964
=> \(\pi(\lambda_1) = 0.4717\) Probabilidad de detener el proceso si se duplica la tasa total de fallas por cm^2 de pintura
Diseño un nuevo ensayo de hipótesis (muestreo a la Poisson, igual que antes):
\(H_0)\lambda \leq \lambda_0\) ; \(H_a)\lambda > \lambda_0\)
CR: \(R \geq r'_c\)
Incrementando la potencia calculada en el item anterior en un 25%:
\(\pi(\lambda_1=\frac{26}{4000})=1.25*0.4717=0.5896\)
Condiciones:
\(G_{Poi}(r'_c|m=\lambda_0*t')=\alpha=\pi(\lambda_0)=0.05\)
\(G_{Poi}(r'_c|m=\lambda_1*t')=\pi(\lambda_1)=0.5896\)
Entonces, aplico la relación de Molina, el cambio de escala de la Gamma, y la relación de esta con la Chi Cuadrado:
\(F_{\chi^2}(2*\lambda_0*t'| \upsilon=2*r'_c)=\alpha\) => \(\chi^2_{(2*r'_c;\alpha)}=2*\lambda_0*t'\)
\(F_{\chi^2}(2*\lambda_1*t'| \upsilon=2*r'_c)=\pi(\lambda_1)\)=> \(\chi^2_{(2*r'_c;\pi(\lambda_1))}=2*\lambda_1*t'\)
Planteo la relación R>1 de los fractiles de la Chi:
\(R=\frac{2*\lambda_1*t'}{2*\lambda_0*t'}=\frac{\chi^2_{(2*r'_c;\pi(\lambda_1))}}{\chi^2_{(2*r'_c;\alpha)}}=\frac{\lambda_1}{\lambda_0}=2\)
Siendo los grados de libertad iguales para los dos fractiles, uso la aproximación:
\(2*r'_c=\upsilon \cong \frac{2}{9}*(a+\sqrt{a^2+1})^2\)
Calculo a:
a<-(qnorm(0.5896)+qnorm(0.95)*2^{1/3}/(2*(2^{1/3}-1)))
a
## [1] 4.213084
=> \(2*r'_c=\upsilon =17.8 \cong 18\)
Entonces: \(r'_c =9\) (con la aproximación)
Se puede tambien realizar una iteración con el software, del siguiente modo:
i <- 1
while (TRUE) {
R <- (qchisq(0.5896, df = i)/qchisq(0.05, df = i))
if (R <= 2) {
R2 <- (qchisq(0.5896, df = i-1)/qchisq(0.05, df = i-1))
if (abs(2-R) <= abs(2-R2)) {
print(c(GL=i, R=R, rc=i/2))
#(opción 1)
# i ---> grados de libertad que mejor cumplen aproximadamente la relación del R=2 deseada
# R ---> valor de la relación R real con los grados de libertad obtenidos, aproximadamente 2
# rc ---> valor crítico que mejor cumplen aproximadamente la relación del R=2 deseada
break
}
else {
print(c(GL=i-1, R=R2, rc=(i-1)/2))
#(opción 2)
# i-1 ---> grados de libertad que mejor cumplen aproximadamente la relación del R=2 deseada
# R2 ---> valor de la relación R real con los grados de libertad obtenidos, aproximadamente 2
# rc ---> valor crítico que mejor cumplen aproximadamente la relación del R=2 deseada
break
}
}
else {
i <- i+1
}
}
## GL R rc
## 18.000000 1.991573 9.000000
Se observa que el valor crítico dio igual realizando la iteración (cálculo más exacto) por ende la aproximación anterior fue buena.
Por lo tanto, calculo el tamaño de muestra t’, la cual será la superficie pintada total de las 46 piezas tomadas como muestra aleatoria:
\(t'=\frac{\chi^2_{(18;0.05)}}{2*\lambda_0}\)
qchisq(0.05, df = 18)/(2*(13/4000))
## [1] 1444.685
=> \(t'=1444.69 cm^2\) Superficie pintada total que se debe observar en el muestreo a la Poisson
Finalmente, sabiendo que cada pieza tiene 25 cm^2 de superficie pintada, calculo el nuevo tamaño de muestra que se deberá tomar:
\(n'=\frac{1444.69 cm^2}{25cm^2}=57.79\)
=> \(n'=58\) Tamaño de muestra a tomar, es decir, la cantidad de piezas que se toman como muestra aleatoria, de las piezas que son sometidas a la operación de pintado