Taller verificación de supuestos y pruebas de rangos múltiples DBCA
Author
Glendy Diaz, Ana Doria, Wilber pacheco, Glenis Naranjo
Taller verificación de supuestos y pruebas de rangos múltiples DBCA
Problema
Un fabricante de productos para la salud produce injertos vasculares (venas artificiales). Estos injertos se fabrican extruyendo tubos de resina de politetrafluoroetileno (PTFE) combinada con un lubricante. Con frecuencia, algunos de los tubos de una serie de producción contienen pequeñas protuberancias duras en la superficie externa. Estos defectos se conocen como “flicks”. El defecto es causa de rechazo de la unidad. El desarrollador del producto responsable de los injertos vasculares sospecha que la presión de extrusión afecta a la aparición de “flicks” y, por tanto, pretende llevar a cabo un experimento para investigar esta hipótesis. Sin embargo, la resina la fabrica un proveedor externo y se entrega al fabricante de productos para la salud por lotes. El ingeniero también sospecha que puede haber una variación significativa entre lotes, porque aunque el material debería ser consistente con respecto a parámetros como el peso molecular, el tamaño medio de partícula y la retención, probablemente no lo sea debido a la variación de fabricación en el proveedor de resina y a la variación natural del material. Por lo tanto, el desarrollador del producto decide investigar el efecto de cuatro niveles diferentes de presión de extrusión sobre los flicks, considerando los lotes de resina como bloques. La variable de respuesta es el rendimiento, es decir, el porcentaje de tubos de la tirada de producción que no contenían ninguna fisura. Recuerde que el orden en que se prueban las presiones de extrusión dentro de cada bloque es aleatorio. Las observaciones se encuentran en la siguiente tabla:
Punto 1 Verificación de la normalidad
Presión de extrusión (PSI)
Lote 1
Lote 2
Lote 3
Lote 4
Lote 5
Lote 6
8500
90,30
89,20
98,20
93,90
87,40
97,90
8700
92,50
89,50
90,60
94,70
87,00
95,80
8900
85,50
90,80
89,60
86,20
88,00
93,40
9100
82,50
89,50
85,60
87,40
78,90
90,70
a. Verifique el supuesto de normalidad de manera gráfica. Concluya partiendo de los resultados.
library(readxl)datos <-read_excel("C:/Users/LVJ/Downloads/Primera base de datos.xlsx")
En este código, primero se importa la librería readxl para leer datos desde un archivo Excel. se utiliza un metodo especifico para analizar la relación entre el rendimiento y los factores de presión y lotes. A continuación, se lleva a cabo un análisis de varianza ANOVA sobre el modelo ajustado para determinar si existen diferencias significativas en el rendimiento según los factores de presión y lotes. Por último, se presenta un resumen del ANOVA para evaluar la significancia de estas relaciones.
conclusion:
Del gráfico Cuantil-Cuantil no se observa alguna evidencia para sospechar que no exista normalidad en los residuales.
b. Verifique la normalidad usando el Test de Shapiro - Wilk. Plantee las hipótesis correspondientes y concluya a partir de ellas y el problema objeto de estudio.
Shapiro-Wilk normality test
data: anova$residuals
W = 0.95631, p-value = 0.3689
El estadístico de prueba obtenido para la prueba de Shapiro-Wilk, utilizado para evaluar la normalidad de los residuos del modelo, fue de 0.95631. Este valor se comparó con el estadístico crítico teórico para la distribución normal, considerando un nivel de significancia de 0.05 y el tamaño de la muestra de los residuos. Dado que el valor de prueba 0.95631 es menor que el valor teorico 0.981, no se encontró evidencia estadística suficiente para rechazar la hipótesis nula.
Por lo tanto esta conclusión es relevante para el problema en estudio, que busca determinar si la presión de extrusión tiene un efecto significativo en la aparición de “flicks” en los injertos vasculares. Sugiere que el supuesto de normalidad de los errores en el modelo de ANOVA podría ser razonablemente válido en este contexto.
c. Verifique la normalidad usando el Test de Kolmogorov - Smirnov. Plantee las hipótesis correspondientes y concluya a partir de ellas y el problema objeto de estudio.
Verificación analítica mediante Kolmogorov - Smirnov.
Lilliefors (Kolmogorov-Smirnov) normality test
data: modelo$residuals
D = 0.1305, p-value = 0.3617
conclusion:
El estadístico de prueba para la prueba de Lilliefors arrojó un valor de D = 0.1305, con un valor p de 0.3617. Dado que el valor p es mayor que el nivel de significancia convencional (0.05), no hay evidencia estadística suficiente para rechazar la hipótesis nula de normalidad de los residuos. Por lo tanto, se concluye que los residuos provienen de una distribución normal según el test de Lilliefors.
Punto 2 Verificación de la homocestacidad
a. Verifique el supuesto de homogeneidad de la varianza de manera gráfica. Concluya partiendo de los resultados.
library(readxl)datos <-read_excel("C:/Users/LVJ/Downloads/Primera base de datos.xlsx")
En esta gráfica se evidencia que no existe un patrón entre los puntos, lo que puede ser una señal de que los tratamientos tiene una igual varianza.
b. Verifique la homogeneidad de la varianza usando el Test de Bartlett. Plantee las hipótesis correspondientes y concluya a partir de ellas y el problema objeto de estudio.
Test de Bartlett
bartlett.test(anova$residuals~datos$presion)
Bartlett test of homogeneity of variances
data: anova$residuals by datos$presion
Bartlett's K-squared = 0.15654, df = 3, p-value = 0.9843
En este caso la prueba de Bartlett nos dio un estadístico de prueba de \(X_0^2=0.15654\) el estadístico teoríco para el nivel de significancia \(\alpha=0.05\) y \(a=1\) grados de libertad en el tratamiento quedea como \(X_{0.05,~3}^2=7.814728\)
Entonces tenemos qué:
\(X_0=0.15654\)
\(X_{0.05,~3}^2=7.814728\)
Como \(X_0^2<X_{\alpha,~a-1}\) No existe suficiente evidencia estadística para rechazar \(H_0\) por lo que las varianzas de los tratamientos son iguales, de la misma manera como se concluye en el gráfico.
Punto 3 Verificación supuesto de independencia
Tenga en cuenta los siguientes datos para el orden de corrida experimental:
datos2 <-read_excel("C:/Users/LVJ/Downloads/Segunda base de datos.xlsx")
a. Verifique el supuesto de independencia de manera gráfica. Concluya partiendo de los resultados gráficos.
residuales2 = anova2$residualsorden =c(1:24)plot(orden, residuales2, ylim =c(-3,5), xlim =c(1,25), main ="Grafico de independencia")
De acuerdo a los datos obtenidos en el gráfico de independecia no se puede observar con claridad un patrón en los datos, por esto no hay evidencia para dudar de la independencia entre los residuales.
b. Verifique la independencia usando el Test de Durbin - Watson. Plantee las hipótesis correspondientes y concluya a partir de ellas y el problema objeto de estudio.
HIPÓTESIS
\(H_0:\rho = 0\)
\(H_1: \rho \neq0\)
Test de Durbin - Watson
library(car)durbinWatsonTest(modelo2, alternative ="two.sided")
lag Autocorrelation D-W Statistic p-value
1 -0.2278286 2.407773 0.288
Alternative hypothesis: rho != 0
\(D=\) 2.407
\(D_L=\) 1.013
\(D_U=\) 1.775
\(4- D_L=\) 2.987
\(4- D_U=\) 2.225
Conclusión:
De acuerdo a los resultados obtenidos por el test de durbin - watson concluimos que \(4- D_U= 2.225 < D= 2.407 < 4- D_L= 2.987\). Por esto la prueba no es concluyente.
Punto 4 Decisión
a. ¿Cuál presión de extrusión ofrece mejores resultados al ingeniero? Responda y argumente usando la Test LSD de Fisher.
b. ¿Cuál presión de extrusión ofrece mejores resultados al ingeniero? Responda y argumente usando la Test HSD de Tukey.
#Análisis de varianza
library(readxl)datos <-read_excel("C:/Users/LVJ/Downloads/Primera base de datos.xlsx")
Study: anova ~ "presion"
LSD t Test for datos$rendimiento
Mean Square Error: 7.32575
presion, means and individual ( 95 %) CI
datos.rendimiento std r se LCL UCL Min Max Q25
8500 92.81667 4.577081 6 1.10497 90.46148 95.17185 87.4 98.2 89.475
8700 91.68333 3.304189 6 1.10497 89.32815 94.03852 87.0 95.8 89.775
8900 88.91667 2.966760 6 1.10497 86.56148 91.27185 85.5 93.4 86.650
9100 85.76667 4.445072 6 1.10497 83.41148 88.12185 78.9 90.7 83.275
Q50 Q75
8500 92.10 96.900
8700 91.55 94.150
8900 88.80 90.500
9100 86.50 88.975
Alpha: 0.05 ; DF Error: 15
Critical Value of t: 2.13145
least Significant Difference: 3.330738
Treatments with the same letter are not significantly different.
datos$rendimiento groups
8500 92.81667 a
8700 91.68333 ab
8900 88.91667 bc
9100 85.76667 c
Se puede concluir que los valores de PSI 8500 y 8700 representan los tratamientos con una media muestral más alta, por lo tanto tienen mayor rendimiento. Además, son estadísticamente iguales. A partir de esto, se infiere que el menor de los niveles de presión de extrusión es el que tendrá un mayor valor porcentual que no contiene ninguna fisura, en este caso es 8500 PSI.
b. ¿Cuál presión de extrusión ofrece mejores resultados al ingeniero? Responda y argumente usando la Test HSD de Tukey.
En conclusión, según los resultados obtenidos en la prueba HSD de Tukey, la presión de extrusión de 9100 ofrece mejores resultados que las presiones de extrusión de 8500 y 8700, ya que la diferencia en las medias es estadísticamente significativa. No hay diferencias significativas entre las demás combinaciones de presiones de extrusión. Esto quiere decir qué, basándonos en los resultados de la prueba HSD de Tukey, la presión de extrusión de 9100 es la que ofrece mejores resultados según los criterios evaluados en tu estudio.