EJERCICIO 5. Diseño factorial 2^3

En una fábrica de dientes se tiene probelmas con la calidad: porosidad(burbujas de aire dentro de los dientes), manchas blancas, dientes sucios, dientes quebrados. En los intentos por resolver los problemas han hecho cambios en algunos factores o variables del proceso. Con base en la metodología del DDE se decide correr un diseño de experimentos 2 a la 3. Los factores y niveles son: temperatura de prensado (90,130°C), tiempo de prensado (8 y 15 min) y tamaño de partícula (sin tamizar y con tamizado), la variable de respuesta fue porcentaje de diente bueno en cada corrida (un lote de producción). Los datos son los siguientes:

Temperatura Tiempo Tamaño Porcentaje 90 8 SinTamizar 76.4 90 8 SinTamizar 76.9 130 8 SinTamizar 76.3 130 8 SinTamizar 76.9 90 15 SinTamizar 80.4 90 15 SinTamizar 81 130 15 SinTamizar 77.9 130 15 SinTamizar 77.6 90 8 ConTamizar 84.4 90 8 ConTamizar 84.6 130 8 ConTamizar 84.7 130 8 ConTamizar 84.5 90 15 ConTamizar 82.7 90 15 ConTamizar 83.2 130 15 ConTamizar 85 130 15 ConTamizar 84.7

Determine la unidad experimental, factores, tratamientos y variable de respuesta.

Unidad experimental = Diente

variable de respuesta= Porcentaje de diente bueno

Factor 1= Temperatura Tratamientos= 90º y 130º

Factor 2= Tiempo Tratamientos= 8 y 15 minutos

Factor 3= Tamaño Tratamientos= sin taminzado con tamizado

Estadísticas descriptivas - Diagrama de cajas

Interpretación de gráficas del factor Temperatura

Se observan que la caja a 90°C presenta menos dispersión de datos que la de 130°C, sin embargo, hay en la de 130°C hay una mayor concentración de datos entre Q1 y Q3. Por la posición de Q2 en las dos cajas esta muy cerca del centro por lo que podría haber normalidad.Asì mismo, Se puede observar que las medias de las temperaturas de 90ºC y 130ºC, no presentan diferencia significativa, la temperatura de130ºC presenta los porcentajes más altos comparado con la temperatura 90ºC.

library("ggplot2")
ggplot(dientes, aes(x = as.factor(Temperatura), y = Porcentaje)) +
  geom_boxplot(fill = "grey80", colour = "blue") +
  scale_x_discrete() + xlab("Temperatura de prensado") +
  ylab("Porcentajes de dientes buenos")

Interpretación de gráficas del factor Tiempo

Para el tiempo de prensado, los dientes prensados a 8 min presentan mayor dispercion que los prensados en 15 minitus, en la caja de 8 minutos de prensado el Q2 esta muy cerca de la mediana por lo que es muy probable que tenga una distriucion normal, en la caja de 15 minutos la caja presenta asimetria positiva. La caja de 15 min presenta un mayor numero de dientes buenos en comparacion con la de 8 min de prensado pero no parece haber diferencia significativa entre las dos medidas.

library("ggplot2")
ggplot(dientes, aes(x = as.factor(Tiempo), y = Porcentaje)) +
  geom_boxplot(fill = "grey80", colour = "blue") +
  scale_x_discrete() + xlab("Tiempo de prensado") +
  ylab("Porcentaje de dientes buenos")

Interpretación de gráficas del factor Tamaño

Al evaluar el tamaño de particula en el porcentaje de buenos dientes existe una evidente diferencia entre los dientes con materialez tamizados y no tamizados, los dientes con materiales tamizados presentan muy poca dispercion de datos y presentan un promedio mas alto que los dientes hechos con materiales sin tamizar. Se observa clara diferencia significativa entre el porcentaje de dientes buenos hechos con materiales tamizados y materiales sin tamizar.

library("ggplot2")
ggplot(dientes, aes(x = as.factor(Tamaño), y = Porcentaje)) +
  geom_boxplot(fill = "grey80", colour = "blue") +
  scale_x_discrete() + xlab("Tamaño de particula") +
  ylab("Porcentaje de dientes buenos")

Interpretación de gráficas de la interacción

Se observa que la interacción de 130 °C, 15 min de presado y con material tamizado presenta el mayor promedio, seguido por las cajas de las interacciones de 90°C, 8 min de prensado y material tamizado, los menores promedios fueron encontrados en las interacciones de las variables de tiempo y temperatura con material sin tamizar. Todas las cajas de los datos presentan datos poco dispersos y un Q2 muy cercano a la mediana por lo que se puede suponer que presentan normalidad.

x11()
boxplot(Porcentaje~Temperatura*Tiempo*Tamaño, 
        ylab="Porcentaje de dientes sanos",data= dientes,
        col=blues9,axe.name=0.6)

Modelo Estadístico

yijkl = µ + τi + βj + γk + (τβ)ij + (τ γ)ik + (βγ)jk + (τβγ)ijk + uijkl i = 1, 2 ; j = 1, 2 ; k = 1, 2 ; l = 1, 2, 3,4,5, 6 • 𝑌ijkl: Es la observación de la variable respuesta debido al i − ésimo nivel factor A, al j − ésimo nivel factor B,al k − ésimo nivel factor c en la l − ésima replica • 𝜇: es la media global • τi: Es el efecto del i-ésimo nivel del factor A sobre la variable respuesta • βj: Es el efecto del j-ésimo nivel del factor B sobre la variable respuesta • γk: Es el efecto del k-ésimo nivel del factor c sobre la variable respuesta • (τβ)ij + (τ γ)ik + (βγ)jk + (τβγ)ijk : Es el efecto de la interacción entre el i-ésimo nivel del factor A con el j-ésimo nivel del factor B y el j-ésimo nivel del factor C, sobre la variable respuesta • uijkl: Es el error aleatorio debido a factores no controlables. • r es el número de replicaciones y n = abcr es el número de observaciones.

Hipótesis

H0= La temperatura de prensado no afecta al porcetaje de diente bueno.

H0= El tiempo de presnado no afecta al porcentaje de diente bueno.

H0= El tamaño de partícula no afecta al porcentaje de diente bueno

H0= Las diferentes interacciones generan el mismo efecto en el porcentaje de dientes buenos.

H1= Existe al menos una temperatura de prensado que tiene un efecto diferente de los demás sobre la variable respuesta.

H1= Existe al menos un tiempo de prensado que tiene un efecto diferente de los demás sobre la variable respuesta

H1= Existe al menos un tamaño de partícula que tiene un efecto diferente de los demás sobre la variable respuesta

H1= Existe al menos una interacción que tiene efecto diferente que los demás.

anova.dientes = aov(Porcentaje~ Temperatura+Tiempo+Tamaño+Temperatura:Tiempo+Temperatura:Tamaño+Tamaño:Tiempo+Tiempo:Temperatura:Tamaño,
                     data=dientes)
summary(anova.dientes)
##                           Df Sum Sq Mean Sq  F value   Pr(>F)    
## Temperatura                1   0.25    0.25    2.703 0.138800    
## Tiempo                     1   3.80    3.80   41.108 0.000207 ***
## Tamaño                     1 158.76  158.76 1716.324 1.27e-10 ***
## Temperatura:Tiempo         1   0.30    0.30    3.270 0.108157    
## Temperatura:Tamaño         1   6.25    6.25   67.568 3.59e-05 ***
## Tiempo:Tamaño              1  10.56   10.56  114.189 5.16e-06 ***
## Temperatura:Tiempo:Tamaño  1   5.52    5.52   59.703 5.60e-05 ***
## Residuals                  8   0.74    0.09                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
e<-anova.dientes$residuals 

La ANOVA es válido si cumplen los supuestos.

Interpretación del suspuesto de Normalidad

𝐻𝑜: Los residuales son normales

𝐻1: Los residuales tienen otra distribución Normal

Se realiza una gráfica para observar si el comportamiento de los residuales del modelo si tienen una distribución normal, donde se puede observar que el histograma se articula bien con la curva, de igual manera se realiza la prueba Shapiro-Wilk obteniendo un valor -p de 0.0633, por lo tanto, la evidencia estadística muestra que los residuales del modelo cumplen con el supuesto de normalidad.

shapiro.test(e) #### Normalidad
## 
##  Shapiro-Wilk normality test
## 
## data:  e
## W = 0.89354, p-value = 0.06338
hist(e, freq=FALSE)
curve(dnorm(x,mean(e), sd(e)), xlim=c(-0.7,0.7), add=TRUE, col=2)

Interpretación del suspuesto de Homogeneidad

𝐻𝑜: Las varianzas de los tratamientos son iguales

𝐻1: Hay diferencias en las varianzas de los tratamientos.

NO hay diferencia significativa, obteniendo un valor-p de 2.2e-16 , por lo tanto, la evidencia estadística muestra que los residuales del modelo no cumplen con el supuesto de homogeneidad.

library(carData)
library(car)
leveneTest(e ~ Temperatura*Tiempo*Tamaño, center = "median") 
## Warning in anova.lm(lm(resp ~ group)): ANOVA F-tests on an essentially perfect
## fit are unreliable
## Levene's Test for Homogeneity of Variance (center = "median")
##       Df   F value    Pr(>F)    
## group  7 4.414e+31 < 2.2e-16 ***
##        8                        
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretación del suspuesto de Independencia

𝐻𝑜: Si hay independencia

𝐻1: No hay independencia

Si hay diferencia significativa, el p-value 0.3 es mayor que 0.05, por tanto, si hay independencia.

library(randtests)
runs.test(e)
## 
##  Runs Test
## 
## data:  e
## statistic = 1.0351, runs = 11, n1 = 8, n2 = 8, n = 16, p-value = 0.3006
## alternative hypothesis: nonrandomness

Interpretación del suspuesto de Linealidad

𝐻𝑜: Si hay linealidad

𝐻1: No hay linealidad

Si hay diferencia significativa, el p-value es mayor que el 5%, por tanto, si hay linealidad.

t.test(e, mu=0)
## 
##  One Sample t-test
## 
## data:  e
## t = -1.562e-16, df = 15, p-value = 1
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  -0.1183546  0.1183546
## sample estimates:
##     mean of x 
## -8.673617e-18

Interpretación de ANOVA

No se realiza ANOVA, porque no se cumple el supuesto de homogenidad , se realiza el MODELO LINEAL GENERALIZADO.

Prueba Modelo lineal generalizado

La variable tamaño de partícula es superior estadísticamente al ser comparado con las variables tiempo y temperatura que no presentan diferencias entre sí. La interacción de las tres variables (temperatura, tiempo y tamaño) son superiores estadísticamente al comparar con las otras interacciones, seguido por la interacción temperatura y tamaño que es superior estadísticamente a su vez a la interacción temperatura tiempo que es el que menor promedio alcanzó.

mod <- glm(Porcentaje ~ Temperatura+Tiempo+Tamaño+Temperatura:Tiempo+Temperatura:Tamaño+Tamaño:Temperatura+Tiempo:Temperatura:Tamaño,
           data=dientes)
anova(mod,test="Chisq")
## Analysis of Deviance Table
## 
## Model: gaussian, link: identity
## 
## Response: Porcentaje
## 
## Terms added sequentially (first to last)
## 
## 
##                           Df Deviance Resid. Df Resid. Dev  Pr(>Chi)    
## NULL                                         15    186.190              
## Temperatura                1    0.250        14    185.940  0.619251    
## Tiempo                     1    3.803        13    182.137  0.052628 .  
## Tamaño                     1  158.760        12     23.377 < 2.2e-16 ***
## Temperatura:Tiempo         1    0.303        11     23.075  0.584651    
## Temperatura:Tamaño         1    6.250        10     16.825  0.012971 *  
## Temperatura:Tiempo:Tamaño  1    7.713         9      9.112  0.005779 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Conclusiones

Para evitar problemas de calidad en la fabricación de diente bueno y por tanto obtener porcentajes altos, es necesario supervisar , monitorear el tamaño de partícula y la interacción de la temperatura, tiempo de prensado y tamaño ya que son factores que influyen en la baja calidad en la fabricación de dientes.

El estudio demostró que la variable tamaño de partícula es la que más influye en el porcentaje de dientes buenos, el segundo factor que mas influye es la variable tiempo de prensado y finalmente la variable la variable temperatura.

Los mayores porcentajes de dientes buenos se encontraron en las interacciones de las variables temperatura y tiempo de prensado cuando interactúan con la variable tamaño en el nivel partículas tamizadas.

Los menores porcentajes de dientes buenos en las interacciones de las variables temperatura y tiempo de prensado cuando interactúan con la variable tamaño en el nivel partículas sin tamizadas.

La interacción tamaño de partícula con tiempo de prensado fue superior al ser comparado con la interacción de tamaño de partícula con temperatura, la interacción de tiempo de prensado con temperatura es inferior significativamente al ser comparada con las interacciones donde se considera el factor tamaño de partícula.