Un diseño de bloques aleatorizados es un diseño frecuentemente utilizado para minimizar el efecto de la variabilidad cuando se asocia con unidades discretas (por ejemplo, ubicación, operador, planta, lote, tiempo). El caso usual consiste en distribuir aleatoriamente una réplica de cada combinación de tratamientos dentro de cada bloque. Por lo general, no hay un interés intrínseco en los bloques, y se considera que éstos son factores aleatorios. La suposición habitual es que el bloque por interacción de tratamiento es cero, y esta interacción pasa a ser el término de error para probar los efectos del tratamiento. Si designa la variable de bloqueo como Bloque, los términos en el modelo serían entonces Bloque, A, B y A*B. También especificaría el Bloque como el factor aleatorio.
En el diseño en cuadro latino (DCL) se controlan dos factores de bloque y se estudia un factor de tratamientos, por lo que se tienen cuatro fuentes de variabilidad que pueden afectar la respuesta observada, éstas son: los tratamientos, el factor de bloque I (columnas), el factor de bloque II (renglones) y el error aleatorio.
Con el diseño en cuadro grecolatino (DCGL) se controlan tres factores de bloque, además del factor de tratamientos. Se llama cuadro grecolatino porque los cuatro factores involucrados se prueban en la misma cantidad de nive les, de aquí que se pueda escribir como un cuadro
Se hace un estudio sobre la efectividad de tres marcas de atomiza dor para matar moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hicieron seis réplicas, pero en días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a esta fuente de variación. Los datos obtenidos se muestran a continuación.
## NReplic MarcaAtm Y
## 1 1 1 72
## 2 1 2 55
## 3 1 3 64
## 4 2 1 65
## 5 2 2 59
## 6 2 3 74
## 7 3 1 67
## 8 3 2 68
## 9 3 3 61
## 10 4 1 75
## 11 4 2 70
## 12 4 3 58
## 13 5 1 62
## 14 5 2 53
## 15 5 3 51
## 16 6 1 73
## 17 6 2 50
## 18 6 3 69
Los datos analizados muestran que P es mayor a 0.05 por lo que no se puede rechazar la Ho, significa que no existe una diferencia significativa entre la efectividad de los atomizadores y las marcas.
## Df Sum Sq Mean Sq F value Pr(>F)
## NReplic 1 33.6 33.60 0.534 0.476
## MarcaAtm 1 114.1 114.08 1.812 0.198
## Residuals 15 944.3 62.95
En esta gráfica podemos observar que ho hay diferencias significativas en los efectos de las replicas aplicadas a las moscas. Solo una pequeña disminución del efecto en el quinto día, pero no es significativa.
En relación a las marcas, la marca de atomizador número 1 muestra un mayor porcentaje de eficacia en sus efectos en comparación a las otras dos, sin embargo, no es significativa entre una y otra.
Observamos que el atommizador 2 en la sexta réplica mostró menos efecto; por el contrario, el atomizador 1 en la cuarta réplica fue el que mostró mayor efectividad.
En esta prueba los datos nos muestra que entre las replicas no hay diferencias significativas, todas registran datos mayores a 0.05 al igual que en los atomizadores por marcas.
Observamos que los residuos siguen una distribución normal
Este test nos demuestra resultado de p-value mayor a 0.05 por lo que se acepta la Hipótesis nula
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.96054, p-value = 0.6121
No existe diferencia entre la varianza de las replicas, por lo que se acepta la h0, los resultados son mayores a 0.05.
Los datos se distribuyen de manera independiente, los residuales están valanceados y no se aprecia ningun cesgo.
Hay una clara muestra en la gráfica de la interacción que existe entre los datos.
Los productos utilizados para matar moscas no mostraron diferencias siognificativas en sus efectos, independientemente de los días y las marcas de los atomizadores no hay varianza en el porcentaje de moscas muertas.
Una de las variables críticas en el proceso de ensamble del brazo lector de un disco duro es el ángulo que éste forma con el cuerpo principal de la cabeza lectora. Se corre un experimento con el objetivo de comparar dos equipos que miden dicho ángulo en unidades de radianes. Se decide utilizar como factor de bloque a los operadores de los equipos.
## Y Op Equipo
## 1 1.328 1 1
## 2 1.113 1 1
## 3 0.985 1 1
## 4 1.057 1 1
## 5 1.316 1 1
## 6 1.144 1 1
## 7 1.553 1 1
## 8 1.485 1 1
## 9 1.310 1 1
## 10 1.386 1 1
## 11 1.273 1 2
## 12 0.789 1 2
## 13 0.985 1 2
## 14 0.671 1 2
## 15 1.134 1 2
## 16 0.554 1 2
## 17 1.412 1 2
## 18 1.386 1 2
## 19 0.917 1 2
## 20 1.289 1 2
## 21 1.269 2 1
## 22 1.093 2 1
## 23 1.268 2 1
## 24 0.984 2 1
## 25 1.091 2 1
## 26 1.087 2 1
## 27 1.195 2 1
## 28 1.482 2 1
## 29 1.380 2 1
## 30 1.442 2 1
## 31 1.036 2 2
## 32 0.201 2 2
## 33 0.783 2 2
## 34 0.900 2 2
## 35 1.108 2 2
## 36 0.916 2 2
## 37 1.129 2 2
## 38 1.434 2 2
## 39 1.132 2 2
## 40 1.223 2 2
## 41 1.440 3 1
## 42 1.150 3 1
## 43 1.079 3 1
## 44 1.190 3 1
## 45 1.389 3 1
## 46 1.247 3 1
## 47 1.611 3 1
## 48 1.617 3 1
## 49 1.445 3 1
## 50 1.574 3 1
## 51 1.454 3 2
## 52 1.018 3 2
## 53 1.063 3 2
## 54 1.050 3 2
## 55 1.219 3 2
## 56 0.997 3 2
## 57 1.602 3 2
## 58 1.538 3 2
## 59 1.583 3 2
## 60 1.478 3 2
El modelo AOV revela que existe una diferencia significativa entre los operadores y los equipos
## Df Sum Sq Mean Sq F value Pr(>F)
## Op 1 0.334 0.3343 5.202 0.02632 *
## Equipo 1 0.493 0.4925 7.662 0.00759 **
## Residuals 57 3.664 0.0643
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En esta gráfica podemos observar que hay diferencia significativa entre los operadores en especial entre el 2 y el 3.
Observamos que el equipo uno muestran datos superiores al equipo dos por lo que podemos interpretar que sus angulos sean mayores.
En esta prueba los datos nos muestra que entre los equipos hay diferencias significativas, se registran datos menores a 0.05 por lo que se rechaza la h0.
Los datos por operadores muestran diferencia significativa entre los operadores 2 y 3 lo cual está influyendo en que rechacemos la h0.
La línea de normalidad revela que los datos en general están distribuidos normalmente, sin embargo, se muestra una leve desviación al final de los datos.
Con el resultado de esta prueba, rechazamos la h0.
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.95024, p-value = 0.01599
La prueba de homogeneidad de varianza se observa que entre los equipos hay una diferencia significativa por lo que se rechaza la h0; sin embargo entre los resultados de la prueba en relación a los operadores no existe diferencia significativa, pero, considerando lo anterior la h0 se sigue rechazando.
Se observa desviación en la distribución de los datos residuales, lo que está provocando cesgo en el experimento.
Hay una clara muestra en la gráfica de que no hay interacción entre los datos.
En la prueba realizada los equipos muestran clara diferencia entre una y otra por lo que la h0 es rechazada, sin embargo existe cesgo en los datos de los operadores puesto que la distribución de la normalidad de datos residuales lo está demostrando. Los ángulos medidos por el equipo 1 muestran datos mayores en comparación al equipo 2.
Se quiere estudiar el efecto de cinco diferentes catalizadores (A, B, C, D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material sólo permite cinco corridas y cada corrida requie re aproximadamente 1.5 horas, por lo que sólo se pueden realizar cinco corridas diarias. El experimentador decide correr los ex perimentos con un diseño en cuadro latino para controlar activa mente a los lotes y días
## Lote Dias Tratamiento Y
## 1 1 1 A 8
## 2 1 2 B 7
## 3 1 3 D 1
## 4 1 4 C 7
## 5 1 5 E 3
## 6 2 1 C 11
## 7 2 2 E 2
## 8 2 3 A 7
## 9 2 4 D 3
## 10 2 5 B 8
## 11 3 1 B 4
## 12 3 2 A 9
## 13 3 3 C 10
## 14 3 4 E 1
## 15 3 5 D 5
## 16 4 1 D 6
## 17 4 2 C 8
## 18 4 3 E 6
## 19 4 4 B 6
## 20 4 5 A 10
## 21 5 1 E 4
## 22 5 2 D 2
## 23 5 3 B 3
## 24 5 4 A 8
## 25 5 5 C 8
Los datos que genera los tratamientos nos indica que existen diferecias significativas, sin embargo, entre los datos diario y los lotes no existe diferencias.
## Df Sum Sq Mean Sq F value Pr(>F)
## Lote 1 0.18 0.18 0.050 0.825845
## Dias 1 0.02 0.02 0.006 0.941496
## Tratamiento 4 141.44 35.36 9.792 0.000218 ***
## Residuals 18 65.00 3.61
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Podemos interpretar que:
a- Entre los tratamientos A vs E, A vs D, C vs D y C vs E; existen diferencia muy significativas.
b- Entre los tratamientos A vs C y D vs E; no hay diferencias.
C- El tratamiento B muestra poca diferencia con los tratamientos A y C, sin embargo, con los tratamientos D y E la diferencia se incrementa.
En esta prueba los datos nos muestra que entre los tratamientos D-A, E-A, D-c y E-c existe una diferencia significativa.
Observamos que los residuos siguen una distribución normal
Este test nos demuestra resultado de p-value mayor a 0.05
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.95303, p-value = 0.293
La prueba de homogeneidad de varianza arroja una p>0.05
Los datos se distribuyen de manera independiente, los residuales están valanceados y no se aprecia ningun cesgo.
Los catalizadores estudiados muestran que no tienen efecto sobre el tiempo de reacción de los procesos químicos. Sin embargo, cada catalizador entre sí muestran diferencias significativas en sus resultados.
El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre una o varias respuestas, cuando se tiene el mismo interés sobre todos los factores.
Los factores pueden ser de tipo cualitativo (máquinas, tipos de material, operador, la presencia o ausencia de una operación previa, etc.), o de tipo cuantitativo (temperatura, humedad, velocidad, presión, etc.). Para estudiar la manera en que influye cada factor sobre la variable de respuesta es necesario elegir al menos dos niveles de prueba para cada uno de ellos. Con el diseño factorial completo se corren aleatoriamente todas las posibles combinaciones que pueden formarse con los niveles de los factores a investigar
Considere los factores A y B con a y b (a, b≥ 2) niveles de prueba, respectivamente. Con ellos se puede construir el arreglo o diseño factorial a × b, el cual consiste en a × b tratamientos. Algunos casos particulares de uso frecuente son: el factorial 22, el factorial 32 y el factorial 3 × 2. Se llama réplica a cada corrida completa del arreglo factorial. Los diseños factoriales que involucran menos de cuatro factores por lo regular se corren replicados para tener la potencia necesaria en las pruebas estadísticas sobre los efectos de interés.
Cuando se quiere investigar la influencia de tres factores (A, B y C) sobre una o más variables de respuesta, y el número de niveles de prueba en cada uno de los factores es a, b y c, respectivamente, se puede construir el arreglo factorial a × b × c, que consiste de a × b × c tratamientos o puntos experimentales. Entre los arreglos de este tipo que se utilizan con frecuencia en aplicaciones diversas se encuentran: el factorial 23, el factorial 33 y los factoriales mixtos con no más de cuatro niveles en dos de los factores, por ejemplo, el factorial 4 × 3 × 2 y el factorial 4 × 4 × 2, por mencionar dos de ellos
Se corre un diseño factorial 3 × 2 con 10 réplicas para investigar el hinchamiento del catalizador después de la extrusión en la fabricación de botellas de polietileno de alta densidad. El catalizador se utiliza en la obtención de dicho polietileno. Los factores investigados son: molde (con dos niveles) y B: catalizador (con tres niveles).
## Molde Catalizador Y
## 1 -1 -1 93
## 2 -1 -1 92
## 3 -1 -1 90
## 4 -1 -1 91
## 5 -1 -1 92
## 6 -1 -1 91
## 7 -1 -1 90
## 8 -1 -1 91
## 9 -1 -1 93
## 10 -1 -1 90
## 11 1 -1 88
## 12 1 -1 88
## 13 1 -1 87
## 14 1 -1 87
## 15 1 -1 88
## 16 1 -1 87
## 17 1 -1 87
## 18 1 -1 87
## 19 1 -1 87
## 20 1 -1 88
## 21 -1 0 92
## 22 -1 0 94
## 23 -1 0 90
## 24 -1 0 91
## 25 -1 0 90
## 26 -1 0 91
## 27 -1 0 92
## 28 -1 0 92
## 29 -1 0 92
## 30 -1 0 91
## 31 1 0 90
## 32 1 0 88
## 33 1 0 88
## 34 1 0 88
## 35 1 0 89
## 36 1 0 90
## 37 1 0 89
## 38 1 0 88
## 39 1 0 88
## 40 1 0 89
## 41 -1 1 95
## 42 -1 1 94
## 43 -1 1 94
## 44 -1 1 94
## 45 -1 1 94
## 46 -1 1 97
## 47 -1 1 95
## 48 -1 1 96
## 49 -1 1 94
## 50 -1 1 96
## 51 1 1 91
## 52 1 1 90
## 53 1 1 92
## 54 1 1 90
## 55 1 1 97
## 56 1 1 89
## 57 1 1 90
## 58 1 1 91
## 59 1 1 91
## 60 1 1 91
Los datos analizados muestran que P es menor de 0.05 lo que significa que existe diferencias muy significativas; este resultado nos lleva a rechazar la h0.
## Df Sum Sq Mean Sq F value Pr(>F)
## Molde 1 180.3 180.27 95.88 8.08e-14 ***
## Catalizador 1 136.9 136.90 72.81 9.01e-12 ***
## Residuals 57 107.2 1.88
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En esta gráfica podemos observar que hay diferencias significativas entre los moldes.
El tercer catalizador comparado a las anteriores muestra diferencias muy significativas; sin embargo, el catalizador 1 y 2 entre ellos las diferencias son menores.
Observemos que el primer molde muestra mejores resultados en cada uno de los catalizadores utilizados en comparación al segundo molde.
En esta prueba los datos nos muestran que hay diferencias significativas entre los moldes y los catalizadores 1 vs 0 y 1 vs -1
Observamos que los residuos siguen una distribución normal.
Este test nos demuestra resultado de p-value menores a 0.05 por lo que se rechaza la Hipótesis nula
Se demuestra homogeneidad de las varianza por variable.
Los datos se distribuyen de manera independiente, los residuales se muestran distribuidos normalmente, pero, se muestra una pequeña dispersión en uno de los moldes .
La gráfica evidencía claramente que no existe interacción entre los datos de las variables.
Para mejorar la resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas, se estudiaron dos tipos de pegamentos (A1 y A2) y tres temperaturas de curado (60, 80 y 100°C). En cada combinación se analizaron dos componentes y los resultados obtenidos son los siguientes:
## Pegamento Temperatura Y
## 1 A1 60 2.50
## 2 A1 60 2.80
## 3 A1 80 3.80
## 4 A1 80 3.40
## 5 A1 100 4.00
## 6 A1 100 4.20
## 7 A2 60 1.60
## 8 A2 60 1.22
## 9 A2 80 3.20
## 10 A2 80 2.80
## 11 A2 100 4.30
## 12 A2 100 4.70
Los datos analizados muestran que P es menor de 0.05 lo que significa que existe diferencias muy significativas; este resultado nos lleva a rechazar la h0.
## Df Sum Sq Mean Sq F value Pr(>F)
## Pegamento 1 0.691 0.691 12.36 0.00790 **
## Temperatura 1 10.306 10.306 184.28 8.33e-07 ***
## Pegamento:Temperatura 1 1.345 1.345 24.05 0.00119 **
## Residuals 8 0.447 0.056
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En esta gráfica podemos observar que hay diferencias significativas en los efectos de los pegamentos A y B. Los datos de del pegamento A muestran mayores resistencias.
Se ve clara diferencia entre una temperatura y otra, pero, entre los datos a 60° vs 100° hay mayor significancia en la diferencia. Además, se obserba que a mayor temperatura la resistencia de adhesión mejora.
Observamos que el pegamanto 2 a 60° muestra la menor resistencia, sin embargo el mismo pegamento a 100°C es el que muestra mejor resistencia a las torsión en la adhesión.
En esta prueba los datos nos muestra que hay diferencias significativas entre las temperaturas, las pruebas de los pegamentos por temperatura, en su mayoría muestran diferencias significativas solo las pruebas A2:80°-A1:60°y A2:100-A1:80° son las que no muestran mayores diferencias.
Observamos que los residuos siguen una distribución normal.
Este test nos demuestra resultado de p-value menores a 0.05 por lo que se rechaza la Hipótesis nula
Existe diferencia entre la varianza de las temperaturas, por lo que se rechaza la h0, los resultados son menores a 0.05.
Los datos se distribuyen de manera independiente, los residuales del pegamento 2 están más dispersos.
La gráfica evidencía claramente que no existe interacción entre los datos de las variables.
Los pegamentos utilizados para el experimento de resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas reflejan que a mayor temperatura los pegamentos dan mejores resultados. Entre los dos pegamentos utilizados el pegamento 2 muestra mayores diferencias, a menor temperatura da peor resultado, pero, a mayor temperatura mejora el rendimiento. El pegamento uno, sin embargo, muetra una constante en mejorar a medida que se elevan las temperaturas pero sus diferencias no son tan significativas.
Se desea investigar de qué manera afecta el tiempo de curado y el tipo del acelerante a la resistencia de caucho vulcanizado. Se realiza un experimento y se obtienen los siguientes datos:
## TIEMPO ACELERANTE Y
## 1 -1 -1 3900
## 2 -1 -1 3600
## 3 0 -1 4100
## 4 0 -1 3500
## 5 1 -1 4000
## 6 1 -1 3800
## 7 -1 0 4300
## 8 -1 0 3700
## 9 0 0 4200
## 10 0 0 3900
## 11 1 0 4300
## 12 1 0 3600
## 13 -1 1 3700
## 14 -1 1 4100
## 15 0 1 3900
## 16 0 1 4000
## 17 1 1 3600
## 18 1 1 3800
Los datos analizados muestran que P es mayor a 0.05 por lo que no se puede rechazar la Ho, significa que no existe una diferencia significativa entre la efectividad de los acelerantes y el tiempo.
## Df Sum Sq Mean Sq F value Pr(>F)
## TIEMPO 1 3333 3333 0.048 0.829
## ACELERANTE 1 3333 3333 0.048 0.829
## Residuals 15 1031111 68741
En esta gráfica podemos observar que ho hay diferencias significativas en el tiempo de cura de los cauchos vulcanizados.
En relación al acelerante a 40°C existe un leve aumento en la resistencia del caucho vulcanizado pero no hay una clara diferencia en comparación a las otras dos temperaturas.
Observamos que el a 40°C el acelerante B, tiene un leve efecto en la resistencia de los cauchos vulganizado, sin embargo, no es una diferencia significativa.
En esta prueba los datos nos muestra que, el experimento en tiempo no hay diferencias significativas, todas registran datos mayores a 0.05 al igual que en los acelerantes. La h0 se acepta.
Observamos que los residuos siguen una distribución normal.
Este test nos demuestra resultado de p-value mayor a 0.05 por lo que se acepta la Hipótesis nula
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.9542, p-value = 0.4947
No existe diferencia entre el tiempo y el efecto del acelerante en la resistencia de los cauchos vulcanizados, por lo que se acepta la h0, los resultados son mayores a 0.05.
Los datos se distribuyen de manera independiente, los residuales están valanceados y no se aprecia ningun cesgo.
Existe interacción entre los datos del acelerante B y C, mientras que el acelerante A no tiene interacción. El acelerante A muestra una mayor resistencia, sin embargo el acelarante B aumenta su efecto de 40° a 60° pero en el tiempo pierde eficacia; además, el acelerante C es el menos efectivo.
El experimento a demostrado que no hay diferencias significativas relacionado al tiempo de curado y el tipo de acelerante a la resistencia de los cauchos vulcanizados.