Evaluar de manera integral el impacto de los diferentes factores, sobre el tiempo de la elaboracion del cafe, con el propósito de identificar áreas de mejora y oportunidades de optimización que impulsen la eficiencia y competitividad en el proceso de elaboracion del cafe.
Identificar cuál de los factores en el proceso de preparación del café tiene un impacto significativo en la disminución de los tiempos de preparación.
Analizar si el tipo de cafetera utilizado (alta rendimiento, automático o semiautomático) tiene un efecto real sobre la reducción de los tiempos de preparación del café.
Evaluar el impacto de la experiencia del barista (principiante, intermedio o experto) en la velocidad y efectividad del proceso de elaboración del café.
El diseño experimental es una herramienta fundamental en la ingeniería industrial, ya que permite analizar y optimizar procesos de producción con base en datos cuantitativos. En el contexto de una cafetería, uno de los aspectos clave para mejorar la eficiencia operativa es la optimización de los tiempos de preparación del café. Esto no solo tiene un impacto en la productividad de la operación, sino que también afecta de manera directa la experiencia del cliente. A continuación, se amplía cómo el diseño experimental puede contribuir a mejorar estos aspectos y cómo se puede aplicar en una cafetería
I
Este estudio busca minimizar el tiempo de preparación del café, evaluándolo mediante un diseño factorial completo con tres factores: tipo de cafetera (automática, semiautomática, manual), experiencia del barista (principiante, intermedio, experto) y tamaño del recipiente (pequeño, mediano, grande). Esto da 27 tratamientos con 3 réplicas cada uno, resultando en 81 observaciones. Se controlarán variables como la calidad y molienda del café, la temperatura del agua y las condiciones óptimas de las cafeteras, mientras que factores no controlables incluyen el estado de ánimo del barista, distracciones y presión ambiental. La unidad experimental será cada preparación de espresso, y la aleatorización se hará conforme al orden de los pedidos, registrando el tiempo de preparación. Este diseño permitirá identificar la combinación más eficiente de factores para optimizar el proceso.
##
## Adjuntando el paquete: 'gplots'
## The following object is masked from 'package:stats':
##
## lowess
## Cargando paquete requerido: carData
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
##
## Adjuntando el paquete: 'goftest'
## The following objects are masked from 'package:nortest':
##
## ad.test, cvm.test
## Cargando paquete requerido: zoo
##
## Adjuntando el paquete: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
## Cargando paquete requerido: usethis
Tamaño <- as.factor(datos$Tamaño)
Cafetera <- as.factor(datos$Cafetera)
Experiencia <- as.factor(datos$Experiencia)
par(mfrow=c(1,3))
boxplot(datos$Tiempo ~ datos$Tamaño, xlab="Tamaño del Expresso", ylab="Tiempo en segundos")
La mediana de los tiempos para el expreso grande está cerca de los 75 segundos, mientras que para el expreso pequeño está cerca de los 50 segundos. Esto sugiere que, en promedio, los tiempos de preparación para los expresos grandes son más largos que los de los expresos pequeños. El hecho de que la mediana para el tamaño grande sea más alta sugiere que, en promedio, los baristas o máquinas tardan más en preparar un expreso grande que uno pequeño.
par(mfrow=c(1,3))
boxplot(datos$Tiempo ~ datos$Cafetera, xlab="Cafetera", ylab="Tiempo en segundos")
No hay diferencias significativas entre las medianas de las tres cafeteras. Todas están cerca de los 60-65 segundos, lo que indica que, en promedio, el tiempo de preparación es similar para todos los tipos de cafeteras.
La cafetera de alto rendimiento tiene la menor dispersión (más consistente), mientras que la automática es la que muestra la mayor variabilidad en los tiempos de preparación.
par(mfrow=c(1,3))
boxplot(datos$Tiempo ~ datos$Experiencia, xlab="Experiencia", ylab="Tiempo en segundos")
El gráfico muestra que, a medida que aumenta la experiencia del barista, el tiempo de preparación tiende a ser más rápido y más consistente:
Los expertos tienen los tiempos de preparación más rápidos y más consistentes.
Los intermedios tienen tiempos más largos que los expertos, con una mayor variabilidad.
Los principiantes tienen los tiempos de preparación más largos y la mayor variabilidad, con un valor atípico que destaca un valor mucho más alto de lo esperado.
Este análisis indica que la experiencia tiene un impacto directo en la eficiencia y consistencia de la preparación del expreso. Los baristas con más experiencia son más rápidos y constantes, mientras que los principiantes muestran una mayor inexperiencia reflejada en la variabilidad y el mayor tiempo necesario para preparar el expreso.
par(mfrow=c(1,1))
require(graphics)
formula <- datos$Tiempo ~ Tamaño + Cafetera + Experiencia
plot.design(formula, col= "coral", xlab="Efectos", ylab="Tiempo Promedio")
Este gráfico resume cómo cada variable afecta el tiempo promedio de preparación:
El tamaño del expreso y la experiencia tienen un impacto evidente y progresivo.
El tipo de cafetera tiene un efecto menos pronunciado, con tiempos similares entre categorías.
Los intervalos de confianza sugieren variaciones importantes según la categoría, especialmente para los principiantes y expresos grandes.
Este tipo de gráfico ayuda a identificar patrones y la magnitud del efecto de cada variable sobre la variable de respuesta.
library(gplots)
require(gplots)
par(mfrow=c(1,3))
plotmeans(datos$Tiempo ~ datos$Tamaño, xlab="Tamaño de expresso", ylab="Tiempo Promedio")
plotmeans(datos$Tiempo ~ datos$Cafetera, xlab="Tipo de Cafetera", ylab="Tiempo Promedio")
plotmeans(datos$Tiempo ~ datos$Experiencia, xlab="Experiencia", ylab="Tiempo Promedio")
El tamaño del expreso tiene un impacto consistente en el tiempo promedio, pero su efecto varía dependiendo del tipo de cafetera y la experiencia.
La experiencia tiene un efecto significativo, con los principiantes tomando más tiempo en todas las categorías.
El tipo de cafetera afecta menos cuando el operador es un principiante, sugiriendo que la habilidad del usuario es un factor clave.
Estos gráficos son útiles para detectar efectos de interacción y guiar conclusiones sobre cómo optimizar la preparación del café.
require(car)
par(mfrow=c(1,3))
qqPlot(datos$Tiempo, xlab="Cuantiles teóricos", ylab="Cuantiles muestrales", main="Grafico cuantil-cuantil")
## [1] 32 17
hist(datos$Tiempo, xlab="Tiempo", ylab="Frecuencia", main="Histograma")
boxplot(datos$Tiempo, xlab="crecimiento", main="Gráfico de cajas")
require(nortest)
shapiro.test(datos$Tiempo)
##
## Shapiro-Wilk normality test
##
## data: datos$Tiempo
## W = 0.97318, p-value = 0.08678
ad.test(datos$Tiempo)
##
## Anderson-Darling test of goodness-of-fit
## Null hypothesis: uniform distribution
## Parameters assumed to be fixed
##
## data: datos$Tiempo
## An = Inf, p-value = 7.407e-06
interpretar estas graficas para la normalidad en un parrafo Las gráficas que proporcionaste incluyen un gráfico cuantil-cuantil (QQ plot), un histograma y un gráfico de cajas (box plot), que se utilizan para evaluar la normalidad de los datos.
Gráfico Cuantil-Cuantil (QQ Plot): Este gráfico compara los cuantiles teóricos de una distribución normal con los cuantiles de los datos observados. Los puntos que se alinean cerca de la línea diagonal sugieren que los datos siguen una distribución normal.
modelo <- aov(datos$Tiempo ~ Tamaño * Cafetera * Experiencia, data = datos)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Tamaño 2 4751 2375 37.747 5.54e-11 ***
## Cafetera 2 209 104 1.657 0.200
## Experiencia 2 8628 4314 68.560 1.51e-15 ***
## Tamaño:Cafetera 4 197 49 0.784 0.540
## Tamaño:Experiencia 4 245 61 0.973 0.430
## Cafetera:Experiencia 4 151 38 0.600 0.664
## Tamaño:Cafetera:Experiencia 8 543 68 1.078 0.392
## Residuals 54 3398 63
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Tamaño:
Valor F: 37.747 Valor p: 5.54e-11
Interpretación: El factor “Tamaño” tiene un efecto significativo en el Tiempo de preparación (p < 0.001). Esto sugiere que hay diferencias significativas en los tiempos de preparación entre los diferentes tamaños de café.
Cafetera:
Valor F: 1.657 Valor p: 0.200
Interpretación: El factor “Cafetera” no tiene un efecto significativo en el Tiempo de preparación (p > 0.05). Esto indica que el tipo de cafetera no afecta significativamente el tiempo de preparación.
Experiencia:
Valor F: 68.560 Valor p: 1.51e-15
Interpretación: El factor “Experiencia” tiene un efecto significativo en el Tiempo de preparación (p < 0.001). Esto sugiere que la experiencia del barista tiene un impacto significativo en la duración del tiempo de preparación.
Tamaño:Cafetera:
Valor F: 0.784 Valor p: 0.540
interpretación: No hay una interacción significativa entre los factores Tamaño y Cafetera (p > 0.05). Esto indica que el efecto del tamaño en el tiempo de preparación no varía significativamente según el tipo de cafetera utilizada.
Tamaño:Experiencia:
Valor F: 0.973 Valor p: 0.430
Interpretación: No hay una interacción significativa entre los factores Tamaño y Experiencia (p > 0.05). Esto indica que el efecto del tamaño en el tiempo de #preparación no varía significativamente según la experiencia del barista.
Cafetera:Experiencia:
Valor F: 0.600 Valor p: 0.664
interpretación: No hay una interacción significativa entre los factores Cafetera y Experiencia (p > 0.05). Esto indica que el efecto del tipo de cafetera en el tiempo de preparación no varía significativamente según la experiencia del barista.
Tamaño:Cafetera:Experiencia:
Valor F: 1.078 Valor p: 0.392
Interpretación: No hay una interacción significativa entre los factores Tamaño, Cafetera y Experiencia en conjunto (p > 0.05). Esto indica que la combinación de estos tres factores no tiene un efecto conjunto significativo en el tiempo de preparación.
model1e <- model.tables(modelo,type='effects')
model1t <- model.tables(modelo,type='means')
ygorro <- fitted(modelo)
Tiempo=μ+α Tama n +β Experiencia+ε Este modelo indica que Tamaño y Experiencia son factores que afectan significativamente el Tiempo, mientras que las interacciones no tienen un efecto significativo en el tiempo.
modelo2 <- lm(Tiempo ~ Tamaño + Cafetera + Experiencia, data = datos)
summary(modelo2)
##
## Call:
## lm(formula = Tiempo ~ Tamaño + Cafetera + Experiencia, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.9173 -4.4173 -0.3914 4.8975 20.4420
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 61.377 2.301 26.673 < 2e-16 ***
## Tamañomediano -12.419 2.130 -5.829 1.36e-07 ***
## Tamañopequeño -18.385 2.130 -8.630 8.32e-13 ***
## Cafeteraautomático 3.581 2.130 1.681 0.0969 .
## Cafeterasemiautomático 3.193 2.130 1.499 0.1382
## Experienciaintermedio 4.344 2.130 2.039 0.0450 *
## Experienciaprincipiante 23.741 2.130 11.144 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 7.827 on 74 degrees of freedom
## Multiple R-squared: 0.7498, Adjusted R-squared: 0.7295
## F-statistic: 36.96 on 6 and 74 DF, p-value: < 2.2e-16
Multiple R-squared: 0.7498. Esto significa que el modelo explica 74.98% de la variabilidad en el Tiempo. Es un buen modelo, pero no perfecto
El valor F es 36.96 con un valor p de < 2.2e-16, lo que indica que el modelo en su conjunto es significativo, es decir, al menos una de las variables predictoras tiene un efecto en el Tiempo.
El modelo es bastante bueno para predecir el Tiempo. Tamaño y Experiencia son los factores más influyentes.
residuales <- rstandard(modelo)
summary(residuales)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -2.24901 -0.58155 -0.02059 0.00000 0.64331 2.55780
require(car)
par(mfrow=c(1,3))
qqPlot(residuales, xlab="Cuantiles teoricos", ylab="Cuantiles muestrales", main="Gr?fico cuantil-cuantil")
## [1] 48 17
Interpretación: Dado que los puntos se distribuyen aproximadamente por la linea podemos concluir que los datos podriantener una distribución normal Ademas los datos se encuentran entre las barras sombreadas lo que indica que los datos estan dentro de la variabilidad.
hist(residuales, xlab="Residuales", ylab="Frecuencia", main="Histograma")
Interpretación: El histograma nos muestra una curva muy similar a la de una campana lo que nos dice que podría haber distribución normal.
boxplot(residuales, xlab="Residuales", main="Gr?fico de cajas")
Interpretación: La caja del boxplot tiene una forma simetrica lo que indica normalidad, Sin embargo se ven muchos valores atipicos lo que nos dice que puede que no haya comportamiento normal, para verificar haremos otros testeos.
require(nortest)
shapiro.test(residuales)
##
## Shapiro-Wilk normality test
##
## data: residuales
## W = 0.98968, p-value = 0.7687
Interpretación: Dado un p-value = 0.7687 es decir mayor al 5% podemos concluir que hay normalidad en los datos.
ad.test(residuales)
##
## Anderson-Darling test of goodness-of-fit
## Null hypothesis: uniform distribution
## Parameters assumed to be fixed
##
## data: residuales
## An = Inf, p-value = 7.407e-06
Dado el p-value = 0.7246 hay normalidad porque el valor p es mayor a la significancia.
valores_ajustados<-fitted(modelo)
par(mfrow=c(1,4))
plot(valores_ajustados, residuales, xlab="Valores ajustados", ylab="Residuales")
abline(h=0, col = "gray60")
plot(as.numeric(Tamaño), residuales, xlab="Tamaño", ylab="Residuales")
abline(h=0, col = "gray60")
plot(as.numeric(Experiencia), residuales, xlab="Experiencia", ylab="Residuales")
abline(h=0, col = "gray60")
plot(as.numeric(Cafetera), residuales, xlab="Cafetera", ylab="Residuales")
abline(h=0, col = "gray60")
Interpretación: En los gráficso de Valores ajustados, Tamaño, Experiencia y Cafetera Vs Residualeslos los puntos están dispersos aleatoriamente alrededor de cero sin un patrón claro, Lo que indica homocedasticidad o Varianza Constantes.
require(car)
# Test de Levene para cada factor
leveneTest(Tiempo ~ factor(Tamaño), data = datos) # Varianza constante respecto al Tamaño
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.2608 0.7711
## 78
leveneTest(Tiempo ~ factor(Cafetera), data = datos) # Varianza constante respecto a la Cafetera
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.1555 0.8562
## 78
leveneTest(Tiempo ~ factor(Experiencia), data = datos)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.3318 0.7187
## 78
Interpretación: Tamaño, Cafetera y Experiencia tienen valores p mayores a 0.05 (0.7711, 0.8562, y 0.7187, respectivamente).No hay evidencia suficiente para rechazar la hipótesis nula de homogeneidad de varianzas. Es decir, las varianzas parecen constantes entre los niveles de cada uno de estos factores.
# Test de Levene para las interacciones
leveneTest(Tiempo ~ factor(Tamaño)*factor(Cafetera), data = datos) # Interacción Tamaño:Cafetera
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 8 0.5543 0.8115
## 72
leveneTest(Tiempo ~ factor(Tamaño)*factor(Experiencia), data = datos) # Interacción Tamaño:Experiencia
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 8 0.8262 0.5823
## 72
leveneTest(Tiempo ~ factor(Cafetera)*factor(Experiencia), data = datos)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 8 0.5 0.8524
## 72
Las interacciones Tamaño:Cafetera, Tamaño:Experiencia, y Cafetera:Experiencia tienen valores p mayores a 0.05 (0.8115, 0.5823, y 0.8524, respectivamente). Tampoco hay evidencia para afirmar que las varianzas difieren significativamente entre los niveles combinados de estos factores.
# Test para todas las interacciones
leveneTest(Tiempo ~ factor(Tamaño)*factor(Cafetera)*factor(Experiencia), data = datos)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 26 0.4971 0.9727
## 54
El valor p es 0.9727, muy superior a 0.05. Las varianzas son consistentes incluso considerando la combinación de todos los factores.
require(lmtest)
bptest(modelo)
##
## studentized Breusch-Pagan test
##
## data: modelo
## BP = 39.93, df = 26, p-value = 0.03963
Hipótesis nula (H0): La varianza de los residuos es constante (homocedasticidad). Hipótesis alternativa (H1): La varianza de los residuos no es constante (heterocedasticidad). #Dado que el valor p (0.03963) es menor que 0.05, se rechaza la hipótesis nula. Sin embargo como en los gráficos se probo homocedasticidad concluire homocedasticidad.
par(mfrow=c(1,3))
plot(residuales, pch=16, ylab="Residuales", xlab="Orden", main="Gr?fico de Orden vs Residuales")
abline(h=0)
acf(residuales,ylim=c(-1,1), main="Grafico de ACF")
pacf(residuales,ylim=c(-1,1), main="Grafico de PACF", ylab="PACF")
los residuos son independientes, ya que no se observan patrones claros en #el Gráfico de Orden vs. Residuales, y tanto el ACF como el PACF indican que las autocorrelaciones están dentro de los intervalos de confianza.
require(lmtest)
dwtest(modelo,alternative="two.sided")
##
## Durbin-Watson test
##
## data: modelo
## DW = 1.9737, p-value = 0.9947
## alternative hypothesis: true autocorrelation is not 0
Hipótesis nula: No hay autocorrelación en los residuos del modelo. Hipótesis alternativa: Hay autocorrelación en los residuos del modelo. Dado que el valor p es muy alto (0.9947), no rechazamos la hipótesis nula. HAY INDEPENDENCIA
require(agricolae)
# Comparaciones múltiples para Tamaño
LSD.test(modelo, "Tamaño", console=TRUE, group=FALSE)
##
## Study: modelo ~ "Tamaño"
##
## LSD t Test for datos$Tiempo
##
## Mean Square Error: 62.92568
##
## Tamaño, means and individual ( 95 %) CI
##
## datos.Tiempo std r se LCL UCL Min Max Q25
## grande 72.99630 12.16693 27 1.526624 69.93560 76.05699 55.1 96.5 63.75
## mediano 60.57778 13.91580 27 1.526624 57.51708 63.63847 42.8 85.1 49.60
## pequeño 54.61111 13.13698 27 1.526624 51.55041 57.67181 30.5 85.4 45.40
## Q50 Q75
## grande 70.5 82.75
## mediano 54.2 73.90
## pequeño 52.3 59.55
##
## Alpha: 0.05 ; DF Error: 54
## Critical Value of t: 2.004879
##
## Comparison between treatments means
##
## difference pvalue signif. LCL UCL
## grande - mediano 12.418519 0.0000 *** 8.090040 16.74700
## grande - pequeño 18.385185 0.0000 *** 14.056706 22.71366
## mediano - pequeño 5.966667 0.0078 ** 1.638188 10.29515
Tamaño
Los tamaños grande, mediano y pequeño muestran diferencias significativas en el tiempo pues: Entre “grande” y “mediano”: Diferencia de 12.42 unidades. Entre “grande” y “pequeño”: Diferencia de 18.39 unidades. Entre “mediano” y “pequeño”: Diferencia de 5.97 unidades. Esto indica que el tamaño afecta significativamente el tiempo. El tamaño “grande” está asociado con un mayor tiempo, mientras que “pequeño” tiene los valores más bajos.
LSD.test(modelo, "Cafetera", console=TRUE, group=FALSE)
##
## Study: modelo ~ "Cafetera"
##
## LSD t Test for datos$Tiempo
##
## Mean Square Error: 62.92568
##
## Cafetera, means and individual ( 95 %) CI
##
## datos.Tiempo std r se LCL UCL Min Max
## alto rendimiento 60.47037 15.73702 27 1.526624 57.40967 63.53107 30.5 95.6
## automático 64.05185 14.93533 27 1.526624 60.99116 67.11255 40.4 90.1
## semiautomático 63.66296 14.77287 27 1.526624 60.60227 66.72366 40.9 96.5
## Q25 Q50 Q75
## alto rendimiento 46.00 62.4 67.65
## automático 50.55 60.7 76.35
## semiautomático 52.25 58.7 73.05
##
## Alpha: 0.05 ; DF Error: 54
## Critical Value of t: 2.004879
##
## Comparison between treatments means
##
## difference pvalue signif. LCL UCL
## alto rendimiento - automático -3.5814815 0.1029 -7.909960 0.7469974
## alto rendimiento - semiautomático -3.1925926 0.1450 -7.521071 1.1358863
## automático - semiautomático 0.3888889 0.8577 -3.939590 4.7173677
Las cafeteras alto rendimiento, automático y semiautomático no muestran diferencias significativas en el tiempo.
Entre alto rendimiento y automático: Diferencia no significativa (p = 0.1029). Entre alto rendimiento y semiautomático: Diferencia no significativa (p = 0.1450). Entre automático y semiautomático: Diferencia no significativa (p = 0.8577). Esto sugiere que el tipo de cafetera no influye significativamente en el tiempo.
LSD.test(modelo, "Experiencia", console=TRUE, group=FALSE)
##
## Study: modelo ~ "Experiencia"
##
## LSD t Test for datos$Tiempo
##
## Mean Square Error: 62.92568
##
## Experiencia, means and individual ( 95 %) CI
##
## datos.Tiempo std r se LCL UCL Min Max
## experto 53.36667 10.89372 27 1.526624 50.30597 56.42736 30.5 85.4
## intermedio 57.71111 11.24481 27 1.526624 54.65041 60.77181 40.7 80.1
## principiante 77.10741 10.95424 27 1.526624 74.04671 80.16810 55.7 96.5
## Q25 Q50 Q75
## experto 46.00 52.3 60.05
## intermedio 50.25 55.2 66.45
## principiante 70.25 78.5 85.25
##
## Alpha: 0.05 ; DF Error: 54
## Critical Value of t: 2.004879
##
## Comparison between treatments means
##
## difference pvalue signif. LCL UCL
## experto - intermedio -4.344444 0.0492 * -8.672923 -0.01596559
## experto - principiante -23.740741 0.0000 *** -28.069220 -19.41226189
## intermedio - principiante -19.396296 0.0000 *** -23.724775 -15.06781744
Los niveles de experiencia (“experto”, “intermedio” y “principiante”) muestran diferencias significativas en el tiempo. Entre experto y intermedio: Diferencia de -4.34, significativa (p = 0.0492). Entre experto y principiante: Diferencia de -23.74, significativa (p < 0.0001). Entre intermedio y principiante: Diferencia de -19.40, significativa (p < 0.0001). Esto indica que los principiantes tardan considerablemente más, mientras que los expertos tienen los tiempos más bajos.
modelo_interaccion <- lm(Tiempo ~ Tamaño * Experiencia, data = datos)
summary(modelo_interaccion)
##
## Call:
## lm(formula = Tiempo ~ Tamaño * Experiencia, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.389 -4.244 -0.400 5.511 20.644
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 64.7556 2.6345 24.579 < 2e-16 ***
## Tamañomediano -15.6556 3.7258 -4.202 7.49e-05 ***
## Tamañopequeño -18.5111 3.7258 -4.968 4.40e-06 ***
## Experienciaintermedio 4.8889 3.7258 1.312 0.1936
## Experienciaprincipiante 19.8333 3.7258 5.323 1.11e-06 ***
## Tamañomediano:Experienciaintermedio 0.7667 5.2691 0.146 0.8847
## Tamañopequeño:Experienciaintermedio -2.4000 5.2691 -0.455 0.6501
## Tamañomediano:Experienciaprincipiante 8.9444 5.2691 1.698 0.0939 .
## Tamañopequeño:Experienciaprincipiante 2.7778 5.2691 0.527 0.5997
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 7.904 on 72 degrees of freedom
## Multiple R-squared: 0.7518, Adjusted R-squared: 0.7242
## F-statistic: 27.26 on 8 and 72 DF, p-value: < 2.2e-16
En este caso ajustamos el modelo con los factores relevantes MODELO AJUSTADO . el Modelo ajustado en función de Tamaño y Experiencia,Tiempo = 64.7556 + (-15.6556 * Tamañomediano) + (-18.5111 * Tamañopequeño) + (4.8889 * Experienciaintermedio) + (19.8333 * Experienciaprincipiante) + (0.7667 * Tamañomediano * Experienciaintermedio) + (-2.4000 * Tamañopequeño * Experienciaintermedio) + (8.9444 * Tamañomediano * Experienciaprincipiante) + (2.7778 * Tamañopequeño * Experienciaprincipiante)
require(pwr2)
## Cargando paquete requerido: pwr2
#f.a <- sqrt((a*D^2)/(2*b*sigma^2))
# Definición de parámetros
a <- 3 # Número de niveles del factor "Tamaño"
b <- 3 # Número de niveles del factor "Experiencia"
sigma <- sd(datos$Tiempo) # Desviación estándar residual del modelo
D <- 5 # Diferencia mínima detectable entre medias (valor asumido)
alpha <- 0.05 # Nivel de significancia (ajustado)
beta <- 0.1 # Potencia = 1 - beta
install.packages("pwr")
## Warning: package 'pwr' is in use and will not be installed
# Cálculo del tamaño del efecto para el factor "Tamaño"
f.a <- sqrt((a * D^2) / (2 * b * sigma^2))
# Cálculo del tamaño del efecto para el factor "Experiencia"
f.b <- sqrt((b * D^2) / (2 * a * sigma^2))
P1 <- pwr.2way(a = a, b = b, alpha = alpha, size.A = 27, size.B = 27, f.A = f.a, f.B = f.b)
P1
##
## Balanced two-way analysis of variance power calculation
##
## a = 3
## b = 3
## n.A = 27
## n.B = 27
## sig.level = 0.05
## power.A = 0.9132486
## power.B = 0.9132486
## power = 0.9132486
##
## NOTE: power is the minimum power among two factors
Con esta potencia del 91%, Podemos asegurar de que si existen diferencias
significativas en el Tiempo de preparación del café entre los diferentes niveles de “Tamaño” o “Experiencia”, y el analisis es lo suficientemente sensible para detectarlas.
Como el factor cafetera en este caso no fue significativo y lo quitamos del modelo vamos a analizar que pasa con la potencia si estos datos se eliminan y solo trabajamos con el factor experincia y tamaño.
P2 <- pwr.2way(a = a, b = b, alpha = alpha, size.A = 9, size.B = 9, f.A = f.a, f.B = f.b)
P2
##
## Balanced two-way analysis of variance power calculation
##
## a = 3
## b = 3
## n.A = 9
## n.B = 9
## sig.level = 0.05
## power.A = 0.4423346
## power.B = 0.4423346
## power = 0.4423346
##
## NOTE: power is the minimum power among two factors
La potencia disminuye a 44% La disminución de la potencia es esperada porque,
al eliminar el factor “Cafetera”, el análisis pierde una de las fuentes de variabilidad que podría haber ayudado a detectar efectos significativos en la variable dependiente (Tiempo).
# Calculo de replicas para alpha y beta definidos
n1 <- ss.2way(a = a, b = b, alpha = alpha, beta = beta, f.A = f.a, f.B = f.b, B = 100)
n1
##
## Balanced two-way analysis of variance sample size adjustment
##
## a = 3
## b = 3
## sig.level = 0.05
## power = 0.9
## n = 26
##
## NOTE: n is number in each group, total sample = 234
El valor final de n = 26 indica que con 26 observaciones en cada grupo, se puede detectar diferencias significativas con un poder del 90%.
El análisis muestra que el factor Experiencia del barista tiene un impacto significativo en el tiempo de preparación del café, con una diferencia significativa entre los niveles de experiencia (experto, intermedio, y principiante)n Los expertos son más rápidos, lo que resalta la importancia de la capacitación y el nivel de habilidad del personal para optimizar los tiempos de preparación
El Tamaño también influye significativamente en el tiempo de preparación, con diferencias claras entre los tamaños de café grande, mediano y pequeño. Los tamaños más grandes requieren más tiempo para prepararse, mientras que los más pequeños son más rápidos.
Los resultados indican que el tipo de cafetera (alto rendimiento, automático, semiautomático) no tiene un efecto significativo en los tiempos de preparación. Las diferencias entre las cafeteras no son relevantes, lo que implica que, en términos de tiempo, no sería necesario invertir en cafeteras de mayor rendimiento para mejorar la eficiencia en este aspecto.
El modelo de regresión ajustado es adecuado para predecir el Tiempo de preparación del café, con un R-squared de 0.7498, lo que indica que el modelo explica el 74.98% de la variabilidad en los tiempos de preparación. Tamaño y Experiencia son los factores más influyentes, mientras que el tipo de Cafetera no contribuye significativamente al modelo.
La evaluación de los residuos y las pruebas de normalidad (como el Shapiro-Wilk test) indican que los residuos del modelo siguen una distribución normal, lo que valida la suposición de normalidad. Además, la prueba de homocedasticidad (Levene test) muestra que la varianza es constante entre los niveles de los factores, lo que respalda la validez de los resultados obtenidos. El test de Durbin-Watson confirma la independencia de los residuos, lo que implica que el modelo es adecuado para la predicción sin problemas de autocorrelación.