Objetivo general

Evaluar de manera integral el impacto de los diferentes factores, sobre el tiempo de la elaboracion del cafe, con el propósito de identificar áreas de mejora y oportunidades de optimización que impulsen la eficiencia y competitividad en el proceso de elaboracion del cafe.

Objetivos especificos

Introducción

El diseño experimental es una herramienta fundamental en la ingeniería industrial, ya que permite analizar y optimizar procesos de producción con base en datos cuantitativos. En el contexto de una cafetería, uno de los aspectos clave para mejorar la eficiencia operativa es la optimización de los tiempos de preparación del café. Esto no solo tiene un impacto en la productividad de la operación, sino que también afecta de manera directa la experiencia del cliente. A continuación, se amplía cómo el diseño experimental puede contribuir a mejorar estos aspectos y cómo se puede aplicar en una cafetería

I

Descripción diagrama del proceso

Este estudio busca minimizar el tiempo de preparación del café, evaluándolo mediante un diseño factorial completo con tres factores: tipo de cafetera (automática, semiautomática, manual), experiencia del barista (principiante, intermedio, experto) y tamaño del recipiente (pequeño, mediano, grande). Esto da 27 tratamientos con 3 réplicas cada uno, resultando en 81 observaciones. Se controlarán variables como la calidad y molienda del café, la temperatura del agua y las condiciones óptimas de las cafeteras, mientras que factores no controlables incluyen el estado de ánimo del barista, distracciones y presión ambiental. La unidad experimental será cada preparación de espresso, y la aleatorización se hará conforme al orden de los pedidos, registrando el tiempo de preparación. Este diseño permitirá identificar la combinación más eficiente de factores para optimizar el proceso.

## 
## Adjuntando el paquete: 'gplots'
## The following object is masked from 'package:stats':
## 
##     lowess
## Cargando paquete requerido: carData
## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo
## 
## Adjuntando el paquete: 'goftest'
## The following objects are masked from 'package:nortest':
## 
##     ad.test, cvm.test
## Cargando paquete requerido: zoo
## 
## Adjuntando el paquete: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## Cargando paquete requerido: usethis
Tamaño <- as.factor(datos$Tamaño)
Cafetera <- as.factor(datos$Cafetera)
Experiencia <- as.factor(datos$Experiencia)

Análisis descriptivo

Efectos principales

Tiempo vs el tamaño del expreso

par(mfrow=c(1,3))
boxplot(datos$Tiempo ~ datos$Tamaño, xlab="Tamaño del Expresso", ylab="Tiempo en segundos")

La mediana de los tiempos para el expreso grande está cerca de los 75 segundos, mientras que para el expreso pequeño está cerca de los 50 segundos. Esto sugiere que, en promedio, los tiempos de preparación para los expresos grandes son más largos que los de los expresos pequeños. El hecho de que la mediana para el tamaño grande sea más alta sugiere que, en promedio, los baristas o máquinas tardan más en preparar un expreso grande que uno pequeño.

Tiempo vs tipo de cafetera

par(mfrow=c(1,3))
boxplot(datos$Tiempo ~ datos$Cafetera, xlab="Cafetera", ylab="Tiempo en segundos")

No hay diferencias significativas entre las medianas de las tres cafeteras. Todas están cerca de los 60-65 segundos, lo que indica que, en promedio, el tiempo de preparación es similar para todos los tipos de cafeteras.

La cafetera de alto rendimiento tiene la menor dispersión (más consistente), mientras que la automática es la que muestra la mayor variabilidad en los tiempos de preparación.

tiempo vs barista

par(mfrow=c(1,3))
boxplot(datos$Tiempo ~ datos$Experiencia, xlab="Experiencia", ylab="Tiempo en segundos")

El gráfico muestra que, a medida que aumenta la experiencia del barista, el tiempo de preparación tiende a ser más rápido y más consistente:

  • Los expertos tienen los tiempos de preparación más rápidos y más consistentes.

  • Los intermedios tienen tiempos más largos que los expertos, con una mayor variabilidad.

  • Los principiantes tienen los tiempos de preparación más largos y la mayor variabilidad, con un valor atípico que destaca un valor mucho más alto de lo esperado.

Este análisis indica que la experiencia tiene un impacto directo en la eficiencia y consistencia de la preparación del expreso. Los baristas con más experiencia son más rápidos y constantes, mientras que los principiantes muestran una mayor inexperiencia reflejada en la variabilidad y el mayor tiempo necesario para preparar el expreso.

Diagrama de efectos con tiempo promedio de todos los factores

par(mfrow=c(1,1))
require(graphics)
formula <- datos$Tiempo ~ Tamaño + Cafetera + Experiencia
plot.design(formula, col= "coral", xlab="Efectos", ylab="Tiempo Promedio")

Este gráfico resume cómo cada variable afecta el tiempo promedio de preparación:

  • El tamaño del expreso y la experiencia tienen un impacto evidente y progresivo.

  • El tipo de cafetera tiene un efecto menos pronunciado, con tiempos similares entre categorías.

  • Los intervalos de confianza sugieren variaciones importantes según la categoría, especialmente para los principiantes y expresos grandes.

Este tipo de gráfico ayuda a identificar patrones y la magnitud del efecto de cada variable sobre la variable de respuesta.

Grafico de interacciones

library(gplots)

require(gplots)
par(mfrow=c(1,3))
plotmeans(datos$Tiempo  ~ datos$Tamaño, xlab="Tamaño de expresso", ylab="Tiempo Promedio")
plotmeans(datos$Tiempo  ~ datos$Cafetera, xlab="Tipo de Cafetera", ylab="Tiempo Promedio")
plotmeans(datos$Tiempo  ~ datos$Experiencia, xlab="Experiencia", ylab="Tiempo Promedio")

  • El tamaño del expreso tiene un impacto consistente en el tiempo promedio, pero su efecto varía dependiendo del tipo de cafetera y la experiencia.

  • La experiencia tiene un efecto significativo, con los principiantes tomando más tiempo en todas las categorías.

  • El tipo de cafetera afecta menos cuando el operador es un principiante, sugiriendo que la habilidad del usuario es un factor clave.

Estos gráficos son útiles para detectar efectos de interacción y guiar conclusiones sobre cómo optimizar la preparación del café.

Prueba de normalidad para la variable respuesta

require(car)
par(mfrow=c(1,3))
qqPlot(datos$Tiempo, xlab="Cuantiles teóricos", ylab="Cuantiles muestrales", main="Grafico cuantil-cuantil")
## [1] 32 17
hist(datos$Tiempo, xlab="Tiempo", ylab="Frecuencia", main="Histograma")
boxplot(datos$Tiempo, xlab="crecimiento",  main="Gráfico de cajas")

require(nortest)
shapiro.test(datos$Tiempo)
## 
##  Shapiro-Wilk normality test
## 
## data:  datos$Tiempo
## W = 0.97318, p-value = 0.08678
ad.test(datos$Tiempo)
## 
##  Anderson-Darling test of goodness-of-fit
##  Null hypothesis: uniform distribution
##  Parameters assumed to be fixed
## 
## data:  datos$Tiempo
## An = Inf, p-value = 7.407e-06

interpretar estas graficas para la normalidad en un parrafo Las gráficas que proporcionaste incluyen un gráfico cuantil-cuantil (QQ plot), un histograma y un gráfico de cajas (box plot), que se utilizan para evaluar la normalidad de los datos.

Gráfico Cuantil-Cuantil (QQ Plot): Este gráfico compara los cuantiles teóricos de una distribución normal con los cuantiles de los datos observados. Los puntos que se alinean cerca de la línea diagonal sugieren que los datos siguen una distribución normal.

Modelo de efectos y ANOVA

modelo <-  aov(datos$Tiempo ~ Tamaño * Cafetera * Experiencia, data = datos)
summary(modelo)
##                             Df Sum Sq Mean Sq F value   Pr(>F)    
## Tamaño                       2   4751    2375  37.747 5.54e-11 ***
## Cafetera                     2    209     104   1.657    0.200    
## Experiencia                  2   8628    4314  68.560 1.51e-15 ***
## Tamaño:Cafetera              4    197      49   0.784    0.540    
## Tamaño:Experiencia           4    245      61   0.973    0.430    
## Cafetera:Experiencia         4    151      38   0.600    0.664    
## Tamaño:Cafetera:Experiencia  8    543      68   1.078    0.392    
## Residuals                   54   3398      63                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Tamaño:

Valor F: 37.747 Valor p: 5.54e-11

Interpretación: El factor “Tamaño” tiene un efecto significativo en el Tiempo de preparación (p < 0.001). Esto sugiere que hay diferencias significativas en los tiempos de preparación entre los diferentes tamaños de café.

Cafetera:

Valor F: 1.657 Valor p: 0.200

Interpretación: El factor “Cafetera” no tiene un efecto significativo en el Tiempo de preparación (p > 0.05). Esto indica que el tipo de cafetera no afecta significativamente el tiempo de preparación.

Experiencia:

Valor F: 68.560 Valor p: 1.51e-15

Interpretación: El factor “Experiencia” tiene un efecto significativo en el Tiempo de preparación (p < 0.001). Esto sugiere que la experiencia del barista tiene un impacto significativo en la duración del tiempo de preparación.

Interacciones entre Factores:

Tamaño:Cafetera:

Valor F: 0.784 Valor p: 0.540

interpretación: No hay una interacción significativa entre los factores Tamaño y Cafetera (p > 0.05). Esto indica que el efecto del tamaño en el tiempo de preparación no varía significativamente según el tipo de cafetera utilizada.

Tamaño:Experiencia:

Valor F: 0.973 Valor p: 0.430

Interpretación: No hay una interacción significativa entre los factores Tamaño y Experiencia (p > 0.05). Esto indica que el efecto del tamaño en el tiempo de #preparación no varía significativamente según la experiencia del barista.

Cafetera:Experiencia:

Valor F: 0.600 Valor p: 0.664

interpretación: No hay una interacción significativa entre los factores Cafetera y Experiencia (p > 0.05). Esto indica que el efecto del tipo de cafetera en el tiempo de preparación no varía significativamente según la experiencia del barista.

Tamaño:Cafetera:Experiencia:

Valor F: 1.078 Valor p: 0.392

Interpretación: No hay una interacción significativa entre los factores Tamaño, Cafetera y Experiencia en conjunto (p > 0.05). Esto indica que la combinación de estos tres factores no tiene un efecto conjunto significativo en el tiempo de preparación.

Modelo de efectos

model1e <- model.tables(modelo,type='effects')
model1t <- model.tables(modelo,type='means')
ygorro <- fitted(modelo)

Tiempo=μ+α Tama n ​ +β Experiencia​+ε Este modelo indica que Tamaño y Experiencia son factores que afectan significativamente el Tiempo, mientras que las interacciones no tienen un efecto significativo en el tiempo.

modelo de regresion

modelo2 <- lm(Tiempo ~ Tamaño + Cafetera + Experiencia, data = datos)
summary(modelo2)
## 
## Call:
## lm(formula = Tiempo ~ Tamaño + Cafetera + Experiencia, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -19.9173  -4.4173  -0.3914   4.8975  20.4420 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)    
## (Intercept)               61.377      2.301  26.673  < 2e-16 ***
## Tamañomediano            -12.419      2.130  -5.829 1.36e-07 ***
## Tamañopequeño            -18.385      2.130  -8.630 8.32e-13 ***
## Cafeteraautomático         3.581      2.130   1.681   0.0969 .  
## Cafeterasemiautomático     3.193      2.130   1.499   0.1382    
## Experienciaintermedio      4.344      2.130   2.039   0.0450 *  
## Experienciaprincipiante   23.741      2.130  11.144  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.827 on 74 degrees of freedom
## Multiple R-squared:  0.7498, Adjusted R-squared:  0.7295 
## F-statistic: 36.96 on 6 and 74 DF,  p-value: < 2.2e-16

Multiple R-squared: 0.7498. Esto significa que el modelo explica 74.98% de la variabilidad en el Tiempo. Es un buen modelo, pero no perfecto

El valor F es 36.96 con un valor p de < 2.2e-16, lo que indica que el modelo en su conjunto es significativo, es decir, al menos una de las variables predictoras tiene un efecto en el Tiempo.

El modelo es bastante bueno para predecir el Tiempo. Tamaño y Experiencia son los factores más influyentes.

Validacion del modelo

residuales <- rstandard(modelo)
summary(residuales)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -2.24901 -0.58155 -0.02059  0.00000  0.64331  2.55780

prueba de nomalidad

require(car)
par(mfrow=c(1,3))
qqPlot(residuales, xlab="Cuantiles teoricos", ylab="Cuantiles muestrales", main="Gr?fico cuantil-cuantil")
## [1] 48 17

Interpretación: Dado que los puntos se distribuyen aproximadamente por la linea podemos concluir que los datos podriantener una distribución normal Ademas los datos se encuentran entre las barras sombreadas lo que indica que los datos estan dentro de la variabilidad.

hist(residuales, xlab="Residuales", ylab="Frecuencia", main="Histograma")

Interpretación: El histograma nos muestra una curva muy similar a la de una campana lo que nos dice que podría haber distribución normal.

boxplot(residuales, xlab="Residuales",  main="Gr?fico de cajas")

Interpretación: La caja del boxplot tiene una forma simetrica lo que indica normalidad, Sin embargo se ven muchos valores atipicos lo que nos dice que puede que no haya comportamiento normal, para verificar haremos otros testeos.

require(nortest)
shapiro.test(residuales)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuales
## W = 0.98968, p-value = 0.7687

Interpretación: Dado un p-value = 0.7687 es decir mayor al 5% podemos concluir que hay normalidad en los datos.

ad.test(residuales)
## 
##  Anderson-Darling test of goodness-of-fit
##  Null hypothesis: uniform distribution
##  Parameters assumed to be fixed
## 
## data:  residuales
## An = Inf, p-value = 7.407e-06

Dado el p-value = 0.7246 hay normalidad porque el valor p es mayor a la significancia.

prueba de varianza constante

valores_ajustados<-fitted(modelo)

par(mfrow=c(1,4))
plot(valores_ajustados, residuales, xlab="Valores ajustados", ylab="Residuales")
abline(h=0, col = "gray60")

plot(as.numeric(Tamaño), residuales, xlab="Tamaño", ylab="Residuales")
abline(h=0, col = "gray60")

plot(as.numeric(Experiencia), residuales, xlab="Experiencia", ylab="Residuales")
abline(h=0, col = "gray60")

plot(as.numeric(Cafetera), residuales, xlab="Cafetera", ylab="Residuales")
abline(h=0, col = "gray60")

Interpretación: En los gráficso de Valores ajustados, Tamaño, Experiencia y Cafetera Vs Residualeslos los puntos están dispersos aleatoriamente alrededor de cero sin un patrón claro, Lo que indica homocedasticidad o Varianza Constantes.

require(car)
# Test de Levene para cada factor
leveneTest(Tiempo ~ factor(Tamaño), data = datos)        # Varianza constante respecto al Tamaño
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.2608 0.7711
##       78
leveneTest(Tiempo ~ factor(Cafetera), data = datos)      # Varianza constante respecto a la Cafetera
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.1555 0.8562
##       78
leveneTest(Tiempo ~ factor(Experiencia), data = datos)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.3318 0.7187
##       78

Interpretación: Tamaño, Cafetera y Experiencia tienen valores p mayores a 0.05 (0.7711, 0.8562, y 0.7187, respectivamente).No hay evidencia suficiente para rechazar la hipótesis nula de homogeneidad de varianzas. Es decir, las varianzas parecen constantes entre los niveles de cada uno de estos factores.

# Test de Levene para las interacciones
leveneTest(Tiempo ~ factor(Tamaño)*factor(Cafetera), data = datos)        # Interacción Tamaño:Cafetera
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  8  0.5543 0.8115
##       72
leveneTest(Tiempo ~ factor(Tamaño)*factor(Experiencia), data = datos)    # Interacción Tamaño:Experiencia
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  8  0.8262 0.5823
##       72
leveneTest(Tiempo ~ factor(Cafetera)*factor(Experiencia), data = datos) 
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  8     0.5 0.8524
##       72

Las interacciones Tamaño:Cafetera, Tamaño:Experiencia, y Cafetera:Experiencia tienen valores p mayores a 0.05 (0.8115, 0.5823, y 0.8524, respectivamente). Tampoco hay evidencia para afirmar que las varianzas difieren significativamente entre los niveles combinados de estos factores.

# Test para todas las interacciones
leveneTest(Tiempo ~ factor(Tamaño)*factor(Cafetera)*factor(Experiencia), data = datos)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group 26  0.4971 0.9727
##       54

El valor p es 0.9727, muy superior a 0.05. Las varianzas son consistentes incluso considerando la combinación de todos los factores.

require(lmtest)
bptest(modelo)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo
## BP = 39.93, df = 26, p-value = 0.03963

Hipótesis nula (H0): La varianza de los residuos es constante (homocedasticidad). Hipótesis alternativa (H1): La varianza de los residuos no es constante (heterocedasticidad). #Dado que el valor p (0.03963) es menor que 0.05, se rechaza la hipótesis nula. Sin embargo como en los gráficos se probo homocedasticidad concluire homocedasticidad.

prueba de independencia

par(mfrow=c(1,3))
plot(residuales, pch=16, ylab="Residuales", xlab="Orden", main="Gr?fico de Orden vs Residuales")
abline(h=0)
acf(residuales,ylim=c(-1,1), main="Grafico de ACF")
pacf(residuales,ylim=c(-1,1), main="Grafico de PACF", ylab="PACF")

los residuos son independientes, ya que no se observan patrones claros en #el Gráfico de Orden vs. Residuales, y tanto el ACF como el PACF indican que las autocorrelaciones están dentro de los intervalos de confianza.

require(lmtest)
dwtest(modelo,alternative="two.sided")
## 
##  Durbin-Watson test
## 
## data:  modelo
## DW = 1.9737, p-value = 0.9947
## alternative hypothesis: true autocorrelation is not 0

Hipótesis nula: No hay autocorrelación en los residuos del modelo. Hipótesis alternativa: Hay autocorrelación en los residuos del modelo. Dado que el valor p es muy alto (0.9947), no rechazamos la hipótesis nula. HAY INDEPENDENCIA

comparaciones multiples para el tamaño

require(agricolae)
# Comparaciones múltiples para Tamaño
LSD.test(modelo, "Tamaño", console=TRUE, group=FALSE)
## 
## Study: modelo ~ "Tamaño"
## 
## LSD t Test for datos$Tiempo 
## 
## Mean Square Error:  62.92568 
## 
## Tamaño,  means and individual ( 95 %) CI
## 
##         datos.Tiempo      std  r       se      LCL      UCL  Min  Max   Q25
## grande      72.99630 12.16693 27 1.526624 69.93560 76.05699 55.1 96.5 63.75
## mediano     60.57778 13.91580 27 1.526624 57.51708 63.63847 42.8 85.1 49.60
## pequeño     54.61111 13.13698 27 1.526624 51.55041 57.67181 30.5 85.4 45.40
##          Q50   Q75
## grande  70.5 82.75
## mediano 54.2 73.90
## pequeño 52.3 59.55
## 
## Alpha: 0.05 ; DF Error: 54
## Critical Value of t: 2.004879 
## 
## Comparison between treatments means
## 
##                   difference pvalue signif.       LCL      UCL
## grande - mediano   12.418519 0.0000     ***  8.090040 16.74700
## grande - pequeño   18.385185 0.0000     *** 14.056706 22.71366
## mediano - pequeño   5.966667 0.0078      **  1.638188 10.29515

Tamaño

Los tamaños grande, mediano y pequeño muestran diferencias significativas en el tiempo pues: Entre “grande” y “mediano”: Diferencia de 12.42 unidades. Entre “grande” y “pequeño”: Diferencia de 18.39 unidades. Entre “mediano” y “pequeño”: Diferencia de 5.97 unidades. Esto indica que el tamaño afecta significativamente el tiempo. El tamaño “grande” está asociado con un mayor tiempo, mientras que “pequeño” tiene los valores más bajos.

Comparaciones múltiples para Cafetera

LSD.test(modelo, "Cafetera", console=TRUE, group=FALSE)
## 
## Study: modelo ~ "Cafetera"
## 
## LSD t Test for datos$Tiempo 
## 
## Mean Square Error:  62.92568 
## 
## Cafetera,  means and individual ( 95 %) CI
## 
##                  datos.Tiempo      std  r       se      LCL      UCL  Min  Max
## alto rendimiento     60.47037 15.73702 27 1.526624 57.40967 63.53107 30.5 95.6
## automático           64.05185 14.93533 27 1.526624 60.99116 67.11255 40.4 90.1
## semiautomático       63.66296 14.77287 27 1.526624 60.60227 66.72366 40.9 96.5
##                    Q25  Q50   Q75
## alto rendimiento 46.00 62.4 67.65
## automático       50.55 60.7 76.35
## semiautomático   52.25 58.7 73.05
## 
## Alpha: 0.05 ; DF Error: 54
## Critical Value of t: 2.004879 
## 
## Comparison between treatments means
## 
##                                   difference pvalue signif.       LCL       UCL
## alto rendimiento - automático     -3.5814815 0.1029         -7.909960 0.7469974
## alto rendimiento - semiautomático -3.1925926 0.1450         -7.521071 1.1358863
## automático - semiautomático        0.3888889 0.8577         -3.939590 4.7173677

Las cafeteras alto rendimiento, automático y semiautomático no muestran diferencias significativas en el tiempo.

Entre alto rendimiento y automático: Diferencia no significativa (p = 0.1029). Entre alto rendimiento y semiautomático: Diferencia no significativa (p = 0.1450). Entre automático y semiautomático: Diferencia no significativa (p = 0.8577). Esto sugiere que el tipo de cafetera no influye significativamente en el tiempo.

Comparaciones múltiples para Experiencia

LSD.test(modelo, "Experiencia", console=TRUE, group=FALSE)
## 
## Study: modelo ~ "Experiencia"
## 
## LSD t Test for datos$Tiempo 
## 
## Mean Square Error:  62.92568 
## 
## Experiencia,  means and individual ( 95 %) CI
## 
##              datos.Tiempo      std  r       se      LCL      UCL  Min  Max
## experto          53.36667 10.89372 27 1.526624 50.30597 56.42736 30.5 85.4
## intermedio       57.71111 11.24481 27 1.526624 54.65041 60.77181 40.7 80.1
## principiante     77.10741 10.95424 27 1.526624 74.04671 80.16810 55.7 96.5
##                Q25  Q50   Q75
## experto      46.00 52.3 60.05
## intermedio   50.25 55.2 66.45
## principiante 70.25 78.5 85.25
## 
## Alpha: 0.05 ; DF Error: 54
## Critical Value of t: 2.004879 
## 
## Comparison between treatments means
## 
##                           difference pvalue signif.        LCL          UCL
## experto - intermedio       -4.344444 0.0492       *  -8.672923  -0.01596559
## experto - principiante    -23.740741 0.0000     *** -28.069220 -19.41226189
## intermedio - principiante -19.396296 0.0000     *** -23.724775 -15.06781744

Los niveles de experiencia (“experto”, “intermedio” y “principiante”) muestran diferencias significativas en el tiempo. Entre experto y intermedio: Diferencia de -4.34, significativa (p = 0.0492). Entre experto y principiante: Diferencia de -23.74, significativa (p < 0.0001). Entre intermedio y principiante: Diferencia de -19.40, significativa (p < 0.0001). Esto indica que los principiantes tardan considerablemente más, mientras que los expertos tienen los tiempos más bajos.

Modelo de regresion y superficie de respuesta

Modelo de regresión con interacción

modelo_interaccion <- lm(Tiempo ~ Tamaño * Experiencia, data = datos)
summary(modelo_interaccion)
## 
## Call:
## lm(formula = Tiempo ~ Tamaño * Experiencia, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -19.389  -4.244  -0.400   5.511  20.644 
## 
## Coefficients:
##                                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                            64.7556     2.6345  24.579  < 2e-16 ***
## Tamañomediano                         -15.6556     3.7258  -4.202 7.49e-05 ***
## Tamañopequeño                         -18.5111     3.7258  -4.968 4.40e-06 ***
## Experienciaintermedio                   4.8889     3.7258   1.312   0.1936    
## Experienciaprincipiante                19.8333     3.7258   5.323 1.11e-06 ***
## Tamañomediano:Experienciaintermedio     0.7667     5.2691   0.146   0.8847    
## Tamañopequeño:Experienciaintermedio    -2.4000     5.2691  -0.455   0.6501    
## Tamañomediano:Experienciaprincipiante   8.9444     5.2691   1.698   0.0939 .  
## Tamañopequeño:Experienciaprincipiante   2.7778     5.2691   0.527   0.5997    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.904 on 72 degrees of freedom
## Multiple R-squared:  0.7518, Adjusted R-squared:  0.7242 
## F-statistic: 27.26 on 8 and 72 DF,  p-value: < 2.2e-16

En este caso ajustamos el modelo con los factores relevantes MODELO AJUSTADO . el Modelo ajustado en función de Tamaño y Experiencia,Tiempo = 64.7556 + (-15.6556 * Tamañomediano) + (-18.5111 * Tamañopequeño) + (4.8889 * Experienciaintermedio) + (19.8333 * Experienciaprincipiante) + (0.7667 * Tamañomediano * Experienciaintermedio) + (-2.4000 * Tamañopequeño * Experienciaintermedio) + (8.9444 * Tamañomediano * Experienciaprincipiante) + (2.7778 * Tamañopequeño * Experienciaprincipiante)

Evaluacion numero de replicas

require(pwr2)
## Cargando paquete requerido: pwr2
#f.a <- sqrt((a*D^2)/(2*b*sigma^2))

# Definición de parámetros
a <- 3 # Número de niveles del factor "Tamaño"
b <- 3 # Número de niveles del factor "Experiencia"
sigma <- sd(datos$Tiempo) # Desviación estándar residual del modelo
D <- 5 # Diferencia mínima detectable entre medias (valor asumido)
alpha <- 0.05 # Nivel de significancia (ajustado)
beta <- 0.1 # Potencia = 1 - beta
install.packages("pwr")
## Warning: package 'pwr' is in use and will not be installed
# Cálculo del tamaño del efecto para el factor "Tamaño"
f.a <- sqrt((a * D^2) / (2 * b * sigma^2))
# Cálculo del tamaño del efecto para el factor "Experiencia"
f.b <- sqrt((b * D^2) / (2 * a * sigma^2))
P1 <- pwr.2way(a = a, b = b, alpha = alpha, size.A = 27, size.B = 27, f.A = f.a, f.B = f.b) 
P1 
## 
##      Balanced two-way analysis of variance power calculation 
## 
##               a = 3
##               b = 3
##             n.A = 27
##             n.B = 27
##       sig.level = 0.05
##         power.A = 0.9132486
##         power.B = 0.9132486
##           power = 0.9132486
## 
## NOTE: power is the minimum power among two factors

Con esta potencia del 91%, Podemos asegurar de que si existen diferencias

significativas en el Tiempo de preparación del café entre los diferentes niveles de “Tamaño” o “Experiencia”, y el analisis es lo suficientemente sensible para detectarlas.

Como el factor cafetera en este caso no fue significativo y lo quitamos del modelo vamos a analizar que pasa con la potencia si estos datos se eliminan y solo trabajamos con el factor experincia y tamaño.

P2 <- pwr.2way(a = a, b = b, alpha = alpha, size.A = 9, size.B = 9, f.A = f.a, f.B = f.b) 
P2
## 
##      Balanced two-way analysis of variance power calculation 
## 
##               a = 3
##               b = 3
##             n.A = 9
##             n.B = 9
##       sig.level = 0.05
##         power.A = 0.4423346
##         power.B = 0.4423346
##           power = 0.4423346
## 
## NOTE: power is the minimum power among two factors

La potencia disminuye a 44% La disminución de la potencia es esperada porque,

al eliminar el factor “Cafetera”, el análisis pierde una de las fuentes de variabilidad que podría haber ayudado a detectar efectos significativos en la variable dependiente (Tiempo).

# Calculo de replicas para alpha y beta definidos 
n1 <- ss.2way(a = a, b = b, alpha = alpha, beta = beta, f.A = f.a, f.B = f.b, B = 100)
n1
## 
##      Balanced two-way analysis of variance sample size adjustment 
## 
##               a = 3
##               b = 3
##       sig.level = 0.05
##           power = 0.9
##               n = 26
## 
## NOTE: n is number in each group, total sample = 234

El valor final de n = 26 indica que con 26 observaciones en cada grupo, se puede detectar diferencias significativas con un poder del 90%.

Conclusiones

El análisis muestra que el factor Experiencia del barista tiene un impacto significativo en el tiempo de preparación del café, con una diferencia significativa entre los niveles de experiencia (experto, intermedio, y principiante)n Los expertos son más rápidos, lo que resalta la importancia de la capacitación y el nivel de habilidad del personal para optimizar los tiempos de preparación

El Tamaño también influye significativamente en el tiempo de preparación, con diferencias claras entre los tamaños de café grande, mediano y pequeño. Los tamaños más grandes requieren más tiempo para prepararse, mientras que los más pequeños son más rápidos.

Los resultados indican que el tipo de cafetera (alto rendimiento, automático, semiautomático) no tiene un efecto significativo en los tiempos de preparación. Las diferencias entre las cafeteras no son relevantes, lo que implica que, en términos de tiempo, no sería necesario invertir en cafeteras de mayor rendimiento para mejorar la eficiencia en este aspecto.

El modelo de regresión ajustado es adecuado para predecir el Tiempo de preparación del café, con un R-squared de 0.7498, lo que indica que el modelo explica el 74.98% de la variabilidad en los tiempos de preparación. Tamaño y Experiencia son los factores más influyentes, mientras que el tipo de Cafetera no contribuye significativamente al modelo.

La evaluación de los residuos y las pruebas de normalidad (como el Shapiro-Wilk test) indican que los residuos del modelo siguen una distribución normal, lo que valida la suposición de normalidad. Además, la prueba de homocedasticidad (Levene test) muestra que la varianza es constante entre los niveles de los factores, lo que respalda la validez de los resultados obtenidos. El test de Durbin-Watson confirma la independencia de los residuos, lo que implica que el modelo es adecuado para la predicción sin problemas de autocorrelación.