Evaluación de la solubilidad del café molido a diferentes temperaturas de infusión

Diseño Experimental Completamente Aleatorizado
Author

Londoño, Liliana; Sanchez, Claudia

Published

March 31, 2024

Resumen

El proceso de extracción del café es la operación mediante la cual el agua caliente solvata el café tostado y molido, disolviendo los compuestos químicos solubles responsables del aroma y sabor. Se ha utilizado el diseño experimental completamente aleatorizado para evaluar la solubilidad del café molido comercial a las temperaturas de infusión de 50, 70 y 90°C, con el fin de obtener la mayor extracción de los sólidos solubles. Se empleó el Método por goteo directo a las mismas condiciones y variables para cada temperatura de extracción (peso de muestra de café, granulometría, volumen de agua, tiempo de infusión). De los resultados se observa que el mayor promedio de los pesos de café solubilizado fue obtenido a 90°C, seguido de 70°C y por último 50°C, esto se debe al hecho de que la solubilidad aumenta con la temperatura porque el aumento de la energía cinética asociado a las temperaturas más altas permite que las moléculas de solvente rompan de manera más efectiva las moléculas unidas a la celulosa insoluble del café. Los resultados se analizaron estadísticamente mediante la prueba t de Student, análisis de varianza, prueba F y falta de ajuste para definir el efecto en la solubilidad del café.

Keywords

Café, solubilidad, sólidos solubles, temperatura, Diseño Experimental completamente aleatroizado

Responsables

Liliana María Londoño Ramírez, Claudia Yaneth Sánchez Jaramillo

1 Objetivo del Experimento

Determinar la variación de la solubilidad del café molido en función de la temperatura de infusión

2 Introducción

La solubilidad del café molido en agua caliente es un proceso fundamental en la preparación de esta popular bebida. El café molido está compuesto principalmente por componentes solubles e insolubles en agua. Los componentes solubles incluyen compuestos como cafeína, ácidos clorogénicos, azúcares y aceites volátiles, que son responsables de dar sabor y aroma al café. Los componentes insolubles son principalmente partículas de café molido que no se disuelven en agua. 

Cuando se añade agua caliente al café molido, se inicia un proceso de extracción en el que los compuestos solubles del café se disuelven en el agua. Este proceso se ve influenciado por varios factores, incluyendo la temperatura del agua, el tamaño de molienda del café, el tiempo de infusión y la proporción de café al agua. 

La temperatura del agua es crucial, ya que afecta la velocidad de extracción de los compuestos solubles del café. El agua caliente tiene mayor capacidad de disolver estos compuestos, lo que acelera el proceso de extracción y puede influir en el sabor y la fuerza del café resultante. Sin embargo, es importante tener en cuenta que utilizar agua demasiado caliente puede dar lugar a una extracción excesiva, lo que puede producir un café con sabores amargos y astringentes. 

El tamaño de molienda del café también desempeña un papel importante en la solubilidad. Una molienda más fina aumenta la superficie de contacto entre el café y el agua, lo que facilita la extracción de los compuestos solubles. Por otro lado, una molienda más gruesa puede resultar en una extracción menos eficiente, ya que el agua tiene más dificultades para penetrar las partículas de café. 

El tiempo de infusión es otro factor crítico. Un tiempo de infusión más largo permite una mayor extracción de compuestos solubles del café, lo que resulta en una bebida más fuerte y con más cuerpo. Sin embargo, un tiempo de infusión excesivamente largo puede llevar a una sobreextracción y a sabores no deseados. 

El estudio de la solubilidad del café se ha realizado en principio, desde la composición y propiedades fisicoquímicas de los compuestos presentes en el café y la solubilidad de los mismos en agua, [Puerta, G. I. 2013]. [Castaño C, et al., 2000] realizaron varios estudios coincidiendo en los factores que afectan el rendimiento en la extracción de los sólidos solubles del extracto y además, realizaron la caracterización del rendimiento de extracción y el contenido de la bebida del café. Adiconalmente, [Ortega C. Jessica et al.2014)], han realizado medidas de rendimiento y contenido de sólidos solubles en extractos de café consumo, café pastilla y mezcla.
Encontraron que los promedios de temperatura de las bebidas obtenidas en cada extracción, en la temperatura empleada de (90°C±1°C) se alcanzó una mayir concentración de solidos solubles extraídos, en comparación a las otras dos temperaturas evaluadas que mantuvieron una temperatura promedio de 85°C±1°C, Figura 1.

Figura 1. Valores promedios de temperatura en la extracción de sólidos solubles en muestras de café comerciales.

3 Materiales y Método

3.1 Materiales

  • Café molido modelo Matix - Colcafé, 10g
  • Agua potable, red acueducto del Poblado - Medellín)
  • Balanza analítica, marca Gynipot, resolución de 0.01g
  • Probeta plástica graduada,100mL
  • Filtros de papel,1.5
  • Cronómetro, resolución 0.01s
  • Plancha de calentamiento y agitación, Thermo Fisher
  • Termómetro de punzón, modelo TP 101, resolución 0.1°C

3.2 Método

3.2.1 Premuestreo

fue necesario realizar experimentos preliminares, para evaluar la variabilidad del peso del residuo de café molido luego de la infusión a las tres diferentes temperaturas seleccionadas y así contar con información representativa para la planeación y ejecución del experimento que permitiera realizar el análisis estadístico de los datos obtenidos. Del premuestreo se concluyó que si existían diferencias en el peso del residuo de café seco a las 3 temperaturas seleccionadas además de que visualmente también se observó diferencia en el color del café filtrado (más claro el filtrado a 50°C y más oscuro a 90°C).

3.2.2 Medición

El experimento se llevó a cabo empleando 10.00g de café molido comercial en 100mL de agua, sometido a 3 diferentes temperaturas (50, 70 y 90°C) cada una con 8 réplicas, con un tiempo de infusión de 3 minutos a 60 rpm, cada solución. Luego del tiempo de infusión, las muestras fueron filtradas en papel de filtro (peso de 1.50g) durante 5 minutos, secadas a temperatura ambiente durante 48 horas. Luego de este tiempo, se calculó el peso solubilizado del café molido, por la diferencia del peso inicial y el peso del residuo del café (teniendo también en cuenta la resta del peso del filtro).

3.2.3 Precisión y rango de las medidas

Para la variable respuesta se empleó la balanza analítica marca Gynipot (resolución de 0.01g), según: - Peso de café molido inicial entre 9.99 y 10.01g - Peso del residuo final de café solubilizado con precisión de 0.01g

3.2.4 Restricciones

  • Métodos de medida: uso de instrumentación adecuada para medición de cada variable y de una instalación con todos los implementos necesarios para llevar a cabo el experimento
  • Materiales: café molido, balanza analítica, probeta plástica graduada de 100mL, filtros de papel, cronómetro del celular, plancha de calentamiento y agitación usada, magnetos (agitadores), termómetro de punzón, vidriería (beakers de vidrio borosilicato de volumen de 250mL y 2000mL), vidrio reloj, agua potable (red de acueducto del barrio El Poblado, Medellín) y espátulas -Duración: el experimento fue realizado en 4 horas, aproximadamente 10 minutos por muestra, y posteriormente a las 48 horas, se realizó el pesaje del residuo secado a temperatura ambiente. Este último proceso tuvo una duración de 1 minuto por muestra
  • Número de repeticiones y réplicas: Número por tratamiento: Son réplicas, dado que cada pesaje de café se considera como una unidad experimental que no repite datos. Número por tratamiento: 8 a una temperatura de infusión de 50°C, 8 a una temperatura de infusión de 70°C y 8 a una temperatura de infusión de 90°C
  • Unidades experimentales: 10 g de café molido
  • Número de experimentos: 24
  • Regiones no permitidas de experimentación: temperaturas de infusión por fuera del intervalo de 30°C y 95°C
  • Límites de aleatorización: Completar el ejercicio académico se diseñó teniendo en cuenta la aleatorización del 100% de los experimentos

Figura 2. Experimento: Variación de la solubilidad de café molido en agua

4 Resultados y Discusión

4.1 Planeación del Experimento

4.1.1 Diagrama del Proceso

Figura 3. Diagrama del Proceso: Variación de la solubilidad de café molido en agua.

4.2 Datos del Experimento

Los datos corresponden a tres tratamientos y una variable respuesta cuantitativa. A continuación, se presentan los datos obtenidos:

Tabla 1. Datos del Experimento

Para el diseño del experimento completamente aleatorizado, se elaboró la siguiente tabla de datos:

Tabla 2. Datos del Experimento Aleatorizados

Posteriormente se marcaron papeles independientes con el número del experimento (ver primer columna de la tabla anterior), y se dispusieron en una bolsa. De forma aleatoria, se sacaron cada uno de los papeles y en el orden de salida se elaboró la siguiente tabla para la ejecución de los experimentos:

Tabla 3. Datos para la ejecucuón del Experimento

El diseño de experimentos que será evaluado en este trabajo es el diseño completamente aleatorizado, con 8 réplicas.

El diseño experimental es balanceado dado que el número de réplicas para cada tratamiento es igual.

Para el diseño experimental, se define el nivel de significancia como α = 0.05.

4.3 Anásis descriptivo de los datos

# A tibble: 24 × 2
    Temp Peso_café_solub
   <dbl>           <dbl>
 1    90            1.09
 2    90            1.19
 3    70            1.09
 4    90            1.15
 5    50            0.72
 6    70            0.88
 7    50            0.7 
 8    70            0.88
 9    70            0.92
10    90            0.98
# ℹ 14 more rows

4.3.1 Simetría de los Datos

Figura 4. Boxplot para cada tratamiento del Proceso.

Del análisis del gráfico boxplot, se obtienen los siguientes datos:

$`50`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
 0.7000  0.7175  0.7800  0.7850  0.8350  0.9100 

$`70`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  0.780   0.880   0.905   0.925   0.955   1.090 

$`90`
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  0.980   1.087   1.160   1.151   1.195   1.340 

Y se puede inferir lo siguiente:

  • Para los tres niveles del factor se observa una diferencia entre las medias y las medianas, siendo la mediana más alta igual a 1.16g correspondiente a la temperatura de 90°C , seguida de la mediana igual a 0.905g correspondiente a la temperatura de 70°C y finalmente una mediana de 0.78g correspondiente a la temperatura de 50°C, el mismo comportamiento se observa para la media obtenida para las mediciones a cada temperatura.

  • Para las mediciones tomadas a 50°C se observa que la mediana está en el centro de la caja, lo que significa que la muestra es simétrica, además, el 25% de los valores son menores a 0.7175g y el 75% de los datos son superiores a 0.8350. No se observan datos atípicos.

  • Para las mediciones tomadas a 70°C se observa que la mediana no está en el centro de la caja, lo que significa que la muestra no es simétrica, además, el 25% de los valores son menores a 0.880g y el 75% de los datos son superiores a 0.955g Se observa un dato atípico por encima del valor máximo de la distribución.

  • Para las mediciones tomadas a 90°C se observa que la mediana no está en el centro de la caja, lo que significa que la muestra es no simétrica, además, el 25% de los valores son menores a 1.087g y el 75% de los datos son superiores a 1.195g. No se observan datos atípicos.

  • Para todos los casos, sería necesario emplear un método estadístico para corroborar la simetría, por ejemplo el estadístico Skewness.

  • Del gráfico se puede observar que si existe una diferencia estadísticamente significativa en el peso del café solubilizado a las tres temperaturas, lo cual debe comprobarse con pruebas estadísticas más robustas.

4.3.2 Determinación de la Densidad

Figura 5. Densidad de los datos del peso de café solubilizado en agua.

Del anterior gráfico de densidad se puede inferir que entre los pesos de café solubilizado de 0.80g y 0.90g se encuentra la mayor densidad, de los datos, es decir, se encuentran distribuidos el mayor número de datos.

4.3.3 Gráfico Boxplot para todos los datos de todos los tratamientos:

Figura 6. Boxplot para todos los datos de los tratamientos del Proceso

De la gráfica boxplot de los datos obtenidos para todos los tratamientos se puede inferir que, del total de los 24 experimentos, se observa que la mediana es de 0.915g y está no se encuentra en el centro de la caja, lo que significa que la muestra no es simétrica, además, el 25% de los valores son menores 0.8225g y el 75% de los datos son superiores a 1.0900g. No se observan datos atípicos. Se obtienen además los siguientes datos:

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
 0.7000  0.8225  0.9150  0.9537  1.0900  1.3400 

Prueba Skewness

Para comprobar la simetría, se aplicó la prueba estadística de Skewness, y se obtuvo el siguiente valor:

[1] 0.3840044
Tip

Skewness = 0.3840044

De lo anterior se interpreta que los datos no son simétricos (SW≠0), y tienen un sesgo positivo que indica que hay una cola más larga que se extiende en sentido positivo.

4.3.4 Histograma

`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Figura 7. Histograma del peso de café solubilizado.

Del histograma se puede observar el comportamiento de los datos basados en la variable cuantitativa del peso de café solubilizado y se observa por ejemplo que tres de los datos se encuentran en un valor promedio de 0.88g y otros tres en 1.09g. Del histograma se observa que los datos se ajustan a una curva llamada campana de Gauss, indicando que es probable que los datos tengan una distribución normal. Esta normalidad debe ser comprobada por medio de test estadísticos.

4.3.5 Test de normalidad de los datos para la variable respuesta

Complementando los gráficos anteriores, se aplican las pruebas de normalidad a los datos de la variable respuesta, teniendo en cuenta las siguientes hipótesis

H0: los datos del peso del café solubilizado en función de las diferentes temperaturas de infusión tienen una distribución normal

H1: los datos del peso del café solubilizado en función de las diferentes temperaturas de infusión no tienen una distribución normal

Obteniéndose los siguientes valores:


    Shapiro-Wilk normality test

data:  datos$Peso_café_solub
W = 0.95478, p-value = 0.3428

    Lilliefors (Kolmogorov-Smirnov) normality test

data:  datos$Peso_café_solub
D = 0.13636, p-value = 0.2958

    Anderson-Darling normality test

data:  datos$Peso_café_solub
A = 0.37199, p-value = 0.3927
Warning: package 'tseries' was built under R version 4.3.3
Registered S3 method overwritten by 'quantmod':
  method            from
  as.zoo.data.frame zoo 

    Jarque Bera Test

data:  datos$Peso_café_solub
X-squared = 1.2693, df = 2, p-value = 0.5301
Resultados del Valor-p

Shapiro-Wilk normality test: p-value = 0.3428

Lilliefors (Kolmogorov-Smirnov) p-value = 0.2958

Anderson-Darling normality test p-value = 0.3927

Jarque Bera Test p-value = 0.5301

Para todas las pruebas se obtiene un valor-p mayor de 0.05 (0.3428, 0.2958, 0.3927 y 0.5301 respectivamente), es decir no podemos rechazar la hipótesis nula (hipótesis de normalidad). Por lo tanto, podemos concluir que nuestros datos cumplen el supuesto de normalidad.

4.4 Modelos con sus respectivas hipótesis.

4.4.1 Modelo de Medias

H0: Promedio del peso del café solubilizado luego de la infusión a 50°C = Promedio del peso del café solubilizado luego de la infusión a 70°C = Promedio del peso del café solubilizado luego de la infusión a 90°C

H1: Promedio del peso del café solubilizado luego de la infusión a 50°C ≠ Promedio del peso del café solubilizado luego de la infusión a 70°C ≠ Promedio del peso del café solubilizado luego de la infusión a 90°C

Hipótesis Nula e Hipótesis Alternativa

H0: \(\mu~1~ = \mu~2~ = \mu~3~\)

H1: \(\mu~1~ ≠ \mu~2~ ≠ \mu~3~\)

4.4.2 Modelo de Efectos (Modelo de Análisis de Varianza o de un sólo factor)

H0: Efecto de la temperatura de infusión de 50°C en el peso del café solubilizado = Efecto de la temperatura de infusión de 70°C en el peso del café solubilizado = Efecto de la temperatura de infusión de 90°C en el peso del café solubilizado

H1: Efecto de la temperatura de infusión de 50°C en el peso del café solubilizado ≠ Efecto de la temperatura de infusión de 70°C en el peso del café solubilizado ≠ Efecto de la temperatura de infusión de 90°C en el peso del café solubilizado

Hipótesis Nula e Hipótesis Alternativa

H0: \(\tau~1~ = \tau~2~ = \tau~3~\)

H1: \(\tau~i~ ≠ 0 para i = 1,2 y 3\)

4.4.3 Modelo de Regresión

H0: Los residuales del peso del café solubilizado luego de la infusión a 50°C = Los residuales del peso del café solubilizado luego de la infusión a 70°C = Los residuales del peso del café solubilizado luego de la infusión a 50°C

H1: Los residuales del peso del café solubilizado luego de la infusión a 50°C ≠ Los residuales del peso del café solubilizado luego de la infusión a 70°C ≠ Los residuales del peso del café solubilizado luego de la infusión a 90°C

Hipótesis Nula e Hipótesis Alternativa

H0: \(\beta~1~ = \beta~2~ = \beta~3~\)

H1: \(\beta~i~ ≠ 0 para i = 1,2 y 3\)

La equivalencia entre los tres modelos propuestos es que el planteamiento de las hipótesis y comprobación, hacen parte del diseño de experimentos completamente aleatorizado y nos permiten comprobar si hay diferencias estadísticamente significativas entre diferentes tratamientos.

4.5 Análisis de Varianza, ANOVA y verificación de Hipótesis

4.5.1 ANOVA

Realizando el análisis ANOVA de los datos obtenidos se obtiene la siguiente información:

            Df Sum Sq Mean Sq F value   Pr(>F)    
datos$Temp   2 0.5465 0.27324   31.27 5.05e-07 ***
Residuals   21 0.1835 0.00874                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

La tabla ANOVA detalla 2 grados de libertad para Temperatura y 21 grados de libertad para los residuales, según los 24 experimentos y los 3 niveles del factor.

Además, se calculan los valores críticos:

Valores críticos

qf(0.025, 2, 21) = 0.02534836

qf(0.975, 2, 21) = 4.419918

De lo anterior se tiene:

Respecto al Pr(>F) igual a 5.05e-07, este es menor que a = 0.05, por lo que se rechaza H0, y nos indica que el efecto de la temperatura sobre el peso del café solubilizado es significativo y por lo tanto se rechaza H0.

Para la región crítica se tiene que el F calculado igual a 31.27 se encuentra por fuera de la región de aceptación que va desde 0.02534836 hasta 4.419918, esto quiere decir que se rechaza igualmente H0 para los modelos de efectos y medias.

La suma de cuadrados de los residuales y de temperatura es de 0.73, de los cuales el 74.86% es representada por la Temperatura y el 25.14% es representada por los residuales.

Del modelo de regresión se iiene:


Call:
lm(formula = datos$Peso_café_solub ~ datos$Temp)

Residuals:
      Min        1Q    Median        3Q       Max 
-0.171250 -0.062187 -0.003125  0.048437  0.188750 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)   0.78500    0.03305  23.753  < 2e-16 ***
datos$Temp70  0.14000    0.04674   2.995  0.00689 ** 
datos$Temp90  0.36625    0.04674   7.836 1.15e-07 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.09347 on 21 degrees of freedom
Multiple R-squared:  0.7486,    Adjusted R-squared:  0.7247 
F-statistic: 31.27 on 2 and 21 DF,  p-value: 5.049e-07

Para el caso de este modelo, se obtiene de igual forma un valor F de 31.27 y un valor-p de 5.049e-07, por lo que se rechaza H0 y se concluye que los \(\beta~i~\) ≠ 0 para los 3 tratamientos.

Respecto a los modelos de medias y de efectos, aunque los tres modelos se deben comprobar, se desconoce los códigos en R (Modelos de Medias y Modelo de Efectos), para obtener los parámetros estadísticos que permita concluir acerca de las hipótesis. Se realizó la búsqueda bibliográfica y material de la asignatura, pero no fue posible obtener la información requerida para conseguir los resultados necesarios.

4.6 Validación del Modelo

Para completar el análisis estadístico de ANOVA y validar el modelo, se debe comprobar el supuesto de independencia, normalidad y de homocedasticidad que se detalla a continuación. Estos supuestos del modelo se comprueban a través de los residuos.

4.6.1 Supuesto de Normalidad de los errores del modelo

Inicialmente se realiza un análisis gráfico de los residuales para evaluar el comportamiento de la distribución de las mediciones.

Se calculan los residuales de los datos obteniéndose las siguientes graficas:

Histograma residuales

`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Figura 8. Histograma de Residuales del Proceso.

El histograma de residuos muestra la distribución de los residuos para toda la distribución del modelo, de que se infiere que los residuales se ajustan a la forma de la campana de Gauss, indicando que probablemente tienen una distribución normal.

Boxplot residuales

Figura 9. Boxplot de residuales

De la gráfica boxplot de los datos obtenidos para los residuales se puede inferir que, la mediana es de 0.0 y se encuentra cercana al centro de la caja, lo que significa que probablemente la muestra es simétrica. No se observan datos atípicos.

Qqplot de residuales

Figura 10. Qqplot de residuales del Proceso.

Los datos están cercanos a la línea continua del gráfico y esto indica que los residuales probablemente tienen una distribución normal, lo cual se corrobora con la siguiente gráfica donde los residuales se encuentran dentro del área coloreada en azul.

Loading required package: carData

[1] 17 10

Figura 11. Qqplot con áreas de aceptación residuales del proceso.

Comprobación del Supuesto de Normalidad

Para comprobar el supuesto de normalidad se realizaron las siguientes pruebas estadísticas, con base en las siguientes hipótesis:

H0: los datos de los residuales del peso del café solubilizado en función de las diferentes temperaturas de infusión tienen una distribución normal

H1: los datos de los residuales del peso del café solubilizado en función de las diferentes temperaturas de infusión no tienen una distribución normal

- Shapiro-Wilk normality test


    Shapiro-Wilk normality test

data:  datos$res
W = 0.97852, p-value = 0.867

- Lilliefors (Kolmogorov-Smirnov) normality test


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  datos$res
D = 0.087303, p-value = 0.9072

- Anderson-Darling normality test


    Anderson-Darling normality test

data:  datos$res
A = 0.22632, p-value = 0.7944

- Jarque Bera Test


    Jarque Bera Test

data:  datos$res
X-squared = 0.41022, df = 2, p-value = 0.8146
Resultado del Valor-p para Residuales

Shapiro-Wilk normality test: p-value = 0.8670

Lilliefors (Kolmogorov-Smirnov) p-value = 0.9072

Anderson-Darling normality test p-value = 0.7944

Jarque Bera Test p-value = 0.8146

Para todas las pruebas se obtiene un valor-p mayor de 0.05 (0.8670, 0.9072, 0.7944 y 0.8146 respectivamente), es decir no podemos rechazar la hipótesis nula (hipótesis de normalidad). Por lo tanto, podemos concluir que nuestros datos cumplen el supuesto de normalidad.

Debido a que Ho no se rechaza, no es necesario aplicar estadístico de medida remedial ni transformaciones de potencia de los datos.

4.6.2 Supuesto de Homocedasticidad (varianza constante)

Para comprobar el supuesto de homocedasticidad se plantean las siguientes hipótesis y realizan inicialmente los siguientes gráficos:

H0: varianza del peso del café solubilizado a temperatura de infusión de 50°C = varianza del peso del café solubilizado a temperatura de infusión de 70°C = varianza del peso del café solubilizado a temperatura de infusión de 90°C

H1: varianza del peso del café solubilizado a temperatura de infusión de 50°C ≠ varianza del peso del café solubilizado a temperatura de infusión de 70°C ≠ varianza del peso del café solubilizado a temperatura de infusión de 90°C

Hipótesis Nula e Hipótesis Alternativa

Ho: σ1 = σ2 = σ3

H1: σ1 ≠ σ2 ≠ σ3

Gráfico de datos ajustados

Figura 12. Datos ajustados de residuales del Proceso.

Del gráfico se observa un comportamiento en forma de embudo, donde los residuos se encuentran distribuidos aleatoriamente a ambos lados del cero y no se detectan patrones, la forma de embudo puede indicar varianzas no constantes en el modelo.

Gráfico boxplot de residuales por tratamiento

Figura 13. Boxplot de residuales por tratamiento del Proceso.

Para corroborar los supuestos anteriores se utilizaron las siguientes pruebas estadísticas:

En el gráfico boxplot de los niveles del factor vs residuales se observa que las medianas de los residuales para los diferentes niveles se encuentran cercanas a cero y podría decirse que no hay diferencias estadísticamente significativas.

- Levene’s Test for Homogeneity of Variance (center = median)

Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2   0.111 0.8954
      21               

- Bartlett test of homogeneity of variances


    Bartlett test of homogeneity of variances

data:  datos$Peso_café_solub by datos$Temp
Bartlett's K-squared = 0.77647, df = 2, p-value = 0.6783

- studentized Breusch-Pagan test

Warning: package 'lmtest' was built under R version 4.3.3
Loading required package: zoo
Warning: package 'zoo' was built under R version 4.3.3

Attaching package: 'zoo'
The following objects are masked from 'package:base':

    as.Date, as.Date.numeric

    studentized Breusch-Pagan test

data:  anova
BP = 0.96147, df = 2, p-value = 0.6183
Valor-p

Levene’s Test: p-value = 0.8954

Bartlett test: p-value = 0.6783

studentized Breusch-Pagan test: p-value = 0.6183

Para todas las pruebas se obtiene un valor-p mayor de 0.05 (0.8954, 0.6783 y 0.6183 respectivamente), no podemos rechazar la hipótesis nula. Por lo tanto, podemos concluir que nuestros datos cumplen el supuesto de homocedasticidad y se prueba que la varianza dentro de los tratamientos es igual.

Debido a que Ho no se rechaza, no es necesario aplicar estadístico de medida remedial ni transformaciones de potencia de los datos.

4.6.3 Supuesto de Independencia de errores

Para comprobar el supuesto de independencia de los errores se plantean las siguientes hipótesis y realiza inicialmente un gráfico:

H0: Hay independencia entre los errores de los tratamientos a diferentes temperaturas de infusión para la obtención del peso del café solubilizado

H1: No hay independencia entre los errores de los tratamientos a diferentes temperaturas de infusión para la obtención del peso del café solubilizado

Hipótesis Nula e Hipótesis Alternativa

𝐻0: 𝐶𝑜𝑟(𝜀i, 𝜀j) = 0 ∀𝑖 ≠ 𝑗

𝐻1: 𝐶𝑜𝑟(𝜀i, 𝜀j) ≠ 0 para algún 𝑖 ≠ 𝑗.

4.6.4 Gráfico de dispersión de residuales vs orden

Para comprobar el supuesto de independencia de los errores se plantean las siguientes hipótesis y realiza inicialmente un gráfico:

H0: Hay independencia entre los errores de los tratamientos a diferentes temperaturas de infusión para la obtención del peso del café solubilizado

H1: No hay independencia entre los errores de los tratamientos a diferentes temperaturas de infusión para la obtención del peso del café solubilizado

Hipótesis Nula e Hipótesis Alternativa

𝐻0: 𝐶𝑜𝑟(𝜀i, 𝜀j) = 0 ∀𝑖 ≠ 𝑗

𝐻1: 𝑜𝑟(𝜀i, 𝜀j) ≠ 0 para algún 𝑖 ≠ 𝑗.

Gráfico de dispersión de residuales vs orden

Figura 14. Dispersión de residuales vs orden del Proceso

El anterior gráfico muestra el comportamiento de los datos del experimento en el orden en el que se realizaron, donde no se observa un patrón o tendencia.

Para demostrar el supuesto de independencia es necesario aplicar la prueba de Durbin – Watson que arroja los siguientes datos:

- Durbin-Watson test


    Durbin-Watson test

data:  anova
DW = 1.32, p-value = 0.04512
alternative hypothesis: true autocorrelation is greater than 0

Dado que valor-P es menor que 0.05, quiere decir que los residuos no son independientes entre sí, por lo que se rechaza la hipótesis nula y se acepta la hipótesis alternativa acerca de que no hay independencia. En este caso, la aceptación de la hipótesis alternativa prueba que el experimento no se aleatorizó completamente. Pero teniendo en cuenta que el valor-P es muy cercano a 0.05, y teniendo en cuenta que existe una aucorrelación natural entre las variables, empleamos otra prueba estadística para comprobar la independencia:

- Breusch-Godfrey test for serial correlation of order up to 1


    Breusch-Godfrey test for serial correlation of order up to 1

data:  anova
LM test = 2.9691, df = 1, p-value = 0.08487

Para este caso, dado que el valor-p es mayor que 0.05, se acepta la hipótesis nula acerca de que la correlación entre los residuos de los diferentes tratamientos es = 0 y no es necesario aplicar una medida remedial.

4.7 Comparación entre tratamientos

Para realizar la comparación entre pares de medias de tratamientos se aplican pruebas estadísticas como las siguientes:

4.7.1 Método LSD, Least Significant Difference (Diferencia mínima significativa)

Warning: package 'agricolae' was built under R version 4.3.3

Attaching package: 'agricolae'
The following objects are masked from 'package:moments':

    kurtosis, skewness

Study: anova ~ "factor"

LSD t Test for Peso_café_solub 

Mean Square Error:  0.0087375 

factor,  means and individual ( 95 %) CI

   Peso_café_solub        std r         se       LCL       UCL  Min  Max    Q25
50         0.78500 0.07540368 8 0.03304826 0.7162724 0.8537276 0.70 0.91 0.7175
70         0.92500 0.09606545 8 0.03304826 0.8562724 0.9937276 0.78 1.09 0.8800
90         1.15125 0.10629306 8 0.03304826 1.0825224 1.2199776 0.98 1.34 1.0875
     Q50   Q75
50 0.780 0.835
70 0.905 0.955
90 1.160 1.195

Alpha: 0.05 ; DF Error: 21
Critical Value of t: 2.079614 

least Significant Difference: 0.09719553 

Treatments with the same letter are not significantly different.

   Peso_café_solub groups
90         1.15125      a
70         0.92500      b
50         0.78500      c

De los anteriores datos se puede concluir que como para los diferentes tratamientos se obtiene una letra diferente, los pesos del café solubilizado para cada temperatura son estadísticamente diferentes.


Study: anova ~ "factor"

LSD t Test for Peso_café_solub 

Mean Square Error:  0.0087375 

factor,  means and individual ( 95 %) CI

   Peso_café_solub        std r         se       LCL       UCL  Min  Max    Q25
50         0.78500 0.07540368 8 0.03304826 0.7162724 0.8537276 0.70 0.91 0.7175
70         0.92500 0.09606545 8 0.03304826 0.8562724 0.9937276 0.78 1.09 0.8800
90         1.15125 0.10629306 8 0.03304826 1.0825224 1.2199776 0.98 1.34 1.0875
     Q50   Q75
50 0.780 0.835
70 0.905 0.955
90 1.160 1.195

Alpha: 0.05 ; DF Error: 21
Critical Value of t: 2.079614 

Comparison between treatments means

        difference pvalue signif.        LCL         UCL
50 - 70   -0.14000 0.0069      ** -0.2371955 -0.04280447
50 - 90   -0.36625 0.0000     *** -0.4634455 -0.26905447
70 - 90   -0.22625 0.0001     *** -0.3234455 -0.12905447

Para las comparaciones entre tratamientos, se encuentra que para todas el valor-p es menor de 0.05 y para ninguno de los casos se incluye el 0 dentro del intervalo de aceptación. De lo anterior se concluye que para todos los casos hay diferencias mínimas significativas entre las medias de los tratamientos (µi-µj≠0).


Study: anova ~ "factor"

HSD Test for Peso_café_solub 

Mean Square Error:  0.0087375 

factor,  means

   Peso_café_solub        std r         se  Min  Max    Q25   Q50   Q75
50         0.78500 0.07540368 8 0.03304826 0.70 0.91 0.7175 0.780 0.835
70         0.92500 0.09606545 8 0.03304826 0.78 1.09 0.8800 0.905 0.955
90         1.15125 0.10629306 8 0.03304826 0.98 1.34 1.0875 1.160 1.195

Alpha: 0.05 ; DF Error: 21 
Critical Value of Studentized Range: 3.564625 

Comparison between treatments means

        difference pvalue signif.        LCL         UCL
50 - 70   -0.14000 0.0181       * -0.2578046 -0.02219536
50 - 90   -0.36625 0.0000     *** -0.4840546 -0.24844536
70 - 90   -0.22625 0.0002     *** -0.3440546 -0.10844536

Método de Tukey Revisar Tabla

Para las comparaciones entre tratamientos, se encuentra que para todas el valor-p es menor de 0.05 y para ninguno de los casos se incluye el 0 dentro del intervalo de aceptación. De lo anterior se concluye que para todos los casos hay diferencias mínimas significativas entre los tratamientos (µi-µj≠0).

4.8 Análisis del número de réplicas empleado

Uno de los métodos usados para calcular los tamaños de muestra, son las curvas de operación características (curvas OC), adecuadas para seleccionar el número de réplicas para que el diseño sea capaz de detectar pequeñas diferencias entre las medias de los tratamientos.

Teniendo en cuenta que el experimento que diseñamos tiene 3 tratamientos y 8 réplicas por tratamiento, y asumiendo los siguientes valores:

  • dif <- 0.01 (valor definido con base en la precisión de las medidas)
  • a <- 3
  • sigma2 <- 1.5 (valor asignado según lo trabajado en la clase)

Se Calcula la potencia del experimento actual y se obtiene lo siguiente:

Warning: package 'pwr' was built under R version 4.3.3

     Balanced one-way analysis of variance power calculation 

              k = 3
              n = 8
              f = 0.004714045
      sig.level = 0.05
          power = 0.05003475

NOTE: n is number in each group

La potencia para el experimento realizado fue de 0.05, y llevando los siguientes valores a la curva OC:

ν1= a – 1= 3 -1=2

ν2= N – a= a* (n-1)= 21

Si quisiéramos una potencia, por ejemplo del 90%, las réplicas que debieron realizarse por cada tratamiento son:


     Balanced one-way analysis of variance power calculation 

              k = 3
              n = 189809.3
              f = 0.004714045
      sig.level = 0.05
          power = 0.9

NOTE: n is number in each group
Número de Réplicas para Potencia del 90%

n = 189.809,3

n= Número de réplicas para cada tratamiento

5 Conclusiones

Del análisis estadístico se concluye que:

  • El diseño del experimento es balanceado, dado que se cuenta con igual cantidad de réplicas para los 3 tratamientos

  • Del experimento se concluye que, a mayor temperatura del agua, se obtiene una mayor solubilidad del café molido. De los resultados y el análisis estadístico se observa que el mayor promedio de los pesos de café solubilizado fue obtenido a 90°C, seguido de 70°C y por último 50°C.

  • La temperatura tiene un efecto significativo en la solubilización del café molido.

  • Teniendo en cuenta los resultados de la prueba de Durbin-Watson, se puede concluir que la aleatorización del experimento no fue la más adecuada, esto puede deberse a una autocorrelación natural entre las mediciones del experimento.

  • Los valores promedio del peso del café solubilizado entre tratamiento, son estadísticamente diferentes.

  • Para el caso de las réplicas analizadas en el experimento (8 por cada tratamiento), éstas no son suficientes y para obtener una probabilidad alta de encontrar diferencias estadísticamente significativas. Para obtener una potencia del 90% (con las siguientes condiciones sig.level=0.05, dif = 0.01, sigma2=1.5), serían necesarias 189809,3 réplicas.

6 Referencias

  1. Castaño C, et al.(2000). Coffee Technology, volume 2, London, Elsevier applied Sciences 321 p. Introducción al Extracción y Solubilidad de Café.

  2. Ortega C. Jessica et al.,(2014). Evaluación del rendimiento de la extracción de café tostado molido comercial. @limentech, Ciencia y Tecnología Alimentaria 12(2014) 40-47.

  3. Puerta, G. I. (2013). Calidad del café. En Federación Nacional de Cafeteros de Colombia, Manual del cafetero colombiano: Investigación y tecnología para la sostenibilidad de la caficultura (Vol. 3, pp. 81–110). Cenicafé. https://doi.org/10.38141/cenbook-0026_30.