# A tibble: 24 × 2
Temp Peso_café_solub
<dbl> <dbl>
1 90 1.09
2 90 1.19
3 70 1.09
4 90 1.15
5 50 0.72
6 70 0.88
7 50 0.7
8 70 0.88
9 70 0.92
10 90 0.98
# ℹ 14 more rows
Evaluación de la solubilidad del café molido a diferentes temperaturas de infusión
Resumen
El proceso de extracción del café es la operación mediante la cual el agua caliente solvata el café tostado y molido, disolviendo los compuestos químicos solubles responsables del aroma y sabor. Se ha utilizado el diseño experimental completamente aleatorizado para evaluar la solubilidad del café molido comercial a las temperaturas de infusión de 50, 70 y 90°C, con el fin de obtener la mayor extracción de los sólidos solubles. Se empleó el Método por goteo directo a las mismas condiciones y variables para cada temperatura de extracción (peso de muestra de café, granulometría, volumen de agua, tiempo de infusión). De los resultados se observa que el mayor promedio de los pesos de café solubilizado fue obtenido a 90°C, seguido de 70°C y por último 50°C, esto se debe al hecho de que la solubilidad aumenta con la temperatura porque el aumento de la energía cinética asociado a las temperaturas más altas permite que las moléculas de solvente rompan de manera más efectiva las moléculas unidas a la celulosa insoluble del café. Los resultados se analizaron estadísticamente mediante la prueba t de Student, análisis de varianza, prueba F y falta de ajuste para definir el efecto en la solubilidad del café.
Keywords
Café, solubilidad, sólidos solubles, temperatura, Diseño Experimental completamente aleatroizado
Responsables
Liliana María Londoño Ramírez, Claudia Yaneth Sánchez Jaramillo
1 Objetivo del Experimento
Determinar la variación de la solubilidad del café molido en función de la temperatura de infusión
2 Introducción
La solubilidad del café molido en agua caliente es un proceso fundamental en la preparación de esta popular bebida. El café molido está compuesto principalmente por componentes solubles e insolubles en agua. Los componentes solubles incluyen compuestos como cafeína, ácidos clorogénicos, azúcares y aceites volátiles, que son responsables de dar sabor y aroma al café. Los componentes insolubles son principalmente partículas de café molido que no se disuelven en agua.
Cuando se añade agua caliente al café molido, se inicia un proceso de extracción en el que los compuestos solubles del café se disuelven en el agua. Este proceso se ve influenciado por varios factores, incluyendo la temperatura del agua, el tamaño de molienda del café, el tiempo de infusión y la proporción de café al agua.
La temperatura del agua es crucial, ya que afecta la velocidad de extracción de los compuestos solubles del café. El agua caliente tiene mayor capacidad de disolver estos compuestos, lo que acelera el proceso de extracción y puede influir en el sabor y la fuerza del café resultante. Sin embargo, es importante tener en cuenta que utilizar agua demasiado caliente puede dar lugar a una extracción excesiva, lo que puede producir un café con sabores amargos y astringentes.
El tamaño de molienda del café también desempeña un papel importante en la solubilidad. Una molienda más fina aumenta la superficie de contacto entre el café y el agua, lo que facilita la extracción de los compuestos solubles. Por otro lado, una molienda más gruesa puede resultar en una extracción menos eficiente, ya que el agua tiene más dificultades para penetrar las partículas de café.
El tiempo de infusión es otro factor crítico. Un tiempo de infusión más largo permite una mayor extracción de compuestos solubles del café, lo que resulta en una bebida más fuerte y con más cuerpo. Sin embargo, un tiempo de infusión excesivamente largo puede llevar a una sobreextracción y a sabores no deseados.
El estudio de la solubilidad del café se ha realizado en principio, desde la composición y propiedades fisicoquímicas de los compuestos presentes en el café y la solubilidad de los mismos en agua, [Puerta, G. I. 2013]. [Castaño C, et al., 2000] realizaron varios estudios coincidiendo en los factores que afectan el rendimiento en la extracción de los sólidos solubles del extracto y además, realizaron la caracterización del rendimiento de extracción y el contenido de la bebida del café. Adiconalmente, [Ortega C. Jessica et al.2014)], han realizado medidas de rendimiento y contenido de sólidos solubles en extractos de café consumo, café pastilla y mezcla.
Encontraron que los promedios de temperatura de las bebidas obtenidas en cada extracción, en la temperatura empleada de (90°C±1°C) se alcanzó una mayir concentración de solidos solubles extraídos, en comparación a las otras dos temperaturas evaluadas que mantuvieron una temperatura promedio de 85°C±1°C, Figura 1.
Figura 1. Valores promedios de temperatura en la extracción de sólidos solubles en muestras de café comerciales.
3 Materiales y Método
3.1 Materiales
- Café molido modelo Matix - Colcafé, 10g
- Agua potable, red acueducto del Poblado - Medellín)
- Balanza analítica, marca Gynipot, resolución de 0.01g
- Probeta plástica graduada,100mL
- Filtros de papel,1.5
- Cronómetro, resolución 0.01s
- Plancha de calentamiento y agitación, Thermo Fisher
- Termómetro de punzón, modelo TP 101, resolución 0.1°C
3.2 Método
3.2.1 Premuestreo
fue necesario realizar experimentos preliminares, para evaluar la variabilidad del peso del residuo de café molido luego de la infusión a las tres diferentes temperaturas seleccionadas y así contar con información representativa para la planeación y ejecución del experimento que permitiera realizar el análisis estadístico de los datos obtenidos. Del premuestreo se concluyó que si existían diferencias en el peso del residuo de café seco a las 3 temperaturas seleccionadas además de que visualmente también se observó diferencia en el color del café filtrado (más claro el filtrado a 50°C y más oscuro a 90°C).
3.2.2 Medición
El experimento se llevó a cabo empleando 10.00g de café molido comercial en 100mL de agua, sometido a 3 diferentes temperaturas (50, 70 y 90°C) cada una con 8 réplicas, con un tiempo de infusión de 3 minutos a 60 rpm, cada solución. Luego del tiempo de infusión, las muestras fueron filtradas en papel de filtro (peso de 1.50g) durante 5 minutos, secadas a temperatura ambiente durante 48 horas. Luego de este tiempo, se calculó el peso solubilizado del café molido, por la diferencia del peso inicial y el peso del residuo del café (teniendo también en cuenta la resta del peso del filtro).
3.2.3 Precisión y rango de las medidas
Para la variable respuesta se empleó la balanza analítica marca Gynipot (resolución de 0.01g), según: - Peso de café molido inicial entre 9.99 y 10.01g - Peso del residuo final de café solubilizado con precisión de 0.01g
3.2.4 Restricciones
- Métodos de medida: uso de instrumentación adecuada para medición de cada variable y de una instalación con todos los implementos necesarios para llevar a cabo el experimento
- Materiales: café molido, balanza analítica, probeta plástica graduada de 100mL, filtros de papel, cronómetro del celular, plancha de calentamiento y agitación usada, magnetos (agitadores), termómetro de punzón, vidriería (beakers de vidrio borosilicato de volumen de 250mL y 2000mL), vidrio reloj, agua potable (red de acueducto del barrio El Poblado, Medellín) y espátulas -Duración: el experimento fue realizado en 4 horas, aproximadamente 10 minutos por muestra, y posteriormente a las 48 horas, se realizó el pesaje del residuo secado a temperatura ambiente. Este último proceso tuvo una duración de 1 minuto por muestra
- Número de repeticiones y réplicas: Número por tratamiento: Son réplicas, dado que cada pesaje de café se considera como una unidad experimental que no repite datos. Número por tratamiento: 8 a una temperatura de infusión de 50°C, 8 a una temperatura de infusión de 70°C y 8 a una temperatura de infusión de 90°C
- Unidades experimentales: 10 g de café molido
- Número de experimentos: 24
- Regiones no permitidas de experimentación: temperaturas de infusión por fuera del intervalo de 30°C y 95°C
- Límites de aleatorización: Completar el ejercicio académico se diseñó teniendo en cuenta la aleatorización del 100% de los experimentos
Figura 2. Experimento: Variación de la solubilidad de café molido en agua
4 Resultados y Discusión
4.1 Planeación del Experimento
4.1.1 Diagrama del Proceso
Figura 3. Diagrama del Proceso: Variación de la solubilidad de café molido en agua.
4.2 Datos del Experimento
Los datos corresponden a tres tratamientos y una variable respuesta cuantitativa. A continuación, se presentan los datos obtenidos:
Tabla 1. Datos del Experimento
Para el diseño del experimento completamente aleatorizado, se elaboró la siguiente tabla de datos:
Tabla 2. Datos del Experimento Aleatorizados
Posteriormente se marcaron papeles independientes con el número del experimento (ver primer columna de la tabla anterior), y se dispusieron en una bolsa. De forma aleatoria, se sacaron cada uno de los papeles y en el orden de salida se elaboró la siguiente tabla para la ejecución de los experimentos:
Tabla 3. Datos para la ejecucuón del Experimento
El diseño de experimentos que será evaluado en este trabajo es el diseño completamente aleatorizado, con 8 réplicas.
El diseño experimental es balanceado dado que el número de réplicas para cada tratamiento es igual.
Para el diseño experimental, se define el nivel de significancia como α = 0.05.
4.3 Anásis descriptivo de los datos
4.3.1 Simetría de los Datos
Figura 4. Boxplot para cada tratamiento del Proceso.
Del análisis del gráfico boxplot, se obtienen los siguientes datos:
$`50`
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.7000 0.7175 0.7800 0.7850 0.8350 0.9100
$`70`
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.780 0.880 0.905 0.925 0.955 1.090
$`90`
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.980 1.087 1.160 1.151 1.195 1.340
Y se puede inferir lo siguiente:
Para los tres niveles del factor se observa una diferencia entre las medias y las medianas, siendo la mediana más alta igual a 1.16g correspondiente a la temperatura de 90°C , seguida de la mediana igual a 0.905g correspondiente a la temperatura de 70°C y finalmente una mediana de 0.78g correspondiente a la temperatura de 50°C, el mismo comportamiento se observa para la media obtenida para las mediciones a cada temperatura.
Para las mediciones tomadas a 50°C se observa que la mediana está en el centro de la caja, lo que significa que la muestra es simétrica, además, el 25% de los valores son menores a 0.7175g y el 75% de los datos son superiores a 0.8350. No se observan datos atípicos.
Para las mediciones tomadas a 70°C se observa que la mediana no está en el centro de la caja, lo que significa que la muestra no es simétrica, además, el 25% de los valores son menores a 0.880g y el 75% de los datos son superiores a 0.955g Se observa un dato atípico por encima del valor máximo de la distribución.
Para las mediciones tomadas a 90°C se observa que la mediana no está en el centro de la caja, lo que significa que la muestra es no simétrica, además, el 25% de los valores son menores a 1.087g y el 75% de los datos son superiores a 1.195g. No se observan datos atípicos.
Para todos los casos, sería necesario emplear un método estadístico para corroborar la simetría, por ejemplo el estadístico Skewness.
Del gráfico se puede observar que si existe una diferencia estadísticamente significativa en el peso del café solubilizado a las tres temperaturas, lo cual debe comprobarse con pruebas estadísticas más robustas.
4.3.2 Determinación de la Densidad
Figura 5. Densidad de los datos del peso de café solubilizado en agua.
Del anterior gráfico de densidad se puede inferir que entre los pesos de café solubilizado de 0.80g y 0.90g se encuentra la mayor densidad, de los datos, es decir, se encuentran distribuidos el mayor número de datos.
4.3.3 Gráfico Boxplot para todos los datos de todos los tratamientos:
Figura 6. Boxplot para todos los datos de los tratamientos del Proceso
De la gráfica boxplot de los datos obtenidos para todos los tratamientos se puede inferir que, del total de los 24 experimentos, se observa que la mediana es de 0.915g y está no se encuentra en el centro de la caja, lo que significa que la muestra no es simétrica, además, el 25% de los valores son menores 0.8225g y el 75% de los datos son superiores a 1.0900g. No se observan datos atípicos. Se obtienen además los siguientes datos:
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.7000 0.8225 0.9150 0.9537 1.0900 1.3400
Prueba Skewness
Para comprobar la simetría, se aplicó la prueba estadística de Skewness, y se obtuvo el siguiente valor:
[1] 0.3840044
Skewness = 0.3840044
De lo anterior se interpreta que los datos no son simétricos (SW≠0), y tienen un sesgo positivo que indica que hay una cola más larga que se extiende en sentido positivo.
4.3.4 Histograma
`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Figura 7. Histograma del peso de café solubilizado.
Del histograma se puede observar el comportamiento de los datos basados en la variable cuantitativa del peso de café solubilizado y se observa por ejemplo que tres de los datos se encuentran en un valor promedio de 0.88g y otros tres en 1.09g. Del histograma se observa que los datos se ajustan a una curva llamada campana de Gauss, indicando que es probable que los datos tengan una distribución normal. Esta normalidad debe ser comprobada por medio de test estadísticos.
4.3.5 Test de normalidad de los datos para la variable respuesta
Complementando los gráficos anteriores, se aplican las pruebas de normalidad a los datos de la variable respuesta, teniendo en cuenta las siguientes hipótesis
H0: los datos del peso del café solubilizado en función de las diferentes temperaturas de infusión tienen una distribución normal
H1: los datos del peso del café solubilizado en función de las diferentes temperaturas de infusión no tienen una distribución normal
Obteniéndose los siguientes valores:
Shapiro-Wilk normality test
data: datos$Peso_café_solub
W = 0.95478, p-value = 0.3428
Lilliefors (Kolmogorov-Smirnov) normality test
data: datos$Peso_café_solub
D = 0.13636, p-value = 0.2958
Anderson-Darling normality test
data: datos$Peso_café_solub
A = 0.37199, p-value = 0.3927
Warning: package 'tseries' was built under R version 4.3.3
Registered S3 method overwritten by 'quantmod':
method from
as.zoo.data.frame zoo
Jarque Bera Test
data: datos$Peso_café_solub
X-squared = 1.2693, df = 2, p-value = 0.5301
Shapiro-Wilk normality test: p-value = 0.3428
Lilliefors (Kolmogorov-Smirnov) p-value = 0.2958
Anderson-Darling normality test p-value = 0.3927
Jarque Bera Test p-value = 0.5301
Para todas las pruebas se obtiene un valor-p mayor de 0.05 (0.3428, 0.2958, 0.3927 y 0.5301 respectivamente), es decir no podemos rechazar la hipótesis nula (hipótesis de normalidad). Por lo tanto, podemos concluir que nuestros datos cumplen el supuesto de normalidad.
4.4 Modelos con sus respectivas hipótesis.
4.4.1 Modelo de Medias
H0: Promedio del peso del café solubilizado luego de la infusión a 50°C = Promedio del peso del café solubilizado luego de la infusión a 70°C = Promedio del peso del café solubilizado luego de la infusión a 90°C
H1: Promedio del peso del café solubilizado luego de la infusión a 50°C ≠ Promedio del peso del café solubilizado luego de la infusión a 70°C ≠ Promedio del peso del café solubilizado luego de la infusión a 90°C
H0: \(\mu~1~ = \mu~2~ = \mu~3~\)
H1: \(\mu~1~ ≠ \mu~2~ ≠ \mu~3~\)
4.4.2 Modelo de Efectos (Modelo de Análisis de Varianza o de un sólo factor)
H0: Efecto de la temperatura de infusión de 50°C en el peso del café solubilizado = Efecto de la temperatura de infusión de 70°C en el peso del café solubilizado = Efecto de la temperatura de infusión de 90°C en el peso del café solubilizado
H1: Efecto de la temperatura de infusión de 50°C en el peso del café solubilizado ≠ Efecto de la temperatura de infusión de 70°C en el peso del café solubilizado ≠ Efecto de la temperatura de infusión de 90°C en el peso del café solubilizado
H0: \(\tau~1~ = \tau~2~ = \tau~3~\)
H1: \(\tau~i~ ≠ 0 para i = 1,2 y 3\)
4.4.3 Modelo de Regresión
H0: Los residuales del peso del café solubilizado luego de la infusión a 50°C = Los residuales del peso del café solubilizado luego de la infusión a 70°C = Los residuales del peso del café solubilizado luego de la infusión a 50°C
H1: Los residuales del peso del café solubilizado luego de la infusión a 50°C ≠ Los residuales del peso del café solubilizado luego de la infusión a 70°C ≠ Los residuales del peso del café solubilizado luego de la infusión a 90°C
H0: \(\beta~1~ = \beta~2~ = \beta~3~\)
H1: \(\beta~i~ ≠ 0 para i = 1,2 y 3\)
La equivalencia entre los tres modelos propuestos es que el planteamiento de las hipótesis y comprobación, hacen parte del diseño de experimentos completamente aleatorizado y nos permiten comprobar si hay diferencias estadísticamente significativas entre diferentes tratamientos.
4.5 Análisis de Varianza, ANOVA y verificación de Hipótesis
4.5.1 ANOVA
Realizando el análisis ANOVA de los datos obtenidos se obtiene la siguiente información:
Df Sum Sq Mean Sq F value Pr(>F)
datos$Temp 2 0.5465 0.27324 31.27 5.05e-07 ***
Residuals 21 0.1835 0.00874
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La tabla ANOVA detalla 2 grados de libertad para Temperatura y 21 grados de libertad para los residuales, según los 24 experimentos y los 3 niveles del factor.
Además, se calculan los valores críticos:
qf(0.025, 2, 21) = 0.02534836
qf(0.975, 2, 21) = 4.419918
De lo anterior se tiene:
Respecto al Pr(>F) igual a 5.05e-07, este es menor que a = 0.05, por lo que se rechaza H0, y nos indica que el efecto de la temperatura sobre el peso del café solubilizado es significativo y por lo tanto se rechaza H0.
Para la región crítica se tiene que el F calculado igual a 31.27 se encuentra por fuera de la región de aceptación que va desde 0.02534836 hasta 4.419918, esto quiere decir que se rechaza igualmente H0 para los modelos de efectos y medias.
La suma de cuadrados de los residuales y de temperatura es de 0.73, de los cuales el 74.86% es representada por la Temperatura y el 25.14% es representada por los residuales.
Del modelo de regresión se iiene:
Call:
lm(formula = datos$Peso_café_solub ~ datos$Temp)
Residuals:
Min 1Q Median 3Q Max
-0.171250 -0.062187 -0.003125 0.048437 0.188750
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.78500 0.03305 23.753 < 2e-16 ***
datos$Temp70 0.14000 0.04674 2.995 0.00689 **
datos$Temp90 0.36625 0.04674 7.836 1.15e-07 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.09347 on 21 degrees of freedom
Multiple R-squared: 0.7486, Adjusted R-squared: 0.7247
F-statistic: 31.27 on 2 and 21 DF, p-value: 5.049e-07
Para el caso de este modelo, se obtiene de igual forma un valor F de 31.27 y un valor-p de 5.049e-07, por lo que se rechaza H0 y se concluye que los \(\beta~i~\) ≠ 0 para los 3 tratamientos.
Respecto a los modelos de medias y de efectos, aunque los tres modelos se deben comprobar, se desconoce los códigos en R (Modelos de Medias y Modelo de Efectos), para obtener los parámetros estadísticos que permita concluir acerca de las hipótesis. Se realizó la búsqueda bibliográfica y material de la asignatura, pero no fue posible obtener la información requerida para conseguir los resultados necesarios.
4.6 Validación del Modelo
Para completar el análisis estadístico de ANOVA y validar el modelo, se debe comprobar el supuesto de independencia, normalidad y de homocedasticidad que se detalla a continuación. Estos supuestos del modelo se comprueban a través de los residuos.
4.6.1 Supuesto de Normalidad de los errores del modelo
Inicialmente se realiza un análisis gráfico de los residuales para evaluar el comportamiento de la distribución de las mediciones.
Se calculan los residuales de los datos obteniéndose las siguientes graficas:
Histograma residuales
`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Figura 8. Histograma de Residuales del Proceso.
El histograma de residuos muestra la distribución de los residuos para toda la distribución del modelo, de que se infiere que los residuales se ajustan a la forma de la campana de Gauss, indicando que probablemente tienen una distribución normal.
Boxplot residuales
Figura 9. Boxplot de residuales
De la gráfica boxplot de los datos obtenidos para los residuales se puede inferir que, la mediana es de 0.0 y se encuentra cercana al centro de la caja, lo que significa que probablemente la muestra es simétrica. No se observan datos atípicos.
Qqplot de residuales
Figura 10. Qqplot de residuales del Proceso.
Los datos están cercanos a la línea continua del gráfico y esto indica que los residuales probablemente tienen una distribución normal, lo cual se corrobora con la siguiente gráfica donde los residuales se encuentran dentro del área coloreada en azul.
Loading required package: carData
[1] 17 10
Figura 11. Qqplot con áreas de aceptación residuales del proceso.
Comprobación del Supuesto de Normalidad
Para comprobar el supuesto de normalidad se realizaron las siguientes pruebas estadísticas, con base en las siguientes hipótesis:
H0: los datos de los residuales del peso del café solubilizado en función de las diferentes temperaturas de infusión tienen una distribución normal
H1: los datos de los residuales del peso del café solubilizado en función de las diferentes temperaturas de infusión no tienen una distribución normal
- Shapiro-Wilk normality test
Shapiro-Wilk normality test
data: datos$res
W = 0.97852, p-value = 0.867
- Lilliefors (Kolmogorov-Smirnov) normality test
Lilliefors (Kolmogorov-Smirnov) normality test
data: datos$res
D = 0.087303, p-value = 0.9072
- Anderson-Darling normality test
Anderson-Darling normality test
data: datos$res
A = 0.22632, p-value = 0.7944
- Jarque Bera Test
Jarque Bera Test
data: datos$res
X-squared = 0.41022, df = 2, p-value = 0.8146
Shapiro-Wilk normality test: p-value = 0.8670
Lilliefors (Kolmogorov-Smirnov) p-value = 0.9072
Anderson-Darling normality test p-value = 0.7944
Jarque Bera Test p-value = 0.8146
Para todas las pruebas se obtiene un valor-p mayor de 0.05 (0.8670, 0.9072, 0.7944 y 0.8146 respectivamente), es decir no podemos rechazar la hipótesis nula (hipótesis de normalidad). Por lo tanto, podemos concluir que nuestros datos cumplen el supuesto de normalidad.
Debido a que Ho no se rechaza, no es necesario aplicar estadístico de medida remedial ni transformaciones de potencia de los datos.
4.6.2 Supuesto de Homocedasticidad (varianza constante)
Para comprobar el supuesto de homocedasticidad se plantean las siguientes hipótesis y realizan inicialmente los siguientes gráficos:
H0: varianza del peso del café solubilizado a temperatura de infusión de 50°C = varianza del peso del café solubilizado a temperatura de infusión de 70°C = varianza del peso del café solubilizado a temperatura de infusión de 90°C
H1: varianza del peso del café solubilizado a temperatura de infusión de 50°C ≠ varianza del peso del café solubilizado a temperatura de infusión de 70°C ≠ varianza del peso del café solubilizado a temperatura de infusión de 90°C
Ho: σ1 = σ2 = σ3
H1: σ1 ≠ σ2 ≠ σ3
Gráfico de datos ajustados
Figura 12. Datos ajustados de residuales del Proceso.
Del gráfico se observa un comportamiento en forma de embudo, donde los residuos se encuentran distribuidos aleatoriamente a ambos lados del cero y no se detectan patrones, la forma de embudo puede indicar varianzas no constantes en el modelo.
Gráfico boxplot de residuales por tratamiento
Figura 13. Boxplot de residuales por tratamiento del Proceso.
Para corroborar los supuestos anteriores se utilizaron las siguientes pruebas estadísticas:
En el gráfico boxplot de los niveles del factor vs residuales se observa que las medianas de los residuales para los diferentes niveles se encuentran cercanas a cero y podría decirse que no hay diferencias estadísticamente significativas.
- Levene’s Test for Homogeneity of Variance (center = median)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 2 0.111 0.8954
21
- Bartlett test of homogeneity of variances
Bartlett test of homogeneity of variances
data: datos$Peso_café_solub by datos$Temp
Bartlett's K-squared = 0.77647, df = 2, p-value = 0.6783
- studentized Breusch-Pagan test
Warning: package 'lmtest' was built under R version 4.3.3
Loading required package: zoo
Warning: package 'zoo' was built under R version 4.3.3
Attaching package: 'zoo'
The following objects are masked from 'package:base':
as.Date, as.Date.numeric
studentized Breusch-Pagan test
data: anova
BP = 0.96147, df = 2, p-value = 0.6183
Levene’s Test: p-value = 0.8954
Bartlett test: p-value = 0.6783
studentized Breusch-Pagan test: p-value = 0.6183
Para todas las pruebas se obtiene un valor-p mayor de 0.05 (0.8954, 0.6783 y 0.6183 respectivamente), no podemos rechazar la hipótesis nula. Por lo tanto, podemos concluir que nuestros datos cumplen el supuesto de homocedasticidad y se prueba que la varianza dentro de los tratamientos es igual.
Debido a que Ho no se rechaza, no es necesario aplicar estadístico de medida remedial ni transformaciones de potencia de los datos.
4.6.3 Supuesto de Independencia de errores
Para comprobar el supuesto de independencia de los errores se plantean las siguientes hipótesis y realiza inicialmente un gráfico:
H0: Hay independencia entre los errores de los tratamientos a diferentes temperaturas de infusión para la obtención del peso del café solubilizado
H1: No hay independencia entre los errores de los tratamientos a diferentes temperaturas de infusión para la obtención del peso del café solubilizado
𝐻0: 𝐶𝑜𝑟(𝜀i, 𝜀j) = 0 ∀𝑖 ≠ 𝑗
𝐻1: 𝐶𝑜𝑟(𝜀i, 𝜀j) ≠ 0 para algún 𝑖 ≠ 𝑗.
4.6.4 Gráfico de dispersión de residuales vs orden
Para comprobar el supuesto de independencia de los errores se plantean las siguientes hipótesis y realiza inicialmente un gráfico:
H0: Hay independencia entre los errores de los tratamientos a diferentes temperaturas de infusión para la obtención del peso del café solubilizado
H1: No hay independencia entre los errores de los tratamientos a diferentes temperaturas de infusión para la obtención del peso del café solubilizado
𝐻0: 𝐶𝑜𝑟(𝜀i, 𝜀j) = 0 ∀𝑖 ≠ 𝑗
𝐻1: 𝑜𝑟(𝜀i, 𝜀j) ≠ 0 para algún 𝑖 ≠ 𝑗.
Gráfico de dispersión de residuales vs orden
Figura 14. Dispersión de residuales vs orden del Proceso
El anterior gráfico muestra el comportamiento de los datos del experimento en el orden en el que se realizaron, donde no se observa un patrón o tendencia.
Para demostrar el supuesto de independencia es necesario aplicar la prueba de Durbin – Watson que arroja los siguientes datos:
- Durbin-Watson test
Durbin-Watson test
data: anova
DW = 1.32, p-value = 0.04512
alternative hypothesis: true autocorrelation is greater than 0
Dado que valor-P es menor que 0.05, quiere decir que los residuos no son independientes entre sí, por lo que se rechaza la hipótesis nula y se acepta la hipótesis alternativa acerca de que no hay independencia. En este caso, la aceptación de la hipótesis alternativa prueba que el experimento no se aleatorizó completamente. Pero teniendo en cuenta que el valor-P es muy cercano a 0.05, y teniendo en cuenta que existe una aucorrelación natural entre las variables, empleamos otra prueba estadística para comprobar la independencia:
- Breusch-Godfrey test for serial correlation of order up to 1
Breusch-Godfrey test for serial correlation of order up to 1
data: anova
LM test = 2.9691, df = 1, p-value = 0.08487
Para este caso, dado que el valor-p es mayor que 0.05, se acepta la hipótesis nula acerca de que la correlación entre los residuos de los diferentes tratamientos es = 0 y no es necesario aplicar una medida remedial.
4.7 Comparación entre tratamientos
Para realizar la comparación entre pares de medias de tratamientos se aplican pruebas estadísticas como las siguientes:
4.7.1 Método LSD, Least Significant Difference (Diferencia mínima significativa)
Warning: package 'agricolae' was built under R version 4.3.3
Attaching package: 'agricolae'
The following objects are masked from 'package:moments':
kurtosis, skewness
Study: anova ~ "factor"
LSD t Test for Peso_café_solub
Mean Square Error: 0.0087375
factor, means and individual ( 95 %) CI
Peso_café_solub std r se LCL UCL Min Max Q25
50 0.78500 0.07540368 8 0.03304826 0.7162724 0.8537276 0.70 0.91 0.7175
70 0.92500 0.09606545 8 0.03304826 0.8562724 0.9937276 0.78 1.09 0.8800
90 1.15125 0.10629306 8 0.03304826 1.0825224 1.2199776 0.98 1.34 1.0875
Q50 Q75
50 0.780 0.835
70 0.905 0.955
90 1.160 1.195
Alpha: 0.05 ; DF Error: 21
Critical Value of t: 2.079614
least Significant Difference: 0.09719553
Treatments with the same letter are not significantly different.
Peso_café_solub groups
90 1.15125 a
70 0.92500 b
50 0.78500 c
De los anteriores datos se puede concluir que como para los diferentes tratamientos se obtiene una letra diferente, los pesos del café solubilizado para cada temperatura son estadísticamente diferentes.
Study: anova ~ "factor"
LSD t Test for Peso_café_solub
Mean Square Error: 0.0087375
factor, means and individual ( 95 %) CI
Peso_café_solub std r se LCL UCL Min Max Q25
50 0.78500 0.07540368 8 0.03304826 0.7162724 0.8537276 0.70 0.91 0.7175
70 0.92500 0.09606545 8 0.03304826 0.8562724 0.9937276 0.78 1.09 0.8800
90 1.15125 0.10629306 8 0.03304826 1.0825224 1.2199776 0.98 1.34 1.0875
Q50 Q75
50 0.780 0.835
70 0.905 0.955
90 1.160 1.195
Alpha: 0.05 ; DF Error: 21
Critical Value of t: 2.079614
Comparison between treatments means
difference pvalue signif. LCL UCL
50 - 70 -0.14000 0.0069 ** -0.2371955 -0.04280447
50 - 90 -0.36625 0.0000 *** -0.4634455 -0.26905447
70 - 90 -0.22625 0.0001 *** -0.3234455 -0.12905447
Para las comparaciones entre tratamientos, se encuentra que para todas el valor-p es menor de 0.05 y para ninguno de los casos se incluye el 0 dentro del intervalo de aceptación. De lo anterior se concluye que para todos los casos hay diferencias mínimas significativas entre las medias de los tratamientos (µi-µj≠0).
Study: anova ~ "factor"
HSD Test for Peso_café_solub
Mean Square Error: 0.0087375
factor, means
Peso_café_solub std r se Min Max Q25 Q50 Q75
50 0.78500 0.07540368 8 0.03304826 0.70 0.91 0.7175 0.780 0.835
70 0.92500 0.09606545 8 0.03304826 0.78 1.09 0.8800 0.905 0.955
90 1.15125 0.10629306 8 0.03304826 0.98 1.34 1.0875 1.160 1.195
Alpha: 0.05 ; DF Error: 21
Critical Value of Studentized Range: 3.564625
Comparison between treatments means
difference pvalue signif. LCL UCL
50 - 70 -0.14000 0.0181 * -0.2578046 -0.02219536
50 - 90 -0.36625 0.0000 *** -0.4840546 -0.24844536
70 - 90 -0.22625 0.0002 *** -0.3440546 -0.10844536
Método de Tukey Revisar Tabla
Para las comparaciones entre tratamientos, se encuentra que para todas el valor-p es menor de 0.05 y para ninguno de los casos se incluye el 0 dentro del intervalo de aceptación. De lo anterior se concluye que para todos los casos hay diferencias mínimas significativas entre los tratamientos (µi-µj≠0).
4.8 Análisis del número de réplicas empleado
Uno de los métodos usados para calcular los tamaños de muestra, son las curvas de operación características (curvas OC), adecuadas para seleccionar el número de réplicas para que el diseño sea capaz de detectar pequeñas diferencias entre las medias de los tratamientos.
Teniendo en cuenta que el experimento que diseñamos tiene 3 tratamientos y 8 réplicas por tratamiento, y asumiendo los siguientes valores:
- dif <- 0.01 (valor definido con base en la precisión de las medidas)
- a <- 3
- sigma2 <- 1.5 (valor asignado según lo trabajado en la clase)
Se Calcula la potencia del experimento actual y se obtiene lo siguiente:
Warning: package 'pwr' was built under R version 4.3.3
Balanced one-way analysis of variance power calculation
k = 3
n = 8
f = 0.004714045
sig.level = 0.05
power = 0.05003475
NOTE: n is number in each group
La potencia para el experimento realizado fue de 0.05, y llevando los siguientes valores a la curva OC:
ν1= a – 1= 3 -1=2
ν2= N – a= a* (n-1)= 21
Si quisiéramos una potencia, por ejemplo del 90%, las réplicas que debieron realizarse por cada tratamiento son:
Balanced one-way analysis of variance power calculation
k = 3
n = 189809.3
f = 0.004714045
sig.level = 0.05
power = 0.9
NOTE: n is number in each group
n = 189.809,3
n= Número de réplicas para cada tratamiento
5 Conclusiones
Del análisis estadístico se concluye que:
El diseño del experimento es balanceado, dado que se cuenta con igual cantidad de réplicas para los 3 tratamientos
Del experimento se concluye que, a mayor temperatura del agua, se obtiene una mayor solubilidad del café molido. De los resultados y el análisis estadístico se observa que el mayor promedio de los pesos de café solubilizado fue obtenido a 90°C, seguido de 70°C y por último 50°C.
La temperatura tiene un efecto significativo en la solubilización del café molido.
Teniendo en cuenta los resultados de la prueba de Durbin-Watson, se puede concluir que la aleatorización del experimento no fue la más adecuada, esto puede deberse a una autocorrelación natural entre las mediciones del experimento.
Los valores promedio del peso del café solubilizado entre tratamiento, son estadísticamente diferentes.
Para el caso de las réplicas analizadas en el experimento (8 por cada tratamiento), éstas no son suficientes y para obtener una probabilidad alta de encontrar diferencias estadísticamente significativas. Para obtener una potencia del 90% (con las siguientes condiciones sig.level=0.05, dif = 0.01, sigma2=1.5), serían necesarias 189809,3 réplicas.
6 Referencias
Castaño C, et al.(2000). Coffee Technology, volume 2, London, Elsevier applied Sciences 321 p. Introducción al Extracción y Solubilidad de Café.
Ortega C. Jessica et al.,(2014). Evaluación del rendimiento de la extracción de café tostado molido comercial. @limentech, Ciencia y Tecnología Alimentaria 12(2014) 40-47.
Puerta, G. I. (2013). Calidad del café. En Federación Nacional de Cafeteros de Colombia, Manual del cafetero colombiano: Investigación y tecnología para la sostenibilidad de la caficultura (Vol. 3, pp. 81–110). Cenicafé. https://doi.org/10.38141/cenbook-0026_30.