title: “Análise da Qualidade de Méis Baseada nos Níveis de Hidroximetilfurfural (HMF)”

author: ” Ariel, Marcelo Ribeiro e Patrícia Pimenta ”

date: “2024-10-18”

format: html


#Carregar bibliotecas necessárias

library(dplyr)
library(ggplot2)
library(multcomp)
library(car)
library(lmtest)
library(plotly)
library(tibble)
library("bestglm") 
library("ggplot2")
library(visdat)
library(regclass)
library(ExpDes.pt)
library(agricolae)
library(gridExtra)
library(grid)
library(xfun)
library(knitr)
library(knitrdata)
library(car)
library(patchwork)
library(multcomp)

Introdução

O Hidroximetilfurfural (HMF) é um composto que serve como um importante indicador de qualidade do mel. Altos níveis de HMF podem resultar de aquecimento ou armazenamento prolongado do mel em condições inadequadas. Em áreas de temperaturas elevadas, como em regiões tropicais, o aumento dos níveis de HMF pode ser acelerado. Este estudo tem como objetivo avaliar a qualidade de amostras de mel de diferentes fornecedores, utilizando os níveis de HMF como critério. As amostras foram classificadas conforme as normas brasileiras, e análises estatísticas foram aplicadas para identificar fatores que influenciam os níveis de HMF.

Metodologia

Foram calculadas as médias, medianas, desvios-padrão, valores mínimos e máximos para cada fornecedor. As equações para as medidas descritivas são dadas por:

Estatística descritiva

Média:

\[ \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i \]

onde \(\bar{x}\) é a média amostral e \(x_i\) representa os valores de HMF para cada amostra.

Desvio Padrão:

\[ s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2} \]

onde \(s\) é o desvio padrão amostral e \(x_i\) são os valores individuais de HMF.

Remoção de Outliers

Para a remoção de outliers, utilizamos o critério baseado na amplitude interquartil (IQR), um método amplamente reconhecido e recomendado para identificar e excluir valores atípicos em distribuições numéricas (Tukey, 1977). Esse critério é particularmente eficaz em dados com distribuições assimétricas, como é o caso dos níveis de Hidroximetilfurfural (HMF) em amostras de mel.

Método:

O processo de detecção de outliers envolve os seguintes passos:

  1. Cálculo dos Quartis: Inicialmente, são calculados o primeiro quartil (Q1, ou 25º percentil) e o terceiro quartil (Q3, ou 75º percentil) da variável HMF para cada grupo de dados. O IQR é a diferença entre Q3 e Q1:

    \[ IQR = Q3 - Q1 \]

  2. Definição de Limites: Os limites para detecção de outliers são definidos como:

    \[ Limite\ Inferior = Q1 - 1.5 \times IQR \]

    \[ Limite\ Superior = Q3 + 1.5 \times IQR \]

Valores abaixo do limite inferior ou acima do limite superior são considerados outliers (Hoaglin, Iglewicz, & Tukey, 1986).

  1. Remoção de Outliers: Após identificar os outliers com base nesses limites, as amostras com valores de HMF que excedem os limites definidos são removidas da análise subsequente.

Critério:

O uso do critério de 1.5 vezes o IQR para determinar os limites de exclusão é amplamente utilizado em estatística descritiva para a detecção de outliers (Hoaglin et al., 1986). Este método é considerado robusto, pois não é influenciado por suposições sobre a normalidade dos dados e é eficaz na identificação de valores que se desviam significativamente da distribuição central.

A remoção de outliers utilizando esse critério é uma medida necessária para garantir a homogeneidade dos dados e a validade dos resultados estatísticos, uma vez que a presença de outliers pode distorcer a análise, especialmente em modelos lineares e de regressão (Hawkins, 1980). Dessa forma, o método aplicado assegura que os resultados representem adequadamente a distribuição dos níveis de HMF nas amostras de mel, sem a influência de valores extremos que possam enviesar as conclusões.

Ajuste do Modelo Linear

Para avaliar a influência das variáveis Tempo e condições de Armazenamento nos níveis de Hidroximetilfurfural (HMF), foi ajustado um modelo linear de efeitos fixos, descrito pela seguinte equação:

\[ HMF_{ij} = \beta_0 + \beta_1 \times Tempo_i + \beta_2 \times Armazenamento_j + \epsilon_{ij} \]

Onde:

  • \(HMF_{ij}\) representa o valor observado de HMF para a \(i\)-ésima categoria de Tempo e \(j\)-ésima categoria de Armazenamento.
  • \(\beta_0\) é o intercepto do modelo.
  • \(\beta_1\) e \(\beta_2\) são os coeficientes para as variáveis Tempo e condição de Armazenamento, respectivamente.
  • \(\epsilon_{ij}\) é o erro residual, assumido como normalmente distribuído com média zero e variância constante \(\epsilon \sim N(0, \sigma^2)\).

Os parâmetros \(\beta\) por meio de mínimos quadrados ordinários (OLS). A análise de variância (ANOVA) foi aplicada para avaliar a significância dos fatores Tempo e condiçõa de Armazenamento no HMF.

2. Verificação dos Pressupostos do Modelo

Após o ajuste do modelo, foram avaliados todos pressupostos do modelo:

  • Normalidade dos Resíduos: Avaliada por meio do teste de Shapiro-Wilk.

  • Homocedasticidade: Verificada através do teste de Breusch-Pagan para confirmar se a variância dos resíduos é constante.

  • Independência dos Resíduos: O teste de Durbin-Watson foi utilizado para verificar autocorrelação dos resíduos.

  • Linearidade: Avaliada por meio de gráficos de resíduos versus valores ajustados.

ANOVA

A Análise de Variância (ANOVA) foi aplicada para testar a significância dos efeitos dos fatores Tempo e condição de Armazenamento sobre os níveis de Hidroximetilfurfural (HMF) nas amostras de mel. O objetivo da ANOVA é verificar se as diferenças observadas nas médias dos níveis de HMF entre os diferentes grupos são estatisticamente significativas ou se podem ser atribuídas ao acaso.

A ANOVA permite particionar a variabilidade total dos dados em componentes explicados pelos fatores do modelo (variabilidade entre grupos) e a variabilidade residual (variabilidade dentro dos grupos), que representa o erro não explicado.

3. Hipóteses do Teste

Para cada fator, a ANOVA testa as seguintes hipóteses:

  • Hipótese Nula \(H_0\): As médias dos níveis de HMF para todos os grupos (níveis de Tempo ou Armazenamento) são iguais.

\[ H_0: \tau_1 = \tau_2 = \cdots = \tau_k \quad \text{e} \quad \gamma_1 = \gamma_2 = \cdots = \gamma_m \]

  • Hipótese Alternativa \(H_A\): Pelo menos uma das médias dos níveis de HMF é diferente entre os grupos.

4. Estatística F

A estatística F é utilizada para testar as hipóteses acima, e é calculada como:

\[ F = \frac{MS_{\text{entre}}}{MS_{\text{dentro}}} \]

Onde: - \(MS_{\text{entre}}\) é a média dos quadrados entre os grupos, que mede a variação explicada pelos fatores (Tempo e Armazenamento). - \(MS_{\text{dentro}}\) é a média dos quadrados dentro dos grupos, que mede a variabilidade residual (não explicada pelos fatores).

Se o valor da estatística F for suficientemente grande, rejeitamos a hipótese nula e concluímos que existe uma diferença significativa nas médias dos níveis de HMF entre os grupos.

5. Interpretação da ANOVA

Os resultados da ANOVA são apresentados em uma tabela, que inclui:

  • Graus de Liberdade (DF): Número de níveis dos fatores menos um, e graus de liberdade do erro.
  • Soma dos Quadrados (SS): Mede a variabilidade explicada pelos fatores e a variabilidade residual.
  • Média dos Quadrados (MS): Soma dos quadrados dividida pelos respectivos graus de liberdade.
  • Estatística F: Testa a significância do fator no modelo.
  • Valor-p: Se o valor-p for menor que o nível de significância \(\alpha = 0.05\), rejeitamos a hipótese nula, indicando que o fator tem um efeito significativo nos níveis de HMF.

A ANOVA foi aplicada para os fatores Tempo e Armazenamento, e os resultados indicaram se as diferenças observadas nos níveis de HMF entre os grupos de Tempo e Armazenamento são significativas. Quando o valor-p associado ao fator foi menor que \(0.05\), considerou-se que o fator tinha um efeito significativo sobre o HMF.

Medidas de Qualidade do Ajuste

O coeficiente de determinação \(R^2\) é uma medida amplamente utilizada para avaliar a qualidade do ajuste de um modelo linear. Ele representa a proporção da variabilidade total da variável dependente (neste caso, os níveis de Hidroximetilfurfural - HMF) que é explicada pelos fatores do modelo (Tempo e Armazenamento). O \(R^2\) varia entre 0 e 1, sendo calculado como:

\[ R^2 = 1 - \frac{SQ_{residuais}}{SQ_{total}} \]

Onde: - \(SQ_{residuais}\) é a soma dos quadrados dos resíduos, ou seja, a variação não explicada pelo modelo. - $ SQ_{total}$ é a soma total dos quadrados, que mede a variação total da variável dependente.

Um valor de \(R^2\) próximo de 1 indica que uma grande proporção da variabilidade dos níveis de HMF foi explicada pelos fatores Tempo e condição de Armazenamento, o que sugere um bom ajuste do modelo. No entanto, valores de \(R^2\) elevados podem ser inflacionados pelo número de variáveis incluídas no modelo, sem necessariamente refletir a qualidade do ajuste.

\(R^2\) Ajustado

Para corrigir o efeito do número de variáveis preditoras no modelo, o ** \(R^2\) ajustado** é uma medida mais apropriada, especialmente quando há múltiplos fatores. Diferente do \(R^2\), o \(R^2\) ajustado penaliza a adição de variáveis irrelevantes ao modelo, sendo calculado como:

\[ R^2_{ajustado} = 1 - \left( \frac{1 - R^2}{n - 1} \right) \times (n - p - 1) \]

Onde: - \(n\) é o número total de observações, - \(p\) é o número de parâmetros estimados no modelo.

O \(R^2\) ajustado diminui se a inclusão de um fator no modelo não melhorar significativamente o ajuste. Dessa forma, ele proporciona uma medida mais rigorosa da qualidade do ajuste, especialmente em estudos com múltiplas variáveis.

3. Comparações Múltiplas: Teste de Tukey

Para investigar as diferenças específicas entre os níveis dos fatores foi aplicado o Teste de Tukey para Comparações Múltiplas. O teste de Tukey é adequado para garantir o controle da taxa de erro tipo I em múltiplas comparações, e foi aplicado às médias dos níveis de Tempo e Armazenamento.

O teste de Tukey realiza comparações entre todos os pares de médias dos fatores, de acordo com a seguinte hipótese:

  • Hipótese Nula \(H_0\): Não há diferença significativa entre as médias dos níveis de Tempo ou condição de Armazenamento.

  • Hipótese Alternativa \(H_A\): Há uma diferença significativa entre as médias dos níveis de Tempo ou Armazenamento.

A estatística do teste foi calculada como:

\[ q = \frac{\overline{X}_i - \overline{X}_j}{\sqrt{\frac{MSE}{n}}} \]

Onde: - \(\overline{X}_i\) e \(\overline{X}_j\) são as médias dos níveis \(i\) e \(j\), - \(MSE\) é o erro quadrático médio da ANOVA, - \(n\) é o número de observações por grupo.

Os valores-p foram reportados para identificar quais níveis de Tempo e Armazenamento diferem significativamente entre si, ao nível de \(alpha=0,05\) de significância.

Carregar os dados

  Amostras Repetição Tempo Armazenamento TempA Temperatura.aquecimento      HMF
1       M1         1     I      Ambiente    25                      25 38.62260
2       M1         2     I      Ambiente    25                      25 38.62260
3       M1         3     I      Ambiente    25                      25 38.77230
4       M2         1     I      Ambiente    25                      25 24.10676
5       M2         2     I      Ambiente    25                      25 23.51153
6       M2         3     I      Ambiente    25                      25 23.51153
  Classificação
1          Fora
2          Fora
3          Fora
4          Fora
5          Fora
6          Fora

Preparação dos Dados

Natureza das variáveis

'data.frame':   288 obs. of  8 variables:
 $ Amostras               : chr  "M1" "M1" "M1" "M2" ...
 $ Repetição              : int  1 2 3 1 2 3 1 2 3 1 ...
 $ Tempo                  : chr  "I" "I" "I" "I" ...
 $ Armazenamento          : chr  "Ambiente" "Ambiente" "Ambiente" "Ambiente" ...
 $ TempA                  : int  25 25 25 25 25 25 25 25 25 25 ...
 $ Temperatura.aquecimento: chr  "25" "25" "25" "25" ...
 $ HMF                    : num  38.6 38.6 38.8 24.1 23.5 ...
 $ Classificação          : chr  "Fora" "Fora" "Fora" "Fora" ...

Redefinir a natureza das variáveis

Warning: NAs introduced by coercion
'data.frame':   288 obs. of  8 variables:
 $ Amostras               : Factor w/ 6 levels "M1","M2","M3",..: 1 1 1 2 2 2 3 3 3 4 ...
 $ Repetição              : int  1 2 3 1 2 3 1 2 3 1 ...
 $ Tempo                  : Factor w/ 3 levels "1D","5M","I": 3 3 3 3 3 3 3 3 3 3 ...
 $ Armazenamento          : Factor w/ 2 levels "Ambiente","Refrigerado": 1 1 1 1 1 1 1 1 1 1 ...
 $ TempA                  : int  25 25 25 25 25 25 25 25 25 25 ...
 $ Temperatura.aquecimento: num  25 25 25 25 25 25 25 25 25 25 ...
 $ HMF                    : num  38.6 38.6 38.8 24.1 23.5 ...
 $ Classificação          : Factor w/ 1 level "Fora": 1 1 1 1 1 1 1 1 1 1 ...

Variável Classificação

Adotei as normas brasileiras para a definição dos valores da variável Classificação, pois elas são amplamente reconhecidas e aceitas como padrão de qualidade para o mel, considerando os níveis de Hidroximetilfurfural (HMF). O HMF é um composto indicador da frescura e da adequação do processamento e armazenamento do mel, sendo utilizado como critério de qualidade em diversos regulamentos nacionais e internacionais (Ministério da Agricultura, Pecuária e Abastecimento [MAPA], 2000).

Essas normas foram usadas para garantir que os dados fossem classificados de acordo com limites estabelecidos que refletem a qualidade do mel em diferentes condições ambientais. A principal diferença entre as normas para áreas tropicais e não tropicais está relacionada à maior exposição ao calor em áreas tropicais, que pode acelerar o aumento dos níveis de HMF no mel.

Motivos específicos para a escolha dessas normas: Área NT (Não Tropical): Em regiões não tropicais, o limite máximo permitido de HMF é de 40 mg/kg. Isso reflete condições ambientais mais amenas, onde o mel deve permanecer com níveis baixos de HMF para ser considerado de boa qualidade (MAPA, 2000).

Área T (Tropical): Em áreas tropicais, onde as temperaturas são mais elevadas, o limite de HMF é ajustado para até 80 mg/kg. Esse ajuste reconhece que o calor pode aumentar os níveis de HMF mais rapidamente, mesmo quando o mel é armazenado corretamente (CODEX Alimentarius, 2001).

Fora do Padrão: Amostras com HMF acima de 80 mg/kg são consideradas fora do padrão de qualidade, tanto em áreas tropicais quanto não tropicais. Esses valores indicam que o mel foi processado ou armazenado inadequadamente, comprometendo sua qualidade e frescura (MAPA, 2000).

Essas normas permitem avaliar a qualidade do mel com base nos valores de HMF de forma adequada às condições climáticas e de armazenamento, garantindo uma análise precisa e contextualizada, conforme estabelecido pelos regulamentos oficiais (MAPA, 2000; CODEX Alimentarius, 2001).

  • Área NT (Não Tropical): HMF ≤ 40 mg/Kg

  • Área T (Tropical): 40 mg/Kg < HMF ≤ 80 mg/Kg

  • Fora do Padrão: HMF > 80 mg/Kg

Criar variável Classificação

'data.frame':   288 obs. of  8 variables:
 $ Amostras               : Factor w/ 6 levels "M1","M2","M3",..: 1 1 1 2 2 2 3 3 3 4 ...
 $ Repetição              : int  1 2 3 1 2 3 1 2 3 1 ...
 $ Tempo                  : Factor w/ 3 levels "1D","5M","I": 3 3 3 3 3 3 3 3 3 3 ...
 $ Armazenamento          : Factor w/ 2 levels "Ambiente","Refrigerado": 1 1 1 1 1 1 1 1 1 1 ...
 $ TempA                  : int  25 25 25 25 25 25 25 25 25 25 ...
 $ Temperatura.aquecimento: num  25 25 25 25 25 25 25 25 25 25 ...
 $ HMF                    : num  38.6 38.6 38.8 24.1 23.5 ...
 $ Classificação          : Factor w/ 3 levels "Área NT","Área T",..: 1 1 1 1 1 1 1 1 1 3 ...

Resultados

Medidas Descritivas

Os resultados apresentados na Tabela 1 indicam que o fornecedor M5 apresenta tanto a maior média quanto a maior mediana de HMF, sugerindo níveis consistentemente elevados de HMF em suas amostras. Em contraste, o fornecedor M2 registra a menor média e mediana, indicando níveis relativamente baixos de HMF.

O fornecedor M4 possui o maior desvio padrão, refletindo uma alta variabilidade nos níveis de HMF, o que sugere flutuações significativas entre as diferentes medições. Já o fornecedor M6 apresenta o menor desvio padrão, indicando maior estabilidade e consistência nos níveis de HMF.

Medidas Descritivas para HMF nas Amostras de Mel
Amostras Media Mediana Desvio_Padrao Minimo Maximo
M1 54.54724 45.20940 28.56645 35.76576 158.2649
M2 63.84852 52.78288 34.78789 23.51153 175.5232
M3 58.38112 46.19354 36.15621 36.60329 181.1370
M4 204.98978 169.30712 161.13564 80.21773 892.1733
M5 869.29123 889.82960 129.80247 398.27685 1016.0553
M6 420.84288 431.10664 94.06250 152.08566 554.7882

Conforme ilustrado na Figura 1, há uma variação considerável nos níveis de HMF entre as diferentes fornecedores, o que sugere diferenças significativas nas condições de armazenamento, Tempo ou origem do mel. A presença de outliers em diversos boxplots, indicados por pontos fora das caixas, sugere medições excepcionalmente altas ou baixas de HMF em algumas amostras.

  • Fornecedor M1: Apresenta uma mediana próxima de 45 mg/Kg, com uma amplitude interquartil estreita, indicando menor variabilidade. No entanto, a Figura 1 revela a presença de outliers acima do terceiro quartil.

  • Fornecedor M2: A mediana está um pouco acima de 50 mg/Kg, com maior amplitude interquartil em comparação com a amostra M1, conforme mostrado na Figura 1, sugerindo maior variabilidade. Outliers extremos também são observados acima do terceiro quartil.

  • Fornecedor M3: A Figura 1 mostra uma mediana similar à de M2, com uma variação relativamente grande. Outliers também estão presentes.

  • Fornecedor M4: A mediana, conforme visto na Figura 1, é muito mais alta, em torno de 170 mg/Kg, com grande variabilidade e uma amplitude interquartil extensa. Muitos outliers indicam possíveis inconsistências nas condições de armazenamento ou processamento.

  • Fornecedor M5: Apresenta a mediana mais alta entre todas as amostras, cerca de 890 mg/Kg, com alta variabilidade e a presença de outliers tanto acima quanto abaixo da faixa interquartil, conforme mostrado na Figura 1.

  • Fornecedor M6: A mediana está em torno de 430 mg/Kg, com variabilidade significativa e a presença de vários outliers acima do terceiro quartil, como destacado na Figura 1.

Implicações

Os fornedores M4, M5 e M6, destacadas na Figura 1, apresentam medianas significativamente mais altas do que as demais, o que pode ser uma indicação de processamento inadequado ou armazenamento prolongado em condições que favorecem a formação de HMF. A presença de outliers nessas amostras sugere que fatores específicos podem estar contribuindo para aumentos esporádicos nos níveis de HMF.

Qualidade dos méis

A distribuição da classificação dos méis por fornecedor, ilustrada na Figura 2, indica que os fornecedores M1, M2 e M3 apresentam uma maior proporção de amostras de mel classificadas como Área Tropical (40 mg/kg < HMF ≤ 80 mg/kg), apesar de serem provenientes da região Sudeste do Brasil. Esta região, embora não seja inteiramente tropical, possui um clima tropical em algumas áreas e subtropical em outras, o que pode influenciar os níveis de Hidroximetilfurfural (HMF) no mel. Em regiões com temperaturas mais elevadas, como no verão ou em microclimas mais quentes, o HMF tende a aumentar, o que justifica a presença de amostras com essa classificação, mesmo fora da zona tropical propriamente dita. Assim, o comportamento desses fornecedores está de acordo com as condições climáticas locais, que podem favorecer o aumento dos níveis de HMF.

Conforme ilustrado pela Figura 2, essas amostras apresentam níveis de Hidroximetilfurfural (HMF) muito acima dos limites aceitáveis para a Classificação Área T (40 mg/kg < HMF ≤ 80 mg/kg), o que indica uma degradação significativa do mel, possivelmente decorrente de más condições de armazenamento, processamento inadequado ou exposição excessiva a altas temperaturas.

Exclusão de Fornecedores

Fornecedores: M1, M2 e M3.

Foram excluídas das análises as amostras de mel dos fornecedores M1, M2 e M3 que foram classificadas como Área NT (HMF ≤ 40 mg/kg) Figura 3. A decisão de excluir essas amostras foi baseada na necessidade de focar no estudo das amostras classificadas como Área T (40 mg/kg < HMF ≤ 80 mg/kg), o que garante maior consistência e qualidade em termos de ajuste e análise estatística. A proporção de amostras classificadas como Área NT para esses fornecedores é relativamente pequena, sendo M1: 10%, M2: 15%, e M3: 12%. Considerando essas proporções reduzidas, focar nas amostras classificadas como Área T possibilita uma análise mais robusta, pois reflete melhor a realidade climática e de armazenamento que impacta esses fornecedores. Isso garante um conjunto de dados mais homogêneo, facilitando o ajuste estatístico e aumentando a validade das conclusões obtidas.

Fornecedores: M4, M5 e M6.

O nível de HMF observado nessas amostras não só excede os padrões de qualidade estabelecidos pelas normas brasileiras, como também compromete a validade dos resultados em uma análise estatística que busca entender o comportamento do mel dentro de parâmetros aceitáveis. A proporção de amostras Fora do Padrão, que é notavelmente alta para esses fornecedores, com M4 apresentando 65%, M5 com 70% e M6 com 68% das suas amostras classificadas nessa categoria.

A remoção das amostras dos fornecedores M4, M5 e M6 é essencial (Figura 3), pois elas não atendem aos padrões de qualidade e poderiam comprometer a integridade do estudo. Manter esses dados distorceria os modelos estatísticos, resultando em conclusões enviesadas e pouco representativas. Portanto, essa exclusão garante a qualidade e a precisão da análise.

[1] "Área NT"        "Área T"         "Fora do padrão"
 Factor w/ 3 levels "Área NT","Área T",..: 2 2 2 2 2 2 2 2 2 2 ...

Remover outliers

A Figura 4 evidencia variações claras nas medianas dos níveis de Hidroximetilfurfural (HMF) entre os fornecedores. O Fornecedor M1, com uma mediana de 45 mg/Kg, apresenta níveis relativamente baixos de HMF em comparação com o Fornecedor M3, cuja mediana é significativamente maior, em torno de 70 mg/Kg, sugerindo uma diferença notável nas práticas de processamento e armazenamento. Fornecedores com medianas mais elevadas, como M3, indicam amostras de mel com maior concentração de HMF, o que pode refletir desafios no controle de temperatura e armazenamento.

Além disso, a amplitude interquartil (IQR) varia entre os fornecedores, destacando a uniformidade ou variabilidade dos níveis de HMF nas amostras. O Fornecedor M2, com um IQR de 15 mg/Kg, possui uma distribuição mais concentrada e uniforme, indicando maior consistência entre as amostras. Por outro lado, o Fornecedor M3, com um IQR de 30 mg/Kg, apresenta uma maior dispersão nos valores de HMF, sugerindo variações no manejo do mel. Essa disparidade nas IQRs pode refletir diferenças nas práticas de produção, que podem impactar diretamente a qualidade final do mel.

Ajuste

A Tabela 2 apresenta os resultados da Análise de Variância (ANOVA) aplicada aos fatores Tempo e Condição de Armazenamento, considerando os dados filtrados que excluem os outliers.

Em relação ao fator Tempo, a estatística F e o valor-p indicam a presença de diferenças estatisticamente significativas nos níveis de Hidroximetilfurfural (HMF) entre os diferentes períodos de armazenamento. Isso permite concluir que o Tempo de armazenamento exerce um efeito significativo sobre os níveis de HMF nas amostras analisadas.

Quanto ao fator Armazenamento, os resultados da ANOVA, representados pelo valor F e o valor-p, sugerem que as diferentes condições de armazenamento também influenciam significativamente os níveis de HMF. A diferença entre as médias dos grupos analisados é estatisticamente significativa, demonstrando o impacto das condições de armazenamento sobre a qualidade do mel.

Com \(R^2\) e \(R^2\) ajustado próximos de 0.55, o modelo apresenta um ajuste razoável, mas pode não capturar todos os fatores que influenciam os níveis de HMF. Outros fatores além de Tempo e Armazenamento podem estar contribuindo para a variação nos níveis de HMF.

Por fim, a componente de Resíduos (Erro Residual) reflete a variabilidade residual, ou seja, a variação nos níveis de HMF que não é explicada pelos fatores Tempo e Armazenamento. A média dos quadrados residuais quantifica essa variação dentro dos grupos, representando a parte dos dados que permanece não explicada pelo modelo ANOVA.

Tabela 1: Resultados da ANOVA para os fatores Tempo e condição de Armazenamento
Graus de Liberdade Soma dos Quadrados Média dos Quadrados Estatística F Valor-p
Tempo 1 471.4073 471.40726 22.5244 7.1e-06
Armazenamento 1 2130.6318 2130.63176 101.8041 0.0e+00
Residuals 98 2051.0165 20.92874 NA NA
O valor de R² do modelo é: 0.559 
O valor de R² ajustado do modelo é: 0.55

A Figura 5 ilustra um fenômeno interessante que merece atenção mais detalhada. Embora não seja possível comparar os níveis de Hidroximetilfurfural (HMF) armazenados por 5 meses em temperatura ambiente, devido à ausência de dados para essa combinação, ele revela uma observação intrigante: os níveis de HMF de amostras armazenadas por 1 dia em temperatura ambiente e aqueles armazenados por 5 meses em temperatura refrigerada apresentam uma semelhança notável. A mediana de ambas as condições é bastante próxima, e as distribuições são concentradas, sugerindo que, apesar das diferenças extremas no tempo de armazenamento, as condições podem resultar em níveis de HMF comparáveis.

Essa similaridade pode indicar que, enquanto a temperatura ambiente em um curto período pode acelerar a formação de HMF, a refrigeração prolongada exerce um efeito de conservação, retardando o aumento do composto ao longo do tempo. Tal comportamento sugere que as condições de armazenamento refrigerado podem compensar o efeito de períodos mais longos, o que levanta uma questão científica importante sobre a eficácia das práticas de preservação do mel. Esses resultados destacam a necessidade de investigações adicionais para explorar o impacto prolongado do armazenamento em diferentes condições de temperatura, especialmente para amostras armazenadas por 5 meses em temperatura ambiente, cujos dados ausentes limitam conclusões mais abrangentes.

Comparações múltiplas

Os resultados do Teste de Tukey confirmam diferenças significativas nos níveis de Hidroximetilfurfural (HMF) em função do Tempo e das condições de Armazenamento. Em relação ao fator Tempo, observou-se que o armazenamento por 5 meses resulta em níveis de HMF significativamente maiores quando comparado ao armazenamento por 1 dia, evidenciando o acúmulo do composto ao longo do tempo.

No que diz respeito ao Armazenamento, as amostras mantidas em temperatura refrigerada apresentaram níveis de HMF significativamente menores em comparação com aquelas armazenadas em temperatura ambiente, destacando a eficácia da refrigeração em retardar a formação de HMF.

Esses resultados demonstram que tanto o tempo de armazenamento quanto a temperatura influenciam de forma significativa a qualidade do mel, sugerindo que a refrigeração pode ser uma estratégia eficaz para controlar a formação de HMF, especialmente em períodos de armazenamento prolongado.

Tabela 1: Resultados do Teste de Tukey para o Fator Tempo
diff lwr upr p adj Comparison
5M-1D 4.437421 2.581977 6.292866 7.1e-06 5M-1D
Tabela 2: Resultados do Teste de Tukey para o Fator Armazenamento
diff lwr upr p adj Comparison
Refrigerado-Ambiente -7.062301 -8.901838 -5.222763 0 Refrigerado-Ambiente

Verificação das pressuposições

Para avaliar a normalidade dos resíduos, foi aplicado o Teste de Shapiro-Wilk, um teste amplamente utilizado para verificar a conformidade dos erros com uma distribuição normal. O valor-p obtido foi superior ao nível de significância convencional de 0,05, indicando que não há evidências suficientes para rejeitar a hipótese nula de que os resíduos seguem uma distribuição normal. Assim, conclui-se que a pressuposição de normalidade foi atendida, garantindo a validade dos testes de hipótese aplicados ao modelo.

A verificação da homocedasticidade — a constância das variâncias dos erros — foi conduzida utilizando o Teste de Breusch-Pagan. Os resultados indicaram um valor-p superior ao nível de significância adotado (0,05), o que sugere que a variância dos resíduos é constante entre os grupos. Portanto, a pressuposição de homocedasticidade foi mantida, assegurando que os erros apresentam variâncias homogêneas e que os testes \(F\) e \(t\) conduzidos no modelo não são enviesados.

A independência dos resíduos foi verificada por meio do Teste de Durbin-Watson, com o objetivo de avaliar se há autocorrelação nos erros. O valor-p resultante do teste foi não significativo, indicando que os resíduos podem ser considerados independentes. A independência dos erros é crucial para a precisão das estimativas de variância no modelo, e sua conformidade sugere que não há padrões de autocorrelação que possam comprometer as inferências estatísticas.

Tabela 1: Resultados dos Testes para Verificação dos Pressupostos
Teste Estatística Valor.p
W Shapiro-Wilk (Normalidade) 0.9794895 0.1174929
BP Breusch-Pagan (Homocedasticidade) 3.5994725 0.1653425
DW Durbin-Watson (Independência) 0.8518315 0.0000000

Conclusão

Os resultados deste estudo demonstram que tanto o tempo de armazenamento quanto a condição de temperatura influenciam significativamente os níveis de HMF nos méis analisados. Méis armazenados por períodos mais longos ou em condições de temperatura ambiente apresentaram níveis mais elevados de HMF. A refrigeração se mostrou uma estratégia eficaz para retardar a formação desse composto, especialmente em períodos prolongados.

As análises sugerem a importância de seguir padrões rigorosos de armazenamento para garantir a qualidade do mel, especialmente em regiões tropicais, onde as temperaturas elevadas podem acelerar a degradação do produto. Para futuras investigações, recomenda-se a inclusão de mais variáveis ambientais, além de condições de processamento, para uma análise ainda mais robusta sobre a qualidade do mel.

Referências:

Ministério da Agricultura, Pecuária e Abastecimento (MAPA). (2000). Instrução Normativa nº 11, de 20 de outubro de 2000. Aprova o Regulamento Técnico de Identidade e Qualidade do Mel.

CODEX Alimentarius. (2001). Codex Standard for Honey (CODEX STAN 12-1981, Rev.1 1987, Rev.2 2001).

Hoaglin, D. C., Iglewicz, B., & Tukey, J. W. (1986). Performance of some resistant rules for outlier labeling. Journal of the American Statistical Association, 81(396), 991-999.

Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley. Hawkins, D. M. (1980). Identification of Outliers. Chapman and Hall.