Estatística Experimental para avaliar se diferentes tipos de embalagem de cereal influenciam nas vendas

Introdução

Delineamento Inteiramente Casualizado (DIC)

O DIC é um delineamento de experimentos que deve ser utilizado quando as unidades experimentais são homogêneas, ou seja, as variações entre as unidades não afetam significativamente os resultados dos experimentos. Exemplos incluem experimentos com ambientes controlados, como estufas ou laboratórios, onde não há grandes variações externas entre os grupos.

Vantagens:

Fácil de implementar;
Alta eficiência quando as unidades experimentais são semelhantes entre si.

Desvantagens:

Se houver muita variabilidade entre as unidades, o DIC pode não capturar as diferenças adequadamente, comprometendo a precisão dos resultados.

Contexto do Estudo

Uma empresa do setor de alimentos está lançando um novo tipo de cereal e pretende verificar se o design das embalagens influencia o volume de vendas. Atualmente, há quatro diferentes designs de embalagem, e a empresa deseja determinar se algum desses designs gera maior impacto nas vendas.

Para conduzir o estudo, foram selecionados cinco estabelecimentos de vendas, considerados semelhantes em termos de volume de vendas, para minimizar a variação externa. Em cada estabelecimento, foram testados diferentes tipos de embalagens de cereal. No entanto, nem todos os estabelecimentos receberam todos os tipos de embalagem, resultando em algumas células vazias na tabela de dados. As vendas foram registradas em milhares de dólares ao longo de um período de tempo determinado.

Objetivos do estudo

O objetivo deste estudo é avaliar se há diferenças significativas nas vendas do novo tipo de cereal em função do design da embalagem. O experimento visa determinar se algum dos quatro desenhos de embalagem disponíveis (TE1, TE2, TE3 e TE4) influencia positiva ou negativamente as vendas ou se não há diferença significativa entre eles.

Método

O experimento foi realizado com um delineamento inteiramente casualizado (DIC), onde quatro tratamentos (diferentes designs de embalagem) foram aplicados em cinco estabelecimentos, com algumas limitações de aplicação em todos os locais. As vendas de cereal foram registradas em milhares de dólares e organizadas em uma tabela para posterior análise estatística.

Hipótese

Hipótese nula (\(H_0\)) Não há diferença significativa nas vendas entre os diferentes tipos de embalagem.

Hipótese alternativa (\(H_1\)): Existe pelo menos uma diferença significativa nas vendas entre os tipos de embalagem.

Dados e Estatísticas

Estrutura dos Dados

Os dados resultantes do experimento foram organizados e estão disponíveis na Tabela 1.

Tabela 1: Dados de referente as vendas em milhares de dólares
Tratamentos	Estab.1	Estab.2	Estab.3	Estab.4	Estab.5
TE1	12.3	11.5	13.9	30.3	NA
TE2	15.2	17.1	12.7	NA	NA
TE3	11.3	16.7	14.9	10.7	19.8
TE4	12.1	15.4	24.3	12.2	NA

Os tratamentos são os diferentes tipos de embalagem (TE1, TE2, TE3 e TE4), e as repetições são os estabelecimentos onde as vendas foram observadas. Como nem todos os tipos de embalagem foram testados em todos os estabelecimentos, o número de repetições varia para cada tratamento.

O experimento pressupõe que os estabelecimentos são similares em termos de volume de vendas (homogeneidade), por isso os desenhos foram distribuídos de forma aleatória.

Abaixo a identifcação dos dados pelo software R. Em que trat refere-se aos tratamentos (embalagens), rep os estabelecimentos e y o volume de vendas em milhares de doláres.

## # A tibble: 20 × 3
##    trat    rep y                 
##    <chr> <dbl> <chr>             
##  1 TE1       1 12.3              
##  2 TE1       2 11.5              
##  3 TE1       3 13.9              
##  4 TE1       4 30.3              
##  5 TE1       5 NA                
##  6 TE2       1 15.2              
##  7 TE2       2 17.100000000000001
##  8 TE2       3 12.7              
##  9 TE2       4 NA                
## 10 TE2       5 NA                
## 11 TE3       1 11.3              
## 12 TE3       2 16.7              
## 13 TE3       3 14.9              
## 14 TE3       4 10.7              
## 15 TE3       5 19.8              
## 16 TE4       1 12.1              
## 17 TE4       2 15.4              
## 18 TE4       3 24.3              
## 19 TE4       4 12.2              
## 20 TE4       5 NA

Estatísticas descritivas

Inicialmente os dados são visualizados através de um resumo de medidas estatísticas como média, desvio padrão, contagem e totais da resposta (volume de vendas em milhares de dólares).

## # A tibble: 4 × 5
##   trat  media    dp     n Total
##   <fct> <dbl> <dbl> <int> <dbl>
## 1 TE1    17    8.92     4  68  
## 2 TE2    15    2.21     3  45  
## 3 TE3    14.7  3.79     5  73.4
## 4 TE4    16    5.74     4  64

Quando as repetições não são iguais entre os tratamentos, isso afeta a variabilidade dos dados e pode influenciar os testes estatísticos, como o ANOVA. No entanto, o uso de médias é uma forma de suavizar as diferenças nas repetições, mas as variâncias (ou seja, o desvio padrão) precisam ser levadas em conta.

O desvio padrão elevado (como o de TE1, que é 8.92) indica que há muita variação entre as vendas nos diferentes estabelecimentos, o que pode reduzir a confiabilidade da média desse tratamento em comparação com tratamentos que têm menor desvio padrão (como TE2, com desvio de 2.21).

Veja esses resultado através deum diagrama de caixa (boxplot).

Cada caixa, no gráfico abaixo, representa o intervalo interquartil (IQR) das respostas para cada tratamento, com a linha dentro da caixa indicando a mediana. A extensão das “orelhas” (linhas verticais) mostra a variabilidade dos dados, incluindo os valores mínimo e máximo, exceto os outliers (valores atípico).

A análise visual com o boxplot não mostra grandes diferenças significativas entre as medianas dos grupos. Note que a embalagens com tipo de desenho 1 (tratamento 1) apresenta o outlier (valor atípico) esse é o valor de referente o estabelecimento 4 (repetição 4). A variação alta identificada em TE1 agora é explicada pela presença do outlier. Seguiremos com a análise de variância (ANOVA).

ANOVA e Teste Tukey

Análise de Variância (ANOVA)

Análise de variância dos tratamentos é obtida para identificar se existe diferenças estatisticamente significativas entre os tratamentos.

Estatisticamente quando p-valor menor que o nível de significância especificado, neste caso 0,05 (5%), os tratamentos possuem diferenças estatísticas sobre o ganho de peso dos frangos de coorte.

##             Df Sum Sq Mean Sq F value Pr(>F)
## trat         3   13.8    4.58   0.136  0.937
## Residuals   12  405.1   33.76               
## 4 observations deleted due to missingness

P-valor não é significativo, dado valor maior que o 0,05. Isso significa que não há diferenças estatisticamente significativas entre os desenhos nas embalagens que sejam capazes de influenciar o volume de vendas.

Se aplicado o teste de Tukey, as médias indicarão grupos homogêneos, ou seja, atribuirá a mesma letra para cada tratamento conforme demonstrado abaixo.

##         y groups
## TE1 17.00      a
## TE4 16.00      a
## TE2 15.00      a
## TE3 14.68      a

Conforme era esperado os tratamentos pertencem ao mesmo grupos, pois não há diferenças etstatísticamente significativas entre as embalagens.

Isso quer dizer que, com um nível de confiança de 9de 95% (ou 5% de significância), não há evidências suficientes para rejeitar a hipótese nula de que as médias das vendas entre os diferentes tratamentos (embalagens) são iguais.

Por fim, é importante observar que houve 4 observações excluídas devido a dados ausentes e presença o que pode ter impactado o resultado.

Veremos a análise de resíduos para que possamos validar esse resultado.

Resíduos

Validação dos resultados

A validação dos resultados de um experimento é uma etapa importante para garantir que as conclusões sejam confiáveis. Isso é feito através de uma análise de resíduos.

A verificação da homocedasticidade é essencial para garantir que as diferenças observadas entre os tratamentos não sejam influenciadas por variações fora do controle experimental.

O gráfico a seguir apresenta quatro visualizações da análise de resíduos de uma ANOVA:

Residuals vs Fitted: avalia padrões nos resíduos e homocedasticidade.
Q-Q Residuals: verifica se os resíduos seguem uma distribuição normal.
Scale-Location: analisa a homocedasticidade através da raiz quadrada dos resíduos.
Constant Leverage: examina resíduos em relação aos níveis de tratamento para identificar discrepâncias.

Para o pressuposto de homocedasticidade dos resíduos os pontos (observações) não aparentam seguirem nenhum padrão específico (quadrantes 1 e 3). No quadrante 2 há suspeita de violação do pressuposto de normalidade, pois há uma quantidade considerável de pontos distantes da reta.

A seguir os testes específicos para a homocedasticidade e normalidade.

Teste de Levene para homocedasticidade

Para que os pressupostos de homocedasticidade e normalidade sejam atendidos, é necessário um p-valor igual ou maior que 0,05 (5%). Isso indica que não há evidências suficientes para rejeitar a hipótese nula de que os resíduos são homocedásticos e normalmente distribuídos.

## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.3627 0.7811
##       12

Com um p-valor de 0,78, o pressuposto de homocedasticidade foi atendido. Isso significa que o princípio de homogeneidade das variâncias está satisfeito, o que é essencial em experimentos inteiramente casualizado.

OBS: homocedasticidade e homogeneidade das variâncias são termos frequentemente de forma equivalentes.

Teste de Shapiro-Wilk para normalidade

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anova_model)
## W = 0.86087, p-value = 0.01977

Com um p-valor de aproximmadamente 0,02, o pressuposto de normalidade não foi atendido. A rejeição do pressuposto de normalidade é um sinal de que as conclusões da ANOVA podem não ser confiáveis.

Isso pode ocorre por vários motivos, entre eles a natureza dos dados, a presença de outliers e dados faltantes.

Conclusão

Mesmo que uma embalagem tenha a maior média de vendas (embalagem TE1), a ausência de diferença significativa implica que a variação nas vendas pode ser atribuída ao acaso, e não a uma influência real da embalagem. Portanto, não se pode garantir que essa embalagem resultará em vendas superiores.

Contudo, isso não impede a empresa pode decidir continuar testando outras embalagens ou mesmo modificar a embalagem que teve a maior média. Isso pode incluir ajustes no design, cores, gráficos ou informações que podem ser mais atraentes para os consumidores.

Além da embalagem, a empresa deve considerar outros fatores que podem influenciar as vendas, como:

Preço do produto;
Promoções e marketing;
Localização das vendas;
Percepção do consumidor em relação ao produto.