Objetivo
O objetivo desta análise é investigar e compreender os padrões de vendas de abacates nos Estados Unidos.
Análise Exploratória dos Dados
dim(dados)
## [1] 18249 14
str(dados)
## 'data.frame': 18249 obs. of 14 variables:
## $ id : int 0 1 2 3 4 5 6 7 8 9 ...
## $ data : Date, format: "2015-12-27" "2015-12-20" ...
## $ preco_medio : num 1.33 1.35 0.93 1.08 1.28 1.26 0.99 0.98 1.02 1.07 ...
## $ total_de_vendas : num 64237 54877 118220 78992 51040 ...
## $ vendas_plu_4046 : num 1037 674 795 1132 941 ...
## $ vendas_plu_4225 : num 54455 44639 109150 71976 43838 ...
## $ vendas_plu_4770 : num 48.2 58.3 130.5 72.6 75.8 ...
## $ vendas_em_sacolas : num 8697 9506 8145 5811 6184 ...
## $ vendas_em_sacolas_pequenas : num 8604 9408 8042 5677 5986 ...
## $ vendas_em_sacolas_grandes : num 93.2 97.5 103.1 133.8 197.7 ...
## $ vendas_em_sacolas_extra_grandes: num 0 0 0 0 0 0 0 0 0 0 ...
## $ tipo : chr "conventional" "conventional" "conventional" "conventional" ...
## $ ano : int 2015 2015 2015 2015 2015 2015 2015 2015 2015 2015 ...
## $ regiao : chr "Albany" "Albany" "Albany" "Albany" ...
kable(head(dados)) # Primeiras linhas da base
| id | data | preco_medio | total_de_vendas | vendas_plu_4046 | vendas_plu_4225 | vendas_plu_4770 | vendas_em_sacolas | vendas_em_sacolas_pequenas | vendas_em_sacolas_grandes | vendas_em_sacolas_extra_grandes | tipo | ano | regiao |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 2015-12-27 | 1.33 | 64236.62 | 1036.74 | 54454.85 | 48.16 | 8696.87 | 8603.62 | 93.25 | 0 | conventional | 2015 | Albany |
| 1 | 2015-12-20 | 1.35 | 54876.98 | 674.28 | 44638.81 | 58.33 | 9505.56 | 9408.07 | 97.49 | 0 | conventional | 2015 | Albany |
| 2 | 2015-12-13 | 0.93 | 118220.22 | 794.70 | 109149.67 | 130.50 | 8145.35 | 8042.21 | 103.14 | 0 | conventional | 2015 | Albany |
| 3 | 2015-12-06 | 1.08 | 78992.15 | 1132.00 | 71976.41 | 72.58 | 5811.16 | 5677.40 | 133.76 | 0 | conventional | 2015 | Albany |
| 4 | 2015-11-29 | 1.28 | 51039.60 | 941.48 | 43838.39 | 75.78 | 6183.95 | 5986.26 | 197.69 | 0 | conventional | 2015 | Albany |
| 5 | 2015-11-22 | 1.26 | 55979.78 | 1184.27 | 48067.99 | 43.61 | 6683.91 | 6556.47 | 127.44 | 0 | conventional | 2015 | Albany |
colSums(is.na(dados)) # Ausência de dados missing
## id data
## 0 0
## preco_medio total_de_vendas
## 0 0
## vendas_plu_4046 vendas_plu_4225
## 0 0
## vendas_plu_4770 vendas_em_sacolas
## 0 0
## vendas_em_sacolas_pequenas vendas_em_sacolas_grandes
## 0 0
## vendas_em_sacolas_extra_grandes tipo
## 0 0
## ano regiao
## 0 0
Análise Descritiva dos Dados
Contagens
table(dados$ano)
##
## 2015 2016 2017 2018
## 5615 5616 5722 1296
table(dados$tipo)
##
## conventional organic
## 9126 9123
table(dados$regiao)
##
## Albany Atlanta BaltimoreWashington Boise
## 338 338 338 338
## Boston BuffaloRochester California Charlotte
## 338 338 338 338
## Chicago CincinnatiDayton Columbus DallasFtWorth
## 338 338 338 338
## Denver Detroit GrandRapids GreatLakes
## 338 338 338 338
## HarrisburgScranton HartfordSpringfield Houston Indianapolis
## 338 338 338 338
## Jacksonville LasVegas LosAngeles Louisville
## 338 338 338 338
## MiamiFtLauderdale Midsouth Nashville NewOrleansMobile
## 338 338 338 338
## NewYork Northeast NorthernNewEngland Orlando
## 338 338 338 338
## Philadelphia PhoenixTucson Pittsburgh Plains
## 338 338 338 338
## Portland RaleighGreensboro RichmondNorfolk Roanoke
## 338 338 338 338
## Sacramento SanDiego SanFrancisco Seattle
## 338 338 338 338
## SouthCarolina SouthCentral Southeast Spokane
## 338 338 338 338
## StLouis Syracuse Tampa TotalUS
## 338 338 338 338
## West WestTexNewMexico
## 338 335
Visualizações
Preço Médio
Preço Médio x Ano
Preço Médio x Tipo
- O preço médio de abacates orgânicos tende a ser maior.
Preço Médio x Região
### Medidas
preco_regiao <- dados %>%
group_by(regiao) %>%
summarise(Média = round(mean(preco_medio), 2),
Mediana = round(median(preco_medio), 2),
`Desvio Padrão` = round(sd(preco_medio), 2)) %>%
rename(Região = regiao)
kable(preco_regiao)
| Região | Média | Mediana | Desvio Padrão |
|---|---|---|---|
| Albany | 1.56 | 1.56 | 0.29 |
| Atlanta | 1.34 | 1.23 | 0.40 |
| BaltimoreWashington | 1.53 | 1.55 | 0.30 |
| Boise | 1.35 | 1.22 | 0.46 |
| Boston | 1.53 | 1.56 | 0.33 |
| BuffaloRochester | 1.52 | 1.48 | 0.27 |
| California | 1.40 | 1.38 | 0.39 |
| Charlotte | 1.61 | 1.58 | 0.41 |
| Chicago | 1.56 | 1.61 | 0.34 |
| CincinnatiDayton | 1.21 | 1.10 | 0.35 |
| Columbus | 1.25 | 1.18 | 0.32 |
| DallasFtWorth | 1.09 | 1.04 | 0.30 |
| Denver | 1.22 | 1.17 | 0.32 |
| Detroit | 1.28 | 1.23 | 0.32 |
| GrandRapids | 1.50 | 1.50 | 0.37 |
| GreatLakes | 1.34 | 1.34 | 0.26 |
| HarrisburgScranton | 1.51 | 1.48 | 0.32 |
| HartfordSpringfield | 1.82 | 1.80 | 0.47 |
| Houston | 1.05 | 0.98 | 0.30 |
| Indianapolis | 1.31 | 1.29 | 0.28 |
| Jacksonville | 1.51 | 1.47 | 0.42 |
| LasVegas | 1.38 | 1.27 | 0.47 |
| LosAngeles | 1.22 | 1.14 | 0.38 |
| Louisville | 1.29 | 1.23 | 0.32 |
| MiamiFtLauderdale | 1.43 | 1.42 | 0.34 |
| Midsouth | 1.40 | 1.40 | 0.26 |
| Nashville | 1.21 | 1.10 | 0.33 |
| NewOrleansMobile | 1.30 | 1.34 | 0.30 |
| NewYork | 1.73 | 1.78 | 0.40 |
| Northeast | 1.60 | 1.64 | 0.31 |
| NorthernNewEngland | 1.48 | 1.51 | 0.30 |
| Orlando | 1.51 | 1.47 | 0.39 |
| Philadelphia | 1.63 | 1.62 | 0.32 |
| PhoenixTucson | 1.22 | 1.23 | 0.55 |
| Pittsburgh | 1.36 | 1.39 | 0.18 |
| Plains | 1.44 | 1.50 | 0.33 |
| Portland | 1.32 | 1.21 | 0.46 |
| RaleighGreensboro | 1.56 | 1.49 | 0.43 |
| RichmondNorfolk | 1.29 | 1.25 | 0.26 |
| Roanoke | 1.25 | 1.16 | 0.28 |
| Sacramento | 1.62 | 1.60 | 0.45 |
| SanDiego | 1.40 | 1.30 | 0.46 |
| SanFrancisco | 1.80 | 1.69 | 0.57 |
| Seattle | 1.44 | 1.34 | 0.47 |
| SouthCarolina | 1.40 | 1.38 | 0.33 |
| SouthCentral | 1.10 | 1.06 | 0.29 |
| Southeast | 1.40 | 1.40 | 0.32 |
| Spokane | 1.45 | 1.32 | 0.49 |
| StLouis | 1.43 | 1.32 | 0.42 |
| Syracuse | 1.52 | 1.46 | 0.25 |
| Tampa | 1.41 | 1.42 | 0.34 |
| TotalUS | 1.32 | 1.33 | 0.30 |
| West | 1.27 | 1.17 | 0.40 |
| WestTexNewMexico | 1.26 | 1.14 | 0.50 |
Total de Vendas
Total de Vendas x Ano
Total de Vendas x Tipo
- Os abacates convencionais superam os orgânicos nas vendas (já foi constatado que o preço médio de abacates orgânicos é superior ao preço médio de abacates convencionais).
PLU
Preço Médio x Total de Vendas
Conclusão
A distinção entre abacates orgânicos e convencionais influencia as preferências dos consumidores e padrões de compra, com os convencionais liderando as vendas devido ao seu preço mais baixo. Precisamos buscar medidas adicionais para identificar diferenças regionais e temporais mais significativas. Além disso, podemos explorar as classificações PLU (que se destacaram na análise) e as vendas por tamanhos de sacolas.