Análise de Vendas de Abacates

Helen Eduarda dos Santos Lourenço - GRR20195801

Objetivo

O objetivo desta análise é investigar e compreender os padrões de vendas de abacates nos Estados Unidos.

Análise Exploratória dos Dados

dim(dados)
## [1] 18249    14
str(dados)
## 'data.frame':    18249 obs. of  14 variables:
##  $ id                             : int  0 1 2 3 4 5 6 7 8 9 ...
##  $ data                           : Date, format: "2015-12-27" "2015-12-20" ...
##  $ preco_medio                    : num  1.33 1.35 0.93 1.08 1.28 1.26 0.99 0.98 1.02 1.07 ...
##  $ total_de_vendas                : num  64237 54877 118220 78992 51040 ...
##  $ vendas_plu_4046                : num  1037 674 795 1132 941 ...
##  $ vendas_plu_4225                : num  54455 44639 109150 71976 43838 ...
##  $ vendas_plu_4770                : num  48.2 58.3 130.5 72.6 75.8 ...
##  $ vendas_em_sacolas              : num  8697 9506 8145 5811 6184 ...
##  $ vendas_em_sacolas_pequenas     : num  8604 9408 8042 5677 5986 ...
##  $ vendas_em_sacolas_grandes      : num  93.2 97.5 103.1 133.8 197.7 ...
##  $ vendas_em_sacolas_extra_grandes: num  0 0 0 0 0 0 0 0 0 0 ...
##  $ tipo                           : chr  "conventional" "conventional" "conventional" "conventional" ...
##  $ ano                            : int  2015 2015 2015 2015 2015 2015 2015 2015 2015 2015 ...
##  $ regiao                         : chr  "Albany" "Albany" "Albany" "Albany" ...
kable(head(dados)) # Primeiras linhas da base
id data preco_medio total_de_vendas vendas_plu_4046 vendas_plu_4225 vendas_plu_4770 vendas_em_sacolas vendas_em_sacolas_pequenas vendas_em_sacolas_grandes vendas_em_sacolas_extra_grandes tipo ano regiao
0 2015-12-27 1.33 64236.62 1036.74 54454.85 48.16 8696.87 8603.62 93.25 0 conventional 2015 Albany
1 2015-12-20 1.35 54876.98 674.28 44638.81 58.33 9505.56 9408.07 97.49 0 conventional 2015 Albany
2 2015-12-13 0.93 118220.22 794.70 109149.67 130.50 8145.35 8042.21 103.14 0 conventional 2015 Albany
3 2015-12-06 1.08 78992.15 1132.00 71976.41 72.58 5811.16 5677.40 133.76 0 conventional 2015 Albany
4 2015-11-29 1.28 51039.60 941.48 43838.39 75.78 6183.95 5986.26 197.69 0 conventional 2015 Albany
5 2015-11-22 1.26 55979.78 1184.27 48067.99 43.61 6683.91 6556.47 127.44 0 conventional 2015 Albany
colSums(is.na(dados)) # Ausência de dados missing
##                              id                            data 
##                               0                               0 
##                     preco_medio                 total_de_vendas 
##                               0                               0 
##                 vendas_plu_4046                 vendas_plu_4225 
##                               0                               0 
##                 vendas_plu_4770               vendas_em_sacolas 
##                               0                               0 
##      vendas_em_sacolas_pequenas       vendas_em_sacolas_grandes 
##                               0                               0 
## vendas_em_sacolas_extra_grandes                            tipo 
##                               0                               0 
##                             ano                          regiao 
##                               0                               0

Análise Descritiva dos Dados

Contagens

table(dados$ano)
## 
## 2015 2016 2017 2018 
## 5615 5616 5722 1296
table(dados$tipo)
## 
## conventional      organic 
##         9126         9123
table(dados$regiao)
## 
##              Albany             Atlanta BaltimoreWashington               Boise 
##                 338                 338                 338                 338 
##              Boston    BuffaloRochester          California           Charlotte 
##                 338                 338                 338                 338 
##             Chicago    CincinnatiDayton            Columbus       DallasFtWorth 
##                 338                 338                 338                 338 
##              Denver             Detroit         GrandRapids          GreatLakes 
##                 338                 338                 338                 338 
##  HarrisburgScranton HartfordSpringfield             Houston        Indianapolis 
##                 338                 338                 338                 338 
##        Jacksonville            LasVegas          LosAngeles          Louisville 
##                 338                 338                 338                 338 
##   MiamiFtLauderdale            Midsouth           Nashville    NewOrleansMobile 
##                 338                 338                 338                 338 
##             NewYork           Northeast  NorthernNewEngland             Orlando 
##                 338                 338                 338                 338 
##        Philadelphia       PhoenixTucson          Pittsburgh              Plains 
##                 338                 338                 338                 338 
##            Portland   RaleighGreensboro     RichmondNorfolk             Roanoke 
##                 338                 338                 338                 338 
##          Sacramento            SanDiego        SanFrancisco             Seattle 
##                 338                 338                 338                 338 
##       SouthCarolina        SouthCentral           Southeast             Spokane 
##                 338                 338                 338                 338 
##             StLouis            Syracuse               Tampa             TotalUS 
##                 338                 338                 338                 338 
##                West    WestTexNewMexico 
##                 338                 335

Visualizações

Preço Médio

Preço Médio x Ano

Preço Médio x Tipo

  • O preço médio de abacates orgânicos tende a ser maior.

Preço Médio x Região

### Medidas
preco_regiao <- dados %>%
  group_by(regiao) %>%
  summarise(Média = round(mean(preco_medio), 2),
            Mediana = round(median(preco_medio), 2),
            `Desvio Padrão` = round(sd(preco_medio), 2)) %>%
  rename(Região = regiao)

kable(preco_regiao)
Região Média Mediana Desvio Padrão
Albany 1.56 1.56 0.29
Atlanta 1.34 1.23 0.40
BaltimoreWashington 1.53 1.55 0.30
Boise 1.35 1.22 0.46
Boston 1.53 1.56 0.33
BuffaloRochester 1.52 1.48 0.27
California 1.40 1.38 0.39
Charlotte 1.61 1.58 0.41
Chicago 1.56 1.61 0.34
CincinnatiDayton 1.21 1.10 0.35
Columbus 1.25 1.18 0.32
DallasFtWorth 1.09 1.04 0.30
Denver 1.22 1.17 0.32
Detroit 1.28 1.23 0.32
GrandRapids 1.50 1.50 0.37
GreatLakes 1.34 1.34 0.26
HarrisburgScranton 1.51 1.48 0.32
HartfordSpringfield 1.82 1.80 0.47
Houston 1.05 0.98 0.30
Indianapolis 1.31 1.29 0.28
Jacksonville 1.51 1.47 0.42
LasVegas 1.38 1.27 0.47
LosAngeles 1.22 1.14 0.38
Louisville 1.29 1.23 0.32
MiamiFtLauderdale 1.43 1.42 0.34
Midsouth 1.40 1.40 0.26
Nashville 1.21 1.10 0.33
NewOrleansMobile 1.30 1.34 0.30
NewYork 1.73 1.78 0.40
Northeast 1.60 1.64 0.31
NorthernNewEngland 1.48 1.51 0.30
Orlando 1.51 1.47 0.39
Philadelphia 1.63 1.62 0.32
PhoenixTucson 1.22 1.23 0.55
Pittsburgh 1.36 1.39 0.18
Plains 1.44 1.50 0.33
Portland 1.32 1.21 0.46
RaleighGreensboro 1.56 1.49 0.43
RichmondNorfolk 1.29 1.25 0.26
Roanoke 1.25 1.16 0.28
Sacramento 1.62 1.60 0.45
SanDiego 1.40 1.30 0.46
SanFrancisco 1.80 1.69 0.57
Seattle 1.44 1.34 0.47
SouthCarolina 1.40 1.38 0.33
SouthCentral 1.10 1.06 0.29
Southeast 1.40 1.40 0.32
Spokane 1.45 1.32 0.49
StLouis 1.43 1.32 0.42
Syracuse 1.52 1.46 0.25
Tampa 1.41 1.42 0.34
TotalUS 1.32 1.33 0.30
West 1.27 1.17 0.40
WestTexNewMexico 1.26 1.14 0.50

Total de Vendas

Total de Vendas x Ano

Total de Vendas x Tipo

  • Os abacates convencionais superam os orgânicos nas vendas (já foi constatado que o preço médio de abacates orgânicos é superior ao preço médio de abacates convencionais).

PLU

Preço Médio x Total de Vendas

Conclusão

A distinção entre abacates orgânicos e convencionais influencia as preferências dos consumidores e padrões de compra, com os convencionais liderando as vendas devido ao seu preço mais baixo. Precisamos buscar medidas adicionais para identificar diferenças regionais e temporais mais significativas. Além disso, podemos explorar as classificações PLU (que se destacaram na análise) e as vendas por tamanhos de sacolas.