A ANP regula e fiscaliza a indústria do petróleo e gás, ao longo de toda a cadeia, do poço ao posto. Nessa tarefa, uma das atividades que mais reúne agentes econômicos a serem regulados e fiscalizados por essa autarquia especial é a de revendedores de combustível automotivo, conhecidos popularmente como postos de combustíveis (ANP, 2022a). E faz parte das atribuições da Agência a realização de pesquisas mercadológicas, em relação a esses comercializadores, visando, sobretudo, ao levantamento dos preços de venda de cada combustível nos postos para acompanhar os valores praticados em todo território nacional.
As informações obtidas em tais pesquisas são divulgadas e disponibilizadas frequentemente à sociedade, no site da ANP, em arquivos contendo planilhas eletrônicas. Ademais, fica disponível, nesse site, um gráfico contendo a série histórica do preço de venda de cada combustível. Toda essa publicização de informações se deve ao disposto no Decreto nº 8.777/2016.
O presente estudo utiliza justamente informações contidas naqueles arquivos para realizar análises estatísticas referentes a combustíveis líquidos fósseis de determinado período.
Essas análises podem mostrar à sociedade a existência de diferenças significativas do preço cobrado nas bombas entre as regiões, os estados e as principais capitais brasileiras. Adicionalmente, podem indicar se determinada(s) bandeira(s) (marca dos postos) revendedora(s) está(ão) praticando preços mais baixos ou mais altos no mercado, em relação às demais.
Outra possibilidade, a partir de tais análises, é verificar o impacto da política de negócios dos agentes atuantes no mercado de petróleo brasileiro, em especial do agente dominante Petrobras, nos aspectos econômicos do país, principalmente em momentos de conflitos no mundo globalizado que possam influenciar o mercado de petróleo e gás, como a recente guerra entre Rússia e Ucrânia.
Este estudo visa efetuar uma análise estatística em relação aos combustíveis líquidos fósseis comercializados nos postos revendedores de todas as regiões brasileiras em determinados períodos de 2021 e de 2022.
Especificamente, este estudo busca:
Efetuar uma análise estatística dos combustíveis líquidos fósseis nas regiões brasileiras para os meses de novembro de 2021, e março e junho, ambos de 2022, verificando, sobretudo, o comportamento dos preços nesses períodos.
Avaliar a existência de diferença significativa nos preços de combustíveis fósseis entre as regiões, considerando-se os períodos analisados.
Verificar o preço médio dos combustíveis líquidos fósseis, por bandeira, no Brasil, de maneira agregada, para os meses de novembro de 2021, e março e junho, ambos de 2022.
Avaliar a existência de diferença significativa nos preços de combustíveis fósseis entre os diferentes tipos de bandeira, considerando-se os períodos analisados.
Verificar o preço médio dos combustíveis líquidos fósseis, por bandeira, nas regiões brasileiras para os meses de novembro de 2021, e março e junho, ambos de 2022.
Verificar o preço médio dos combustíveis líquidos fósseis nos estados brasileiros para os meses de novembro de 2021, e março e junho, ambos de 2022.
Avaliar o comportamento dos preços de comercialização dos combustíveis líquidos fósseis nos estados entre os três períodos analisados.
Avaliar a existência de correlação entre os preços dos combustíveis fósseis e o IPCA nas principais capitais brasileiras, no período analisado.
Historicamente, o Brasil sempre foi deficitário em relação aos combustíveis automotivos, necessitando, frequentemente, de importações de diesel e de gasolina para complementação de seus estoques, visando suprir a demanda interna desses combustíveis.
Em 2021, a importação de diesel e de gasolina, em relação ao total comercializado no Brasil, foram de, aproximadamente, 23% e 6%, respectivamente (ANP, 2021). Em 2022, estima-se que os valores importados ficaram em torno de 25%, para o diesel, e de 8,5%, para a gasolina (ANP, 2022b).
Nesses mesmos anos, a comercialização total de diesel no Brasil foi de cerca de 63 bilhões de litros, em 2021, e de 58 bilhões de litros, até novembro de 2022, enquanto a de gasolina foi de, aproximadamente, 39 bilhões de litros, tanto em 2021 quanto no período de janeiro a novembro de 2022 (ANP, 2021), (ANP, 2022b), (EPE, 2022).
De acordo com esses dados, verifica-se uma maior utilização de diesel na matriz energética brasileira, em função, principalmente, do modelo adotado para o transporte de carga, eminentemente rodoviário e à base de diesel, além de uma dependência maior da importação deste combustível, quando comparado com a gasolina, no mercado interno brasileiro. A associação de todas essas características relacionadas ao mercado de combustíveis, especialmente em relação ao diesel, pode acarretar uma degradação na política econômica do Brasil, dependendo da estratégia adotada para esse mercado, sobretudo em função de uma elevação substancial do petróleo e de seus derivados no mercado externo.
Uma forma encontrada para o governo brasileiro buscar soluções devido aos possíveis problemas relacionados ao mercado de combustíveis, como um todo, e não só o de diesel, foi a criação e controle de uma empresa do setor de petróleo e gás, a Petrobras.
Nesse contexto, quase toda infraestrutura de refino de petróleo no Brasil encontra-se ainda sob o controle da Petrobras, sendo que, das 18 refinarias existentes até o início de 2021, essa empresa detinha 13 refinarias que respondiam por cerca de 98% da capacidade de processamento de petróleo no país. Além disso, essa empresa atua na atividade de importação de diesel e de gasolina (dentre outros derivados), sendo responsável, até 2019, por cerca de 85% desta (MME, 2019).
Entretanto, desde o final de 2016, essa empresa anunciou um reposicionamento no mercado de combustíveis no Brasil, direcionando sua estratégia de negócios à maximização de valor da empresa por meio de uma gestão ativa do portfólio de refino, logística, comercialização e petroquímica integrados às atividades de produção de óleo e gás nacionais (PETROBRAS, 2018).
A Petrobras decidiu pela promoção de uma política de preços de mercado e maximização de margens da sua cadeia de valor, implementando o PPI (Preço de Paridade de Importação), além de anunciar o desinvestimento de alguns ativos, incluindo a BR Distribuidora e 8 refinarias.
Essa decisão, se e quando totalmente implementada, estabelecerá uma redefinição do papel exercido pela Petrobras e uma nova estrutura de mercado com a possível presença de múltiplos agentes econômicos, alterando a dinâmica de planejamento logístico de suprimento de derivados imposta há anos no país, acarretando uma reestruturação do abastecimento nacional de combustíveis.
O planejamento logístico do abastecimento nacional de combustíveis que ficou, há anos, a cargo da Petrobras se mostrou um dos principais instrumentos de garantia do abastecimento de combustíveis ao logo do território nacional, sobretudo nos eventuais momentos de interrupção dos fluxos logísticos em determinados pontos da cadeia. A partir desse planejamento centralizado, a Petrobras conseguia ter uma visão holística do abastecimento e realizava eventuais remanejamentos de produção e de logística quando necessários à garantia do abastecimento (MME, 2020).
A despeito das vantagens do planejamento logístico conduzido pela Petrobras há anos, a intensão é a de que exista uma maior concorrência com a entrada de mais agentes econômicos no mercado de petróleo e gás, especialmente nos ramos de refino, de distribuição e de comercialização, entendidos como concorrenciais, podendo conduzir a uma redução dos preços de derivados de petróleo ao longo de todo o território brasileiro (MME, 2020).
Pelo lado da Petrobras, a principal vantagem verificada foi a sua extraordinária margem de lucro, nos últimos dois anos (ALVARENGA, 2022), (PAMPLONA, 2022), com a implementação de seus planos relacionados aos desinvestimentos e à precificação de seus produtos.
Nesse sentido, a mudança de rumo traçada ainda em 2016 visava propiciar a busca da melhor rentabilidade para a empresa, valendo-se da aderência à dinâmica de precificação das commodities internacionais, com a adoção da prática de preços competitivos e que tenham como referência o conceito de Preço de Paridade de Importação (PPI), adicionado de uma margem para remunerar os riscos inerentes à operação. Assim, os preços praticados pela empresa nunca estariam abaixo dessa paridade e o seu principal objetivo passou a ser a maximização do resultado “preço x volume”.
Em relação aos ativos desinvestidos, a Petrobras vendeu o restante de sua participação na BR Distribuidora, em junho de 2021, transformando essa empresa em 100% privada, e saindo definitivamente do ramo de revenda de combustíveis (FERRARI, 2021). Posteriormente, em novembro de 2021, concluiu a venda da RLAM (Refinaria Landulpho Alves), refinaria localizada na Bahia, juntamente com todos os seus ativos logísticos, para um grupo investidor internacional (PETROBRAS, 2021).
Importante salientar que, de acordo com o planejamento inicial, a Petrobras colocou à venda uma capacidade de refino compreendida entre 40% a 50% da capacidade total da empresa, selecionando, para a alienação, ativos localizados fora do eixo Rio-São Paulo (MME, 2020).
O conflito iniciado no final de 2021 entre Rússia e Ucrânia acarretou uma escalada de preços de insumos energéticos em todo o mundo, inclusive do petróleo e seus derivados. Esse fato culminou com uma elevação dos preços dos combustíveis no mercado interno brasileiro a partir do início de 2022, situação que se agravou ainda mais em fevereiro de 2022, deflagrando uma verdadeira crise de combustíveis no Brasil.
Os sucessivos aumentos nos preços internos dos combustíveis acarretados por essa crise geraram uma situação de emergência, fato que, via de regra, requer o envolvimento, o acompanhamento e a tomada de decisões adequadas por parte de autoridades governamentais, com a finalidade de contornar ou suavizar os efeitos deletérios das condições econômicas e sociais do país.
Em meados de 2022, em função da situação formada e de decisões tomadas pelas autoridades governamentais brasileiras, o preço de comercialização do diesel ultrapassou, após vários anos, o da gasolina, conforme pode ser verificado na Figura 1, a seguir.
Na busca de solução para atenuar ou solucionar os efeitos da referida crise dos combustíveis, estes foram classificados e declarados como itens essenciais pelo Poder Legislativo, no âmbito da discussão do Projeto de Lei que visava à redução e à harmonização nacional da tributação via ICMS, que culminou nas publicações de Emenda Constitucional e de Lei Complementar, em julho de 2022, positivando, além de outros dispositivos, essa “nova” característica dos combustíveis.
A estatística faz parte do método científico, sendo fundamental para integrar as explicações e as teorias a partir dos dados. Ela utiliza procedimentos sistemáticos que geralmente necessitam de evidências para apoiar determinado argumento (DUTT-ROSS, 2020).
Dentre as ferramentas utilizadas nas análises estatísticas podem ser citadas aquelas para (i) cálculo das medidas de tendência central, como as médias e a mediana; (ii) verificação da medida de dispersão ou variabilidade, como o desvio padrão; (iii) visualização de dados numéricos, como o histograma e o boxplot; (iv) análise de correlações entre variáveis, como os testes de correlação e diagramas de dispersão; e (v) realização de testes de hipóteses.
As medidas de tendência central resultam de certas operações feitas em variáveis quantitativas para passar uma ideia representativa da ordem de grandeza dos valores da variável medida, ou do valor que melhor representa os dados coletados. Para essas medidas destacam-se a média de uma série de números, que é a soma destes números dividida pela quantidade de números que compõe a série, e a mediana, valor central de determinada variável numérica (JELIHOVSCHI, 2014).
A medida da dispersão está relacionada à distribuição de determinada variável, ou seja, à variabilidade desta em torno de um valor padrão. Comumente, essa dispersão é representada pelo desvio padrão, definido como o padrão para se medir desvios em relação a um valor esperado (ASSUNÇÃO, 2017).
É importante frisar que a média, mediana e desvio padrão fazem parte do resumo estatístico do conjunto de dados de determinada variável quantitativa.
O histograma é uma representação gráfica que divide uma série de dados em diferentes classes igualmente espaçadas, mostrando a frequência de valores em cada classe. Ele permite verificar como os dados de uma variável quantitativa (tipicamente contínua) espalham-se no intervalo formado entre o menor e o maior valor de uma amostra, possibilitando a visualização da tendência de (i) acúmulos em uma pequena região, (ii) espalhamento igualitário ou (iii) concentração em mais de uma região, dentro do intervalo delimitado pelos extremos, máximo e mínimo (ASSUNÇÃO, 2017). Os histogramas podem ser simétricos, distorcidos à esquerda ou à direita, achatados, bimodais ou multimodais.
Já o boxplot (ou diagrama de caixa) é um resumo gráfico da dispersão dos dados com alta compressão, usando 5 números apenas, e possibilita mostrar rapidamente se os dados são simétricos, onde estão concentrados e se existem valores extremos, denominados outliers (ASSUNÇÃO, 2017). Ele pode ser usado para comparar certos resultados, uma vez que os dados gráficos apresentados possuem a mesma unidade de medida e a mesma ordem de grandeza (JELIHOVSCHI, 2014).
Os testes de correlação e o diagrama de dispersão são ferramentas utilizadas com frequência para analisar se os dados obtidos de duas variáveis apresentam certa relação entre si, valendo-se do coeficiente de correlação, que é um número que varia entre −1 e 1 e que indica a força da correlação linear entre duas variáveis, e se estas possuem relação positiva ou negativa. Um valor positivo desse coeficiente indica uma correlação linear positiva entre duas variáveis e um valor negativo, uma correlação negativa. Ademais, quanto mais próximo de zero o valor do coeficiente, mais fraca é a relação entre as duas variáveis, e quanto mais perto de 1 ou −1, mais forte a relação linear entre elas (JELIHOVSCHI, 2014).
Os testes de hipóteses são métodos estatísticos importantes para determinar se há efeitos estatisticamente significativos entre observações e estão fundamentados, geralmente, na tomada de decisões com base no resultado do p-valor. Contam com o teste de uma hipótese nula, que possui uma formulação específica para cada teste, e a hipótese alternativa, contrária à hipótese nula (DUTT-ROSS, 2020).
O resultado apresentado pelo p-valor nos testes de hipóteses indica se a hipótese nula deve ser rejeitada ou não. Para tal, o p-valor é comparado com um valor de alpha pré-determinado (geralmente adota-se o valor de 0,05). Assim, se o p-valor para o teste for menor que alpha, rejeita-se a hipótese nula e, em caso contrário (p-valor maior ou igual a alpha) não se rejeita a hipótese nula (DUTT-ROSS, 2020).
No pressente estudo importa mencionar os testes de Kolmogorov-Smirnov, de correlação de Pearson e de Spearman, de Kruscal-Wallis e de comparações múltiplas de Wilcoxon.
O teste de Kolmogorov-Smirnov, a exemplo do teste de Shapiro Wilk, serve para aferir a normalidade dos dados (se a variável segue uma distribuição normal). Suas hipóteses são:
H0: dados seguem uma distribuição normal.
H1: dados não seguem uma distribuição normal.
O teste de correlação de Pearson mede o grau de associação linear entre duas variáveis quantitativas que possuem distribuição normal, além de testar se a correlação é significativa. Suas hipóteses são:
H0: ρ = 0 (as variáveis não estão correlacionadas).
H1: ρ ≠ 0 (as variáveis estão correlacionadas).
O teste de correlação de Spearman também mede o grau de associação linear entre duas variáveis quantitativas, porém para os casos em que uma delas não possua distribuição normal. Suas hipóteses são:
H0: não há associação monotônica entre as variáveis.
H1: há associação monotônica entre as variáveis.
O teste de Kruscal-Wallis é um método não-paramétrico utilizado quando os pressupostos de normalidade ou de homogêneidade de variâncias são violados e pode ser aplicado a variáveis categóricas com mais de dois grupos. Seu resultado informa se existem diferenças entre os grupos, mas não informa quais grupos são diferentes de outros grupos (DUTT-ROSS, 2020). Suas hipóteses são:
H0: grupos amostrados de populações com distribuições idênticas.
H1: grupos amostrados de populações com diferentes distribuições.
O teste de comparações múltiplas de Wilcoxon complementa o teste de Kruscal-Wallis, possibilitando determinar quais grupos se diferenciam de outros, a partir da comparação de cada par de grupos. Para esse teste, o p-valor resultante para cada par indica a existência de diferença entre as distribuições analisadas (p-valor menor que alpha) ou a não existência de diferença entre tais distribuições (p-valor maior que alpha) (DUTT-ROSS, 2020).
Para o estudo estatístico deste trabalho, foi necessário, incialmente, obter as Bases de Dados (BD) de interesse nos sites correspondentes e prepará-las para que fossem carregadas e utilizadas no software R Studio versão 4.1.0.
Dessa forma, para a primeira BD utilizada, relacionada aos preços de combustíveis fósseis comercializados no Brasil (principal), tomaram-se dois arquivos disponibilizados (em formato de valores separados por vírgula do Microsoft Excel - arquivos .csv), no site da ANP (https://www.gov.br/anp/pt-br/centrais-de-conteudo/dados-abertos/serie-historica-de-precos-de-combustiveis): um com informações do 2º semestre de 2021 (ca-2021-02.csv) e outro com informações do 1º semestre de 2022 (precos-semestrais-ca-2022-01.csv). Ambos foram unidos e, após, selecionados os registros referentes aos meses de interesse (novembro/2021, março/2022 e junho/2022). Ao final, obteve-se uma BD consolidada, no formato .xlsx, com informações de postos comercializadores de combustíveis automotivos de várias cidades brasileiras, contando com 208.830 observações para tais meses, a qual foi carregada no R Studio.
O dicionário de dados dessa primeira BD, que contém 16 variáveis, pode ser observado na Tabela 1, a seguir.
Tabela 1 – Dicionário de dados da BD dos combustíveis utilizada neste estudo.
#---------
# Carregamento das BDs
#---------
Dicio <- read_excel("D:/Curso Adm Publica/Semestre 8/Estatistica/TrabFinal/Precos_combustiveis_postos_2021-2022.xlsx",
sheet = "Dicio")
DT::datatable(Dicio)As primeiras observações da BD principal, relacionada aos preços de combustíveis fósseis comercializados no Brasil, utilizada neste estudo, pode ser vista a seguir.
#---------
# Carregamento das BDs
#---------
DB_Comb <- read_excel("D:/Curso Adm Publica/Semestre 8/Estatistica/TrabFinal/Precos_combustiveis_postos_2021-2022.xlsx",
sheet = "precos-postos-2021-2022")
DB_Comb %>% head() %>% data.frame() %>% flextable() Regiao...Sigla | Estado...Sigla | Municipio | Revenda | CNPJ.da.Revenda | Nome.da.Rua | Numero.Rua | Complemento | Bairro | Cep | Produto | Data.da.Coleta | Valor.de.Venda | Valor.de.Compra | Unidade.de.Medida | Bandeira |
NE | AL | ARAPIRACA | POSTO ARAPIRACA LTDA | 12.451.076/0004-65 | RODOVIA AL 220 | 105 | KM 68 | CANAFISTULA | 57302-605 | GASOLINA | 2021-11-01 00:00:00 | 6.799 | R$ / litro | VIBRA ENERGIA | |
NE | AL | ARAPIRACA | POSTO ARAPIRACA LTDA | 12.451.076/0004-65 | RODOVIA AL 220 | 105 | KM 68 | CANAFISTULA | 57302-605 | DIESEL | 2021-11-01 00:00:00 | 5.549 | R$ / litro | VIBRA ENERGIA | |
NE | AL | ARAPIRACA | POSTO ARAPIRACA LTDA | 12.451.076/0004-65 | RODOVIA AL 220 | 105 | KM 68 | CANAFISTULA | 57302-605 | GASOLINA ADITIVADA | 2021-11-01 00:00:00 | 6.899 | R$ / litro | VIBRA ENERGIA | |
NE | AL | ARAPIRACA | POSTO ARAPIRACA LTDA | 12.451.076/0004-65 | RODOVIA AL 220 | 105 | KM 68 | CANAFISTULA | 57302-605 | DIESEL S10 | 2021-11-01 00:00:00 | 5.649 | R$ / litro | VIBRA ENERGIA | |
NE | AL | DELMIRO GOUVEIA | AUTO POSTO FREITAS & MAIA LTDA | 12.436.978/0001-80 | RUA FLORIANO PEIXOTO | 247 | CENTRO | 57480-000 | GASOLINA | 2021-11-01 00:00:00 | 7.198 | R$ / litro | VIBRA ENERGIA | ||
NE | AL | DELMIRO GOUVEIA | AUTO POSTO FREITAS & MAIA LTDA | 12.436.978/0001-80 | RUA FLORIANO PEIXOTO | 247 | CENTRO | 57480-000 | DIESEL | 2021-11-01 00:00:00 | 5.974 | R$ / litro | VIBRA ENERGIA |
Em relação a outra BD, referente ao índice nacional de preços ao consumidor amplo (IPCA) para as principais capitais brasileiras (secundária), foram tomados dados disponibilizados, em formato do Microsoft Excel (arquivos .xlsx), no site do IBGE (https://www.ibge.gov.br/estatisticas/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo.html?=&t=destaques), estratificados por mês/ano. Foram utilizados os valores de IPCA compreendidos entre os períodos de novembro de 2021 a novembro de 2022 que, após consolidados em um único arquivo (.xlsx), contou com 16 observações. A BD resultante deste arquivo também foi carregada no R Studio.
O dicionário de dados dessa segunda BD pode ser observado na Tabela 2, a seguir. Ela contém 14 variáveis, sendo 13 referentes aos meses de apuração do respectivo IPCA.
Tabela 2 – Dicionário de dados da BD de IPCA utilizada neste estudo.
A BD relacionada ao IPCA mensal das principais capitais brasileiras, utilizada neste estudo, pode ser vista a seguir.
#---------
# Carregamento das BDs
#---------
IPCA <- read_excel("D:/Curso Adm Publica/Semestre 8/Estatistica/TrabFinal/Tab_IPCA_2021-2022.xlsx")
kable(IPCA, row.names = FALSE)%>%
kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"),
position = "center", fixed_thead = T) %>%
scroll_box(width = "900px", height = "600px")| Cidade | nov_21 | dez_21 | jan_22 | fev_22 | mar_22 | abr_22 | mai_22 | jun_22 | jul_22 | ago_22 | set_22 | out_22 | nov_22 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Aracaju | 0.92 | 0.92 | 0.90 | 1.26 | 1.43 | 1.36 | 0.74 | 0.67 | -1.21 | -0.50 | -0.12 | 0.58 | 0.12 |
| Belo Horizonte | 0.92 | 0.75 | 0.80 | 1.07 | 1.44 | 1.06 | 0.27 | 0.83 | -1.07 | -1.25 | -0.35 | 0.54 | 0.54 |
| Belem | -0.03 | 0.95 | 0.65 | 0.97 | 1.47 | 1.21 | 0.36 | 0.26 | -1.29 | 0.18 | -0.01 | 0.51 | 0.10 |
| Brasilia | 1.04 | 0.46 | 0.49 | 0.93 | 1.41 | 1.21 | 0.31 | 0.81 | -0.98 | -0.22 | -0.26 | 0.87 | 1.03 |
| Campo Grande | 1.47 | 0.47 | 0.62 | 1.06 | 1.73 | 1.21 | 0.27 | 0.64 | -0.95 | -0.39 | -0.22 | 0.47 | 0.27 |
| Curitiba | 1.07 | 0.51 | 0.47 | 1.28 | 2.40 | 0.85 | 0.38 | 0.65 | -1.41 | -0.46 | -0.16 | 0.20 | 0.23 |
| Fortaleza | 1.06 | 0.55 | 0.73 | 0.77 | 1.69 | 0.98 | 1.41 | 0.61 | -0.65 | -0.74 | -0.65 | 0.61 | 0.28 |
| Goiania | 1.39 | 0.58 | 0.74 | 0.91 | 2.10 | 0.81 | 0.37 | 0.51 | -2.12 | -0.32 | -0.31 | 0.53 | 0.95 |
| Porto Alegre | 0.96 | 0.83 | -0.53 | 0.43 | 1.61 | 1.13 | 0.47 | 0.70 | -0.59 | -0.90 | -0.46 | 0.76 | 0.42 |
| Recife | 1.02 | 1.05 | 0.41 | 0.97 | 1.53 | 1.12 | 0.55 | 1.13 | -0.42 | -1.40 | -0.43 | 0.95 | 0.39 |
| Rio Branco | 0.82 | 1.18 | 0.87 | 0.93 | 1.35 | 0.90 | 0.21 | 0.81 | -0.92 | -0.34 | -0.09 | 0.44 | 0.12 |
| Rio de Janeiro | 0.88 | 0.70 | 0.60 | 1.32 | 1.67 | 1.39 | 0.56 | 0.39 | -0.44 | 0.01 | -0.11 | 0.41 | 0.34 |
| Salvador | 1.42 | 1.04 | 0.86 | 0.83 | 1.53 | 0.67 | 1.29 | 1.24 | -1.06 | -0.17 | -0.32 | 0.61 | 0.26 |
| Sao Luis | 0.73 | 0.94 | 0.54 | 1.33 | 2.06 | 1.03 | 0.28 | 0.51 | -0.63 | -1.07 | -0.15 | 0.71 | 0.36 |
| Sao Paulo | 0.86 | 0.70 | 0.63 | 1.05 | 1.46 | 1.06 | 0.35 | 0.61 | -0.07 | -0.01 | -0.32 | 0.66 | 0.40 |
| Vitoria | 1.01 | 0.73 | 0.57 | 0.86 | 1.50 | 0.83 | -0.08 | 0.61 | -1.31 | 0.46 | 0.17 | 0.60 | 0.09 |
IPCA$Cidade <- toupper(rm_accent(IPCA$Cidade))
estado <- read_state(code_state="all", year=2019,
showProgress = FALSE) Using year 2019
As variáveis de interesse das BDs para as análises estatísticas efetuadas neste trabalho foram:
Regiao - Sigla, Estado - Sigla, Produto, Data da Coleta, Valor de Venda, Bandeira e Municipio, todas da BD referente aos combustíveis fósseis; e
Cidade e “IPCA” de alguns meses, da BD referente ao IPCA.
Em um primeiro momento, foram criadas tabelas específicas para o cálculo das médias e dos desvios padrões do valor de venda, além da confecção de gráficos do tipo boxplot, estratificados por região, para cada um dos combustíveis analisados e para cada mês de interesse, utilizando-se a variável qualitativa Regiao - Sigla e a quantitativa Valor de Venda. Foram confeccionados também histogramas para cada combustível e mês de interesse.
Em seguida, partindo-se dos valores das médias da variável Valor de Venda obtidas para cada região brasileira e para cada combustível, dentro dos meses de interesse, foram realizados testes de hipóteses para verificar a existência de diferença nos preços de venda de cada combustível entre as regiões brasileiras.
Posteriormente, foi verificada a quantidade de estabelecimentos de determinada bandeira no Brasil, presente na BD, para cada produto analisado, elaborando-se tabelas em números absoluto e em números relativo. Essas tabelas foram úteis para direcionar a criação de tabelas específicas para o cálculo das médias e dos desvios padrões do valor de venda, além da confecção de gráficos do tipo boxplot, estratificados por bandeira, para cada um dos combustíveis analisados e para cada mês de interesse, utilizando-se a variável qualitativa Bandeira e a quantitativa Valor de Venda.
Ato contínuo, com os valores das médias calculadas da variável Valor de Venda para cada combustível, estratificados por bandeira e dentro dos meses de interesse, foram realizados testes de hipóteses para verificar a existência de diferença nos preços de venda de cada combustível, praticados no Brasil, entre as bandeiras.
Após, foi verificada a quantidade de estabelecimentos de determinada bandeira, estratificada por regiões e para cada produto analisado, presente na BD, elaborando-se tabelas em números absoluto e em números relativo. Essas tabelas foram consideradas para decidir quais as bandeiras deveriam ser escolhidas para os cálculos dos preços médios e desvios padrões de cada região. A partir dessas informações, foram criadas tabelas específicas para tais cálculos e para a confecção de gráficos do tipo boxplot, estratificados por bandeira, para cada região brasileira e para cada combustível analisado, dentro dos meses de interesse, utilizando-se a variável qualitativa Bandeira e a quantitativa Valor de Venda.
Outro cálculo efetuado foi o do preço médio de cada combustível, com o respectivo desvio padrão, para cada estado brasileiro, dentro dos meses de interesse, utilizando-se a variável qualitativa Estado - Sigla e a quantitativa Valor de Venda. Os preços médios de cada estado foram usados para compor vários mapas do Brasil, considerando-se os combustíveis e os meses analisados, buscando facilitar a visualização dos resultados obtidos.
Por último, foi efetuado o cálculo do preço médio do diesel (conjunção do Diesel S10 e Diesel S500) e da gasolina (conjunção da Gasolina comum e Gasolina aditivada), com os respectivos desvios padrões, para cada município e para cada mês de interesse, utilizando-se a variável qualitativa Municipio e a quantitativa Valor de Venda. A tabela gerada a partir desses cálculos foi cruzada com a BD de IPCA, originando uma nova tabela com as principais capitais brasileiras, alguns valores mensais de IPCA de interesse e os preços médios de diesel e de gasolina praticados para os meses analisados. Esses preços médios foram usados para o cálculo de índices de variação do preço do diesel e da gasolina, para os meses novembro/2021-março/2022 e março/2022-junho/2022, a partir da seguinte expressão:
Finalmente, foi averiguada a existência de correlação entre os valores dos índices originados e o IPCA acumulado para os meses novembro/2021 a março/2022 e abril/2022 a junho/2022. Adicionalmente, foi avaliada a existência de correlação entre os valores do índice originado para os meses novembro/2021-março/2022 e o IPCA de março/2022. Para todas as correlações avaliadas, foram realizados testes de hipótese de correlação entre os pares de variáveis de interesse.
A partir das tabelas específicas confeccionadas para o cálculo das médias e desvios padrões do valor de venda, estratificados por região, para cada um dos combustíveis e para cada mês analisados, utilizando-se a variável qualitativa Regiao - Sigla e a quantitativa Valor de Venda, foram obtidos gráficos do tipo boxplot e histogramas, sendo alguns apresentados a seguir. Os demais estão no ANEXO.
#---------
# Análises estatísticas
#-------
# Tabelas com preços médios e desvio padrão
# por região para os meses de nov/21, mar/22 e
# jun/22, extratificadas pelos
# produtos D S10, D S500, G comum e G aditivada
#-------
ftT11BP <- DB_Comb %>%
filter(Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01") %>%
select(`Regiao - Sigla`,`Valor de Venda`)
ftT11 <- ftT11BP %>%
group_by(`Regiao - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftT12BP <- DB_Comb %>%
filter(Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") %>%
select(`Regiao - Sigla`,`Valor de Venda`)
ftT12 <- ftT12BP %>%
group_by(`Regiao - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftT13BP <- DB_Comb %>%
filter(Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30") %>%
select(`Regiao - Sigla`,`Valor de Venda`)
ftT13 <- ftT13BP %>%
group_by(`Regiao - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
cor_dark <- brewer.pal(7,"Pastel1")
hist(ftT11BP$`Valor de Venda`, main = "Histograma de preços de Diesel S10 - Nov/21",
col="skyblue", xlab="R$", ylab="Frequência")hist(ftT12BP$`Valor de Venda`, main = "Histograma de preços de Diesel S10 - Mar/22",
col="skyblue", xlab="R$", ylab="Frequência")hist(ftT13BP$`Valor de Venda`, main = "Histograma de preços de Diesel S10 - Jun/22",
col="skyblue", xlab="R$", ylab="Frequência")boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT11BP,
main="Boxplot de preços de Diesel S10 por região - Nov/21",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT12BP,
main="Boxplot de preços de Diesel S10 por região - Mar/22",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT13BP,
main="Boxplot de preços de Diesel S10 por região - Jun/22",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftT21BP <- DB_Comb %>%
filter(Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01") %>%
select(`Regiao - Sigla`,`Valor de Venda`)
ftT21 <- ftT21BP %>%
group_by(`Regiao - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftT22BP <- DB_Comb %>%
filter(Produto == 'DIESEL'
& `Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") %>%
select(`Regiao - Sigla`,`Valor de Venda`)
ftT22 <- ftT22BP %>%
group_by(`Regiao - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftT23BP <- DB_Comb %>%
filter(Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30") %>%
select(`Regiao - Sigla`,`Valor de Venda`)
ftT23 <- ftT23BP %>%
group_by(`Regiao - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftT31BP <- DB_Comb %>%
filter(Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01") %>%
select(`Regiao - Sigla`,`Valor de Venda`)
ftT31 <- ftT31BP %>%
group_by(`Regiao - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftT32BP <- DB_Comb %>%
filter(Produto == 'GASOLINA'
& `Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") %>%
select(`Regiao - Sigla`,`Valor de Venda`)
ftT32 <- ftT32BP %>%
group_by(`Regiao - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftT33BP <- DB_Comb %>%
filter(Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30") %>%
select(`Regiao - Sigla`,`Valor de Venda`)
ftT33 <- ftT33BP %>%
group_by(`Regiao - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
hist(ftT31BP$`Valor de Venda`, main = "Histograma de preços de Gas. comum - Nov/21",
col="Red", xlab="R$", ylab="Frequência")hist(ftT32BP$`Valor de Venda`, main = "Histograma de preços de Gas. comum - Mar/22",
col="Red", xlab="R$", ylab="Frequência")hist(ftT33BP$`Valor de Venda`, main = "Histograma de preços de Gas. comum - Jun/22",
col="Red", xlab="R$", ylab="Frequência")boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT31BP,
main="Boxplot de preços de Gas. comum por região - Nov/21",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT32BP,
main="Boxplot de preços de Gas. comum por região - Mar/22",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT33BP,
main="Boxplot de preços de Gas. comum por região - Jun/22",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftT41BP <- DB_Comb %>%
filter(Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01") %>%
select(`Regiao - Sigla`,`Valor de Venda`)
ftT41 <- ftT41BP %>%
group_by(`Regiao - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftT42BP <- DB_Comb %>%
filter(Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") %>%
select(`Regiao - Sigla`,`Valor de Venda`)
ftT42 <- ftT42BP %>%
group_by(`Regiao - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftT43BP <- DB_Comb %>%
filter(Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30") %>%
select(`Regiao - Sigla`,`Valor de Venda`)
ftT43 <- ftT43BP %>%
group_by(`Regiao - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame() As tabelas contendo as médias e desvios padrões do valor de venda, por região, para cada combustível são apresentadas a seguir.
ftT1 <- ftT11 %>%
left_join(ftT12, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
left_join(ftT13, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
flextable()
ftT1 <- delete_part(ftT1, part = "header")
ftT1 <- add_header(x=ftT1, Regiao...Sigla = "Região",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftT1 <- add_header(x=ftT1,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftT1 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Média dos preços do DIESEL S10 por região")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Região | Preço | DP | Preço | DP | Preço | DP |
CO | 5.6927 | 0.2368 | 6.5279 | 0.5720 | 7.3990 | 0.4318 |
N | 5.7232 | 0.3334 | 6.6628 | 0.5892 | 7.6092 | 0.5239 |
NE | 5.5863 | 0.2091 | 6.5608 | 0.5717 | 7.5494 | 0.4915 |
S | 5.2913 | 0.1999 | 6.2293 | 0.5325 | 7.1636 | 0.4324 |
SE | 5.3954 | 0.1863 | 6.2880 | 0.5090 | 7.2374 | 0.4202 |
ftT2 <- ftT21 %>%
left_join(ftT22, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
left_join(ftT23, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
flextable()
ftT2 <- delete_part(ftT2, part = "header")
ftT2 <- add_header(x=ftT2, Regiao...Sigla = "Região",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftT2 <- add_header(x=ftT2,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftT2 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Média dos preços do DIESEL S500 por região")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Região | Preço | DP | Preço | DP | Preço | DP |
CO | 5.5605 | 0.2548 | 6.3902 | 0.5552 | 7.2352 | 0.4349 |
N | 5.7067 | 0.3482 | 6.6132 | 0.6015 | 7.5695 | 0.5336 |
NE | 5.5422 | 0.2099 | 6.5451 | 0.5437 | 7.5594 | 0.4906 |
S | 5.2281 | 0.2032 | 6.1413 | 0.5003 | 7.0345 | 0.4286 |
SE | 5.3063 | 0.1807 | 6.1860 | 0.4933 | 7.1154 | 0.4220 |
ftT3 <- ftT31 %>%
left_join(ftT32, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
left_join(ftT33, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
flextable()
ftT3 <- delete_part(ftT3, part = "header")
ftT3 <- add_header(x=ftT3, Regiao...Sigla = "Região",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftT3 <- add_header(x=ftT3,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftT3 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Média dos preços da GASOLINA COMUM por região")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Região | Preço | DP | Preço | DP | Preço | DP |
CO | 6.9315 | 0.2966 | 7.0333 | 0.4335 | 7.2600 | 0.3753 |
N | 6.7752 | 0.3604 | 7.1811 | 0.4952 | 7.4102 | 0.4234 |
NE | 6.7996 | 0.2459 | 7.2342 | 0.4937 | 7.6053 | 0.4052 |
S | 6.7683 | 0.3313 | 6.8507 | 0.3961 | 7.0607 | 0.3245 |
SE | 6.6717 | 0.4174 | 6.9408 | 0.5221 | 7.1526 | 0.4855 |
ftT4 <- ftT41 %>%
left_join(ftT42, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
left_join(ftT43, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
flextable()
ftT4 <- delete_part(ftT4, part = "header")
ftT4 <- add_header(x=ftT4, Regiao...Sigla = "Região",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftT4 <- add_header(x=ftT4,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftT4 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Média dos preços da GASOLINA ADITIVADA por região")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Região | Preço | DP | Preço | DP | Preço | DP |
CO | 7.0506 | 0.3016 | 7.1517 | 0.4229 | 7.3839 | 0.3629 |
N | 6.8930 | 0.2617 | 7.3243 | 0.3832 | 7.5592 | 0.3152 |
NE | 6.9386 | 0.2737 | 7.3807 | 0.4900 | 7.7359 | 0.4031 |
S | 6.9095 | 0.3398 | 6.9710 | 0.4141 | 7.1773 | 0.3441 |
SE | 6.8401 | 0.4235 | 7.1184 | 0.5302 | 7.3441 | 0.4815 |
Analisando-se os histogramas obtidos, verificou-se, para o Diesel S10, que os preços de venda ficaram concentrados entre 5,2 e 5,6 em Nov/2021, entre 6,4 e 7,0, com uma maior frequência, e entre 5,4 e 6,0, com uma menor frequência, em Mar/2022, e entre 6,6 e 8,0 em Jun/2022. Nenhum deles apresentou simetria e o de Mar/2022 obteve formato bimodal. Para a Gasolina comum, os preços de venda ficaram concentrados entre 6,2 e 7,0 em Nov/2021, entre 6,6 e 7,4 em Mar/2022 e entre 6,8 e 7,6 em Jun/2022. Nenhum deles apresentou simetria.
De acordo com os boxplots obtidos e analisando-se principalmente as medianas, percebeu-se claramente uma evolução acentuada dos preços de venda do Diesel S10 ao longo do período analisado, enquanto os da Gasolina comum aumentaram levemente. Além disso, dentro de cada mês/ano, a diferença de tais preços entre as regiões para esses combustíveis não foi tão discrepante, sobretudo para a Gasolina comum. E todos esses comportamentos são corroborados com os valores das médias dos preços apresentados nas tabelas referentes aos respectivos combustíveis.
Ainda sobre esses boxplots, verificou-se uma grande quantidade de outliers (tanto na faixa superior quanto na inferior) em todas as regiões no mês de Nov/2021 para o combustível Diesel S10, o que indica valores atípicos para os preços de venda praticados. Já no mês de Mar/2022 e ainda para ao Diesel S10, somente a região Sudeste apresentou um único outlier, enquanto em Jun/2022 todas as regiões voltaram a apresentar vários outliers, mas em menor quantidade quando comparado com Nov/2021. Em relação à Gasolina comum, observou-se a presença de outiliers de uma forma mais igualitária em todos os meses analisados, muito embora a região Centro-Oeste não tenha apresentado qualquer outlier em Nov/2021 e em Mar/2022, enquanto o Nordeste não os apresentou em Nov/2021 e em Jun/2022.
Ademais, verificou-se uma alta concentração e uma certa simetria dos valores de venda de Diesel S10 em Nov/2021, enquanto para o mês de Mar/2022 houve um aumento da dispersão e uma assimetria desses valores em todas as regiões. Em Jun/2022, a dispersão voltou a diminuir em todas as regiões, mas ficando maior do que em Nov/2021, e os valores de venda voltaram a apresentar uma certa simetria. Já os preços de venda da Gasolina comum apresentaram uma dispersão mais semelhante nos meses analisados nas cinco regiões, muito embora notou-se uma maior concentração desses valores nas regiões Norte e Nordeste, em Nov/2021, enquanto na região Sul houve uma maior concentração em Jun/2022. Ainda para a Gasolina comum, observou-se uma simetria de seus preços de venda nas regiões Norte, Nordeste e Sul, em Nov/2021 e Jun/2022.
Considerando-se os valores das tabelas referentes aos combustíveis analisados, o primeiro teste de hipótese efetuado para verificar a existência de diferença significativa nos preços de venda de cada combustível entre as regiões brasileiras foi o de normalidade (Kolmogorov-Smirnov), com as seguintes hipóteses nula e alternativa:
H0: Dados seguem uma distribuição normal.
H1: Dados não seguem uma distribuição normal.
O valor de alpha considerado para todos os testes foi de 0,05.
Em todos os casos, o teste de normalidade resultou em um p-valor menor que alpha, devendo-se rejeitar H0, o que significa que os dados não seguem uma distribuição normal, acarretando a violação do pressuposto de normalidade. Então, o teste da ANOVA foi abandonado e seguiu-se para o teste de Kruskal-Wallis com as seguintes hipóteses nula e alternativa:
H0: Todas as regiões têm a mesma distribuição de preços.
H1: Existe ao menos uma região com distribuição de preços diferente.
Em todos os casos, esse teste resultou em um p-valor menor que alpha, devendo-se rejeitar H0, o que significa que os grupos foram amostrados de populações com diferentes distribuições, existindo ao menos uma região com distribuição de preços diferente. Logo, foi necessário realizar o teste de comparações múltiplas de Wilcoxon para complementar o teste de Kruskal-Wallis.
Os resultados obtidos de alguns desses testes de hipótese podem ser vistos a seguir. Os demais estão no ANEXO.
#---------
# Testes de Hipóteses
# alpha:0,05
# Se pvalor for menor que 0,05 Rej H0
# Se pvalor for maior que 0,05 Não Rej H0
#-------
# Verificar se para cada período e combustível
# existe alguma região que pratica preço diferenciado
# (maior ou menor)
#------------------------------------------------------
# Para D. S10 e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModT11 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT11BP)
ResT11 <- residuals(ModT11)
lillie.test(ResT11)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResT11
D = 0.08228, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT11BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 5276.2, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT11 <- pairwise.wilcox.test(ftT11BP$`Valor de Venda`,
ftT11BP$`Regiao - Sigla`,
p.adjust.method="fdr")
ModT11
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftT11BP$`Valor de Venda` and ftT11BP$`Regiao - Sigla`
CO N NE S
N 0.91 - - -
NE <2e-16 <2e-16 - -
S <2e-16 <2e-16 <2e-16 -
SE <2e-16 <2e-16 <2e-16 <2e-16
P value adjustment method: fdr
#------------------------------------------------------
# Para D. S10 e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModT12 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT12BP)
ResT12 <- residuals(ModT12)
lillie.test(ResT12)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResT12
D = 0.12054, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT12BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 1475.8, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT12 <- pairwise.wilcox.test(ftT12BP$`Valor de Venda`,
ftT12BP$`Regiao - Sigla`,
p.adjust.method="fdr")
ModT12
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftT12BP$`Valor de Venda` and ftT12BP$`Regiao - Sigla`
CO N NE S
N 1.7e-08 - - -
NE 0.15 7.7e-07 - -
S < 2e-16 < 2e-16 < 2e-16 -
SE < 2e-16 < 2e-16 < 2e-16 6.9e-09
P value adjustment method: fdr
#------------------------------------------------------
# Para D. S10 e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModT13 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT13BP)
ResT13 <- residuals(ModT13)
lillie.test(ResT13)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResT13
D = 0.074723, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT13BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 1991.5, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT13 <- pairwise.wilcox.test(ftT13BP$`Valor de Venda`,
ftT13BP$`Regiao - Sigla`,
p.adjust.method="fdr")
ModT13
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftT13BP$`Valor de Venda` and ftT13BP$`Regiao - Sigla`
CO N NE S
N <2e-16 - - -
NE <2e-16 0.0011 - -
S <2e-16 <2e-16 <2e-16 -
SE <2e-16 <2e-16 <2e-16 <2e-16
P value adjustment method: fdr
#------------------------------------------------------
#------------------------------------------------------
# Para G. comum e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModT31 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT31BP)
ResT31 <- residuals(ModT31)
lillie.test(ResT31)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResT31
D = 0.094178, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT31BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 1297.9, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT31 <- pairwise.wilcox.test(ftT31BP$`Valor de Venda`,
ftT31BP$`Regiao - Sigla`,
p.adjust.method="fdr")
ModT31
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftT31BP$`Valor de Venda` and ftT31BP$`Regiao - Sigla`
CO N NE S
N < 2e-16 - - -
NE < 2e-16 0.96227 - -
S < 2e-16 0.00067 2.1e-10 -
SE < 2e-16 < 2e-16 < 2e-16 < 2e-16
P value adjustment method: fdr
#------------------------------------------------------
# Para G. comum e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModT32 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT32BP)
ResT32 <- residuals(ModT32)
lillie.test(ResT32)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResT32
D = 0.044143, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT32BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 1660, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT32 <- pairwise.wilcox.test(ftT32BP$`Valor de Venda`,
ftT32BP$`Regiao - Sigla`,
p.adjust.method="fdr")
ModT32
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftT32BP$`Valor de Venda` and ftT32BP$`Regiao - Sigla`
CO N NE S
N < 2e-16 - - -
NE < 2e-16 0.34 - -
S < 2e-16 < 2e-16 < 2e-16 -
SE < 2e-16 < 2e-16 < 2e-16 3.9e-14
P value adjustment method: fdr
#------------------------------------------------------
# Para G. comum e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModT33 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT33BP)
ResT33 <- residuals(ModT33)
lillie.test(ResT33)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResT33
D = 0.063941, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT33BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 4108.6, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT33 <- pairwise.wilcox.test(ftT33BP$`Valor de Venda`,
ftT33BP$`Regiao - Sigla`,
p.adjust.method="fdr")
ModT33
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftT33BP$`Valor de Venda` and ftT33BP$`Regiao - Sigla`
CO N NE S
N <2e-16 - - -
NE <2e-16 <2e-16 - -
S <2e-16 <2e-16 <2e-16 -
SE <2e-16 <2e-16 <2e-16 <2e-16
P value adjustment method: fdr
#------------------------------------------------------
#------------------------------------------------------De acordo com os resultados dos testes de hipótese para o Diesel S10, verificou-se o seguinte:
considerando-se o mês de Nov/2021, em virtude do p-valor entre CO e N (0,91) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço nas regiões Norte e Centro-Oeste. Já nas demais regiões, há diferença significativa nessas distribuições. Assim, pode-se dizer que os preços de Diesel S10 praticados nas regiões Norte e Centro-Oeste foram semelhantes entre si e maiores em relação a outras regiões e que houve diferença significativa nos preços desse combustível nas regiões Nordeste, Sul e Sudeste (e destas em relação às regiões Norte e Centro-Oeste).
considerando-se o mês de Mar/2022, em virtude do p-valor entre CO e NE (0,15) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço nas regiões Nordeste e Centro-Oeste. Já nas demais regiões, há diferença significativa nas distribuições do preço de Diesel S10. Assim, pode-se dizer que os preços de Diesel S10 praticados nas regiões Nordeste e Centro-Oeste foram semelhantes entre si, mas foram menores em relação à região Norte e maiores em relação às demais. Além disso, houve diferença significativa nos preços desse combustível nas regiões Norte, Sul e Sudeste (e destas em relação às regiões Nordeste e Centro-Oeste).
para o mês de Jun/2022, realmente existe um p-valor (entre N e NE) bem maior que os demais (0,001), mas ainda está dentro do limite de significância (é menor que alpha). Assim, para todos os pares, inclusive entre as regiões Norte e Nordeste, existiu diferença significativa entre as distribuições do preço de Diesel S10 para todas as regiões, podendo-se dizer que houve diferença significativa nos preços praticados desse combustível em todas as regiões.
Já em relação à Gasolina comum, e ainda de acordo com os resultados dos testes de hipótese, verificou-se o seguinte:
considerando-se o mês de Nov/2021, em virtude do p-valor entre NE e N (0,962) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço nas regiões Norte e Nordeste. Além disso, o p-valor entre S e N é bem maior que os demais (0,00067), excluindo-se aquele entre NE e N, mas ainda está dentro do limite de significância (é menor que alpha). Assim, excluindo-se o par NE e N, há diferença significativa nas distribuições do preço de Gasolina comum nas regiões. Logo, pode-se dizer que os preços de Gasolina comum praticados nas regiões Norte e Nordeste foram semelhantes entre si, mas foram menores em relação à região Centro-Oeste e maiores em relação às demais. Além disso, houve diferença significativa nos preços desse combustível nas regiões Centro-Oeste, Sul e Sudeste (e destas em relação às regiões Nordeste e Norte).
para o mês de Mar/2022, em virtude do p-valor entre NE e N (0,34) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço nas regiões Norte e Nordeste. Já nas demais regiões, há diferença significativa nessas distribuições. Assim, pode-se dizer que os preços de Gasolina comum praticados nas regiões Norte e Nordeste foram semelhantes entre si e maiores em relação a outras regiões e que houve diferença significativa nos preços desse combustível nas regiões Centro-Oeste, Sul e Sudeste (e destas em relação às regiões Norte e Nordeste).
considerando-se o mês de Jun/2022, todos os valores de p-valor para os pares de todas as regiões são muito baixos (< 2e-16). Assim, para todos os pares de regiões existe diferença significativa entre as distribuições do preço. Portanto, pode-se dizer que houve diferença significativa nos preços praticados de Gasolina comum em todas as regiões.
Em um primeiro momento, foi verificada a quantidade de estabelecimentos de determinada bandeira no Brasil, na BD, para cada produto analisado, elaborando-se uma tabela em números absoluto e outra em números relativo. Essas tabelas estão apresentadas no ANEXO.
Observou-se, a partir dessas tabelas, que 4 bandeiras foram responsáveis por, aproximadamente, 90% da frequência na BD, sendo que as demais correspondem a percentuais pequenos (alguns menores que 1%). Dessa forma, optou-se por agregar todas essas bandeiras de baixo percentual em uma única modalidade de bandeira, denominada OUTRAS, elaborando-se duas novas tabelas semelhantes às mencionadas anteriormente, apresentadas a seguir (Tabela 3 e Tabela 4).
#---------
# Tabela em num abs
#-------
# Tabelas indicando quantidades de estabelecimentos de
# determinada bandeira no Brasil para os produtos
# D S10, D S500, G comum e G aditivada
#-------
ftBxP <- DB_Comb %>%
filter(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') %>%
select(Produto,Bandeira) %>%
data.frame()
ftOBP <- DB_Comb %>%
filter(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA') %>%
select(Produto,Bandeira) %>%
data.frame()
ftOBP$Bandeira <- "OUTRAS"
ftBxP <- bind_rows(ftBxP, ftOBP)
ftBxP %>%
tabyl(Bandeira,Produto) %>%
flextable() %>% theme_zebra() %>% autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Tabela 3 - Frequência de cada BANDEIRA por PRODUTO na BD")Bandeira | DIESEL | DIESEL S10 | GASOLINA | GASOLINA ADITIVADA |
BRANCA | 12,229 | 19,876 | 26,424 | 16,021 |
IPIRANGA | 4,835 | 9,751 | 11,240 | 9,591 |
OUTRAS | 3,240 | 5,376 | 6,361 | 4,684 |
RAIZEN | 4,414 | 9,072 | 10,644 | 9,249 |
VIBRA ENERGIA | 6,466 | 12,877 | 14,282 | 12,198 |
# Tabela em num relativos - por coluna
#-------
# Tabelas indicando percentuais de estabelecimentos de
# determinada bandeira no Brasil para os produtos
# D S10, D S500, G comum e G aditivada
#-------
ftBxP %>%
tabyl(Bandeira,Produto) %>%
adorn_percentages("col") %>%
adorn_pct_formatting(digits = 2) %>%
flextable() %>% theme_zebra() %>% autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Tabela 4 - Frequência relativa de cada BANDEIRA por PRODUTO na BD")Bandeira | DIESEL | DIESEL S10 | GASOLINA | GASOLINA ADITIVADA |
BRANCA | 39.22% | 34.90% | 38.32% | 30.96% |
IPIRANGA | 15.50% | 17.12% | 16.30% | 18.54% |
OUTRAS | 10.39% | 9.44% | 9.23% | 9.05% |
RAIZEN | 14.15% | 15.93% | 15.44% | 17.87% |
VIBRA ENERGIA | 20.73% | 22.61% | 20.71% | 23.57% |
Considerando-se os resultados dessas tabelas, foram criadas as tabelas específicas para cálculo das médias e desvios padrões, estratificados por bandeiras, para cada um dos combustíveis e para cada mês analisados, utilizando-se a variável qualitativa Bandeira e a quantitativa Valor de Venda, obtendo-se gráficos do tipo boxplot, apresentados no ANEXO, e tabelas contendo as médias e desvios padrões do valor de venda, por bandeira, apresentadas a seguir.
#-------
# Tabelas com preços médios e desvio padrão
# por bandeira no Brasil para os meses de
# nov/21, mar/22 e jun/22, extratificadas pelos
# produtos D S10, D S500, G comum e G aditivada
#-------
ftB11BP <- DB_Comb %>%
filter(Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ftB11OBP <- DB_Comb %>%
filter(Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ftB11OBP$Bandeira <- "OUTRAS"
ftB11BP <- bind_rows(ftB11BP, ftB11OBP)
ftB11 <- ftB11BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftB12BP <- DB_Comb %>%
filter(Produto == 'DIESEL S10'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ftB12OBP <- DB_Comb %>%
filter(Produto == 'DIESEL S10'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ftB12OBP$Bandeira <- "OUTRAS"
ftB12BP <- bind_rows(ftB12BP, ftB12OBP)
ftB12 <- ftB12BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftB13BP <- DB_Comb %>%
filter(Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ftB13OBP <- DB_Comb %>%
filter(Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ftB13OBP$Bandeira <- "OUTRAS"
ftB13BP <- bind_rows(ftB13BP, ftB13OBP)
ftB13 <- ftB13BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftB1 <- ftB11 %>%
left_join(ftB12, by = c("Bandeira" = "Bandeira")) %>%
left_join(ftB13, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftB1 <- delete_part(ftB1, part = "header")
ftB1 <- add_header(x=ftB1, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftB1 <- add_header(x=ftB1,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftB1 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Média dos preços do DIESEL S10 por BANDEIRA no Brasil")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 5.4280 | 0.2346 | 6.3559 | 0.5761 | 7.2758 | 0.4709 |
IPIRANGA | 5.4399 | 0.2509 | 6.3651 | 0.5395 | 7.3499 | 0.4749 |
OUTRAS | 5.4938 | 0.2795 | 6.4062 | 0.5854 | 7.3800 | 0.4874 |
RAIZEN | 5.4434 | 0.2172 | 6.3642 | 0.5293 | 7.3281 | 0.4599 |
VIBRA ENERGIA | 5.5431 | 0.2702 | 6.4429 | 0.5488 | 7.4113 | 0.4788 |
ftB21BP <- DB_Comb %>%
filter(Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ftB21OBP <- DB_Comb %>%
filter(Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ftB21OBP$Bandeira <- "OUTRAS"
ftB21BP <- bind_rows(ftB21BP, ftB21OBP)
ftB21 <- ftB21BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftB22BP <- DB_Comb %>%
filter(Produto == 'DIESEL'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ftB22OBP <- DB_Comb %>%
filter(Produto == 'DIESEL'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ftB22OBP$Bandeira <- "OUTRAS"
ftB22BP <- bind_rows(ftB22BP, ftB22OBP)
ftB22 <- ftB22BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftB23BP <- DB_Comb %>%
filter(Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ftB23OBP <- DB_Comb %>%
filter(Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ftB23OBP$Bandeira <- "OUTRAS"
ftB23BP <- bind_rows(ftB23BP, ftB23OBP)
ftB23 <- ftB23BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftB2 <- ftB21 %>%
left_join(ftB22, by = c("Bandeira" = "Bandeira")) %>%
left_join(ftB23, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftB2 <- delete_part(ftB2, part = "header")
ftB2 <- add_header(x=ftB2, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftB2 <- add_header(x=ftB2,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftB2 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Média dos preços do DIESEL S500 por BANDEIRA no Brasil")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 5.3274 | 0.2366 | 6.2680 | 0.5562 | 7.1743 | 0.4949 |
IPIRANGA | 5.3778 | 0.2643 | 6.2728 | 0.5280 | 7.2552 | 0.4829 |
OUTRAS | 5.4534 | 0.2900 | 6.3591 | 0.5782 | 7.3223 | 0.4932 |
RAIZEN | 5.3556 | 0.2152 | 6.2330 | 0.5108 | 7.1883 | 0.4684 |
VIBRA ENERGIA | 5.4853 | 0.2976 | 6.3501 | 0.5436 | 7.3080 | 0.4990 |
ftB31BP <- DB_Comb %>%
filter(Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ftB31OBP <- DB_Comb %>%
filter(Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ftB31OBP$Bandeira <- "OUTRAS"
ftB31BP <- bind_rows(ftB31BP, ftB31OBP)
ftB31 <- ftB31BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftB32BP <- DB_Comb %>%
filter(Produto == 'GASOLINA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ftB32OBP <- DB_Comb %>%
filter(Produto == 'GASOLINA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ftB32OBP$Bandeira <- "OUTRAS"
ftB32BP <- bind_rows(ftB32BP, ftB32OBP)
ftB32 <- ftB32BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftB33BP <- DB_Comb %>%
filter(Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ftB33OBP <- DB_Comb %>%
filter(Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ftB33OBP$Bandeira <- "OUTRAS"
ftB33BP <- bind_rows(ftB33BP, ftB33OBP)
ftB33 <- ftB33BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftB3 <- ftB31 %>%
left_join(ftB32, by = c("Bandeira" = "Bandeira")) %>%
left_join(ftB33, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftB3 <- delete_part(ftB3, part = "header")
ftB3 <- add_header(x=ftB3, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftB3 <- add_header(x=ftB3,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftB3 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Média dos preços da GASOLINA COMUM por BANDEIRA no Brasil")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 6.6666 | 0.3838 | 6.9283 | 0.5190 | 7.1844 | 0.5067 |
IPIRANGA | 6.7511 | 0.3646 | 6.9924 | 0.4831 | 7.2217 | 0.4318 |
OUTRAS | 6.7895 | 0.3012 | 7.0918 | 0.4589 | 7.3498 | 0.3911 |
RAIZEN | 6.7535 | 0.3682 | 7.0091 | 0.4952 | 7.2664 | 0.4588 |
VIBRA ENERGIA | 6.8430 | 0.3549 | 7.1197 | 0.5018 | 7.3740 | 0.4569 |
ftB41BP <- DB_Comb %>%
filter(Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ftB41OBP <- DB_Comb %>%
filter(Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ftB41OBP$Bandeira <- "OUTRAS"
ftB41BP <- bind_rows(ftB41BP, ftB41OBP)
ftB41 <- ftB41BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftB42BP <- DB_Comb %>%
filter(Produto == 'GASOLINA ADITIVADA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ftB42OBP <- DB_Comb %>%
filter(Produto == 'GASOLINA ADITIVADA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ftB42OBP$Bandeira <- "OUTRAS"
ftB42BP <- bind_rows(ftB42BP, ftB42OBP)
ftB42 <- ftB42BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftB43BP <- DB_Comb %>%
filter(Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ftB43OBP <- DB_Comb %>%
filter(Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ftB43OBP$Bandeira <- "OUTRAS"
ftB43BP <- bind_rows(ftB43BP, ftB43OBP)
ftB43 <- ftB43BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftB4 <- ftB41 %>%
left_join(ftB42, by = c("Bandeira" = "Bandeira")) %>%
left_join(ftB43, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftB4 <- delete_part(ftB4, part = "header")
ftB4 <- add_header(x=ftB4, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftB4 <- add_header(x=ftB4,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftB4 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Média dos preços da GASOLINA ADITIVADA por BANDEIRA no Brasil")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 6.7661 | 0.3711 | 7.0298 | 0.5104 | 7.2988 | 0.4935 |
IPIRANGA | 6.9250 | 0.3522 | 7.1636 | 0.4724 | 7.3961 | 0.4198 |
OUTRAS | 6.8710 | 0.3080 | 7.1932 | 0.4586 | 7.4279 | 0.3857 |
RAIZEN | 6.9599 | 0.3554 | 7.2150 | 0.5013 | 7.4826 | 0.4650 |
VIBRA ENERGIA | 6.9863 | 0.3685 | 7.2581 | 0.5098 | 7.5146 | 0.4524 |
Considerando-se os valores das tabelas referentes aos combustíveis analisados, foram realizados os mesmos testes de hipótese da seção anterior referente à análise dos preços por região, só que agora para verificar a existência de diferença nos preços de venda de cada combustível, praticados no Brasil, entre as bandeiras.
Semelhantemente à seção anterior, em todos os casos, o teste de normalidade resultou em um p-valor menor que alpha, devendo-se rejeitar H0, o que significa que os dados não seguem uma distribuição normal, acarretando a violação do pressuposto de normalidade. Então, o teste da ANOVA foi abandonado e seguiu-se para o teste de Kruskal-Wallis com as seguintes hipóteses nula e alternativa:
H0: Todas as bandeiras apresentam a mesma distribuição de preços.
H1: Existe ao menos uma bandeira com distribuição de preços diferente.
Em todos os casos, esse teste resultou em um p-valor menor que alpha, devendo-se rejeitar H0, o que significa que os grupos foram amostrados de populações com diferentes distribuições, existindo ao menos uma bandeira com distribuição de preços diferente, sendo necessário realizar o teste de comparações múltiplas de Wilcoxon para complementar o teste de Kruskal-Wallis.
Os resultados obtidos de alguns desses testes de hipótese podem ser vistos a seguir. Os demais estão no ANEXO.
#---------
# Testes de Hipóteses
# alpha:0,05
# Se pvalor for menor que 0,05 Rej H0
# Se pvalor for maior que 0,05 Não Rej H0
#-------
# Verificar se para cada período e combustível
# existe alguma bandeira que pratica preço diferenciado
# (maior ou menor)
#------------------------------------------------------
# Para D. S10 e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModB11 <- aov(`Valor de Venda`~Bandeira,data=ftB11BP)
ResB11 <- residuals(ModB11)
lillie.test(ResB11)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResB11
D = 0.089787, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB11BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 523.82, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB11 <- pairwise.wilcox.test(ftB11BP$`Valor de Venda`,
ftB11BP$Bandeira,
p.adjust.method="fdr")
ModB11
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftB11BP$`Valor de Venda` and ftB11BP$Bandeira
BRANCA IPIRANGA OUTRAS RAIZEN
IPIRANGA 0.014 - - -
OUTRAS < 2e-16 1.9e-09 - -
RAIZEN 1.7e-05 0.111 6.8e-07 -
VIBRA ENERGIA < 2e-16 < 2e-16 1.9e-09 < 2e-16
P value adjustment method: fdr
#------------------------------------------------------
# Para D. S10 e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModB12 <- aov(`Valor de Venda`~Bandeira,data=ftB12BP)
ResB12 <- residuals(ModB12)
lillie.test(ResB12)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResB12
D = 0.095093, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB12BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 79.584, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB12 <- pairwise.wilcox.test(ftB12BP$`Valor de Venda`,
ftB12BP$Bandeira,
p.adjust.method="fdr")
ModB12
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftB12BP$`Valor de Venda` and ftB12BP$Bandeira
BRANCA IPIRANGA OUTRAS RAIZEN
IPIRANGA 0.3669 - - -
OUTRAS 0.0022 0.0235 - -
RAIZEN 0.5888 0.6670 0.0155 -
VIBRA ENERGIA 7.8e-15 2.0e-09 0.0397 5.8e-10
P value adjustment method: fdr
#------------------------------------------------------
# Para D. S10 e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModB13 <- aov(`Valor de Venda`~Bandeira,data=ftB13BP)
ResB13 <- residuals(ModB13)
lillie.test(ResB13)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResB13
D = 0.078486, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB13BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 240.28, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB13 <- pairwise.wilcox.test(ftB13BP$`Valor de Venda`,
ftB13BP$Bandeira,
p.adjust.method="fdr")
ModB13
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftB13BP$`Valor de Venda` and ftB13BP$Bandeira
BRANCA IPIRANGA OUTRAS RAIZEN
IPIRANGA 6.0e-14 - - -
OUTRAS 2.3e-16 0.0560 - -
RAIZEN 1.6e-08 0.0812 0.0013 -
VIBRA ENERGIA < 2e-16 1.8e-07 0.0220 6.2e-12
P value adjustment method: fdr
#------------------------------------------------------
#------------------------------------------------------
# Para G. comum e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModB31 <- aov(`Valor de Venda`~Bandeira,data=ftB31BP)
ResB31 <- residuals(ModB31)
lillie.test(ResB31)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResB31
D = 0.073524, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB31BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 723.9, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB31 <- pairwise.wilcox.test(ftB31BP$`Valor de Venda`,
ftB31BP$Bandeira,
p.adjust.method="fdr")
ModB31
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftB31BP$`Valor de Venda` and ftB31BP$Bandeira
BRANCA IPIRANGA OUTRAS RAIZEN
IPIRANGA < 2e-16 - - -
OUTRAS < 2e-16 1.3e-08 - -
RAIZEN < 2e-16 0.77 2.8e-06 -
VIBRA ENERGIA < 2e-16 < 2e-16 3.8e-08 < 2e-16
P value adjustment method: fdr
#------------------------------------------------------
# Para G. comum e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModB32 <- aov(`Valor de Venda`~Bandeira,data=ftB32BP)
ResB32 <- residuals(ModB32)
lillie.test(ResB32)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResB32
D = 0.038673, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB32BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 510.71, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB32 <- pairwise.wilcox.test(ftB32BP$`Valor de Venda`,
ftB32BP$Bandeira,
p.adjust.method="fdr")
ModB32
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftB32BP$`Valor de Venda` and ftB32BP$Bandeira
BRANCA IPIRANGA OUTRAS RAIZEN
IPIRANGA 2.9e-10 - - -
OUTRAS < 2e-16 3.4e-15 - -
RAIZEN 1.4e-14 0.16 9.6e-11 -
VIBRA ENERGIA < 2e-16 < 2e-16 0.03 < 2e-16
P value adjustment method: fdr
#------------------------------------------------------
# Para G. comum e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModB33 <- aov(`Valor de Venda`~Bandeira,data=ftB33BP)
ResB33 <- residuals(ModB33)
lillie.test(ResB33)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResB33
D = 0.058661, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB33BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 651.07, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB33 <- pairwise.wilcox.test(ftB33BP$`Valor de Venda`,
ftB33BP$Bandeira,
p.adjust.method="fdr")
ModB33
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftB33BP$`Valor de Venda` and ftB33BP$Bandeira
BRANCA IPIRANGA OUTRAS RAIZEN
IPIRANGA 3.1e-05 - - -
OUTRAS < 2e-16 < 2e-16 - -
RAIZEN < 2e-16 0.00014 3.0e-16 -
VIBRA ENERGIA < 2e-16 < 2e-16 0.01585 < 2e-16
P value adjustment method: fdr
#------------------------------------------------------
#------------------------------------------------------De acordo com os resultados dos testes de hipótese para o Diesel S10, verificou-se o seguinte:
considerando-se o mês de Nov/2021, em virtude do p-valor entre IPIRANGA e RAIZEN (0,111) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço para as bandeiras IPIRANGA e RAIZEN. Já para as demais bandeiras, há diferença significativa nessas distribuições. Assim, pode-se dizer que os preços praticados pelas bandeiras IPIRANGA e RAIZEN foram semelhantes entre si, mas foram menores em relação às bandeiras OUTRAS e VIBRA ENERGIA e maiores em relação à BRANCA. Além disso, houve diferença significativa nos preços para as bandeiras BRANCA, OUTRAS e VIBRA ENERGIA (e destas em relação às bandeiras IPIRANGA e RAIZEN).
considerando-se o mês de Mar/2022, em virtude do p-valor entre BRANCA e IPIRANGA (0,3669), BRANCA e RAIZEN (0,5888) e IPIRANGA e RAIZEN (0,667) serem maiores que alpha para esses pares, não existe diferença significativa entre as distribuições do preço para as bandeiras BRANCA, IPIRANGA e RAIZEN. Assim, pode-se dizer que os preços praticados por essas bandeiras foram semelhantes entre si e menores em relação às demais. Além disso, houve diferença significativa nos preços para as bandeiras OUTRAS e VIBRA ENERGIA (e destas em relação às bandeiras BRANCA, IPIRANGA e RAIZEN).
para o mês de Jun/2022, em virtude do p-valor entre IPIRANGA e OUTRAS (0,056) e IPIRANGA e RAIZEN (0,0812) serem maiores que alpha para esses pares, não existe diferença significativa entre as distribuições do preço para as bandeiras IPIRANGA e OUTRAS e para IPIRANGA e RAIZEN. Assim, pode-se dizer que os preços praticados pelas bandeiras IPIRANGA e OUTRAS foram semelhantes entre si e que os preços praticados pelas bandeiras IPIRANGA e RAIZEN foram semelhantes entre si. Além disso, houve diferença significativa nos preços para as bandeiras BRANCA, VIBRA ENERGIA e os pares IPIRANGA e OUTRAS e IPIRANGA e RAIZEN, sendo que a VIBRA ENERGIA pratica o maior preço e a BRANCA, o menor.
Já em relação à Gasolina comum, e ainda de acordo com os resultados dos testes de hipótese, verificou-se o seguinte:
considerando-se o mês de Nov/2021, em virtude do p-valor entre IPIRANGA e RAIZEN (0,77) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço para as bandeiras IPIRANGA e RAIZEN. Já para as demais bandeiras, há diferença significativa nessas distribuições. Assim, pode-se dizer que os preços praticados pelas bandeiras IPIRANGA e RAIZEN foram semelhantes entre si, mas foram menores em relação às bandeiras OUTRAS e VIBRA ENERGIA e maiores em relação à BRANCA. Além disso, houve diferença significativa nos preços para as bandeiras BRANCA, OUTRAS e VIBRA ENERGIA (e destas em relação às bandeiras IPIRANGA e RAIZEN).
considerando-se o mês de Mar/2022, em virtude do p-valor entre IPIRANGA e RAIZEN (0,16) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço para as bandeiras IPIRANGA e RAIZEN. Já para as demais bandeiras, há diferença significativa nessas distribuições, sendo que o comportamento dos preços foi semelhante ao de Nov/2021.
para o mês de Jun/2022, realmente existe um p-valor (entre OUTRAS e VIBRA ENERGIA) maior que os demais (0,01585), mas ainda está dentro do limite de significância (é menor que alpha). Assim, para todos os pares, inclusive entre as as bandeiras OUTRAS e VIBRA ENERGIA, existiu diferença significativa entre as distribuições do preço de Gasolina comum para todas as bandeiras, podendo-se dizer que houve diferença significativa nos preços praticados desse combustível para todas as bandeiras.
Os mapas do Brasil confeccionados a partir das tabelas contendo as médias e os desvios padrões do valor de venda, para cada um dos combustíveis e para cada mês analisados, utilizando-se a variável qualitativa Estado - Sigla e a quantitativa Valor de Venda, são apresentados seguir. Já as tabelas estão no ANEXO.
#-------
# Tabela com preços médios e desvio padrão
# por estado para os meses de
# nov/21, mar/22 e jun/22, extratificadas pelos
# produtos D S10, D S500, G comum e G aditivada
#-------
ftE11 <- DB_Comb %>%
select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>%
filter(Produto == 'DIESEL S10' &
`Data da Coleta` <= "2022-01-01") %>%
group_by(`Estado - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftE12 <- DB_Comb %>%
select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>%
filter(Produto == 'DIESEL S10' &
(`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01")) %>%
group_by(`Estado - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftE13 <- DB_Comb %>%
select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>%
filter(Produto == 'DIESEL S10' &
`Data da Coleta` > "2022-05-30") %>%
group_by(`Estado - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftE21 <- DB_Comb %>%
select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>%
filter(Produto == 'DIESEL' &
`Data da Coleta` <= "2022-01-01") %>%
group_by(`Estado - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftE22 <- DB_Comb %>%
select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>%
filter(Produto == 'DIESEL' &
(`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01")) %>%
group_by(`Estado - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftE23 <- DB_Comb %>%
select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>%
filter(Produto == 'DIESEL' &
`Data da Coleta` > "2022-05-30") %>%
group_by(`Estado - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftE31 <- DB_Comb %>%
select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>%
filter(Produto == 'GASOLINA' &
`Data da Coleta` <= "2022-01-01") %>%
group_by(`Estado - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftE32 <- DB_Comb %>%
select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>%
filter(Produto == 'GASOLINA' &
(`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01")) %>%
group_by(`Estado - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftE33 <- DB_Comb %>%
select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>%
filter(Produto == 'GASOLINA' &
`Data da Coleta` > "2022-05-30") %>%
group_by(`Estado - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftE41 <- DB_Comb %>%
select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>%
filter(Produto == 'GASOLINA ADITIVADA' &
`Data da Coleta` <= "2022-01-01") %>%
group_by(`Estado - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftE42 <- DB_Comb %>%
select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>%
filter(Produto == 'GASOLINA ADITIVADA' &
(`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01")) %>%
group_by(`Estado - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftE43 <- DB_Comb %>%
select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>%
filter(Produto == 'GASOLINA ADITIVADA' &
`Data da Coleta` > "2022-05-30") %>%
group_by(`Estado - Sigla`) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
#-------
# Apresentar os preços médios dos estados em mapas,
# para os meses de nov/21, mar/22 e jun/22,
# extratificadas pelos
# produtos D S10, D S500, G comum e G aditivada
#-------
# Código do MAPA s10 - Nov/21
mapa1_s10 <- estado %>%
left_join(ftE11, by = c("abbrev_state" = "Estado...Sigla"))
ggplot() +
geom_sf(data=mapa1_s10, aes(fill=preco_med),
color= "black", size=.15) +
labs(subtitle="Mapa 1 - Preço de diesel S10 por estado e DF - Nov/21",
size=10) +
geom_sf_text(data=mapa1_s10,aes(label = abbrev_state),
size=2, color= "black") +
scale_fill_distiller(palette = "Blues",
direction = 1, name="Preço médio",
limits = c(5.2,8.2)) +
theme_minimal() # Código do MAPA s10 - Mar/22
mapa2_s10 <- estado %>%
left_join(ftE12, by = c("abbrev_state" = "Estado...Sigla"))
ggplot() +
geom_sf(data=mapa2_s10, aes(fill=preco_med),
color= "black", size=.15) +
labs(subtitle="Mapa 2 - Preço de diesel S10 por estado e DF - Mar/22",
size=10) +
geom_sf_text(data=mapa2_s10,aes(label = abbrev_state),
size=2, color= "black") +
scale_fill_distiller(palette = "Blues",
direction = 1, name="Preço médio",
limits = c(5.2,8.2)) +
theme_minimal() # Código do MAPA s10 - Jun/22
mapa3_s10 <- estado %>%
left_join(ftE13, by = c("abbrev_state" = "Estado...Sigla"))
ggplot() +
geom_sf(data=mapa3_s10, aes(fill=preco_med),
color= "black", size=.15) +
labs(subtitle="Mapa 3 - Preço de diesel S10 por estado e DF - Jun/22",
size=10) +
geom_sf_text(data=mapa3_s10,aes(label = abbrev_state),
size=2, color= "black") +
scale_fill_distiller(palette = "Blues",
direction = 1, name="Preço médio",
limits = c(5.2,8.2)) +
theme_minimal() # Código do MAPA s500 - Nov/21
mapa1_s500 <- estado %>%
left_join(ftE21, by = c("abbrev_state" = "Estado...Sigla"))
ggplot() +
geom_sf(data=mapa1_s500, aes(fill=preco_med),
color= "black", size=.15) +
labs(subtitle="Mapa 4 - Preço de diesel S500 por estado e DF - Nov/21",
size=10) +
geom_sf_text(data=mapa1_s500,aes(label = abbrev_state),
size=2, color= "black") +
scale_fill_distiller(palette = "Greens",
direction = 1, name="Preço médio",
limits = c(5.1,8.2)) +
theme_minimal() # Código do MAPA s500 - Mar/22
mapa2_s500 <- estado %>%
left_join(ftE22, by = c("abbrev_state" = "Estado...Sigla"))
ggplot() +
geom_sf(data=mapa2_s500, aes(fill=preco_med),
color= "black", size=.15) +
labs(subtitle="Mapa 5 - Preço de diesel S500 por estado e DF - Mar/22",
size=10) +
geom_sf_text(data=mapa2_s500,aes(label = abbrev_state),
size=2, color= "black") +
scale_fill_distiller(palette = "Greens",
direction = 1, name="Preço médio",
limits = c(5.1,8.2)) +
theme_minimal() # Código do MAPA s500 - Jun/22
mapa3_s500 <- estado %>%
left_join(ftE23, by = c("abbrev_state" = "Estado...Sigla"))
ggplot() +
geom_sf(data=mapa3_s500, aes(fill=preco_med),
color= "black", size=.15) +
labs(subtitle="Mapa 6 - Preço de diesel S500 por estado e DF - Jun/22",
size=10) +
geom_sf_text(data=mapa3_s500,aes(label = abbrev_state),
size=2, color= "black") +
scale_fill_distiller(palette = "Greens",
direction = 1, name="Preço médio",
limits = c(5.1,8.2)) +
theme_minimal() # Código do MAPA G.C - Nov/21
mapa1_GC <- estado %>%
left_join(ftE31, by = c("abbrev_state" = "Estado...Sigla"))
ggplot() +
geom_sf(data=mapa1_GC, aes(fill=preco_med),
color= "black", size=.15) +
labs(subtitle="Mapa 7 - Preço de G. comum por estado e DF - Nov/21",
size=10) +
geom_sf_text(data=mapa1_GC,aes(label = abbrev_state),
size=2, color= "black") +
scale_fill_distiller(palette = "Reds",
direction = 1, name="Preço médio",
limits = c(5.9,8)) +
theme_minimal() # Código do MAPA G.C - Mar/22
mapa2_GC <- estado %>%
left_join(ftE32, by = c("abbrev_state" = "Estado...Sigla"))
ggplot() +
geom_sf(data=mapa2_GC, aes(fill=preco_med),
color= "black", size=.15) +
labs(subtitle="Mapa 8 - Preço de G. comum por estado e DF - Mar/22",
size=10) +
geom_sf_text(data=mapa2_GC,aes(label = abbrev_state),
size=2, color= "black") +
scale_fill_distiller(palette = "Reds",
direction = 1, name="Preço médio",
limits = c(5.9,8)) +
theme_minimal() # Código do MAPA G.C - Jun/22
mapa3_GC <- estado %>%
left_join(ftE33, by = c("abbrev_state" = "Estado...Sigla"))
ggplot() +
geom_sf(data=mapa3_GC, aes(fill=preco_med),
color= "black", size=.15) +
labs(subtitle="Mapa 9 - Preço de G. comum por estado e DF - Jun/22",
size=10) +
geom_sf_text(data=mapa3_GC,aes(label = abbrev_state),
size=2, color= "black") +
scale_fill_distiller(palette = "Reds",
direction = 1, name="Preço médio",
limits = c(5.9,8)) +
theme_minimal() # Código do MAPA G.A - Nov/21
mapa1_GA <- estado %>%
left_join(ftE41, by = c("abbrev_state" = "Estado...Sigla"))
ggplot() +
geom_sf(data=mapa1_GA, aes(fill=preco_med),
color= "black", size=.15) +
labs(subtitle="Mapa 10 - Preço de G. aditivada por estado e DF - Nov/21",
size=10) +
geom_sf_text(data=mapa1_GA,aes(label = abbrev_state),
size=2, color= "black") +
scale_fill_distiller(palette = "Oranges",
direction = 1, name="Preço médio",
limits = c(6.3,8.1)) +
theme_minimal() # Código do MAPA G.A - Mar/22
mapa2_GA <- estado %>%
left_join(ftE42, by = c("abbrev_state" = "Estado...Sigla"))
ggplot() +
geom_sf(data=mapa2_GA, aes(fill=preco_med),
color= "black", size=.15) +
labs(subtitle="Mapa 11 - Preço de G. aditivada por estado e DF - Mar/22",
size=10) +
geom_sf_text(data=mapa2_GA,aes(label = abbrev_state),
size=2, color= "black") +
scale_fill_distiller(palette = "Oranges",
direction = 1, name="Preço médio",
limits = c(6.3,8.1)) +
theme_minimal() # Código do MAPA G.A - Jun/22
mapa3_GA <- estado %>%
left_join(ftE43, by = c("abbrev_state" = "Estado...Sigla"))
ggplot() +
geom_sf(data=mapa3_GA, aes(fill=preco_med),
color= "black", size=.15) +
labs(subtitle="Mapa 12 - Preço de G. aditivada por estado e DF - Jun/22",
size=10) +
geom_sf_text(data=mapa3_GA,aes(label = abbrev_state),
size=2, color= "black") +
scale_fill_distiller(palette = "Oranges",
direction = 1, name="Preço médio",
limits = c(6.3,8.1)) +
theme_minimal() Analisando-se os mapas gerados, constatou-se facilmente uma elevação dos preços médios de venda de todos os combustíveis líquidos fósseis, de uma maneira geral, nos estados brasileiros, ao longo do período considerado no estudo. As escalas utilizadas nos mapas foram fixadas para cada combustível para facilitar tal constatação a partir da simples visualização dos mapas.
Alguns fatos chamaram a atenção em relação aos mapas gerados:
No estado do Acre, os preços de venda sempre estiveram elevados ao longo de todo o período analisado, para todos os combustíveis, principalmente o diesel, mas não foi o que experimentou os maiores aumentos nos preços.
Nos estados de Goiás, do Rio Grande do Norte, do Piauí, de Minas Gerais e do Rio de Janeiro, os preços de venda para a gasolina sempre estiveram mais elevados em relação aos demais estados ao longo de todo o período analisado.
No estado do Rio Grande do Sul, os preços de venda do diesel aumentaram, enquanto os da gasolina diminuíram, nos meses analisados.
Nos estados da Bahia e do Piauí, houve os maiores aumentos nos preços dos combustíveis, sobretudo para a gasolina, ao longo de todo o período analisado.
Utilizando-se a expressão para o cálculo de índices de variação do preço do diesel e da gasolina, para os meses novembro/2021-março/2022 e março/2022-junho/2022, obteve-se a tabela a seguir, que contém, além dos referidos índices, o IPCA acumulado entre os meses Nov/2021-Mar/2022 e Abr/2022-Jun/2022, para as principais capitais brasileiras.
#===========
# Análises para Municípios
#===========
ftM11t <- DB_Comb %>%
filter((Produto == 'DIESEL S10' | Produto == 'DIESEL')
& `Data da Coleta` <= "2022-01-01") %>%
select(Municipio,`Valor de Venda`) %>%
group_by(Municipio) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftM12t <- DB_Comb %>%
filter((Produto == 'DIESEL S10' | Produto == 'DIESEL')
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01")) %>%
select(Municipio,`Valor de Venda`) %>%
group_by(Municipio) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftM13t <- DB_Comb %>%
filter((Produto == 'DIESEL S10' | Produto == 'DIESEL')
& `Data da Coleta` > "2022-05-30") %>%
select(Municipio,`Valor de Venda`) %>%
group_by(Municipio) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftM11 <- as_tibble(IPCA$Cidade)
colnames(ftM11)=c("Cidade")
ftM11 <- ftM11 %>%
left_join(ftM11t, by = c("Cidade" = "Municipio")) %>%
left_join(ftM12t, by = c("Cidade" = "Municipio")) %>%
left_join(ftM13t, by = c("Cidade" = "Municipio"))
ftM11[length(ftM11)+1] <-
round((ftM11$preco_med.y - ftM11$preco_med.x)/ftM11$preco_med.x,4)*100
ftM11[length(ftM11)+1] <-
round((ftM11$preco_med - ftM11$preco_med.y)/ftM11$preco_med.y,4)*100
x=names(ftM11)
x[length(ftM11)-1] = "varD_N_M"
x[length(ftM11)] = "varD_M_J"
colnames(ftM11) = x
ftM21t <- DB_Comb %>%
filter((Produto == 'GASOLINA' | Produto == 'GASOLINA ADITIVADA')
& `Data da Coleta` <= "2022-01-01") %>%
select(Municipio,`Valor de Venda`) %>%
group_by(Municipio) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftM22t <- DB_Comb %>%
filter((Produto == 'GASOLINA' | Produto == 'GASOLINA ADITIVADA')
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01")) %>%
select(Municipio,`Valor de Venda`) %>%
group_by(Municipio) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftM23t <- DB_Comb %>%
filter((Produto == 'GASOLINA' | Produto == 'GASOLINA ADITIVADA')
& `Data da Coleta` > "2022-05-30") %>%
select(Municipio,`Valor de Venda`) %>%
group_by(Municipio) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
ftM21 <- as_tibble(IPCA$Cidade)
colnames(ftM21)=c("Cidade")
ftM21 <- ftM21 %>%
left_join(ftM21t, by = c("Cidade" = "Municipio")) %>%
left_join(ftM22t, by = c("Cidade" = "Municipio")) %>%
left_join(ftM23t, by = c("Cidade" = "Municipio"))
ftM21[length(ftM21)+1] <-
round((ftM21$preco_med.y - ftM21$preco_med.x)/ftM21$preco_med.x,4)*100
ftM21[length(ftM21)+1] <-
round((ftM21$preco_med - ftM21$preco_med.y)/ftM21$preco_med.y,4)*100
x=names(ftM21)
x[length(ftM21)-1] = "varG_N_M"
x[length(ftM21)] = "varG_M_J"
colnames(ftM21) = x
IPCA[length(IPCA)+1] <-
round((1+IPCA$nov_21/100)*(1+IPCA$dez_21/100)*(1+IPCA$jan_22/100)*
(1+IPCA$fev_22/100)*(1+IPCA$mar_22/100)-1,4)*100
IPCA[length(IPCA)+1] <-
round((1+IPCA$abr_22/100)*(1+IPCA$mai_22/100)*(1+IPCA$jun_22/100)-1,4)*100
x=names(IPCA)
x[length(IPCA)-1] = "acum_N_M"
x[length(IPCA)] = "acum_A_J"
colnames(IPCA) = x
ftIPCA <- IPCA %>%
left_join(ftM11, by = c("Cidade" = "Cidade")) %>%
left_join(ftM21, by = c("Cidade" = "Cidade"))
ftVIPCA <- ftIPCA %>%
select(Cidade, acum_N_M, varD_N_M, varG_N_M, acum_A_J,
varD_M_J, varG_M_J) %>%
data_frame()
ftVIPCA <- ftVIPCA[order(ftVIPCA$acum_N_M, decreasing=c(TRUE)),]
ftVIPCA <- ftVIPCA %>% flextable()
ftVIPCA <- delete_part(ftVIPCA, part = "header")
ftVIPCA <- add_header(x=ftVIPCA, "Cidade" = "Cidade",
acum_N_M="IPCA Acum.", varD_N_M="Var. Diesel",
varG_N_M="Var. Gasolina", acum_A_J="IPCA Acum.",
varD_M_J="Var. Diesel", varG_M_J="Var. Gasolina",
top = FALSE)
ftVIPCA <- add_header(x=ftVIPCA,
acum_N_M="Nov/21 a Mar/22", varD_N_M="Nov/21 a Mar/22",
varG_N_M="Nov/21 a Mar/22", acum_A_J="Abr/22 a Jun/22",
varD_M_J="Abr/22 a Jun/22", varG_M_J="Abr/22 a Jun/22",
top = TRUE)
ftVIPCA %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Variação acumulada do IPCA e índice de variação dos combustíveis nas capitais")Nov/21 a Mar/22 | Abr/22 a Jun/22 | |||||
Cidade | IPCA Acum. | Var. Diesel | Var. Gasolina | IPCA Acum. | Var. Diesel | Var. Gasolina |
CURITIBA | 5.85 | 23.28 | 10.82 | 1.89 | 14.97 | 2.98 |
GOIANIA | 5.84 | 15.37 | -0.49 | 1.70 | 12.59 | 1.64 |
SALVADOR | 5.81 | 20.75 | 7.82 | 3.23 | 14.50 | 7.94 |
SAO LUIS | 5.72 | 21.27 | 6.85 | 1.83 | 9.95 | 0.69 |
ARACAJU | 5.55 | 12.75 | 3.80 | 2.79 | 12.13 | 3.48 |
CAMPO GRANDE | 5.46 | 15.44 | 2.68 | 2.13 | 16.20 | 2.55 |
RIO DE JANEIRO | 5.27 | 18.42 | 3.21 | 2.36 | 13.01 | 2.80 |
RIO BRANCO | 5.26 | 14.41 | 4.29 | 1.93 | 14.10 | 4.29 |
BELO HORIZONTE | 5.08 | 16.62 | 4.99 | 2.17 | 14.73 | 2.55 |
RECIFE | 5.08 | 14.97 | 4.61 | 2.83 | 14.81 | 5.96 |
FORTALEZA | 4.89 | 15.15 | 2.64 | 3.03 | 15.06 | 4.76 |
SAO PAULO | 4.79 | 17.40 | 5.02 | 2.03 | 13.14 | 1.85 |
VITORIA | 4.76 | 14.96 | 4.71 | 1.36 | 17.91 | 3.52 |
BRASILIA | 4.40 | 13.77 | 0.40 | 2.35 | 13.54 | 4.66 |
BELEM | 4.07 | 17.27 | 5.76 | 1.84 | 13.42 | 1.34 |
PORTO ALEGRE | 3.33 | 14.93 | -7.83 | 2.32 | 14.93 | 4.03 |
Com as informações da tabela anterior e com outros índices de ICPA mensais, foram elaboradas as seguintes matrizes de correlação. Ademais, foram realizados os testes de hipótese de correlação para as variáveis de interesse, procedendo-se, inicialmente, aos testes de normalidade de Shapiro Wilk, com as seguintes hipóteses nula e alternativa:
H0: Dados seguem uma distribuição normal.
H1: Dados não seguem uma distribuição normal.
Em seguida, para as análises de correlações que envolveram somente variáveis com distribuição normal, foram realizados os testes de hipótese de Pearson, com as seguintes hipóteses nula e alternativa:
H0: ρ = 0 (as variáveis não estão correlacionadas).
H1: ρ ≠ 0 (as variáveis estão correlacionadas).
E para as análises de correlações que envolveram ao menos uma variável com distribuição não normal, foram realizados os testes de hipótese de Spearman, com as seguintes hipóteses nula e alternativa:
H0: não há associação monotônica entre as variáveis.
H1: há associação monotônica entre as variáveis.
Os resultados dos testes de hipótese para verificar a existência de correlação entre as variáveis consideradas nas Matrizes de Correlação estão apresentados no ANEXO.
#===========
# Matriz de correlação utilizando-se os dados para os Municípios
#===========
MC_N_M <- ftIPCA %>%
select(varD_N_M, varG_N_M, acum_N_M) %>% cor()
MC_N_M varD_N_M varG_N_M acum_N_M
varD_N_M 1.0000000 0.6261219 0.4131660
varG_N_M 0.6261219 1.0000000 0.6259379
acum_N_M 0.4131660 0.6259379 1.0000000
par(cex.main=1)
corrplot.mixed(MC_N_M, mar = c(0,0,1,0), lower.col = "black", title=
"Matriz de Correlação entre preços de combustíveis e IPCA - Nov/21 a Mar/22")MC_M_J <- ftIPCA %>%
select(varD_M_J, varG_M_J, acum_A_J) %>% cor()
MC_M_J varD_M_J varG_M_J acum_A_J
varD_M_J 1.00000000 0.3991022 -0.04180144
varG_M_J 0.39910222 1.0000000 0.73074661
acum_A_J -0.04180144 0.7307466 1.00000000
corrplot.mixed(MC_M_J, mar = c(0,0,1,0), lower.col = "black", title=
"Matriz de Correlação entre preços de combustíveis e IPCA - Abr/22 a Jun/22")#var de preços de Nov a Mar e IPCA de Mar
MC_N_M_Mar <- ftIPCA %>%
select(varD_N_M, varG_N_M, mar_22) %>% cor()
MC_N_M_Mar varD_N_M varG_N_M mar_22
varD_N_M 1.0000000 0.6261219 0.6313076
varG_N_M 0.6261219 1.0000000 0.2221243
mar_22 0.6313076 0.2221243 1.0000000
corrplot.mixed(MC_N_M_Mar, mar = c(0,0,1,0), lower.col = "black", title=
"Matriz de Correlação entre preços de combustíveis e IPCA de Mar/22")Analisando-se a Matriz de Correlação entre o IPCA acumulado e os índices de variação dos combustíveis para o período Nov/2021 a Mar/2022, observou-se uma correlação positiva e moderada entre o IPCA acumulado no período e os índices de variação dos preços dos combustíveis, sendo que o coeficiente de correlação para o índice da gasolina e o IPCA acumulado (0,63) foi maior do que para o índice do diesel e o IPCA acumulado (0,41).
Em relação à Matriz de Correlação para o período Abr/2022 a Jun/2022, verificou-se uma correlação forte e positiva entre o IPCA acumulado no período e o índice de variação dos preços de gasolina (0,73). Já entre o IPCA acumulado e o índice de variação dos preços de diesel praticamente não houve correlação para o período.
Finalmente, a partir da Matriz de Correlação entre o IPCA do mês de Março/2022 e os índices de variação dos combustíveis para o período Nov/2021 a Mar/2022, notou-se uma correlação positiva e moderada entre tal IPCA e o índice de variação dos preços de diesel (0,63) e uma correlação fraca e positiva entre aquele IPCA e o índice de variação dos preços de gasolina (0,22).
Com exceção da variável correspondente ao IPCA de Março/2022 (que resultou em um p-valor menor que alpha no teste de normalidade, rejeitando a hipótese nula, de normalidade), todas as outras apresentaram distribuição normal, já que seus testes de normalidade resultaram em um p-valor maior que alpha, não rejeitando a hipótese nula de normalidade. Assim, para os testes de hipótese de correlação envolvendo esse IPCA, utilizou-se o método de Spearman, ao passo que para os demais, utilizou-se o método de Pearson.
Verificando-se tais testes, foi possível concluir que existe correlação entre o IPCA acumulado e o índice de variação dos preços de gasolina para os dois períodos analisados nas correlações (Nov/2021 a Mar/2022 e Abr/2022 a Jun/2022), dado que os p-valor resultantes para esses testes foram menores que alpha, devendo-se rejeitar a hipótese nula em favor da alternativa, que diz existir correlação entre as variáveis. De forma semelhante, foi possível concluir que existe correlação entre o IPCA de Mar/2022 e o índice de variação dos preços de diesel para o período de Nov/2021 a Mar/2022, pois o p-valor resultante para esse teste foi menor que alpha, devendo-se rejeitar a hipótese nula. Para os demais testes, como os p-valor resultantes foram maiores que alpha, a hipótese nula não foi rejeitada, o que significa que não há correlação ou associação entre as variáveis.
De uma maneira geral, muito embora exista diferença nos preços de venda dos combustíveis entre revendedores de bandeiras distintas, conforme foi constatado na análise dos resultados, tal diferença se mostra tímida, salvo algumas raras exceções. Como foi visto anteriormente, cerca de 50% desse mercado é dominado por três agentes econômicos (VIBRA ENERGIA, RAIZEN e IPIRANGA), sendo que os revendedores sem bandeira (BRANCA), que perfazem de 30% a 40% do mercado, podem optar por adquirir o combustível de uma distribuidora ligada àqueles agentes dominantes. O resultado seria, realmente, um preço de venda praticado mais equilibrado entre as bandeiras.
O fato de que grande parte do combustível refinado no Brasil esteja concentrado em um agente dominante, que fornece derivados às distribuidoras, também pode contribuir para esse equilíbrio de preços.
De qualquer maneira, invariavelmente, os preços dos combustíveis da VIBRA ENERGIA sempre estiveram, isolada ou conjugadamente, entre os mais elevados, considerando-se o período analisado. Contudo, seria necessário analisar com maiores detalhes o comportamento dos preços de combustíveis, para cada região em separado, para confirmar se essa bandeira pratica, efetivamente, preços mais altos em relação às demais.
Outro ponto importante em relação às bandeiras se deve ao fato de que nem sempre um posto não bandeirado (BRANCA) pratica os menores preços de venda. Além disso, a pulverização desse mercado associada ao baixo Market Share de cada agente não garante uma redução de preços, como foi constatado nas análises dos resultados, haja vista que os preços praticados pela categoria OUTRAS (integração de todos os postos com baixa concentração de mercado) não figuraram, via de regra, entre os mais baixos.
Diversamente da situação relacionada às bandeiras, os preços de venda dos combustíveis praticados nas diferentes regiões brasileiras parecem apresentar maiores desigualdades. De acordo com os resultados analisados, as regiões Norte e Nordeste apresentaram, sobretudo nos meses de 2022 considerados no estudo, preços mais elevados em relação as outras regiões. Do lado oposto, as regiões Sul e Sudeste praticaram preços mais baixos em todo o período analisado.
E é da região Nordeste os estados onde os preços dos combustíveis sofreram maiores aumentos, em especial Bahia e Piauí, como foi verificado na visualização dos mapas mostrados nos resultados. Isso pode estar relacionado à venda da refinaria RLAM pela Petrobras, que está localizada justamente na Bahia e cuja conclusão do negócio foi em novembro de 2021. Ressalta-se que uma empresa privada busca repassar com maior rapidez os aumentos de custos no processo, como os ocorridos em virtude da crise energética gerada pelo conflito entre Rússia e Ucrânia, e ampliar as margens de lucros. E isso pode ser mais relevante no caso de existir poucas (ou nenhuma outra) opções para o fornecimento de derivados refinados, a não ser da refinaria alienada.
Por certo, o destacado privilégio de ampliação das margens de lucros não se reservou somente àquela refinaria privada, mas também à Petrobras, quando passou a adotar a política do PPI, deixando à margem as funções sociais inerentes a essa espécie societária.
Analisando-se de forma ampla, era de se esperar que o efeito do cenário formado, sobretudo em consequência do conflito entre Rússia e Ucrânia, levaria ao aumento dos custos do transporte no Brasil, dado que este é sobremaneira rodoviário e, no caso do transporte de cargas, à base do diesel, que possui maior dependência externa. Tal aumento poderia induzir, por conseguinte, uma elevação do preço dos produtos e dos serviços consumidos pela sociedade, pressionando os índices inflacionários nacionais.
E como foi verificado nos resultados, ocorreu um aumento generalizado dos preços dos combustíveis no Brasil. Além disso, analisando-se os testes de correlação, realmente parece existir uma relação entre o aumento dos preços dos combustíveis e a elevação da inflação para o período estudado, muito embora estudos mais completos devessem ser realizados para confirmar essa tendência e em que janela de tempo se processa, utilizando-se, por exemplo, testes de sensibilidade.
Em todo o caso, a degradação das condições econômicas e sociais no Brasil ocasionada pelo cenário global e, mais especificamente pela elevação dos preços dos combustíveis e da inflação, a partir do final de 2021, poderia ser minimizada com ações mais assertivas e adequadas, por parte das autoridades governamentais, amparadas na “nova” característica de essencialidade conferida aos combustíveis.
Apesar deste estudo focar na análise estatística de períodos temporais curtos e específicos, resta demonstrado que é necessária uma reflexão sobre a condução da política da Petrobras e da estrutura do mercado de refino e de derivados de petróleo no Brasil, sobretudo por parte das autoridades governamentais, executivas e legislativas.
A alienação dos ativos da Petrobras, pertencentes aos elos mais próximos ao consumidor, vem se demonstrando ineficaz, ao menos no curto prazo, uma vez que a finalidade principal buscada não está sendo alcançada: a redução dos preços praticados no mercado de derivados do petróleo, o que poderia induzir uma melhora do bem estar social da população brasileira.
Outrossim, a política de precificação adotada por essa empresa de economia mista não só vem sendo ineficaz quanto as suas funções sociais, mas também deletéria às condições econômicas e sociais brasileiras a partir da implementação do Preço de Paridade de Importação. A crise nacional dos combustíveis gerada pelo cenário internacional, especialmente pelo conflito entre Rússia e Ucrânia, é mais que suficiente para evidenciar que essa espécie de sociedade, dominada de certa forma pelo Governo, não pode escantear certos preceitos constitucionais e legais relacionados à função social pretendida por empresas assim constituídas pelo Estado brasileiro.
Portanto, as autoridades governamentais brasileiras devem tomar uma decisão em relação à condução das políticas delineadas pela Petrobras e à reestruturação do mercado nacional de petróleo. Optando pela continuidade dos planos associados a esse tema e iniciados em 2016, deveriam ser modificados e/ou criados institutos legais que possam garantir uma atuação dos agentes econômicos no sentido de propiciar uma efetiva melhora do bem estar social para toda a população brasileira e não somente para a sociedade empresária.
ANP - Agência Nacional do Petróleo, Gás Natural e Biocombustíveis (2022a). Relatório de Gestão da ANP 2021. Disponível em https://www.gov.br/anp/pt-br/acesso-a-informacao/transparencia/rg/relatoriogestao-2021-pdf.pdf. Acesso em: 28 de jan 2023.
ANP - Agência Nacional do Petróleo, Gás Natural e Biocombustíveis (2022b). Síntese Mensal de Comercialização de Combustíveis. Disponível em https://www.gov.br/anp/pt-br/centrais-de-conteudo/publicacoes/sinteses/scc/2022/sintese-volume-novembro.pdf. Acesso em: 28 de jan 2023.
ANP - Agência Nacional do Petróleo, Gás Natural e Biocombustíveis (2021). Síntese Mensal de Comercialização de Combustíveis. Disponível em https://www.gov.br/anp/pt-br/centrais-de-conteudo/publicacoes/sinteses/scc/2021/sintese-volume-dezembro-2021.pdf. Acesso em: 28 de jan 2023.
EPE - Empresa de Pesquisa Energética (2022). Perspectivas para o Mercado Brasileiro de Combustíveis no Curto Prazo. Disponível em: https://www.epe.gov.br/sites-pt/publicacoes-dados-abertos/publicacoes/PublicacoesArquivos/publicacao-594/topico-620/Perspectivas%20para%20o%20Mercado%20Brasileiro%20de%20Combust%C3%ADveis%20no%20Curto%20Prazo_2022-12.pdf. Acesso em: 28 jan 2023.
MINISTÉRIO DE MINAS E ENERGIA (2019). Estudos do art. 2º da Resolução CNPE nº 12/2019. Disponível em: https://www.gov.br/mme/pt-br/assuntos/secretarias/petroleo-gas-natural-e-biocombustiveis/abastece-brasil/resolucao-cnpe-no-12-2019/RelatrioRCNPE122019v12.pdf. Acesso em: 28 jan 2023.
PETROBRAS - PETRÓLEO BRASILEIRO S.A. (2019). Plano de Negócios e Gestão 2019 - Plano de Negócios e Gestão 2017-2021 (PNG 2017-2021). Disponível em: https://www.investidorpetrobras.com.br/apresentacoes-relatorios-e-eventos/apresentacoes/. Acesso em: 27 de jan. 2023.
MINISTÉRIO DE MINAS E ENERGIA (2020). Subcomitê Novo Cenário Downstream - Tema: Infraestrutura para movimentação de derivados de petróleo. Disponível em: < https://www.gov.br/mme/pt-br/assuntos/secretarias/petroleo-gas-natural-e-biocombustiveis/abastece-brasil/subcomites/RelatrioSubcomitNovoCenrioDownstreamInfraestruturav19v2final.pdf>. Acesso em: 28 jan 2023.
ALVARENGA, D. Petrobras em números: veja evolução do lucro, produção, dividendos, nº de funcionários e valor de mercado. G1, 2022. Disponível em: < https://g1.globo.com/economia/noticia/2022/03/31/petrobras-em-numeros-veja-evolucao-do-lucro-producao-dividendos-no-de-funcionarios-e-valor-de-mercado.ghtml>. Acesso em: 29 jan 2023.
PAMPLONA, N. Petrobras tem lucro recorde de R$ 106 bi e anuncia mais R$ 37 bi em dividendos. Folha, 2022. Disponível em: https://www1.folha.uol.com.br/mercado/2022/02/lucro-da-petrobras-passa-de-r-100-bilhoes-e-empresa-anuncia-mais-r-37-bilhoes-em-dividendos.shtml. Acesso em: 29 jan 2023.
FERRARI, H. Petrobras não é mais sócia da BR Distribuidora e recebe R$ 11,4 bilhões. Poder360, 2021. Disponível em: <https://www.poder360.com.br/economia/petrobras-nao-e-mais-socia-da-br-distribuidora-e-recebe-r-114-bilhoes/ >. Acesso em: 28 jan 2023.
PETROBRAS - PETRÓLEO BRASILEIRO S.A. (2019). Fatos e Dados - Concluímos venda da Refinaria Landulpho Alves (RLAM) para o Mubadala Capital. Disponível em: https://petrobras.com.br/fatos-e-dados/concluimos-venda-da-refinaria-landulpho-alves-rlam-para-o-mubadala-capital.htm. Acesso em: 29 de jan. 2023.
DUTT-ROSS, S. Manual de Análise de Dados. Rio de Janeiro, 2020. JELIHOVSCHI, E. Análise Exploratória de Dados usando o R. Bahia: Editora da UESC, 2014.
ASSUNÇÃO, R. Fundamentos Estatísticos de Ciência dos Dados - voltado para aplicações. 2017.
Os demais resultados obtidos a partir das análises e não apresentados na seção Resultados podem ser vistos a seguir. Adicionalmente, foram gerados resultados para uma avaliação dos preços nas regiões brasileiras por bandeira, porém, não foram analisados em virtude da complexidade que geraria, fugindo ao propósito do trabalho. Contudo, para a complementação e detalhamento de análises, discussões e conclusões, recomenda-se a análise de tal tópico.
Resultados referentes às análises dos preços por região. Histogramas e boxplots:
#-------
# Boxplots e Histogramas referentes às Tabelas
# com preços médios e desvio padrão
# por região para os meses de nov/21, mar/22 e
# jun/22, extratificadas pelos
# produtos D S10, D S500, G comum e G aditivada
#-------
hist(ftT21BP$`Valor de Venda`, main = "Histograma de preços de Diesel S500 - Nov/21",
col="Green", xlab="R$", ylab="Frequência")hist(ftT22BP$`Valor de Venda`, main = "Histograma de preços de Diesel S500 - Mar/22",
col="Green", xlab="R$", ylab="Frequência")hist(ftT23BP$`Valor de Venda`, main = "Histograma de preços de Diesel S500 - Jun/22",
col="Green", xlab="R$", ylab="Frequência")hist(ftT41BP$`Valor de Venda`, main = "Histograma de preços de Gas. aditivada - Nov/21",
col="Orange", xlab="R$", ylab="Frequência")hist(ftT42BP$`Valor de Venda`, main = "Histograma de preços de Gas. aditivada - Mar/22",
col="Orange", xlab="R$", ylab="Frequência")hist(ftT43BP$`Valor de Venda`, main = "Histograma de preços de Gas. aditivada - Jun/22",
col="Orange", xlab="R$", ylab="Frequência")boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT21BP,
main="Boxplot de preços de Diesel S500 por região - Nov/21",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT22BP,
main="Boxplot de preços de Diesel S500 por região - Mar/22",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT23BP,
main="Boxplot de preços de Diesel S500 por região - Jun/22",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT41BP,
main="Boxplot de preços de Gas. aditivada por região - Nov/21",
ylim = c(5.5,9.5), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT42BP,
main="Boxplot de preços de Gas. aditivada por região - Mar/22",
ylim = c(5.5,9.5), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT43BP,
main="Boxplot de preços de Gas. aditivada por região - Jun/22",
ylim = c(5.5,9.5), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)Testes de hipóteses:
#---------
# Testes de Hipóteses
#-------
# Verificar se para cada período e combustível
# existe alguma região que pratica preço diferenciado
# (maior ou menor)
#------------------------------------------------------
# Para D. S500 e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModT21 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT21BP)
ResT21 <- residuals(ModT21)
lillie.test(ResT21)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResT21
D = 0.058715, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT21BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 3156.3, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT21 <- pairwise.wilcox.test(ftT21BP$`Valor de Venda`,
ftT21BP$`Regiao - Sigla`,
p.adjust.method="fdr")
ModT21
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftT21BP$`Valor de Venda` and ftT21BP$`Regiao - Sigla`
CO N NE S
N <2e-16 - - -
NE 0.0099 <2e-16 - -
S <2e-16 <2e-16 <2e-16 -
SE <2e-16 <2e-16 <2e-16 <2e-16
P value adjustment method: fdr
# De acordo com o resultado desse teste, realmente existe um p-valor
# (entre CO e NE) que é bem maior que os demais (0,0099), mas
# ainda está dentro do limite de significância (é menor que alpha)
# Assim, deve-se Rej H0 para todos os pares, inclusive entre as
# regiões Centro-Oeste e Nordeste, indicando que existe diferença
# significativa entre as distribuições do preço de D.S500 para todas
# as regiões. Assim, pode-se dizer que há diferença significativa
# nos preços praticados desse combustível em todas as regiões,
# considerando-se o mês de nov/2021.
#------------------------------------------------------
# Para D. S500 e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModT22 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT22BP)
ResT22 <- residuals(ModT22)
lillie.test(ResT22)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResT22
D = 0.10956, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT22BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 991.96, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT22 <- pairwise.wilcox.test(ftT22BP$`Valor de Venda`,
ftT22BP$`Regiao - Sigla`,
p.adjust.method="fdr")
ModT22
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftT22BP$`Valor de Venda` and ftT22BP$`Regiao - Sigla`
CO N NE S
N < 2e-16 - - -
NE 2.4e-10 0.0036 - -
S < 2e-16 < 2e-16 < 2e-16 -
SE < 2e-16 < 2e-16 < 2e-16 4.2e-05
P value adjustment method: fdr
# De acordo com o resultado desse teste, realmente existe um p-valor
# (entre N e NE) que é maior que os demais (0,0036), mas
# ainda está dentro do limite de significância (é menor que alpha)
# Assim, deve-se Rej H0 para todos os pares, inclusive entre as
# regiões Norte e Nordeste, indicando que existe diferença
# significativa entre as distribuições do preço de D.S500 para todas
# as regiões. Assim, pode-se dizer que há diferença significativa
# nos preços praticados desse combustível em todas as regiões,
# considerando-se o mês de mar/2022.
#------------------------------------------------------
# Para D. S500 e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModT23 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT23BP)
ResT23 <- residuals(ModT23)
lillie.test(ResT23)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResT23
D = 0.062565, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT23BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 1705, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT23 <- pairwise.wilcox.test(ftT23BP$`Valor de Venda`,
ftT23BP$`Regiao - Sigla`,
p.adjust.method="fdr")
ModT23
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftT23BP$`Valor de Venda` and ftT23BP$`Regiao - Sigla`
CO N NE S
N < 2e-16 - - -
NE < 2e-16 0.79 - -
S < 2e-16 < 2e-16 < 2e-16 -
SE < 2e-16 < 2e-16 < 2e-16 7.2e-13
P value adjustment method: fdr
# De acordo com o resultado desse teste, em virtude dO p-valor
# entre NE e N (0,79) ser maior que alpha, não se deve Rej H0
# para esse par, indicando que não existe diferença significativa
# entre as distribuições do preço de D.S500 nas regiões Norte e
# Nordeste. Já nas demais regiões, há diferença significativa
# nas distribuições do preço de D.S500. Assim, pode-se dizer que
# os preços de D.S500 praticados nas regiões Norte e Nordeste são
# semelhantes entre si e maiores em relação a outras regiões e que
# há diferença significativa nos preços desse combustível nas
# regiões Centro-Oeste, Sul e Sudeste (e destas em relação às regiões
# Norte e Nordeste), considerando-se o mês de jun/2022.
#------------------------------------------------------
#------------------------------------------------------
# Para G. aditivada e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModT41 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT41BP)
ResT41 <- residuals(ModT41)
lillie.test(ResT41)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResT41
D = 0.081472, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT41BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 573.85, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT41 <- pairwise.wilcox.test(ftT41BP$`Valor de Venda`,
ftT41BP$`Regiao - Sigla`,
p.adjust.method="fdr")
ModT41
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftT41BP$`Valor de Venda` and ftT41BP$`Regiao - Sigla`
CO N NE S
N < 2e-16 - - -
NE < 2e-16 1.3e-05 - -
S < 2e-16 0.41 1.1e-06 -
SE < 2e-16 1.0e-09 < 2e-16 < 2e-16
P value adjustment method: fdr
# De acordo com o resultado desse teste, em virtude dO p-valor
# entre S e N (0,41) ser maior que alpha, não se deve Rej H0
# para esse par, indicando que não existe diferença significativa
# entre as distribuições do preço de G.aditivada nas regiões Norte
# e Sul. Assim, excluindo-se o par S e N, há diferença significativa nas
# distribuições do preço de G.aditivada nas regiões. Logo, pode-se dizer
# que os preços de G.aditivada praticados nas regiões Norte e Sul são
# semelhantes entre si, mas são maiores em relação à região Sudeste
# e menores em relação às demais. Além disso,
# há diferença significativa nos preços desse combustível nas
# regiões Centro-Oeste, Nordeste e Sudeste (e destas em relação às regiões
# Norte e Sul), considerando-se o mês de nov/2021.
#------------------------------------------------------
# Para G. aditivada e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModT42 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT42BP)
ResT42 <- residuals(ModT42)
lillie.test(ResT42)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResT42
D = 0.03309, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT42BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 1293.4, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT42 <- pairwise.wilcox.test(ftT42BP$`Valor de Venda`,
ftT42BP$`Regiao - Sigla`,
p.adjust.method="fdr")
ModT42
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftT42BP$`Valor de Venda` and ftT42BP$`Regiao - Sigla`
CO N NE S
N <2e-16 - - -
NE <2e-16 0.0067 - -
S <2e-16 <2e-16 <2e-16 -
SE 0.0012 <2e-16 <2e-16 <2e-16
P value adjustment method: fdr
# De acordo com o resultado desse teste, realmente existe dois p-valor
# (entre N e NE e entre CO e SE) que são maiores que os demais (0,0067
# e 0,0012), mas ainda estão dentro do limite de significância
# (é menor que alpha). Assim, deve-se Rej H0 para todos os pares,
# inclusive entre as regiões Norte e Nordeste e Centro-Oeste e Sudeste,
# indicando que existe diferença significativa entre as distribuições
# do preço de G.aditivada para todas as regiões.
# Assim, pode-se dizer que há diferença significativa
# nos preços praticados desse combustível em todas as regiões,
# considerando-se o mês de mar/2022.
#------------------------------------------------------
# Para G. aditivada e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModT43 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT43BP)
ResT43 <- residuals(ModT43)
lillie.test(ResT43)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResT43
D = 0.045141, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT43BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 3193.4, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT43 <- pairwise.wilcox.test(ftT43BP$`Valor de Venda`,
ftT43BP$`Regiao - Sigla`,
p.adjust.method="fdr")
ModT43
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftT43BP$`Valor de Venda` and ftT43BP$`Regiao - Sigla`
CO N NE S
N < 2e-16 - - -
NE < 2e-16 < 2e-16 - -
S < 2e-16 < 2e-16 < 2e-16 -
SE 9.2e-05 < 2e-16 < 2e-16 < 2e-16
P value adjustment method: fdr
# De acordo com o resultado desse teste, todos os valores
# de p-valor para os pares de todas as regiões estão
# abaixo de alpha. Assim, deve-se Rej H0 para todos os
# pares de regiões, indicando que existe diferença
# significativa entre as distribuições do preço de
# G.aditivada para todas as regiões.
# Assim, pode-se dizer que há diferença significativa nos
# preços praticados desse combustível em todas as regiões,
# considerando-se o mês de jun/2022.
#------------------------------------------------------
#------------------------------------------------------Resultados referentes às análises dos preços no Brasil por bandeiras. Tabelas:
#---------
# Tabela em num abs
#-------
# Tabelas indicando quantidades de estabelecimentos de
# determinada bandeira no Brasil para os produtos
# D S10, D S500, G comum e G aditivada
#-------
DB_Comb %>%
tabyl(Bandeira,Produto) %>%
flextable() %>% theme_zebra() %>%
set_caption(caption = "Frequência de cada BANDEIRA por PRODUTO na BD")Bandeira | DIESEL | DIESEL S10 | GASOLINA | GASOLINA ADITIVADA |
ALESAT | 724 | 1,253 | 1,614 | 1,003 |
AMERICANOIL | 39 | 39 | 34 | 43 |
ATEMS | 234 | 274 | 335 | 266 |
ATLÂNTICA | 35 | 59 | 65 | 50 |
BRANCA | 12,229 | 19,876 | 26,424 | 16,021 |
CHARRUA | 73 | 93 | 119 | 116 |
CIAPETRO | 96 | 125 | 129 | 82 |
DIBRAPE | 28 | 39 | 42 | 37 |
DISLUB | 24 | 110 | 125 | 103 |
EQUADOR | 208 | 230 | 267 | 221 |
ESTRADA | 1 | 1 | 1 | 1 |
FAN | 24 | 38 | 46 | 15 |
FEDERAL ENERGIA | 23 | 28 | 41 | 18 |
IDAZA | 86 | 116 | 119 | 96 |
IPIRANGA | 4,835 | 9,751 | 11,240 | 9,591 |
LARCO | 25 | 30 | 30 | 28 |
MASUT DISTRIBUIDORA | 27 | 30 | 33 | 24 |
MAXSUL | 18 | 89 | 84 | 88 |
MONTEPETRO | 24 | 24 | 24 | 24 |
PELIKANO | 9 | 9 | 9 | 9 |
PETROBAHIA | 19 | 38 | 41 | 32 |
PETROSERRA | 25 | 17 | 31 | 17 |
PETROX DISTRIBUIDORA | 31 | 109 | 111 | 96 |
PODIUM | 0 | 1 | 1 | 1 |
POTENCIAL | 41 | 50 | 64 | 60 |
RAIZEN | 4,414 | 9,072 | 10,644 | 9,249 |
RAIZEN MIME | 84 | 271 | 373 | 307 |
REJAILE | 4 | 11 | 11 | 11 |
RIO BRANCO | 57 | 76 | 89 | 59 |
RODOIL | 185 | 310 | 387 | 369 |
ROYAL FIC | 18 | 10 | 18 | 18 |
RUFF C.J. | 0 | 11 | 11 | 0 |
RZD DISTRIBUIDORA | 0 | 16 | 16 | 16 |
SABBÁ | 495 | 821 | 904 | 742 |
SETTA DISTRIBUIDORA | 15 | 66 | 65 | 36 |
SIMARELLI | 38 | 69 | 65 | 43 |
SMALL | 19 | 20 | 31 | 27 |
SP | 72 | 273 | 301 | 186 |
STANG | 102 | 132 | 141 | 135 |
SUL COMBUSTÍVEIS | 30 | 32 | 33 | 31 |
TAURUS | 200 | 221 | 245 | 72 |
TDC DISTRIBUIDORA | 2 | 51 | 64 | 60 |
TEMAPE | 13 | 41 | 55 | 38 |
TOBRAS | 0 | 2 | 4 | 2 |
TORRAO | 6 | 20 | 22 | 19 |
TOTALENERGIES | 52 | 80 | 116 | 50 |
UNI | 0 | 7 | 11 | 11 |
VIBRA ENERGIA | 6,466 | 12,877 | 14,282 | 12,198 |
WALENDOWSKY | 12 | 12 | 12 | 12 |
WATT | 22 | 22 | 22 | 10 |
# Tabela em num relativos - por coluna
#-------
# Tabelas indicando percentuais de estabelecimentos de
# determinada bandeira no Brasil para os produtos
# D S10, D S500, G comum e G aditivada
#-------
DB_Comb %>%
tabyl(Bandeira,Produto) %>%
adorn_percentages("col") %>%
adorn_pct_formatting(digits = 2) %>%
flextable() %>% theme_zebra() %>%
set_caption(caption = "Frequência relativa de cada BANDEIRA por PRODUTO na BD")Bandeira | DIESEL | DIESEL S10 | GASOLINA | GASOLINA ADITIVADA |
ALESAT | 2.32% | 2.20% | 2.34% | 1.94% |
AMERICANOIL | 0.13% | 0.07% | 0.05% | 0.08% |
ATEMS | 0.75% | 0.48% | 0.49% | 0.51% |
ATLÂNTICA | 0.11% | 0.10% | 0.09% | 0.10% |
BRANCA | 39.22% | 34.90% | 38.32% | 30.96% |
CHARRUA | 0.23% | 0.16% | 0.17% | 0.22% |
CIAPETRO | 0.31% | 0.22% | 0.19% | 0.16% |
DIBRAPE | 0.09% | 0.07% | 0.06% | 0.07% |
DISLUB | 0.08% | 0.19% | 0.18% | 0.20% |
EQUADOR | 0.67% | 0.40% | 0.39% | 0.43% |
ESTRADA | 0.00% | 0.00% | 0.00% | 0.00% |
FAN | 0.08% | 0.07% | 0.07% | 0.03% |
FEDERAL ENERGIA | 0.07% | 0.05% | 0.06% | 0.03% |
IDAZA | 0.28% | 0.20% | 0.17% | 0.19% |
IPIRANGA | 15.50% | 17.12% | 16.30% | 18.54% |
LARCO | 0.08% | 0.05% | 0.04% | 0.05% |
MASUT DISTRIBUIDORA | 0.09% | 0.05% | 0.05% | 0.05% |
MAXSUL | 0.06% | 0.16% | 0.12% | 0.17% |
MONTEPETRO | 0.08% | 0.04% | 0.03% | 0.05% |
PELIKANO | 0.03% | 0.02% | 0.01% | 0.02% |
PETROBAHIA | 0.06% | 0.07% | 0.06% | 0.06% |
PETROSERRA | 0.08% | 0.03% | 0.04% | 0.03% |
PETROX DISTRIBUIDORA | 0.10% | 0.19% | 0.16% | 0.19% |
PODIUM | 0.00% | 0.00% | 0.00% | 0.00% |
POTENCIAL | 0.13% | 0.09% | 0.09% | 0.12% |
RAIZEN | 14.15% | 15.93% | 15.44% | 17.87% |
RAIZEN MIME | 0.27% | 0.48% | 0.54% | 0.59% |
REJAILE | 0.01% | 0.02% | 0.02% | 0.02% |
RIO BRANCO | 0.18% | 0.13% | 0.13% | 0.11% |
RODOIL | 0.59% | 0.54% | 0.56% | 0.71% |
ROYAL FIC | 0.06% | 0.02% | 0.03% | 0.03% |
RUFF C.J. | 0.00% | 0.02% | 0.02% | 0.00% |
RZD DISTRIBUIDORA | 0.00% | 0.03% | 0.02% | 0.03% |
SABBÁ | 1.59% | 1.44% | 1.31% | 1.43% |
SETTA DISTRIBUIDORA | 0.05% | 0.12% | 0.09% | 0.07% |
SIMARELLI | 0.12% | 0.12% | 0.09% | 0.08% |
SMALL | 0.06% | 0.04% | 0.04% | 0.05% |
SP | 0.23% | 0.48% | 0.44% | 0.36% |
STANG | 0.33% | 0.23% | 0.20% | 0.26% |
SUL COMBUSTÍVEIS | 0.10% | 0.06% | 0.05% | 0.06% |
TAURUS | 0.64% | 0.39% | 0.36% | 0.14% |
TDC DISTRIBUIDORA | 0.01% | 0.09% | 0.09% | 0.12% |
TEMAPE | 0.04% | 0.07% | 0.08% | 0.07% |
TOBRAS | 0.00% | 0.00% | 0.01% | 0.00% |
TORRAO | 0.02% | 0.04% | 0.03% | 0.04% |
TOTALENERGIES | 0.17% | 0.14% | 0.17% | 0.10% |
UNI | 0.00% | 0.01% | 0.02% | 0.02% |
VIBRA ENERGIA | 20.73% | 22.61% | 20.71% | 23.57% |
WALENDOWSKY | 0.04% | 0.02% | 0.02% | 0.02% |
WATT | 0.07% | 0.04% | 0.03% | 0.02% |
Boxplots:
#-------
# Tabelas com preços médios e desvio padrão
# por bandeira no Brasil para os meses de
# nov/21, mar/22 e jun/22, extratificadas pelos
# produtos D S10, D S500, G comum e G aditivada
#-------
boxplot(`Valor de Venda`~Bandeira,data=ftB11BP,
main="Boxplot de preços de D.S10 por bandeira - Nov/21",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~Bandeira,data=ftB12BP,
main="Boxplot de preços de D.S10 por bandeira - Mar/22",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~Bandeira,data=ftB13BP,
main="Boxplot de preços de D.S10 por bandeira - Jun/22",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~Bandeira,data=ftB21BP,
main="Boxplot de preços de D.S500 por bandeira - Nov/21",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~Bandeira,data=ftB22BP,
main="Boxplot de preços de D.S500 por bandeira - Mar/22",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~Bandeira,data=ftB23BP,
main="Boxplot de preços de D.S500 por bandeira - Jun/22",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~Bandeira,data=ftB31BP,
main="Boxplot de preços de G.comum por bandeira - Nov/21",
ylim = c(5,10), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~Bandeira,data=ftB32BP,
main="Boxplot de preços de G.comum por bandeira - Mar/22",
ylim = c(5,10), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~Bandeira,data=ftB33BP,
main="Boxplot de preços de G.comum por bandeira - Jun/22",
ylim = c(5,10), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~Bandeira,data=ftB41BP,
main="Boxplot de preços de G.aditivada por bandeira - Nov/21",
ylim = c(5,10), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~Bandeira,data=ftB42BP,
main="Boxplot de preços de G.aditivada por bandeira - Mar/22",
ylim = c(5,10), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)boxplot(`Valor de Venda`~Bandeira,data=ftB43BP,
main="Boxplot de preços de G.aditivada por bandeira - Jun/22",
ylim = c(5,10), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)Testes de hipóteses:
#---------
# Testes de Hipóteses
# alpha:0,05
# Se pvalor for menor que 0,05 Rej H0
# Se pvalor for maior que 0,05 Não Rej H0
#-------
# Verificar se para cada período e combustível
# existe alguma bandeira que pratica preço diferenciado
# (maior ou menor)
#------------------------------------------------------
# Para D. S500 e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModB21 <- aov(`Valor de Venda`~Bandeira,data=ftB21BP)
ResB21 <- residuals(ModB21)
lillie.test(ResB21)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResB21
D = 0.068897, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB21BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 497.73, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB21 <- pairwise.wilcox.test(ftB21BP$`Valor de Venda`,
ftB21BP$Bandeira,
p.adjust.method="fdr")
ModB21
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftB21BP$`Valor de Venda` and ftB21BP$Bandeira
BRANCA IPIRANGA OUTRAS RAIZEN
IPIRANGA 3.2e-09 - - -
OUTRAS < 2e-16 2.6e-12 - -
RAIZEN 7.7e-07 0.396 2.8e-15 -
VIBRA ENERGIA < 2e-16 < 2e-16 0.038 < 2e-16
P value adjustment method: fdr
#------------------------------------------------------
# Para D. S500 e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModB22 <- aov(`Valor de Venda`~Bandeira,data=ftB22BP)
ResB22 <- residuals(ModB22)
lillie.test(ResB22)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResB22
D = 0.078789, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB22BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 66.321, df = 4, p-value = 1.356e-13
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB22 <- pairwise.wilcox.test(ftB22BP$`Valor de Venda`,
ftB22BP$Bandeira,
p.adjust.method="fdr")
ModB22
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftB22BP$`Valor de Venda` and ftB22BP$Bandeira
BRANCA IPIRANGA OUTRAS RAIZEN
IPIRANGA 0.58610 - - -
OUTRAS 5.9e-06 0.00021 - -
RAIZEN 0.03636 0.02508 6.4e-08 -
VIBRA ENERGIA 1.2e-07 8.3e-05 0.58610 7.4e-10
P value adjustment method: fdr
#------------------------------------------------------
# Para D. S500 e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModB23 <- aov(`Valor de Venda`~Bandeira,data=ftB23BP)
ResB23 <- residuals(ModB23)
lillie.test(ResB23)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResB23
D = 0.066179, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB23BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 165.86, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB23 <- pairwise.wilcox.test(ftB23BP$`Valor de Venda`,
ftB23BP$Bandeira,
p.adjust.method="fdr")
ModB23
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftB23BP$`Valor de Venda` and ftB23BP$Bandeira
BRANCA IPIRANGA OUTRAS RAIZEN
IPIRANGA 3.2e-09 - - -
OUTRAS < 2e-16 0.00073 - -
RAIZEN 0.08973 0.00041 5.2e-11 -
VIBRA ENERGIA < 2e-16 0.00324 0.34902 3.7e-11
P value adjustment method: fdr
#------------------------------------------------------
#------------------------------------------------------
# Para G. aditivada e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModB41 <- aov(`Valor de Venda`~Bandeira,data=ftB41BP)
ResB41 <- residuals(ModB41)
lillie.test(ResB41)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResB41
D = 0.064691, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB41BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 857.96, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB41 <- pairwise.wilcox.test(ftB41BP$`Valor de Venda`,
ftB41BP$Bandeira,
p.adjust.method="fdr")
ModB41
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftB41BP$`Valor de Venda` and ftB41BP$Bandeira
BRANCA IPIRANGA OUTRAS RAIZEN
IPIRANGA < 2e-16 - - -
OUTRAS < 2e-16 2e-04 - -
RAIZEN < 2e-16 1.8e-05 2.9e-13 -
VIBRA ENERGIA < 2e-16 5.8e-12 < 2e-16 2e-02
P value adjustment method: fdr
#------------------------------------------------------
# Para G. aditivada e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModB42 <- aov(`Valor de Venda`~Bandeira,data=ftB42BP)
ResB42 <- residuals(ModB42)
lillie.test(ResB42)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResB42
D = 0.033396, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB42BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 511.86, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB42 <- pairwise.wilcox.test(ftB42BP$`Valor de Venda`,
ftB42BP$Bandeira,
p.adjust.method="fdr")
ModB42
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftB42BP$`Valor de Venda` and ftB42BP$Bandeira
BRANCA IPIRANGA OUTRAS RAIZEN
IPIRANGA < 2e-16 - - -
OUTRAS < 2e-16 0.01018 - -
RAIZEN < 2e-16 8.9e-05 0.40497 -
VIBRA ENERGIA < 2e-16 1.6e-15 8.9e-05 0.00057
P value adjustment method: fdr
#------------------------------------------------------
# Para G. aditivada e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição normal
# H1: dados não seguem distribuição normal
ModB43 <- aov(`Valor de Venda`~Bandeira,data=ftB43BP)
ResB43 <- residuals(ModB43)
lillie.test(ResB43)
Lilliefors (Kolmogorov-Smirnov) normality test
data: ResB43
D = 0.045707, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente
# (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB43BP)
Kruskal-Wallis rank sum test
data: Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 548.1, df = 4, p-value < 2.2e-16
# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB43 <- pairwise.wilcox.test(ftB43BP$`Valor de Venda`,
ftB43BP$Bandeira,
p.adjust.method="fdr")
ModB43
Pairwise comparisons using Wilcoxon rank sum test with continuity correction
data: ftB43BP$`Valor de Venda` and ftB43BP$Bandeira
BRANCA IPIRANGA OUTRAS RAIZEN
IPIRANGA < 2e-16 - - -
OUTRAS < 2e-16 0.00013 - -
RAIZEN < 2e-16 5.2e-13 0.00548 -
VIBRA ENERGIA < 2e-16 < 2e-16 6.2e-11 0.00067
P value adjustment method: fdr
#------------------------------------------------------
#------------------------------------------------------Resultados referentes às análises dos preços por estados. Tabelas:
#-------
# Tabela com preços médios e desvio padrão
# por estado para os meses de
# nov/21, mar/22 e jun/22, extratificadas pelos
# produtos D S10, D S500, G comum e G aditivada
#-------
ftE1 <- ftE11 %>%
left_join(ftE12, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
left_join(ftE13, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
flextable()
ftE1 <- delete_part(ftE1, part = "header")
ftE1 <- add_header(x=ftE1, Estado...Sigla = "Estado",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftE1 <- add_header(x=ftE1,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftE1 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios do DIESEL S10 por ESTADO")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Estado | Preço | DP | Preço | DP | Preço | DP |
AC | 6.2445 | 0.2619 | 7.1195 | 0.5599 | 8.1442 | 0.4384 |
AL | 5.6766 | 0.2059 | 6.7044 | 0.5955 | 7.5265 | 0.4861 |
AM | 5.5266 | 0.3011 | 6.5130 | 0.5621 | 7.4607 | 0.5390 |
AP | 5.5725 | 0.3164 | 6.2785 | 0.4563 | 7.3349 | 0.4192 |
BA | 5.5597 | 0.1620 | 6.7885 | 0.4872 | 7.8434 | 0.4903 |
CE | 5.7415 | 0.1580 | 6.5928 | 0.5787 | 7.6167 | 0.4274 |
DF | 5.6777 | 0.1604 | 6.4278 | 0.6215 | 7.3227 | 0.3877 |
ES | 5.2339 | 0.1565 | 6.0525 | 0.4736 | 7.0890 | 0.4428 |
GO | 5.6878 | 0.1942 | 6.5703 | 0.6011 | 7.3362 | 0.3915 |
MA | 5.4165 | 0.1094 | 6.5953 | 0.5559 | 7.4056 | 0.4092 |
MG | 5.4670 | 0.1513 | 6.3785 | 0.5313 | 7.3407 | 0.3989 |
MS | 5.3746 | 0.1809 | 6.2901 | 0.5266 | 7.2130 | 0.3787 |
MT | 5.8196 | 0.1878 | 6.6421 | 0.4903 | 7.5864 | 0.4464 |
PA | 5.7232 | 0.2109 | 6.7216 | 0.5766 | 7.6264 | 0.4997 |
PB | 5.5230 | 0.1239 | 6.4729 | 0.5070 | 7.4160 | 0.3747 |
PE | 5.3956 | 0.1192 | 6.1990 | 0.5363 | 7.1712 | 0.3727 |
PI | 5.6308 | 0.1619 | 6.6405 | 0.5637 | 7.5791 | 0.3365 |
PR | 5.2214 | 0.1712 | 6.2729 | 0.5541 | 7.2038 | 0.4133 |
RJ | 5.3597 | 0.1775 | 6.2971 | 0.4971 | 7.2453 | 0.4072 |
RN | 5.8931 | 0.1645 | 6.6089 | 0.5030 | 7.6721 | 0.3952 |
RO | 5.6701 | 0.2107 | 6.5223 | 0.4660 | 7.6135 | 0.4243 |
RR | 5.6741 | 0.0785 | 6.4752 | 0.4601 | 7.5772 | 0.3430 |
RS | 5.3497 | 0.2208 | 6.2133 | 0.4948 | 7.1032 | 0.4512 |
SC | 5.3024 | 0.1706 | 6.1887 | 0.5533 | 7.2017 | 0.4179 |
SE | 5.6666 | 0.1869 | 6.4578 | 0.5372 | 7.1454 | 0.4266 |
SP | 5.3943 | 0.1896 | 6.2748 | 0.4993 | 7.2093 | 0.4221 |
TO | 5.4788 | 0.1722 | 6.4978 | 0.6004 | 7.2350 | 0.3776 |
ftE2 <- ftE21 %>%
left_join(ftE22, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
left_join(ftE23, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
flextable()
ftE2 <- delete_part(ftE2, part = "header")
ftE2 <- add_header(x=ftE2, Estado...Sigla = "Estado",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftE2 <- add_header(x=ftE2,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftE2 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios do DIESEL S500 por ESTADO")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Estado | Preço | DP | Preço | DP | Preço | DP |
AC | 6.2302 | 0.2706 | 7.0672 | 0.5520 | 8.1192 | 0.4404 |
AL | 5.6946 | 0.2417 | 6.7111 | 0.6295 | 7.5215 | 0.5057 |
AM | 5.4836 | 0.2557 | 6.4396 | 0.5481 | 7.3457 | 0.5236 |
AP | 5.3957 | 0.1482 | 6.0086 | 0.3925 | 7.0747 | 0.3945 |
BA | 5.4882 | 0.1376 | 6.6360 | 0.4720 | 7.7790 | 0.4807 |
CE | 5.7586 | 0.1822 | 6.6953 | 0.5923 | 7.5660 | 0.3425 |
DF | 5.5448 | 0.1425 | 6.3500 | 0.6376 | 7.1829 | 0.4113 |
ES | 5.1234 | 0.1637 | 5.9191 | 0.4515 | 6.9708 | 0.4215 |
GO | 5.5235 | 0.1677 | 6.4424 | 0.5542 | 7.1746 | 0.4156 |
MA | 5.4085 | 0.1252 | 6.5676 | 0.5684 | 7.3484 | 0.4216 |
MG | 5.3964 | 0.1525 | 6.2774 | 0.5105 | 7.2201 | 0.4067 |
MS | 5.2718 | 0.1579 | 6.1702 | 0.5111 | 7.0948 | 0.3739 |
MT | 5.7565 | 0.2247 | 6.5205 | 0.5022 | 7.4542 | 0.4370 |
PA | 5.7033 | 0.2129 | 6.7033 | 0.5874 | 7.6360 | 0.4803 |
PB | 5.3692 | 0.0885 | 6.3711 | 0.5274 | 7.2388 | 0.4184 |
PE | 5.3559 | 0.2629 | 6.1714 | 0.5359 | 7.3516 | 0.4078 |
PI | 5.5798 | 0.1592 | 6.5624 | 0.5700 | 7.4825 | 0.3594 |
PR | 5.1396 | 0.1626 | 6.1892 | 0.5278 | 7.0229 | 0.4054 |
RJ | 5.2789 | 0.1738 | 6.2021 | 0.4925 | 7.1066 | 0.4201 |
RN | 5.6616 | 0.2111 | 6.3848 | 0.5177 | 7.3544 | 0.3975 |
RO | 5.6280 | 0.1929 | 6.4766 | 0.4652 | 7.5881 | 0.4121 |
RR | 5.6188 | 0.1200 | 6.4292 | 0.4373 | 7.5248 | 0.3651 |
RS | 5.2768 | 0.2175 | 6.1326 | 0.4752 | 7.0181 | 0.4511 |
SC | 5.2534 | 0.1741 | 6.0832 | 0.5097 | 7.1026 | 0.4038 |
SE | 5.5539 | 0.1799 | 6.4167 | 0.4572 | 7.2458 | 0.4729 |
SP | 5.2855 | 0.1778 | 6.1585 | 0.4776 | 7.0753 | 0.4200 |
TO | 5.4608 | 0.1907 | 6.4576 | 0.6131 | 7.1614 | 0.3625 |
ftE3 <- ftE31 %>%
left_join(ftE32, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
left_join(ftE33, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
flextable()
ftE3 <- delete_part(ftE3, part = "header")
ftE3 <- add_header(x=ftE3, Estado...Sigla = "Estado",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftE3 <- add_header(x=ftE3,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftE3 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios da GASOLINA COMUM por ESTADO")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Estado | Preço | DP | Preço | DP | Preço | DP |
AC | 7.1221 | 0.2591 | 7.3658 | 0.3242 | 7.6791 | 0.2078 |
AL | 6.7157 | 0.2861 | 7.1811 | 0.4350 | 7.4406 | 0.3339 |
AM | 6.7373 | 0.2493 | 7.2778 | 0.4344 | 7.4643 | 0.3581 |
AP | 5.9314 | 0.1124 | 6.1093 | 0.2735 | 6.4387 | 0.2568 |
BA | 6.7886 | 0.1800 | 7.4255 | 0.4059 | 7.9744 | 0.2597 |
CE | 6.9599 | 0.1173 | 7.2111 | 0.5131 | 7.5680 | 0.3578 |
DF | 7.1018 | 0.1970 | 7.1347 | 0.3835 | 7.4778 | 0.2728 |
ES | 6.7666 | 0.1455 | 7.1098 | 0.3240 | 7.3649 | 0.2213 |
GO | 7.1877 | 0.1921 | 7.2325 | 0.3505 | 7.4350 | 0.3103 |
MA | 6.5138 | 0.1033 | 7.0756 | 0.4195 | 7.2526 | 0.3446 |
MG | 7.0882 | 0.1926 | 7.3097 | 0.3779 | 7.5371 | 0.2326 |
MS | 6.5910 | 0.1683 | 6.9340 | 0.4362 | 7.1681 | 0.3778 |
MT | 6.7626 | 0.1650 | 6.7663 | 0.3976 | 7.0146 | 0.3156 |
PA | 6.8493 | 0.2442 | 7.3098 | 0.3937 | 7.5133 | 0.3753 |
PB | 6.5284 | 0.1079 | 6.9329 | 0.3389 | 7.1838 | 0.2105 |
PE | 6.6836 | 0.2118 | 7.0009 | 0.4443 | 7.4133 | 0.2971 |
PI | 7.1411 | 0.1278 | 7.6443 | 0.4936 | 7.9016 | 0.1871 |
PR | 6.5537 | 0.2244 | 6.9264 | 0.3837 | 7.1611 | 0.2940 |
RJ | 7.2967 | 0.2272 | 7.5766 | 0.4103 | 7.7811 | 0.2828 |
RN | 7.1278 | 0.1359 | 7.4771 | 0.4503 | 7.5827 | 0.2394 |
RO | 6.7731 | 0.2169 | 7.2032 | 0.3838 | 7.4043 | 0.2849 |
RR | 6.3837 | 0.0626 | 6.8182 | 0.3257 | 7.0656 | 0.0948 |
RS | 7.0901 | 0.2219 | 6.7828 | 0.4144 | 6.9486 | 0.3366 |
SC | 6.5815 | 0.1629 | 6.8399 | 0.3636 | 7.0870 | 0.2924 |
SE | 6.7329 | 0.1925 | 7.0210 | 0.4378 | 7.2799 | 0.1259 |
SP | 6.4133 | 0.2195 | 6.6634 | 0.3746 | 6.8462 | 0.3224 |
TO | 6.9742 | 0.1269 | 7.2986 | 0.3269 | 7.4836 | 0.1652 |
ftE4 <- ftE41 %>%
left_join(ftE42, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
left_join(ftE43, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
flextable()
ftE4 <- delete_part(ftE4, part = "header")
ftE4 <- add_header(x=ftE4, Estado...Sigla = "Estado",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftE4 <- add_header(x=ftE4,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftE4 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios da GASOLINA ADITIVADA por ESTADO")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Estado | Preço | DP | Preço | DP | Preço | DP |
AC | 7.1209 | 0.1761 | 7.4029 | 0.3008 | 7.7185 | 0.1583 |
AL | 6.7982 | 0.2673 | 7.2772 | 0.4034 | 7.5424 | 0.3188 |
AM | 6.6872 | 0.1341 | 7.2205 | 0.3906 | 7.4540 | 0.2929 |
AP | 6.3200 | 0.1085 | 6.4764 | 0.2242 | 6.8094 | 0.2395 |
BA | 6.8872 | 0.2307 | 7.5045 | 0.4219 | 8.0545 | 0.2754 |
CE | 7.0890 | 0.1564 | 7.3646 | 0.5124 | 7.7241 | 0.3691 |
DF | 7.2170 | 0.2211 | 7.2360 | 0.3782 | 7.5612 | 0.2818 |
ES | 6.8894 | 0.1470 | 7.2258 | 0.3503 | 7.4850 | 0.2309 |
GO | 7.2957 | 0.1944 | 7.3422 | 0.3526 | 7.5484 | 0.3021 |
MA | 6.6525 | 0.1755 | 7.2010 | 0.4253 | 7.3556 | 0.3253 |
MG | 7.2054 | 0.1870 | 7.4531 | 0.3803 | 7.6814 | 0.2396 |
MS | 6.7168 | 0.1579 | 7.0518 | 0.4149 | 7.2765 | 0.3578 |
MT | 6.8709 | 0.1802 | 6.9003 | 0.3980 | 7.1538 | 0.3196 |
PA | 6.9759 | 0.2232 | 7.4087 | 0.3652 | 7.6511 | 0.3426 |
PB | 6.6583 | 0.1173 | 7.0648 | 0.3217 | 7.3234 | 0.1973 |
PE | 6.8233 | 0.2395 | 7.1848 | 0.4321 | 7.5401 | 0.2869 |
PI | 7.3454 | 0.1912 | 7.8005 | 0.5202 | 8.0781 | 0.2508 |
PR | 6.6955 | 0.2273 | 7.0648 | 0.4156 | 7.3036 | 0.3202 |
RJ | 7.4174 | 0.2505 | 7.7076 | 0.4094 | 7.9107 | 0.2919 |
RN | 7.1991 | 0.1589 | 7.5684 | 0.4445 | 7.6361 | 0.2484 |
RO | 6.8743 | 0.2378 | 7.3121 | 0.3680 | 7.5443 | 0.2660 |
RR | 6.5113 | 0.0900 | 6.9502 | 0.3355 | 7.2068 | 0.1033 |
RS | 7.2129 | 0.2372 | 6.9161 | 0.4270 | 7.0831 | 0.3564 |
SC | 6.6746 | 0.1668 | 6.9426 | 0.3674 | 7.1797 | 0.2977 |
SE | 6.8526 | 0.2036 | 7.1096 | 0.4347 | 7.3542 | 0.1625 |
SP | 6.5965 | 0.2794 | 6.8600 | 0.4199 | 7.0570 | 0.3585 |
TO | 7.0601 | 0.1438 | 7.4230 | 0.3170 | 7.5621 | 0.1999 |
Resultados referentes às análises dos preços para municípios. Testes de hipótese:
#===========
# Testes de hipóteses de correlação utilizando-se os dados
# para os Municípios
#===========
shapiro.test(ftIPCA$acum_N_M)
Shapiro-Wilk normality test
data: ftIPCA$acum_N_M
W = 0.91027, p-value = 0.1175
shapiro.test(ftIPCA$acum_A_J)
Shapiro-Wilk normality test
data: ftIPCA$acum_A_J
W = 0.95756, p-value = 0.6178
shapiro.test(ftIPCA$varD_N_M)
Shapiro-Wilk normality test
data: ftIPCA$varD_N_M
W = 0.89615, p-value = 0.06976
shapiro.test(ftIPCA$varD_M_J)
Shapiro-Wilk normality test
data: ftIPCA$varD_M_J
W = 0.96383, p-value = 0.7315
shapiro.test(ftIPCA$varG_N_M)
Shapiro-Wilk normality test
data: ftIPCA$varG_N_M
W = 0.89224, p-value = 0.06045
shapiro.test(ftIPCA$varG_M_J)
Shapiro-Wilk normality test
data: ftIPCA$varG_M_J
W = 0.9554, p-value = 0.5798
shapiro.test(ftIPCA$mar_22) # menor que alpha... usar spearman
Shapiro-Wilk normality test
data: ftIPCA$mar_22
W = 0.81866, p-value = 0.004872
cor.test(ftIPCA$acum_N_M, ftIPCA$varD_N_M, method = "pearson")
Pearson's product-moment correlation
data: ftIPCA$acum_N_M and ftIPCA$varD_N_M
t = 1.6976, df = 14, p-value = 0.1117
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.1037981 0.7543699
sample estimates:
cor
0.413166
#não estão correlacionados
cor.test(ftIPCA$acum_N_M, ftIPCA$varG_N_M, method = "pearson")
Pearson's product-moment correlation
data: ftIPCA$acum_N_M and ftIPCA$varG_N_M
t = 3.0031, df = 14, p-value = 0.009493
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.1888196 0.8560327
sample estimates:
cor
0.6259379
#estão correlacionados
cor.test(ftIPCA$acum_A_J, ftIPCA$varD_M_J, method = "pearson")
Pearson's product-moment correlation
data: ftIPCA$acum_A_J and ftIPCA$varD_M_J
t = -0.15654, df = 14, p-value = 0.8778
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.5265951 0.4635083
sample estimates:
cor
-0.04180144
#não estão correlacionados
cor.test(ftIPCA$acum_A_J, ftIPCA$varG_M_J, method = "pearson")
Pearson's product-moment correlation
data: ftIPCA$acum_A_J and ftIPCA$varG_M_J
t = 4.0053, df = 14, p-value = 0.001302
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.3685390 0.9003233
sample estimates:
cor
0.7307466
#estão correlacionados
cor.test(ftIPCA$mar_22, ftIPCA$varD_N_M, method = "spearman")
Spearman's rank correlation rho
data: ftIPCA$mar_22 and ftIPCA$varD_N_M
S = 289.71, p-value = 0.02008
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.5739516
#estão correlacionados
cor.test(ftIPCA$mar_22, ftIPCA$varG_N_M, method = "spearman")
Spearman's rank correlation rho
data: ftIPCA$mar_22 and ftIPCA$varG_N_M
S = 667.99, p-value = 0.9482
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.01766005
#não estão correlacionadosFoi verificada a quantidade de estabelecimentos de determinada banderia, na BD, estratificada por regiões e para cada produto analisado, elaborando-se uma tabela em números absoluto e outra em números relativo. Essas tabelas são apresentadas a seguir e foram consideradas para decidir quais as banderias deveriam ser escolhidas para os cálculos dos preços médios e desvios padrões de cada região. O critério de decisão para tal escolha se refere ao precentual de aparição na BD, sendo descartadas as bandeiras que apresentaram baixos percentuais (abaixo de 5%).
#-------
# Tabela em num abs
#-------
# Tabelas indicando quantidades de estabelecimentos de
# determinada bandeira por regiões para os produtos
# D S10, D S500, G comum e G aditivada
#-------
DB_Comb %>% filter(Produto == 'DIESEL S10') %>%
tabyl(Bandeira,`Regiao - Sigla`) %>%
flextable() %>% theme_zebra() %>%
set_caption(caption = "Frequência de cada BANDEIRA por região de DIESEL S10 na BD")Bandeira | CO | N | NE | S | SE |
ALESAT | 101 | 47 | 401 | 117 | 587 |
AMERICANOIL | 0 | 0 | 0 | 39 | 0 |
ATEMS | 0 | 274 | 0 | 0 | 0 |
ATLÂNTICA | 0 | 0 | 0 | 0 | 59 |
BRANCA | 2,016 | 848 | 4,626 | 2,741 | 9,645 |
CHARRUA | 0 | 0 | 0 | 93 | 0 |
CIAPETRO | 9 | 0 | 0 | 92 | 24 |
DIBRAPE | 0 | 0 | 0 | 39 | 0 |
DISLUB | 0 | 0 | 110 | 0 | 0 |
EQUADOR | 0 | 230 | 0 | 0 | 0 |
ESTRADA | 0 | 0 | 0 | 1 | 0 |
FAN | 0 | 0 | 38 | 0 | 0 |
FEDERAL ENERGIA | 0 | 0 | 28 | 0 | 0 |
IDAZA | 83 | 0 | 0 | 33 | 0 |
IPIRANGA | 743 | 703 | 1,042 | 2,575 | 4,688 |
LARCO | 2 | 0 | 28 | 0 | 0 |
MASUT DISTRIBUIDORA | 30 | 0 | 0 | 0 | 0 |
MAXSUL | 0 | 0 | 0 | 89 | 0 |
MONTEPETRO | 0 | 0 | 0 | 0 | 24 |
PELIKANO | 0 | 0 | 0 | 9 | 0 |
PETROBAHIA | 0 | 0 | 38 | 0 | 0 |
PETROSERRA | 0 | 0 | 17 | 0 | 0 |
PETROX DISTRIBUIDORA | 0 | 0 | 109 | 0 | 0 |
PODIUM | 0 | 0 | 0 | 0 | 1 |
POTENCIAL | 0 | 0 | 0 | 50 | 0 |
RAIZEN | 686 | 100 | 1,926 | 1,331 | 5,029 |
RAIZEN MIME | 0 | 0 | 0 | 271 | 0 |
REJAILE | 0 | 0 | 0 | 11 | 0 |
RIO BRANCO | 3 | 0 | 0 | 0 | 73 |
RODOIL | 0 | 0 | 0 | 310 | 0 |
ROYAL FIC | 10 | 0 | 0 | 0 | 0 |
RUFF C.J. | 0 | 0 | 0 | 0 | 11 |
RZD DISTRIBUIDORA | 0 | 16 | 0 | 0 | 0 |
SABBÁ | 0 | 505 | 316 | 0 | 0 |
SETTA DISTRIBUIDORA | 0 | 0 | 66 | 0 | 0 |
SIMARELLI | 59 | 10 | 0 | 0 | 0 |
SMALL | 16 | 0 | 0 | 0 | 4 |
SP | 0 | 2 | 271 | 0 | 0 |
STANG | 0 | 0 | 0 | 132 | 0 |
SUL COMBUSTÍVEIS | 0 | 0 | 0 | 32 | 0 |
TAURUS | 203 | 0 | 0 | 0 | 18 |
TDC DISTRIBUIDORA | 0 | 0 | 51 | 0 | 0 |
TEMAPE | 0 | 0 | 41 | 0 | 0 |
TOBRAS | 0 | 0 | 0 | 0 | 2 |
TORRAO | 0 | 0 | 0 | 0 | 20 |
TOTALENERGIES | 11 | 0 | 0 | 0 | 69 |
UNI | 0 | 0 | 0 | 7 | 0 |
VIBRA ENERGIA | 1,195 | 1,017 | 3,348 | 1,836 | 5,481 |
WALENDOWSKY | 0 | 0 | 0 | 12 | 0 |
WATT | 22 | 0 | 0 | 0 | 0 |
DB_Comb %>% filter(Produto == 'DIESEL') %>%
tabyl(Bandeira,`Regiao - Sigla`) %>%
flextable() %>% theme_zebra() %>%
set_caption(caption = "Frequência de cada BANDEIRA por região de DIESEL S500 na BD")Bandeira | CO | N | NE | S | SE |
ALESAT | 74 | 25 | 153 | 64 | 408 |
AMERICANOIL | 0 | 0 | 0 | 39 | 0 |
ATEMS | 0 | 234 | 0 | 0 | 0 |
ATLÂNTICA | 0 | 0 | 0 | 0 | 35 |
BRANCA | 1,518 | 698 | 2,059 | 1,893 | 6,061 |
CHARRUA | 0 | 0 | 0 | 73 | 0 |
CIAPETRO | 10 | 0 | 0 | 76 | 10 |
DIBRAPE | 0 | 0 | 0 | 28 | 0 |
DISLUB | 0 | 0 | 24 | 0 | 0 |
EQUADOR | 0 | 208 | 0 | 0 | 0 |
ESTRADA | 0 | 0 | 0 | 1 | 0 |
FAN | 0 | 0 | 24 | 0 | 0 |
FEDERAL ENERGIA | 12 | 0 | 11 | 0 | 0 |
IDAZA | 68 | 0 | 0 | 18 | 0 |
IPIRANGA | 391 | 452 | 384 | 1,503 | 2,105 |
LARCO | 2 | 0 | 23 | 0 | 0 |
MASUT DISTRIBUIDORA | 27 | 0 | 0 | 0 | 0 |
MAXSUL | 0 | 0 | 0 | 18 | 0 |
MONTEPETRO | 0 | 0 | 0 | 0 | 24 |
PELIKANO | 0 | 0 | 0 | 9 | 0 |
PETROBAHIA | 0 | 0 | 19 | 0 | 0 |
PETROSERRA | 0 | 0 | 25 | 0 | 0 |
PETROX DISTRIBUIDORA | 0 | 0 | 31 | 0 | 0 |
POTENCIAL | 0 | 0 | 0 | 41 | 0 |
RAIZEN | 470 | 44 | 543 | 863 | 2,494 |
RAIZEN MIME | 0 | 0 | 0 | 84 | 0 |
REJAILE | 0 | 0 | 0 | 4 | 0 |
RIO BRANCO | 8 | 0 | 0 | 0 | 49 |
RODOIL | 0 | 0 | 0 | 185 | 0 |
ROYAL FIC | 18 | 0 | 0 | 0 | 0 |
SABBÁ | 0 | 375 | 120 | 0 | 0 |
SETTA DISTRIBUIDORA | 0 | 0 | 15 | 0 | 0 |
SIMARELLI | 28 | 10 | 0 | 0 | 0 |
SMALL | 15 | 0 | 0 | 0 | 4 |
SP | 0 | 0 | 72 | 0 | 0 |
STANG | 0 | 0 | 0 | 102 | 0 |
SUL COMBUSTÍVEIS | 0 | 0 | 0 | 30 | 0 |
TAURUS | 184 | 0 | 0 | 0 | 16 |
TDC DISTRIBUIDORA | 0 | 0 | 2 | 0 | 0 |
TEMAPE | 0 | 0 | 13 | 0 | 0 |
TORRAO | 0 | 0 | 0 | 0 | 6 |
TOTALENERGIES | 24 | 0 | 0 | 0 | 28 |
VIBRA ENERGIA | 717 | 815 | 1,114 | 1,105 | 2,715 |
WALENDOWSKY | 0 | 0 | 0 | 12 | 0 |
WATT | 22 | 0 | 0 | 0 | 0 |
DB_Comb %>% filter(Produto == 'GASOLINA') %>%
tabyl(Bandeira,`Regiao - Sigla`) %>%
flextable() %>% theme_zebra() %>%
set_caption(caption = "Frequência de cada BANDEIRA por região de GASOLINA COMUM na BD")Bandeira | CO | N | NE | S | SE |
ALESAT | 146 | 50 | 458 | 148 | 812 |
AMERICANOIL | 0 | 0 | 0 | 34 | 0 |
ATEMS | 0 | 335 | 0 | 0 | 0 |
ATLÂNTICA | 0 | 0 | 0 | 0 | 65 |
BRANCA | 2,577 | 1,247 | 5,179 | 3,566 | 13,855 |
CHARRUA | 0 | 0 | 0 | 119 | 0 |
CIAPETRO | 10 | 0 | 0 | 90 | 29 |
DIBRAPE | 0 | 0 | 0 | 42 | 0 |
DISLUB | 0 | 0 | 125 | 0 | 0 |
EQUADOR | 0 | 267 | 0 | 0 | 0 |
ESTRADA | 0 | 0 | 0 | 1 | 0 |
FAN | 0 | 0 | 46 | 0 | 0 |
FEDERAL ENERGIA | 12 | 0 | 29 | 0 | 0 |
IDAZA | 83 | 0 | 0 | 36 | 0 |
IPIRANGA | 849 | 741 | 1,117 | 2,872 | 5,661 |
LARCO | 2 | 0 | 28 | 0 | 0 |
MASUT DISTRIBUIDORA | 33 | 0 | 0 | 0 | 0 |
MAXSUL | 0 | 0 | 0 | 84 | 0 |
MONTEPETRO | 0 | 0 | 0 | 0 | 24 |
PELIKANO | 0 | 0 | 0 | 9 | 0 |
PETROBAHIA | 0 | 0 | 41 | 0 | 0 |
PETROSERRA | 0 | 0 | 31 | 0 | 0 |
PETROX DISTRIBUIDORA | 0 | 0 | 111 | 0 | 0 |
PODIUM | 0 | 0 | 0 | 0 | 1 |
POTENCIAL | 0 | 0 | 0 | 64 | 0 |
RAIZEN | 824 | 107 | 2,026 | 1,495 | 6,192 |
RAIZEN MIME | 0 | 0 | 0 | 373 | 0 |
REJAILE | 0 | 0 | 0 | 11 | 0 |
RIO BRANCO | 9 | 0 | 0 | 0 | 80 |
RODOIL | 0 | 0 | 0 | 387 | 0 |
ROYAL FIC | 18 | 0 | 0 | 0 | 0 |
RUFF C.J. | 0 | 0 | 0 | 0 | 11 |
RZD DISTRIBUIDORA | 0 | 16 | 0 | 0 | 0 |
SABBÁ | 0 | 586 | 318 | 0 | 0 |
SETTA DISTRIBUIDORA | 0 | 0 | 65 | 0 | 0 |
SIMARELLI | 61 | 4 | 0 | 0 | 0 |
SMALL | 27 | 0 | 0 | 0 | 4 |
SP | 0 | 5 | 296 | 0 | 0 |
STANG | 0 | 0 | 0 | 141 | 0 |
SUL COMBUSTÍVEIS | 0 | 0 | 0 | 33 | 0 |
TAURUS | 214 | 0 | 0 | 0 | 31 |
TDC DISTRIBUIDORA | 0 | 0 | 64 | 0 | 0 |
TEMAPE | 0 | 0 | 55 | 0 | 0 |
TOBRAS | 0 | 0 | 0 | 0 | 4 |
TORRAO | 0 | 0 | 0 | 0 | 22 |
TOTALENERGIES | 26 | 0 | 0 | 0 | 90 |
UNI | 0 | 0 | 0 | 11 | 0 |
VIBRA ENERGIA | 1,341 | 1,128 | 3,490 | 2,071 | 6,252 |
WALENDOWSKY | 0 | 0 | 0 | 12 | 0 |
WATT | 22 | 0 | 0 | 0 | 0 |
DB_Comb %>% filter(Produto == 'GASOLINA ADITIVADA') %>%
tabyl(Bandeira,`Regiao - Sigla`) %>%
flextable() %>% theme_zebra() %>%
set_caption(caption = "Frequência de cada BANDEIRA por região de GASOLINA ADITIVADA na BD")Bandeira | CO | N | NE | S | SE |
ALESAT | 43 | 23 | 257 | 144 | 536 |
AMERICANOIL | 0 | 0 | 0 | 43 | 0 |
ATEMS | 0 | 266 | 0 | 0 | 0 |
ATLÂNTICA | 0 | 0 | 0 | 0 | 50 |
BRANCA | 1,203 | 454 | 3,782 | 2,901 | 7,681 |
CHARRUA | 0 | 0 | 0 | 116 | 0 |
CIAPETRO | 0 | 0 | 0 | 71 | 11 |
DIBRAPE | 0 | 0 | 0 | 37 | 0 |
DISLUB | 0 | 0 | 103 | 0 | 0 |
EQUADOR | 0 | 221 | 0 | 0 | 0 |
ESTRADA | 0 | 0 | 0 | 1 | 0 |
FAN | 0 | 0 | 15 | 0 | 0 |
FEDERAL ENERGIA | 0 | 0 | 18 | 0 | 0 |
IDAZA | 59 | 0 | 0 | 37 | 0 |
IPIRANGA | 576 | 580 | 912 | 2,710 | 4,813 |
LARCO | 0 | 0 | 28 | 0 | 0 |
MASUT DISTRIBUIDORA | 24 | 0 | 0 | 0 | 0 |
MAXSUL | 0 | 0 | 0 | 88 | 0 |
MONTEPETRO | 0 | 0 | 0 | 0 | 24 |
PELIKANO | 0 | 0 | 0 | 9 | 0 |
PETROBAHIA | 0 | 0 | 32 | 0 | 0 |
PETROSERRA | 0 | 0 | 17 | 0 | 0 |
PETROX DISTRIBUIDORA | 0 | 0 | 96 | 0 | 0 |
PODIUM | 0 | 0 | 0 | 0 | 1 |
POTENCIAL | 0 | 0 | 0 | 60 | 0 |
RAIZEN | 642 | 96 | 1,788 | 1,362 | 5,361 |
RAIZEN MIME | 0 | 0 | 0 | 307 | 0 |
REJAILE | 0 | 0 | 0 | 11 | 0 |
RIO BRANCO | 0 | 0 | 0 | 0 | 59 |
RODOIL | 0 | 0 | 0 | 369 | 0 |
ROYAL FIC | 18 | 0 | 0 | 0 | 0 |
RZD DISTRIBUIDORA | 0 | 16 | 0 | 0 | 0 |
SABBÁ | 0 | 476 | 266 | 0 | 0 |
SETTA DISTRIBUIDORA | 0 | 0 | 36 | 0 | 0 |
SIMARELLI | 37 | 6 | 0 | 0 | 0 |
SMALL | 27 | 0 | 0 | 0 | 0 |
SP | 0 | 6 | 180 | 0 | 0 |
STANG | 0 | 0 | 0 | 135 | 0 |
SUL COMBUSTÍVEIS | 0 | 0 | 0 | 31 | 0 |
TAURUS | 69 | 0 | 0 | 0 | 3 |
TDC DISTRIBUIDORA | 0 | 0 | 60 | 0 | 0 |
TEMAPE | 0 | 0 | 38 | 0 | 0 |
TOBRAS | 0 | 0 | 0 | 0 | 2 |
TORRAO | 0 | 0 | 0 | 0 | 19 |
TOTALENERGIES | 18 | 0 | 0 | 0 | 32 |
UNI | 0 | 0 | 0 | 11 | 0 |
VIBRA ENERGIA | 1,008 | 785 | 3,139 | 1,962 | 5,304 |
WALENDOWSKY | 0 | 0 | 0 | 12 | 0 |
WATT | 10 | 0 | 0 | 0 | 0 |
# Tabela em num relativos - por coluna
#-------
# Tabelas indicando percentuais de estabelecimentos de
# determinada bandeira por regiões para os produtos
# D S10, D S500, G comum e G aditivada
#-------
DB_Comb %>% filter(Produto == 'DIESEL S10') %>%
tabyl(Bandeira,`Regiao - Sigla`) %>%
adorn_percentages("col") %>%
adorn_pct_formatting(digits = 2) %>%
flextable() %>% theme_zebra() %>%
set_caption(caption = "Frequência relativa de cada BANDEIRA por região de DIESEL S10 na BD")Bandeira | CO | N | NE | S | SE |
ALESAT | 1.95% | 1.25% | 3.22% | 1.19% | 2.28% |
AMERICANOIL | 0.00% | 0.00% | 0.00% | 0.40% | 0.00% |
ATEMS | 0.00% | 7.30% | 0.00% | 0.00% | 0.00% |
ATLÂNTICA | 0.00% | 0.00% | 0.00% | 0.00% | 0.23% |
BRANCA | 38.85% | 22.60% | 37.14% | 27.91% | 37.48% |
CHARRUA | 0.00% | 0.00% | 0.00% | 0.95% | 0.00% |
CIAPETRO | 0.17% | 0.00% | 0.00% | 0.94% | 0.09% |
DIBRAPE | 0.00% | 0.00% | 0.00% | 0.40% | 0.00% |
DISLUB | 0.00% | 0.00% | 0.88% | 0.00% | 0.00% |
EQUADOR | 0.00% | 6.13% | 0.00% | 0.00% | 0.00% |
ESTRADA | 0.00% | 0.00% | 0.00% | 0.01% | 0.00% |
FAN | 0.00% | 0.00% | 0.31% | 0.00% | 0.00% |
FEDERAL ENERGIA | 0.00% | 0.00% | 0.22% | 0.00% | 0.00% |
IDAZA | 1.60% | 0.00% | 0.00% | 0.34% | 0.00% |
IPIRANGA | 14.32% | 18.74% | 8.37% | 26.22% | 18.22% |
LARCO | 0.04% | 0.00% | 0.22% | 0.00% | 0.00% |
MASUT DISTRIBUIDORA | 0.58% | 0.00% | 0.00% | 0.00% | 0.00% |
MAXSUL | 0.00% | 0.00% | 0.00% | 0.91% | 0.00% |
MONTEPETRO | 0.00% | 0.00% | 0.00% | 0.00% | 0.09% |
PELIKANO | 0.00% | 0.00% | 0.00% | 0.09% | 0.00% |
PETROBAHIA | 0.00% | 0.00% | 0.31% | 0.00% | 0.00% |
PETROSERRA | 0.00% | 0.00% | 0.14% | 0.00% | 0.00% |
PETROX DISTRIBUIDORA | 0.00% | 0.00% | 0.88% | 0.00% | 0.00% |
PODIUM | 0.00% | 0.00% | 0.00% | 0.00% | 0.00% |
POTENCIAL | 0.00% | 0.00% | 0.00% | 0.51% | 0.00% |
RAIZEN | 13.22% | 2.67% | 15.46% | 13.55% | 19.54% |
RAIZEN MIME | 0.00% | 0.00% | 0.00% | 2.76% | 0.00% |
REJAILE | 0.00% | 0.00% | 0.00% | 0.11% | 0.00% |
RIO BRANCO | 0.06% | 0.00% | 0.00% | 0.00% | 0.28% |
RODOIL | 0.00% | 0.00% | 0.00% | 3.16% | 0.00% |
ROYAL FIC | 0.19% | 0.00% | 0.00% | 0.00% | 0.00% |
RUFF C.J. | 0.00% | 0.00% | 0.00% | 0.00% | 0.04% |
RZD DISTRIBUIDORA | 0.00% | 0.43% | 0.00% | 0.00% | 0.00% |
SABBÁ | 0.00% | 13.46% | 2.54% | 0.00% | 0.00% |
SETTA DISTRIBUIDORA | 0.00% | 0.00% | 0.53% | 0.00% | 0.00% |
SIMARELLI | 1.14% | 0.27% | 0.00% | 0.00% | 0.00% |
SMALL | 0.31% | 0.00% | 0.00% | 0.00% | 0.02% |
SP | 0.00% | 0.05% | 2.18% | 0.00% | 0.00% |
STANG | 0.00% | 0.00% | 0.00% | 1.34% | 0.00% |
SUL COMBUSTÍVEIS | 0.00% | 0.00% | 0.00% | 0.33% | 0.00% |
TAURUS | 3.91% | 0.00% | 0.00% | 0.00% | 0.07% |
TDC DISTRIBUIDORA | 0.00% | 0.00% | 0.41% | 0.00% | 0.00% |
TEMAPE | 0.00% | 0.00% | 0.33% | 0.00% | 0.00% |
TOBRAS | 0.00% | 0.00% | 0.00% | 0.00% | 0.01% |
TORRAO | 0.00% | 0.00% | 0.00% | 0.00% | 0.08% |
TOTALENERGIES | 0.21% | 0.00% | 0.00% | 0.00% | 0.27% |
UNI | 0.00% | 0.00% | 0.00% | 0.07% | 0.00% |
VIBRA ENERGIA | 23.03% | 27.11% | 26.88% | 18.70% | 21.30% |
WALENDOWSKY | 0.00% | 0.00% | 0.00% | 0.12% | 0.00% |
WATT | 0.42% | 0.00% | 0.00% | 0.00% | 0.00% |
DB_Comb %>% filter(Produto == 'DIESEL') %>%
tabyl(Bandeira,`Regiao - Sigla`) %>%
adorn_percentages("col") %>%
adorn_pct_formatting(digits = 2) %>%
flextable() %>% theme_zebra() %>%
set_caption(caption = "Frequência relativa de cada BANDEIRA por região de DIESEL S500 na BD")Bandeira | CO | N | NE | S | SE |
ALESAT | 2.06% | 0.87% | 3.30% | 1.04% | 2.92% |
AMERICANOIL | 0.00% | 0.00% | 0.00% | 0.63% | 0.00% |
ATEMS | 0.00% | 8.18% | 0.00% | 0.00% | 0.00% |
ATLÂNTICA | 0.00% | 0.00% | 0.00% | 0.00% | 0.25% |
BRANCA | 42.31% | 24.40% | 44.45% | 30.79% | 43.43% |
CHARRUA | 0.00% | 0.00% | 0.00% | 1.19% | 0.00% |
CIAPETRO | 0.28% | 0.00% | 0.00% | 1.24% | 0.07% |
DIBRAPE | 0.00% | 0.00% | 0.00% | 0.46% | 0.00% |
DISLUB | 0.00% | 0.00% | 0.52% | 0.00% | 0.00% |
EQUADOR | 0.00% | 7.27% | 0.00% | 0.00% | 0.00% |
ESTRADA | 0.00% | 0.00% | 0.00% | 0.02% | 0.00% |
FAN | 0.00% | 0.00% | 0.52% | 0.00% | 0.00% |
FEDERAL ENERGIA | 0.33% | 0.00% | 0.24% | 0.00% | 0.00% |
IDAZA | 1.90% | 0.00% | 0.00% | 0.29% | 0.00% |
IPIRANGA | 10.90% | 15.80% | 8.29% | 24.45% | 15.08% |
LARCO | 0.06% | 0.00% | 0.50% | 0.00% | 0.00% |
MASUT DISTRIBUIDORA | 0.75% | 0.00% | 0.00% | 0.00% | 0.00% |
MAXSUL | 0.00% | 0.00% | 0.00% | 0.29% | 0.00% |
MONTEPETRO | 0.00% | 0.00% | 0.00% | 0.00% | 0.17% |
PELIKANO | 0.00% | 0.00% | 0.00% | 0.15% | 0.00% |
PETROBAHIA | 0.00% | 0.00% | 0.41% | 0.00% | 0.00% |
PETROSERRA | 0.00% | 0.00% | 0.54% | 0.00% | 0.00% |
PETROX DISTRIBUIDORA | 0.00% | 0.00% | 0.67% | 0.00% | 0.00% |
POTENCIAL | 0.00% | 0.00% | 0.00% | 0.67% | 0.00% |
RAIZEN | 13.10% | 1.54% | 11.72% | 14.04% | 17.87% |
RAIZEN MIME | 0.00% | 0.00% | 0.00% | 1.37% | 0.00% |
REJAILE | 0.00% | 0.00% | 0.00% | 0.07% | 0.00% |
RIO BRANCO | 0.22% | 0.00% | 0.00% | 0.00% | 0.35% |
RODOIL | 0.00% | 0.00% | 0.00% | 3.01% | 0.00% |
ROYAL FIC | 0.50% | 0.00% | 0.00% | 0.00% | 0.00% |
SABBÁ | 0.00% | 13.11% | 2.59% | 0.00% | 0.00% |
SETTA DISTRIBUIDORA | 0.00% | 0.00% | 0.32% | 0.00% | 0.00% |
SIMARELLI | 0.78% | 0.35% | 0.00% | 0.00% | 0.00% |
SMALL | 0.42% | 0.00% | 0.00% | 0.00% | 0.03% |
SP | 0.00% | 0.00% | 1.55% | 0.00% | 0.00% |
STANG | 0.00% | 0.00% | 0.00% | 1.66% | 0.00% |
SUL COMBUSTÍVEIS | 0.00% | 0.00% | 0.00% | 0.49% | 0.00% |
TAURUS | 5.13% | 0.00% | 0.00% | 0.00% | 0.11% |
TDC DISTRIBUIDORA | 0.00% | 0.00% | 0.04% | 0.00% | 0.00% |
TEMAPE | 0.00% | 0.00% | 0.28% | 0.00% | 0.00% |
TORRAO | 0.00% | 0.00% | 0.00% | 0.00% | 0.04% |
TOTALENERGIES | 0.67% | 0.00% | 0.00% | 0.00% | 0.20% |
VIBRA ENERGIA | 19.98% | 28.49% | 24.05% | 17.97% | 19.46% |
WALENDOWSKY | 0.00% | 0.00% | 0.00% | 0.20% | 0.00% |
WATT | 0.61% | 0.00% | 0.00% | 0.00% | 0.00% |
DB_Comb %>% filter(Produto == 'GASOLINA') %>%
tabyl(Bandeira,`Regiao - Sigla`) %>%
adorn_percentages("col") %>%
adorn_pct_formatting(digits = 2) %>%
flextable() %>% theme_zebra() %>%
set_caption(caption = "Frequência relativa de cada BANDEIRA por região de GASOLINA COMUM na BD")Bandeira | CO | N | NE | S | SE |
ALESAT | 2.33% | 1.11% | 3.40% | 1.28% | 2.45% |
AMERICANOIL | 0.00% | 0.00% | 0.00% | 0.29% | 0.00% |
ATEMS | 0.00% | 7.47% | 0.00% | 0.00% | 0.00% |
ATLÂNTICA | 0.00% | 0.00% | 0.00% | 0.00% | 0.20% |
BRANCA | 41.21% | 27.80% | 38.42% | 30.74% | 41.82% |
CHARRUA | 0.00% | 0.00% | 0.00% | 1.03% | 0.00% |
CIAPETRO | 0.16% | 0.00% | 0.00% | 0.78% | 0.09% |
DIBRAPE | 0.00% | 0.00% | 0.00% | 0.36% | 0.00% |
DISLUB | 0.00% | 0.00% | 0.93% | 0.00% | 0.00% |
EQUADOR | 0.00% | 5.95% | 0.00% | 0.00% | 0.00% |
ESTRADA | 0.00% | 0.00% | 0.00% | 0.01% | 0.00% |
FAN | 0.00% | 0.00% | 0.34% | 0.00% | 0.00% |
FEDERAL ENERGIA | 0.19% | 0.00% | 0.22% | 0.00% | 0.00% |
IDAZA | 1.33% | 0.00% | 0.00% | 0.31% | 0.00% |
IPIRANGA | 13.58% | 16.52% | 8.29% | 24.76% | 17.09% |
LARCO | 0.03% | 0.00% | 0.21% | 0.00% | 0.00% |
MASUT DISTRIBUIDORA | 0.53% | 0.00% | 0.00% | 0.00% | 0.00% |
MAXSUL | 0.00% | 0.00% | 0.00% | 0.72% | 0.00% |
MONTEPETRO | 0.00% | 0.00% | 0.00% | 0.00% | 0.07% |
PELIKANO | 0.00% | 0.00% | 0.00% | 0.08% | 0.00% |
PETROBAHIA | 0.00% | 0.00% | 0.30% | 0.00% | 0.00% |
PETROSERRA | 0.00% | 0.00% | 0.23% | 0.00% | 0.00% |
PETROX DISTRIBUIDORA | 0.00% | 0.00% | 0.82% | 0.00% | 0.00% |
PODIUM | 0.00% | 0.00% | 0.00% | 0.00% | 0.00% |
POTENCIAL | 0.00% | 0.00% | 0.00% | 0.55% | 0.00% |
RAIZEN | 13.18% | 2.39% | 15.03% | 12.89% | 18.69% |
RAIZEN MIME | 0.00% | 0.00% | 0.00% | 3.22% | 0.00% |
REJAILE | 0.00% | 0.00% | 0.00% | 0.09% | 0.00% |
RIO BRANCO | 0.14% | 0.00% | 0.00% | 0.00% | 0.24% |
RODOIL | 0.00% | 0.00% | 0.00% | 3.34% | 0.00% |
ROYAL FIC | 0.29% | 0.00% | 0.00% | 0.00% | 0.00% |
RUFF C.J. | 0.00% | 0.00% | 0.00% | 0.00% | 0.03% |
RZD DISTRIBUIDORA | 0.00% | 0.36% | 0.00% | 0.00% | 0.00% |
SABBÁ | 0.00% | 13.06% | 2.36% | 0.00% | 0.00% |
SETTA DISTRIBUIDORA | 0.00% | 0.00% | 0.48% | 0.00% | 0.00% |
SIMARELLI | 0.98% | 0.09% | 0.00% | 0.00% | 0.00% |
SMALL | 0.43% | 0.00% | 0.00% | 0.00% | 0.01% |
SP | 0.00% | 0.11% | 2.20% | 0.00% | 0.00% |
STANG | 0.00% | 0.00% | 0.00% | 1.22% | 0.00% |
SUL COMBUSTÍVEIS | 0.00% | 0.00% | 0.00% | 0.28% | 0.00% |
TAURUS | 3.42% | 0.00% | 0.00% | 0.00% | 0.09% |
TDC DISTRIBUIDORA | 0.00% | 0.00% | 0.47% | 0.00% | 0.00% |
TEMAPE | 0.00% | 0.00% | 0.41% | 0.00% | 0.00% |
TOBRAS | 0.00% | 0.00% | 0.00% | 0.00% | 0.01% |
TORRAO | 0.00% | 0.00% | 0.00% | 0.00% | 0.07% |
TOTALENERGIES | 0.42% | 0.00% | 0.00% | 0.00% | 0.27% |
UNI | 0.00% | 0.00% | 0.00% | 0.09% | 0.00% |
VIBRA ENERGIA | 21.44% | 25.14% | 25.89% | 17.85% | 18.87% |
WALENDOWSKY | 0.00% | 0.00% | 0.00% | 0.10% | 0.00% |
WATT | 0.35% | 0.00% | 0.00% | 0.00% | 0.00% |
DB_Comb %>% filter(Produto == 'GASOLINA ADITIVADA') %>%
tabyl(Bandeira,`Regiao - Sigla`) %>%
adorn_percentages("col") %>%
adorn_pct_formatting(digits = 2) %>%
flextable() %>% theme_zebra() %>%
set_caption(caption = "Frequência relativa de cada BANDEIRA por região de GASOLINA ADITIVADA na BD")Bandeira | CO | N | NE | S | SE |
ALESAT | 1.15% | 0.79% | 2.39% | 1.38% | 2.24% |
AMERICANOIL | 0.00% | 0.00% | 0.00% | 0.41% | 0.00% |
ATEMS | 0.00% | 9.08% | 0.00% | 0.00% | 0.00% |
ATLÂNTICA | 0.00% | 0.00% | 0.00% | 0.00% | 0.21% |
BRANCA | 32.22% | 15.50% | 35.13% | 27.85% | 32.14% |
CHARRUA | 0.00% | 0.00% | 0.00% | 1.11% | 0.00% |
CIAPETRO | 0.00% | 0.00% | 0.00% | 0.68% | 0.05% |
DIBRAPE | 0.00% | 0.00% | 0.00% | 0.36% | 0.00% |
DISLUB | 0.00% | 0.00% | 0.96% | 0.00% | 0.00% |
EQUADOR | 0.00% | 7.55% | 0.00% | 0.00% | 0.00% |
ESTRADA | 0.00% | 0.00% | 0.00% | 0.01% | 0.00% |
FAN | 0.00% | 0.00% | 0.14% | 0.00% | 0.00% |
FEDERAL ENERGIA | 0.00% | 0.00% | 0.17% | 0.00% | 0.00% |
IDAZA | 1.58% | 0.00% | 0.00% | 0.36% | 0.00% |
IPIRANGA | 15.43% | 19.80% | 8.47% | 26.02% | 20.14% |
LARCO | 0.00% | 0.00% | 0.26% | 0.00% | 0.00% |
MASUT DISTRIBUIDORA | 0.64% | 0.00% | 0.00% | 0.00% | 0.00% |
MAXSUL | 0.00% | 0.00% | 0.00% | 0.84% | 0.00% |
MONTEPETRO | 0.00% | 0.00% | 0.00% | 0.00% | 0.10% |
PELIKANO | 0.00% | 0.00% | 0.00% | 0.09% | 0.00% |
PETROBAHIA | 0.00% | 0.00% | 0.30% | 0.00% | 0.00% |
PETROSERRA | 0.00% | 0.00% | 0.16% | 0.00% | 0.00% |
PETROX DISTRIBUIDORA | 0.00% | 0.00% | 0.89% | 0.00% | 0.00% |
PODIUM | 0.00% | 0.00% | 0.00% | 0.00% | 0.00% |
POTENCIAL | 0.00% | 0.00% | 0.00% | 0.58% | 0.00% |
RAIZEN | 17.19% | 3.28% | 16.61% | 13.07% | 22.43% |
RAIZEN MIME | 0.00% | 0.00% | 0.00% | 2.95% | 0.00% |
REJAILE | 0.00% | 0.00% | 0.00% | 0.11% | 0.00% |
RIO BRANCO | 0.00% | 0.00% | 0.00% | 0.00% | 0.25% |
RODOIL | 0.00% | 0.00% | 0.00% | 3.54% | 0.00% |
ROYAL FIC | 0.48% | 0.00% | 0.00% | 0.00% | 0.00% |
RZD DISTRIBUIDORA | 0.00% | 0.55% | 0.00% | 0.00% | 0.00% |
SABBÁ | 0.00% | 16.25% | 2.47% | 0.00% | 0.00% |
SETTA DISTRIBUIDORA | 0.00% | 0.00% | 0.33% | 0.00% | 0.00% |
SIMARELLI | 0.99% | 0.20% | 0.00% | 0.00% | 0.00% |
SMALL | 0.72% | 0.00% | 0.00% | 0.00% | 0.00% |
SP | 0.00% | 0.20% | 1.67% | 0.00% | 0.00% |
STANG | 0.00% | 0.00% | 0.00% | 1.30% | 0.00% |
SUL COMBUSTÍVEIS | 0.00% | 0.00% | 0.00% | 0.30% | 0.00% |
TAURUS | 1.85% | 0.00% | 0.00% | 0.00% | 0.01% |
TDC DISTRIBUIDORA | 0.00% | 0.00% | 0.56% | 0.00% | 0.00% |
TEMAPE | 0.00% | 0.00% | 0.35% | 0.00% | 0.00% |
TOBRAS | 0.00% | 0.00% | 0.00% | 0.00% | 0.01% |
TORRAO | 0.00% | 0.00% | 0.00% | 0.00% | 0.08% |
TOTALENERGIES | 0.48% | 0.00% | 0.00% | 0.00% | 0.13% |
UNI | 0.00% | 0.00% | 0.00% | 0.11% | 0.00% |
VIBRA ENERGIA | 27.00% | 26.80% | 29.15% | 18.83% | 22.20% |
WALENDOWSKY | 0.00% | 0.00% | 0.00% | 0.12% | 0.00% |
WATT | 0.27% | 0.00% | 0.00% | 0.00% | 0.00% |
As tabelas com o cálculo das médias e desvios padrões, além dos gráficos tipo boxplot, dos combustíveis analisados, estratificados por bandeiras para cada região estão apresentados a seguir. Não foram feitas quaisquer análises acerca desses reultados.
#-------
# Tabelas com preços médios e desvio padrão
# por bandeira da região norte para os meses de
# nov/21, mar/22 e jun/22, extratificadas pelos
# produtos D S10, D S500, G comum e G aditivada
#-------
ft111BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
Bandeira == 'VIBRA ENERGIA' |
Bandeira == 'EQUADOR') ) %>%
select(Bandeira,`Valor de Venda`)
ft111OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
Bandeira != 'VIBRA ENERGIA' &
Bandeira != 'EQUADOR')) %>%
select(Bandeira,`Valor de Venda`)
ft111OBP$Bandeira <- "OUTRAS"
ft111BP <- bind_rows(ft111BP, ft111OBP)
ft111 <- ft111BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft111BP,
main="Boxplot de preços de D.S10 por bandeira - Norte (Nov/21)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft112BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL S10'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
Bandeira == 'VIBRA ENERGIA' |
Bandeira == 'EQUADOR') ) %>%
select(Bandeira,`Valor de Venda`)
ft112OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL S10'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
Bandeira != 'VIBRA ENERGIA' &
Bandeira != 'EQUADOR')) %>%
select(Bandeira,`Valor de Venda`)
ft112OBP$Bandeira <- "OUTRAS"
ft112BP <- bind_rows(ft112BP, ft112OBP)
ft112 <- ft112BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft112BP,
main="Boxplot de preços de D.S10 por bandeira - Norte (Mar/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft113BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
Bandeira == 'VIBRA ENERGIA' |
Bandeira == 'EQUADOR') ) %>%
select(Bandeira,`Valor de Venda`)
ft113OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
Bandeira != 'VIBRA ENERGIA' &
Bandeira != 'EQUADOR')) %>%
select(Bandeira,`Valor de Venda`)
ft113OBP$Bandeira <- "OUTRAS"
ft113BP <- bind_rows(ft113BP, ft113OBP)
ft113 <- ft113BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft113BP,
main="Boxplot de preços de D.S10 por bandeira - Norte (Jun/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftN1 <- ft111 %>%
left_join(ft112, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft113, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftN1 <- delete_part(ftN1, part = "header")
ftN1 <- add_header(x=ftN1, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftN1 <- add_header(x=ftN1,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftN1 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios do DIESEL S10 por BANDEIRA no Norte")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
ATEMS | 5.5482 | 0.2618 | 6.4464 | 0.5108 | 7.5210 | 0.5136 |
BRANCA | 5.6951 | 0.3199 | 6.6399 | 0.6212 | 7.5201 | 0.5231 |
EQUADOR | 5.7808 | 0.2820 | 6.7211 | 0.5629 | 7.7305 | 0.5268 |
IPIRANGA | 5.7541 | 0.3164 | 6.6682 | 0.5581 | 7.6512 | 0.4915 |
OUTRAS | 5.5652 | 0.2329 | 6.7285 | 0.5935 | 7.5179 | 0.5150 |
SABBÁ | 5.6448 | 0.2799 | 6.6125 | 0.5838 | 7.6070 | 0.5136 |
VIBRA ENERGIA | 5.8251 | 0.3793 | 6.7410 | 0.5961 | 7.6663 | 0.5427 |
ft121BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
Bandeira == 'VIBRA ENERGIA' |
Bandeira == 'EQUADOR') ) %>%
select(Bandeira,`Valor de Venda`)
ft121OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
Bandeira != 'VIBRA ENERGIA' &
Bandeira != 'EQUADOR')) %>%
select(Bandeira,`Valor de Venda`)
ft121OBP$Bandeira <- "OUTRAS"
ft121BP <- bind_rows(ft121BP, ft121OBP)
ft121 <- ft121BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft121BP,
main="Boxplot de preços de D.S500 por bandeira - Norte (Nov/21)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft122BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
Bandeira == 'VIBRA ENERGIA' |
Bandeira == 'EQUADOR') ) %>%
select(Bandeira,`Valor de Venda`)
ft122OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
Bandeira != 'VIBRA ENERGIA' &
Bandeira != 'EQUADOR')) %>%
select(Bandeira,`Valor de Venda`)
ft122OBP$Bandeira <- "OUTRAS"
ft122BP <- bind_rows(ft122BP, ft122OBP)
ft122 <- ft122BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft122BP,
main="Boxplot de preços de D.S500 por bandeira - Norte (Mar/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft123BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
Bandeira == 'VIBRA ENERGIA' |
Bandeira == 'EQUADOR') ) %>%
select(Bandeira,`Valor de Venda`)
ft123OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
Bandeira != 'VIBRA ENERGIA' &
Bandeira != 'EQUADOR')) %>%
select(Bandeira,`Valor de Venda`)
ft123OBP$Bandeira <- "OUTRAS"
ft123BP <- bind_rows(ft123BP, ft123OBP)
ft123 <- ft123BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft123BP,
main="Boxplot de preços de D.S500 por bandeira - Norte (Jun/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftN2 <- ft121 %>%
left_join(ft122, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft123, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftN2 <- delete_part(ftN2, part = "header")
ftN2 <- add_header(x=ftN2, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftN2 <- add_header(x=ftN2,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftN2 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios do DIESEL S500 por BANDEIRA no Norte")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
ATEMS | 5.5400 | 0.3050 | 6.4053 | 0.5169 | 7.4100 | 0.4727 |
BRANCA | 5.6350 | 0.3138 | 6.5579 | 0.6489 | 7.5062 | 0.5316 |
EQUADOR | 5.7871 | 0.2409 | 6.7374 | 0.5575 | 7.6786 | 0.5362 |
IPIRANGA | 5.7922 | 0.3423 | 6.6067 | 0.5603 | 7.5702 | 0.5265 |
OUTRAS | 5.5037 | 0.1456 | 6.5025 | 0.5853 | 7.3568 | 0.5049 |
SABBÁ | 5.6391 | 0.2743 | 6.6636 | 0.5664 | 7.6277 | 0.4835 |
VIBRA ENERGIA | 5.8151 | 0.4084 | 6.6829 | 0.6161 | 7.6280 | 0.5615 |
ft131BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
Bandeira == 'VIBRA ENERGIA' |
Bandeira == 'EQUADOR') ) %>%
select(Bandeira,`Valor de Venda`)
ft131OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
Bandeira != 'VIBRA ENERGIA' &
Bandeira != 'EQUADOR')) %>%
select(Bandeira,`Valor de Venda`)
ft131OBP$Bandeira <- "OUTRAS"
ft131BP <- bind_rows(ft131BP, ft131OBP)
ft131 <- ft131BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft131BP,
main="Boxplot de preços de G.C por bandeira - Norte (Nov/21)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft132BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
Bandeira == 'VIBRA ENERGIA' |
Bandeira == 'EQUADOR') ) %>%
select(Bandeira,`Valor de Venda`)
ft132OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
Bandeira != 'VIBRA ENERGIA' &
Bandeira != 'EQUADOR')) %>%
select(Bandeira,`Valor de Venda`)
ft132OBP$Bandeira <- "OUTRAS"
ft132BP <- bind_rows(ft132BP, ft132OBP)
ft132 <- ft132BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft132BP,
main="Boxplot de preços de G.C por bandeira - Norte (Mar/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft133BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
Bandeira == 'VIBRA ENERGIA' |
Bandeira == 'EQUADOR') ) %>%
select(Bandeira,`Valor de Venda`)
ft133OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
Bandeira != 'VIBRA ENERGIA' &
Bandeira != 'EQUADOR')) %>%
select(Bandeira,`Valor de Venda`)
ft133OBP$Bandeira <- "OUTRAS"
ft133BP <- bind_rows(ft133BP, ft133OBP)
ft133 <- ft133BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft133BP,
main="Boxplot de preços de G.C por bandeira - Norte (Jun/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftN3 <- ft131 %>%
left_join(ft132, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft133, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftN3 <- delete_part(ftN3, part = "header")
ftN3 <- add_header(x=ftN3, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftN3 <- add_header(x=ftN3,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftN3 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios da GASOLINA COMUM por BANDEIRA no Norte")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
ATEMS | 6.6923 | 0.2661 | 7.1455 | 0.4073 | 7.3664 | 0.3477 |
BRANCA | 6.7362 | 0.4597 | 7.1145 | 0.5964 | 7.3655 | 0.5121 |
EQUADOR | 6.8708 | 0.2502 | 7.3409 | 0.4379 | 7.5699 | 0.3567 |
IPIRANGA | 6.8071 | 0.3423 | 7.2090 | 0.4771 | 7.4220 | 0.3961 |
OUTRAS | 6.8752 | 0.2043 | 7.2993 | 0.3375 | 7.4517 | 0.2537 |
SABBÁ | 6.7222 | 0.1604 | 7.1990 | 0.3598 | 7.4111 | 0.3166 |
VIBRA ENERGIA | 6.8072 | 0.3822 | 7.1859 | 0.4799 | 7.4195 | 0.4322 |
ft141BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
Bandeira == 'VIBRA ENERGIA' |
Bandeira == 'EQUADOR') ) %>%
select(Bandeira,`Valor de Venda`)
ft141OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
Bandeira != 'VIBRA ENERGIA' &
Bandeira != 'EQUADOR')) %>%
select(Bandeira,`Valor de Venda`)
ft141OBP$Bandeira <- "OUTRAS"
ft141BP <- bind_rows(ft141BP, ft141OBP)
ft141 <- ft141BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft141BP,
main="Boxplot de preços de G.A por bandeira - Norte (Nov/21)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft142BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA ADITIVADA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
Bandeira == 'VIBRA ENERGIA' |
Bandeira == 'EQUADOR') ) %>%
select(Bandeira,`Valor de Venda`)
ft142OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA ADITIVADA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
Bandeira != 'VIBRA ENERGIA' &
Bandeira != 'EQUADOR')) %>%
select(Bandeira,`Valor de Venda`)
ft142OBP$Bandeira <- "OUTRAS"
ft142BP <- bind_rows(ft142BP, ft142OBP)
ft142 <- ft142BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft142BP,
main="Boxplot de preços de G.A por bandeira - Norte (Mar/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft143BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
Bandeira == 'VIBRA ENERGIA' |
Bandeira == 'EQUADOR') ) %>%
select(Bandeira,`Valor de Venda`)
ft143OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
Bandeira != 'VIBRA ENERGIA' &
Bandeira != 'EQUADOR')) %>%
select(Bandeira,`Valor de Venda`)
ft143OBP$Bandeira <- "OUTRAS"
ft143BP <- bind_rows(ft143BP, ft143OBP)
ft143 <- ft143BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft143BP,
main="Boxplot de preços de G.A por bandeira - Norte (Jun/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftN4 <- ft141 %>%
left_join(ft142, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft143, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftN4 <- delete_part(ftN4, part = "header")
ftN4 <- add_header(x=ftN4, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftN4 <- add_header(x=ftN4,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftN4 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios da GASOLINA ADITIVADA por BANDEIRA no Norte")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
ATEMS | 6.6358 | 0.1485 | 7.1174 | 0.3825 | 7.3380 | 0.3018 |
BRANCA | 6.9246 | 0.2992 | 7.3086 | 0.3981 | 7.5214 | 0.3333 |
EQUADOR | 6.8769 | 0.2043 | 7.3442 | 0.3965 | 7.6281 | 0.2844 |
IPIRANGA | 6.9598 | 0.2610 | 7.3660 | 0.3724 | 7.6043 | 0.3114 |
OUTRAS | 6.9913 | 0.2755 | 7.4757 | 0.3617 | 7.5962 | 0.2718 |
SABBÁ | 6.8878 | 0.2021 | 7.3505 | 0.3516 | 7.5843 | 0.2988 |
VIBRA ENERGIA | 6.9101 | 0.2652 | 7.3217 | 0.3769 | 7.5789 | 0.3057 |
#-------
# Tabelas com preços médios e desvio padrão
# por bandeira da região nordeste para os meses de
# nov/21, mar/22 e jun/22, extratificadas pelos
# produtos D S10, D S500, G comum e G aditivada
#-------
ft211BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft211OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft211OBP$Bandeira <- "OUTRAS"
ft211BP <- bind_rows(ft211BP, ft211OBP)
ft211 <- ft211BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft211BP,
main="Boxplot de preços de D.S10 por bandeira - Nordeste (Nov/21)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft212BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL S10'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft212OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL S10'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft212OBP$Bandeira <- "OUTRAS"
ft212BP <- bind_rows(ft212BP, ft212OBP)
ft212 <- ft212BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft212BP,
main="Boxplot de preços de D.S10 por bandeira - Nordeste (Mar/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft213BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft213OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft213OBP$Bandeira <- "OUTRAS"
ft213BP <- bind_rows(ft213BP, ft213OBP)
ft213 <- ft213BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft213BP,
main="Boxplot de preços de D.S10 por bandeira - Nordeste (Jun/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftNE1 <- ft211 %>%
left_join(ft212, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft213, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftNE1 <- delete_part(ftNE1, part = "header")
ftNE1 <- add_header(x=ftNE1, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftNE1 <- add_header(x=ftNE1,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftNE1 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios do DIESEL S10 por BANDEIRA no Nordeste")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 5.5420 | 0.2047 | 6.5503 | 0.5797 | 7.5448 | 0.4951 |
IPIRANGA | 5.5691 | 0.2023 | 6.5937 | 0.5800 | 7.5749 | 0.5071 |
OUTRAS | 5.5804 | 0.2153 | 6.5299 | 0.5882 | 7.4862 | 0.4505 |
RAIZEN | 5.5854 | 0.1829 | 6.5515 | 0.5559 | 7.5800 | 0.4910 |
VIBRA ENERGIA | 5.6527 | 0.2121 | 6.5835 | 0.5596 | 7.5590 | 0.4967 |
ft221BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft221OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft221OBP$Bandeira <- "OUTRAS"
ft221BP <- bind_rows(ft221BP, ft221OBP)
ft221 <- ft221BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft221BP,
main="Boxplot de preços de D.S500 por bandeira - Nordeste (Nov/21)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft222BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft222OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft222OBP$Bandeira <- "OUTRAS"
ft222BP <- bind_rows(ft222BP, ft222OBP)
ft222 <- ft222BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft222BP,
main="Boxplot de preços de D.S500 por bandeira - Nordeste (Mar/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft223BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft223OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft223OBP$Bandeira <- "OUTRAS"
ft223BP <- bind_rows(ft223BP, ft223OBP)
ft223 <- ft223BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft223BP,
main="Boxplot de preços de D.S500 por bandeira - Nordeste (Jun/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftNE2 <- ft221 %>%
left_join(ft222, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft223, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftNE2 <- delete_part(ftNE2, part = "header")
ftNE2 <- add_header(x=ftNE2, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftNE2 <- add_header(x=ftNE2,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftNE2 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios do DIESEL S500 por BANDEIRA no Nordeste")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 5.4975 | 0.2114 | 6.5649 | 0.5414 | 7.5883 | 0.4981 |
IPIRANGA | 5.5399 | 0.2072 | 6.5435 | 0.5630 | 7.5564 | 0.5194 |
OUTRAS | 5.5253 | 0.2040 | 6.5164 | 0.5778 | 7.4730 | 0.4202 |
RAIZEN | 5.5496 | 0.2094 | 6.4815 | 0.5636 | 7.5845 | 0.5196 |
VIBRA ENERGIA | 5.6167 | 0.1901 | 6.5529 | 0.5146 | 7.5307 | 0.4776 |
ft231BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft231OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft231OBP$Bandeira <- "OUTRAS"
ft231BP <- bind_rows(ft231BP, ft231OBP)
ft231 <- ft231BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft231BP,
main="Boxplot de preços de G.C por bandeira - Nordeste (Nov/21)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft232BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft232OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft232OBP$Bandeira <- "OUTRAS"
ft232BP <- bind_rows(ft232BP, ft232OBP)
ft232 <- ft232BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft232BP,
main="Boxplot de preços de G.C por bandeira - Nordeste (Mar/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft233BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft233OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft233OBP$Bandeira <- "OUTRAS"
ft233BP <- bind_rows(ft233BP, ft233OBP)
ft233 <- ft233BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft233BP,
main="Boxplot de preços de G.C por bandeira - Nordeste (Jun/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftNE3 <- ft231 %>%
left_join(ft232, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft233, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftNE3 <- delete_part(ftNE3, part = "header")
ftNE3 <- add_header(x=ftNE3, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftNE3 <- add_header(x=ftNE3,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftNE3 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios da GASOLINA COMUM por BANDEIRA no Nordeste")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 6.7554 | 0.2398 | 7.2218 | 0.4796 | 7.6191 | 0.4037 |
IPIRANGA | 6.8149 | 0.2596 | 7.2909 | 0.5381 | 7.5904 | 0.4437 |
OUTRAS | 6.8112 | 0.2606 | 7.2059 | 0.4976 | 7.5098 | 0.3910 |
RAIZEN | 6.8046 | 0.2260 | 7.2060 | 0.4802 | 7.6405 | 0.4103 |
VIBRA ENERGIA | 6.8482 | 0.2438 | 7.2631 | 0.5028 | 7.6137 | 0.3909 |
ft241BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft241OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft241OBP$Bandeira <- "OUTRAS"
ft241BP <- bind_rows(ft241BP, ft241OBP)
ft241 <- ft241BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft241BP,
main="Boxplot de preços de G.A por bandeira - Nordeste (Nov/21)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft242BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA ADITIVADA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft242OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA ADITIVADA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft242OBP$Bandeira <- "OUTRAS"
ft242BP <- bind_rows(ft242BP, ft242OBP)
ft242 <- ft242BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft242BP,
main="Boxplot de preços de G.A por bandeira - Nordeste (Mar/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft243BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft243OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft243OBP$Bandeira <- "OUTRAS"
ft243BP <- bind_rows(ft243BP, ft243OBP)
ft243 <- ft243BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft243BP,
main="Boxplot de preços de G.A por bandeira - Nordeste (Jun/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftNE4 <- ft241 %>%
left_join(ft242, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft243, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftNE4 <- delete_part(ftNE4, part = "header")
ftNE4 <- add_header(x=ftNE4, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftNE4 <- add_header(x=ftNE4,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftNE4 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios da GASOLINA ADITIVADA por BANDEIRA no Nordeste")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 6.8232 | 0.2529 | 7.3080 | 0.4594 | 7.6942 | 0.3970 |
IPIRANGA | 7.0103 | 0.2834 | 7.4782 | 0.5282 | 7.7549 | 0.4381 |
OUTRAS | 6.9352 | 0.2801 | 7.3592 | 0.4997 | 7.6293 | 0.3699 |
RAIZEN | 7.0471 | 0.2221 | 7.4645 | 0.4868 | 7.8920 | 0.4041 |
VIBRA ENERGIA | 6.9881 | 0.2718 | 7.4009 | 0.4994 | 7.7335 | 0.3856 |
#-------
# Tabelas com preços médios e desvio padrão
# por bandeira da região centro oeste para os meses de
# nov/21, mar/22 e jun/22, extratificadas pelos
# produtos D S10, D S500, G comum e G aditivada
#-------
ft311BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft311OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft311OBP$Bandeira <- "OUTRAS"
ft311BP <- bind_rows(ft311BP, ft311OBP)
ft311 <- ft311BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft311BP,
main="Boxplot de preços de D.S10 por bandeira - Centro Oeste (Nov/21)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft312BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL S10'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft312OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL S10'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft312OBP$Bandeira <- "OUTRAS"
ft312BP <- bind_rows(ft312BP, ft312OBP)
ft312 <- ft312BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft312BP,
main="Boxplot de preços de D.S10 por bandeira - Centro Oeste (Mar/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft313BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft313OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft313OBP$Bandeira <- "OUTRAS"
ft313BP <- bind_rows(ft313BP, ft313OBP)
ft313 <- ft313BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft313BP,
main="Boxplot de preços de D.S10 por bandeira - Centro Oeste (Jun/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftCO1 <- ft311 %>%
left_join(ft312, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft313, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftCO1 <- delete_part(ftCO1, part = "header")
ftCO1 <- add_header(x=ftCO1, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftCO1 <- add_header(x=ftCO1,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftCO1 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios do DIESEL S10 por BANDEIRA no Centro Oeste")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 5.6953 | 0.1898 | 6.5643 | 0.6003 | 7.3501 | 0.3874 |
IPIRANGA | 5.6472 | 0.2539 | 6.4187 | 0.5501 | 7.4013 | 0.4292 |
OUTRAS | 5.6570 | 0.2874 | 6.4980 | 0.5914 | 7.4196 | 0.4933 |
RAIZEN | 5.7063 | 0.1875 | 6.5195 | 0.5260 | 7.4010 | 0.3833 |
VIBRA ENERGIA | 5.7258 | 0.2893 | 6.5542 | 0.5454 | 7.4680 | 0.4867 |
ft321BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft321OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft321OBP$Bandeira <- "OUTRAS"
ft321BP <- bind_rows(ft321BP, ft321OBP)
ft321 <- ft321BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft321BP,
main="Boxplot de preços de D.S500 por bandeira - Centro Oeste (Nov/21)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft322BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft322OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft322OBP$Bandeira <- "OUTRAS"
ft322BP <- bind_rows(ft322BP, ft322OBP)
ft322 <- ft322BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft322BP,
main="Boxplot de preços de D.S500 por bandeira - Centro Oeste (Mar/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft323BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft323OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft323OBP$Bandeira <- "OUTRAS"
ft323BP <- bind_rows(ft323BP, ft323OBP)
ft323 <- ft323BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft323BP,
main="Boxplot de preços de D.S500 por bandeira - Centro Oeste (Jun/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftCO2 <- ft321 %>%
left_join(ft322, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft323, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftCO2 <- delete_part(ftCO2, part = "header")
ftCO2 <- add_header(x=ftCO2, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftCO2 <- add_header(x=ftCO2,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftCO2 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios do DIESEL S500 por BANDEIRA no Centro Oeste")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 5.5267 | 0.1876 | 6.4004 | 0.5619 | 7.1575 | 0.4063 |
IPIRANGA | 5.5568 | 0.2250 | 6.3397 | 0.5341 | 7.3515 | 0.4088 |
OUTRAS | 5.5519 | 0.2870 | 6.3562 | 0.5780 | 7.2815 | 0.4801 |
RAIZEN | 5.5452 | 0.2044 | 6.3637 | 0.5308 | 7.2833 | 0.4032 |
VIBRA ENERGIA | 5.6435 | 0.3531 | 6.4404 | 0.5517 | 7.2761 | 0.4699 |
ft331BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft331OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft331OBP$Bandeira <- "OUTRAS"
ft331BP <- bind_rows(ft331BP, ft331OBP)
ft331 <- ft331BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft331BP,
main="Boxplot de preços de G.C por bandeira - Centro Oeste (Nov/21)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft332BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft332OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft332OBP$Bandeira <- "OUTRAS"
ft332BP <- bind_rows(ft332BP, ft332OBP)
ft332 <- ft332BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft332BP,
main="Boxplot de preços de G.C por bandeira - Centro Oeste (Mar/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft333BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft333OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft333OBP$Bandeira <- "OUTRAS"
ft333BP <- bind_rows(ft333BP, ft333OBP)
ft333 <- ft333BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft333BP,
main="Boxplot de preços de G.C por bandeira - Centro Oeste (Jun/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftCO3 <- ft331 %>%
left_join(ft332, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft333, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftCO3 <- delete_part(ftCO3, part = "header")
ftCO3 <- add_header(x=ftCO3, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftCO3 <- add_header(x=ftCO3,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftCO3 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios da GASOLINA COMUM por BANDEIRA no Centro Oeste")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 6.9360 | 0.3046 | 7.0160 | 0.4270 | 7.2099 | 0.3899 |
IPIRANGA | 6.9894 | 0.3158 | 7.0642 | 0.4305 | 7.3057 | 0.3542 |
OUTRAS | 6.8435 | 0.2653 | 6.9851 | 0.4095 | 7.2931 | 0.3442 |
RAIZEN | 6.9435 | 0.2889 | 7.0233 | 0.4473 | 7.2557 | 0.3443 |
VIBRA ENERGIA | 6.9255 | 0.2795 | 7.0760 | 0.4473 | 7.3143 | 0.3799 |
ft341BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft341OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft341OBP$Bandeira <- "OUTRAS"
ft341BP <- bind_rows(ft341BP, ft341OBP)
ft341 <- ft341BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft341BP,
main="Boxplot de preços de G.A por bandeira - Centro Oeste (Nov/21)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft342BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA ADITIVADA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft342OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA ADITIVADA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft342OBP$Bandeira <- "OUTRAS"
ft342BP <- bind_rows(ft342BP, ft342OBP)
ft342 <- ft342BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft342BP,
main="Boxplot de preços de G.A por bandeira - Centro Oeste (Mar/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft343BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft343OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft343OBP$Bandeira <- "OUTRAS"
ft343BP <- bind_rows(ft343BP, ft343OBP)
ft343 <- ft343BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft343BP,
main="Boxplot de preços de G.A por bandeira - Centro Oeste (Jun/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftCO4 <- ft341 %>%
left_join(ft342, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft343, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftCO4 <- delete_part(ftCO4, part = "header")
ftCO4 <- add_header(x=ftCO4, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftCO4 <- add_header(x=ftCO4,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftCO4 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios da GASOLINA ADITIVADA por BANDEIRA no Centro Oeste")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 7.0460 | 0.3087 | 7.0998 | 0.4160 | 7.2884 | 0.3802 |
IPIRANGA | 7.0963 | 0.3163 | 7.1797 | 0.4069 | 7.4495 | 0.3304 |
OUTRAS | 6.9317 | 0.2440 | 7.1186 | 0.3914 | 7.3534 | 0.3093 |
RAIZEN | 7.1206 | 0.3135 | 7.1773 | 0.4365 | 7.4386 | 0.3333 |
VIBRA ENERGIA | 7.0180 | 0.2755 | 7.1903 | 0.4356 | 7.4343 | 0.3690 |
#-------
# Tabelas com preços médios e desvio padrão
# por bandeira da região sudeste para os meses de
# nov/21, mar/22 e jun/22, extratificadas pelos
# produtos D S10, D S500, G comum e G aditivada
#-------
ft411BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft411OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft411OBP$Bandeira <- "OUTRAS"
ft411BP <- bind_rows(ft411BP, ft411OBP)
ft411 <- ft411BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft411BP,
main="Boxplot de preços de D.S10 por bandeira - Sudeste (Nov/21)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft412BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL S10'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft412OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL S10'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft412OBP$Bandeira <- "OUTRAS"
ft412BP <- bind_rows(ft412BP, ft412OBP)
ft412 <- ft412BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft412BP,
main="Boxplot de preços de D.S10 por bandeira - Sudeste (Mar/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft413BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft413OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft413OBP$Bandeira <- "OUTRAS"
ft413BP <- bind_rows(ft413BP, ft413OBP)
ft413 <- ft413BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft413BP,
main="Boxplot de preços de D.S10 por bandeira - Sudeste (Jun/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftSE1 <- ft411 %>%
left_join(ft412, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft413, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftSE1 <- delete_part(ftSE1, part = "header")
ftSE1 <- add_header(x=ftSE1, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftSE1 <- add_header(x=ftSE1,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftSE1 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios do DIESEL S10 por BANDEIRA no Sudeste")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 5.3529 | 0.1747 | 6.2334 | 0.5269 | 7.1427 | 0.3961 |
IPIRANGA | 5.4285 | 0.1888 | 6.3246 | 0.4818 | 7.3066 | 0.4437 |
OUTRAS | 5.4182 | 0.1985 | 6.3174 | 0.5480 | 7.2545 | 0.4001 |
RAIZEN | 5.3878 | 0.1763 | 6.2967 | 0.4940 | 7.2533 | 0.4184 |
VIBRA ENERGIA | 5.4497 | 0.1926 | 6.3371 | 0.4985 | 7.3234 | 0.4129 |
ft421BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft421OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft421OBP$Bandeira <- "OUTRAS"
ft421BP <- bind_rows(ft421BP, ft421OBP)
ft421 <- ft421BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft421BP,
main="Boxplot de preços de D.S500 por bandeira - Sudeste (Nov/21)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft422BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft422OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft422OBP$Bandeira <- "OUTRAS"
ft422BP <- bind_rows(ft422BP, ft422OBP)
ft422 <- ft422BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft422BP,
main="Boxplot de preços de D.S500 por bandeira - Sudeste (Mar/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft423BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft423OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft423OBP$Bandeira <- "OUTRAS"
ft423BP <- bind_rows(ft423BP, ft423OBP)
ft423 <- ft423BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft423BP,
main="Boxplot de preços de D.S500 por bandeira - Sudeste (Jun/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftSE2 <- ft421 %>%
left_join(ft422, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft423, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftSE2 <- delete_part(ftSE2, part = "header")
ftSE2 <- add_header(x=ftSE2, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftSE2 <- add_header(x=ftSE2,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftSE2 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios do DIESEL S500 por BANDEIRA no Sudeste")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 5.2529 | 0.1673 | 6.1485 | 0.5069 | 7.0401 | 0.4003 |
IPIRANGA | 5.3472 | 0.1781 | 6.2186 | 0.4652 | 7.2082 | 0.4423 |
OUTRAS | 5.3815 | 0.2024 | 6.2582 | 0.5301 | 7.1572 | 0.4045 |
RAIZEN | 5.3101 | 0.1763 | 6.1802 | 0.4813 | 7.1251 | 0.4257 |
VIBRA ENERGIA | 5.3786 | 0.1728 | 6.2316 | 0.4808 | 7.1951 | 0.4239 |
ft431BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft431OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft431OBP$Bandeira <- "OUTRAS"
ft431BP <- bind_rows(ft431BP, ft431OBP)
ft431 <- ft431BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft431BP,
main="Boxplot de preços de G.C por bandeira - Sudeste (Nov/21)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft432BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft432OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft432OBP$Bandeira <- "OUTRAS"
ft432BP <- bind_rows(ft432BP, ft432OBP)
ft432 <- ft432BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft432BP,
main="Boxplot de preços de G.C por bandeira - Sudeste (Mar/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft433BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft433OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft433OBP$Bandeira <- "OUTRAS"
ft433BP <- bind_rows(ft433BP, ft433OBP)
ft433 <- ft433BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft433BP,
main="Boxplot de preços de G.C por bandeira - Sudeste (Jun/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftSE3 <- ft431 %>%
left_join(ft432, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft433, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftSE3 <- delete_part(ftSE3, part = "header")
ftSE3 <- add_header(x=ftSE3, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftSE3 <- add_header(x=ftSE3,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftSE3 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios da GASOLINA COMUM por BANDEIRA no Sudeste")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 6.5786 | 0.4136 | 6.8177 | 0.5213 | 7.0277 | 0.4901 |
IPIRANGA | 6.6737 | 0.3737 | 6.9531 | 0.4768 | 7.1627 | 0.4341 |
OUTRAS | 6.8882 | 0.4002 | 7.1631 | 0.4804 | 7.4280 | 0.4090 |
RAIZEN | 6.6873 | 0.4082 | 6.9767 | 0.5070 | 7.1833 | 0.4519 |
VIBRA ENERGIA | 6.8331 | 0.4122 | 7.1143 | 0.5135 | 7.3348 | 0.4808 |
ft441BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft441OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft441OBP$Bandeira <- "OUTRAS"
ft441BP <- bind_rows(ft441BP, ft441OBP)
ft441 <- ft441BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft441BP,
main="Boxplot de preços de G.A por bandeira - Sudeste (Nov/21)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft442BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA ADITIVADA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft442OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA ADITIVADA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft442OBP$Bandeira <- "OUTRAS"
ft442BP <- bind_rows(ft442BP, ft442OBP)
ft442 <- ft442BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft442BP,
main="Boxplot de preços de G.A por bandeira - Sudeste (Mar/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft443BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft443OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft443OBP$Bandeira <- "OUTRAS"
ft443BP <- bind_rows(ft443BP, ft443OBP)
ft443 <- ft443BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft443BP,
main="Boxplot de preços de G.A por bandeira - Sudeste (Jun/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftSE4 <- ft441 %>%
left_join(ft442, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft443, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftSE4 <- delete_part(ftSE4, part = "header")
ftSE4 <- add_header(x=ftSE4, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftSE4 <- add_header(x=ftSE4,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftSE4 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios da GASOLINA ADITIVADA por BANDEIRA no Sudeste")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 6.6797 | 0.4155 | 6.9317 | 0.5252 | 7.1727 | 0.4807 |
IPIRANGA | 6.8641 | 0.3654 | 7.1498 | 0.4730 | 7.3651 | 0.4284 |
OUTRAS | 6.9696 | 0.3939 | 7.2933 | 0.4913 | 7.5474 | 0.4054 |
RAIZEN | 6.8914 | 0.3903 | 7.1814 | 0.5010 | 7.4000 | 0.4469 |
VIBRA ENERGIA | 6.9915 | 0.4451 | 7.2617 | 0.5442 | 7.4887 | 0.4958 |
#-------
# Tabelas com preços médios e desvio padrão
# por bandeira da região sul para os meses de
# nov/21, mar/22 e jun/22, extratificadas pelos
# produtos D S10, D S500, G comum e G aditivada
#-------
ft511BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft511OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL S10'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft511OBP$Bandeira <- "OUTRAS"
ft511BP <- bind_rows(ft511BP, ft511OBP)
ft511 <- ft511BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft511BP,
main="Boxplot de preços de D.S10 por bandeira - Sul (Nov/21)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft512BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL S10'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft512OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL S10'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft512OBP$Bandeira <- "OUTRAS"
ft512BP <- bind_rows(ft512BP, ft512OBP)
ft512 <- ft512BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft512BP,
main="Boxplot de preços de D.S10 por bandeira - Sul (Mar/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft513BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft513OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL S10'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft513OBP$Bandeira <- "OUTRAS"
ft513BP <- bind_rows(ft513BP, ft513OBP)
ft513 <- ft513BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft513BP,
main="Boxplot de preços de D.S10 por bandeira - Sul (Jun/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftS1 <- ft511 %>%
left_join(ft512, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft513, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftS1 <- delete_part(ftS1, part = "header")
ftS1 <- add_header(x=ftS1, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftS1 <- add_header(x=ftS1,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftS1 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios do DIESEL S10 por BANDEIRA no Sul")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 5.2672 | 0.1767 | 6.2188 | 0.5351 | 7.0827 | 0.4162 |
IPIRANGA | 5.2885 | 0.2248 | 6.2428 | 0.5559 | 7.2206 | 0.4453 |
OUTRAS | 5.2454 | 0.1866 | 6.1417 | 0.5122 | 7.1462 | 0.4242 |
RAIZEN | 5.2973 | 0.1781 | 6.2475 | 0.5209 | 7.1814 | 0.4330 |
VIBRA ENERGIA | 5.3592 | 0.2014 | 6.2761 | 0.5125 | 7.2080 | 0.4256 |
ft521BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft521OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft521OBP$Bandeira <- "OUTRAS"
ft521BP <- bind_rows(ft521BP, ft521OBP)
ft521 <- ft521BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft521BP,
main="Boxplot de preços de D.S500 por bandeira - Sul (Nov/21)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft522BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft522OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft522OBP$Bandeira <- "OUTRAS"
ft522BP <- bind_rows(ft522BP, ft522OBP)
ft522 <- ft522BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft522BP,
main="Boxplot de preços de D.S500 por bandeira - Sul (Mar/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft523BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft523OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft523OBP$Bandeira <- "OUTRAS"
ft523BP <- bind_rows(ft523BP, ft523OBP)
ft523 <- ft523BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft523BP,
main="Boxplot de preços de D.S500 por bandeira - Sul (Jun/22)",
ylim = c(4,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftS2 <- ft521 %>%
left_join(ft522, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft523, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftS2 <- delete_part(ftS2, part = "header")
ftS2 <- add_header(x=ftS2, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftS2 <- add_header(x=ftS2,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftS2 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios do DIESEL S500 por BANDEIRA no Sul")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 5.1683 | 0.1717 | 6.1333 | 0.5008 | 6.9350 | 0.4157 |
IPIRANGA | 5.2464 | 0.2283 | 6.1599 | 0.5270 | 7.0985 | 0.4328 |
OUTRAS | 5.2041 | 0.1814 | 6.0752 | 0.4797 | 7.0657 | 0.4166 |
RAIZEN | 5.2536 | 0.1905 | 6.1651 | 0.4936 | 7.0440 | 0.4205 |
VIBRA ENERGIA | 5.3006 | 0.2107 | 6.1587 | 0.4789 | 7.0937 | 0.4309 |
ft531BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft531OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft531OBP$Bandeira <- "OUTRAS"
ft531BP <- bind_rows(ft531BP, ft531OBP)
ft531 <- ft531BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft531BP,
main="Boxplot de preços de G.C por bandeira - Sul (Nov/21)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft532BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft532OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft532OBP$Bandeira <- "OUTRAS"
ft532BP <- bind_rows(ft532BP, ft532OBP)
ft532 <- ft532BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft532BP,
main="Boxplot de preços de G.C por bandeira - Sul (Mar/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft533BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft533OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft533OBP$Bandeira <- "OUTRAS"
ft533BP <- bind_rows(ft533BP, ft533OBP)
ft533 <- ft533BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft533BP,
main="Boxplot de preços de G.C por bandeira - Sul (Jun/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftS3 <- ft531 %>%
left_join(ft532, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft533, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftS3 <- delete_part(ftS3, part = "header")
ftS3 <- add_header(x=ftS3, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftS3 <- add_header(x=ftS3,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftS3 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios da GASOLINA COMUM por BANDEIRA no Sul")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 6.6994 | 0.3044 | 6.8084 | 0.3804 | 6.9930 | 0.3230 |
IPIRANGA | 6.8060 | 0.3508 | 6.8745 | 0.4192 | 7.0985 | 0.3374 |
OUTRAS | 6.7010 | 0.2955 | 6.8565 | 0.3567 | 7.0808 | 0.2783 |
RAIZEN | 6.8405 | 0.3309 | 6.8550 | 0.4060 | 7.0835 | 0.3125 |
VIBRA ENERGIA | 6.8319 | 0.3419 | 6.8823 | 0.4055 | 7.0954 | 0.3328 |
ft541BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft541OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` <= "2022-01-01" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft541OBP$Bandeira <- "OUTRAS"
ft541BP <- bind_rows(ft541BP, ft541OBP)
ft541 <- ft541BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft541BP,
main="Boxplot de preços de G.A por bandeira - Sul (Nov/21)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft542BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA ADITIVADA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft542OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA ADITIVADA'
& (`Data da Coleta` > "2022-02-28" &
`Data da Coleta` < "2022-04-01") &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft542OBP$Bandeira <- "OUTRAS"
ft542BP <- bind_rows(ft542BP, ft542OBP)
ft542 <- ft542BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft542BP,
main="Boxplot de preços de G.A por bandeira - Sul (Mar/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ft543BP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira == 'BRANCA' |
Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
Bandeira == 'VIBRA ENERGIA') ) %>%
select(Bandeira,`Valor de Venda`)
ft543OBP <- DB_Comb %>%
filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA ADITIVADA'
& `Data da Coleta` > "2022-05-30" &
(Bandeira != 'BRANCA' &
Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
Bandeira != 'VIBRA ENERGIA')) %>%
select(Bandeira,`Valor de Venda`)
ft543OBP$Bandeira <- "OUTRAS"
ft543BP <- bind_rows(ft543BP, ft543OBP)
ft543 <- ft543BP %>%
group_by(Bandeira) %>%
summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
data.frame()
boxplot(`Valor de Venda`~Bandeira,data=ft543BP,
main="Boxplot de preços de G.A por bandeira - Sul (Jun/22)",
ylim = c(5,9), ylab = "Preço", col=cor_dark,
cex.axis = 0.7)ftS4 <- ft541 %>%
left_join(ft542, by = c("Bandeira" = "Bandeira")) %>%
left_join(ft543, by = c("Bandeira" = "Bandeira")) %>%
flextable()
ftS4 <- delete_part(ftS4, part = "header")
ftS4 <- add_header(x=ftS4, Bandeira = "Bandeira",
preco_med.x="Preço", desv_pad.x="DP",
preco_med.y="Preço", desv_pad.y="DP",
preco_med="Preço", desv_pad="DP",
top = FALSE)
ftS4 <- add_header(x=ftS4,
preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
preco_med.y="Março/2022", desv_pad.y="Março/2022",
preco_med="Junho/2022", desv_pad="Junho/2022",
top = TRUE)
ftS4 %>%
autofit() %>%
theme_booktabs(bold_header = TRUE) %>%
merge_h(part = "header") %>%
align(align = "center", part = "all") %>%
merge_v(j = 1) %>%
valign(j = 1, valign = "top") %>%
set_caption(caption = "Preços médios da GASOLINA ADITIVADA por BANDEIRA no Sul")Novembro/2021 | Março/2022 | Junho/2022 | ||||
Bandeira | Preço | DP | Preço | DP | Preço | DP |
BRANCA | 6.8005 | 0.3080 | 6.8546 | 0.4072 | 7.0339 | 0.3498 |
IPIRANGA | 6.9676 | 0.3453 | 7.0355 | 0.4215 | 7.2571 | 0.3354 |
OUTRAS | 6.7990 | 0.3175 | 6.9599 | 0.3621 | 7.1692 | 0.2888 |
RAIZEN | 7.0293 | 0.3125 | 7.0195 | 0.4219 | 7.2494 | 0.3198 |
VIBRA ENERGIA | 6.9847 | 0.3426 | 7.0259 | 0.4101 | 7.2416 | 0.3343 |