1. INTRODUÇÃO

A ANP regula e fiscaliza a indústria do petróleo e gás, ao longo de toda a cadeia, do poço ao posto. Nessa tarefa, uma das atividades que mais reúne agentes econômicos a serem regulados e fiscalizados por essa autarquia especial é a de revendedores de combustível automotivo, conhecidos popularmente como postos de combustíveis (ANP, 2022a). E faz parte das atribuições da Agência a realização de pesquisas mercadológicas, em relação a esses comercializadores, visando, sobretudo, ao levantamento dos preços de venda de cada combustível nos postos para acompanhar os valores praticados em todo território nacional.

As informações obtidas em tais pesquisas são divulgadas e disponibilizadas frequentemente à sociedade, no site da ANP, em arquivos contendo planilhas eletrônicas. Ademais, fica disponível, nesse site, um gráfico contendo a série histórica do preço de venda de cada combustível. Toda essa publicização de informações se deve ao disposto no Decreto nº 8.777/2016.

O presente estudo utiliza justamente informações contidas naqueles arquivos para realizar análises estatísticas referentes a combustíveis líquidos fósseis de determinado período.

Essas análises podem mostrar à sociedade a existência de diferenças significativas do preço cobrado nas bombas entre as regiões, os estados e as principais capitais brasileiras. Adicionalmente, podem indicar se determinada(s) bandeira(s) (marca dos postos) revendedora(s) está(ão) praticando preços mais baixos ou mais altos no mercado, em relação às demais.

Outra possibilidade, a partir de tais análises, é verificar o impacto da política de negócios dos agentes atuantes no mercado de petróleo brasileiro, em especial do agente dominante Petrobras, nos aspectos econômicos do país, principalmente em momentos de conflitos no mundo globalizado que possam influenciar o mercado de petróleo e gás, como a recente guerra entre Rússia e Ucrânia.

2. OBJETIVO

Este estudo visa efetuar uma análise estatística em relação aos combustíveis líquidos fósseis comercializados nos postos revendedores de todas as regiões brasileiras em determinados períodos de 2021 e de 2022.

2.1. Objetivos específicos

Especificamente, este estudo busca:

Efetuar uma análise estatística dos combustíveis líquidos fósseis nas regiões brasileiras para os meses de novembro de 2021, e março e junho, ambos de 2022, verificando, sobretudo, o comportamento dos preços nesses períodos.
Avaliar a existência de diferença significativa nos preços de combustíveis fósseis entre as regiões, considerando-se os períodos analisados.
Verificar o preço médio dos combustíveis líquidos fósseis, por bandeira, no Brasil, de maneira agregada, para os meses de novembro de 2021, e março e junho, ambos de 2022.
Avaliar a existência de diferença significativa nos preços de combustíveis fósseis entre os diferentes tipos de bandeira, considerando-se os períodos analisados.
Verificar o preço médio dos combustíveis líquidos fósseis, por bandeira, nas regiões brasileiras para os meses de novembro de 2021, e março e junho, ambos de 2022.
Verificar o preço médio dos combustíveis líquidos fósseis nos estados brasileiros para os meses de novembro de 2021, e março e junho, ambos de 2022.
Avaliar o comportamento dos preços de comercialização dos combustíveis líquidos fósseis nos estados entre os três períodos analisados.
Avaliar a existência de correlação entre os preços dos combustíveis fósseis e o IPCA nas principais capitais brasileiras, no período analisado.

3. MERCADO BRASILEIRO DE COMBUSTÍVEL

3.1. Cenário contemporâneo

Historicamente, o Brasil sempre foi deficitário em relação aos combustíveis automotivos, necessitando, frequentemente, de importações de diesel e de gasolina para complementação de seus estoques, visando suprir a demanda interna desses combustíveis.

Em 2021, a importação de diesel e de gasolina, em relação ao total comercializado no Brasil, foram de, aproximadamente, 23% e 6%, respectivamente (ANP, 2021). Em 2022, estima-se que os valores importados ficaram em torno de 25%, para o diesel, e de 8,5%, para a gasolina (ANP, 2022b).

Nesses mesmos anos, a comercialização total de diesel no Brasil foi de cerca de 63 bilhões de litros, em 2021, e de 58 bilhões de litros, até novembro de 2022, enquanto a de gasolina foi de, aproximadamente, 39 bilhões de litros, tanto em 2021 quanto no período de janeiro a novembro de 2022 (ANP, 2021), (ANP, 2022b), (EPE, 2022).

De acordo com esses dados, verifica-se uma maior utilização de diesel na matriz energética brasileira, em função, principalmente, do modelo adotado para o transporte de carga, eminentemente rodoviário e à base de diesel, além de uma dependência maior da importação deste combustível, quando comparado com a gasolina, no mercado interno brasileiro. A associação de todas essas características relacionadas ao mercado de combustíveis, especialmente em relação ao diesel, pode acarretar uma degradação na política econômica do Brasil, dependendo da estratégia adotada para esse mercado, sobretudo em função de uma elevação substancial do petróleo e de seus derivados no mercado externo.

Uma forma encontrada para o governo brasileiro buscar soluções devido aos possíveis problemas relacionados ao mercado de combustíveis, como um todo, e não só o de diesel, foi a criação e controle de uma empresa do setor de petróleo e gás, a Petrobras.

Nesse contexto, quase toda infraestrutura de refino de petróleo no Brasil encontra-se ainda sob o controle da Petrobras, sendo que, das 18 refinarias existentes até o início de 2021, essa empresa detinha 13 refinarias que respondiam por cerca de 98% da capacidade de processamento de petróleo no país. Além disso, essa empresa atua na atividade de importação de diesel e de gasolina (dentre outros derivados), sendo responsável, até 2019, por cerca de 85% desta (MME, 2019).

Entretanto, desde o final de 2016, essa empresa anunciou um reposicionamento no mercado de combustíveis no Brasil, direcionando sua estratégia de negócios à maximização de valor da empresa por meio de uma gestão ativa do portfólio de refino, logística, comercialização e petroquímica integrados às atividades de produção de óleo e gás nacionais (PETROBRAS, 2018).

3.2. Reposicionamento da Petrobras

A Petrobras decidiu pela promoção de uma política de preços de mercado e maximização de margens da sua cadeia de valor, implementando o PPI (Preço de Paridade de Importação), além de anunciar o desinvestimento de alguns ativos, incluindo a BR Distribuidora e 8 refinarias.

Essa decisão, se e quando totalmente implementada, estabelecerá uma redefinição do papel exercido pela Petrobras e uma nova estrutura de mercado com a possível presença de múltiplos agentes econômicos, alterando a dinâmica de planejamento logístico de suprimento de derivados imposta há anos no país, acarretando uma reestruturação do abastecimento nacional de combustíveis.

O planejamento logístico do abastecimento nacional de combustíveis que ficou, há anos, a cargo da Petrobras se mostrou um dos principais instrumentos de garantia do abastecimento de combustíveis ao logo do território nacional, sobretudo nos eventuais momentos de interrupção dos fluxos logísticos em determinados pontos da cadeia. A partir desse planejamento centralizado, a Petrobras conseguia ter uma visão holística do abastecimento e realizava eventuais remanejamentos de produção e de logística quando necessários à garantia do abastecimento (MME, 2020).

A despeito das vantagens do planejamento logístico conduzido pela Petrobras há anos, a intensão é a de que exista uma maior concorrência com a entrada de mais agentes econômicos no mercado de petróleo e gás, especialmente nos ramos de refino, de distribuição e de comercialização, entendidos como concorrenciais, podendo conduzir a uma redução dos preços de derivados de petróleo ao longo de todo o território brasileiro (MME, 2020).

Pelo lado da Petrobras, a principal vantagem verificada foi a sua extraordinária margem de lucro, nos últimos dois anos (ALVARENGA, 2022), (PAMPLONA, 2022), com a implementação de seus planos relacionados aos desinvestimentos e à precificação de seus produtos.

Nesse sentido, a mudança de rumo traçada ainda em 2016 visava propiciar a busca da melhor rentabilidade para a empresa, valendo-se da aderência à dinâmica de precificação das commodities internacionais, com a adoção da prática de preços competitivos e que tenham como referência o conceito de Preço de Paridade de Importação (PPI), adicionado de uma margem para remunerar os riscos inerentes à operação. Assim, os preços praticados pela empresa nunca estariam abaixo dessa paridade e o seu principal objetivo passou a ser a maximização do resultado “preço x volume”.

Em relação aos ativos desinvestidos, a Petrobras vendeu o restante de sua participação na BR Distribuidora, em junho de 2021, transformando essa empresa em 100% privada, e saindo definitivamente do ramo de revenda de combustíveis (FERRARI, 2021). Posteriormente, em novembro de 2021, concluiu a venda da RLAM (Refinaria Landulpho Alves), refinaria localizada na Bahia, juntamente com todos os seus ativos logísticos, para um grupo investidor internacional (PETROBRAS, 2021).

Importante salientar que, de acordo com o planejamento inicial, a Petrobras colocou à venda uma capacidade de refino compreendida entre 40% a 50% da capacidade total da empresa, selecionando, para a alienação, ativos localizados fora do eixo Rio-São Paulo (MME, 2020).

3.4. Influência do conflito Rússia x Ucrânia

O conflito iniciado no final de 2021 entre Rússia e Ucrânia acarretou uma escalada de preços de insumos energéticos em todo o mundo, inclusive do petróleo e seus derivados. Esse fato culminou com uma elevação dos preços dos combustíveis no mercado interno brasileiro a partir do início de 2022, situação que se agravou ainda mais em fevereiro de 2022, deflagrando uma verdadeira crise de combustíveis no Brasil.

Os sucessivos aumentos nos preços internos dos combustíveis acarretados por essa crise geraram uma situação de emergência, fato que, via de regra, requer o envolvimento, o acompanhamento e a tomada de decisões adequadas por parte de autoridades governamentais, com a finalidade de contornar ou suavizar os efeitos deletérios das condições econômicas e sociais do país.

Em meados de 2022, em função da situação formada e de decisões tomadas pelas autoridades governamentais brasileiras, o preço de comercialização do diesel ultrapassou, após vários anos, o da gasolina, conforme pode ser verificado na Figura 1, a seguir.

Na busca de solução para atenuar ou solucionar os efeitos da referida crise dos combustíveis, estes foram classificados e declarados como itens essenciais pelo Poder Legislativo, no âmbito da discussão do Projeto de Lei que visava à redução e à harmonização nacional da tributação via ICMS, que culminou nas publicações de Emenda Constitucional e de Lei Complementar, em julho de 2022, positivando, além de outros dispositivos, essa “nova” característica dos combustíveis.

4. ABORDAGEM ESTATÍSTICA

A estatística faz parte do método científico, sendo fundamental para integrar as explicações e as teorias a partir dos dados. Ela utiliza procedimentos sistemáticos que geralmente necessitam de evidências para apoiar determinado argumento (DUTT-ROSS, 2020).

Dentre as ferramentas utilizadas nas análises estatísticas podem ser citadas aquelas para (i) cálculo das medidas de tendência central, como as médias e a mediana; (ii) verificação da medida de dispersão ou variabilidade, como o desvio padrão; (iii) visualização de dados numéricos, como o histograma e o boxplot; (iv) análise de correlações entre variáveis, como os testes de correlação e diagramas de dispersão; e (v) realização de testes de hipóteses.

As medidas de tendência central resultam de certas operações feitas em variáveis quantitativas para passar uma ideia representativa da ordem de grandeza dos valores da variável medida, ou do valor que melhor representa os dados coletados. Para essas medidas destacam-se a média de uma série de números, que é a soma destes números dividida pela quantidade de números que compõe a série, e a mediana, valor central de determinada variável numérica (JELIHOVSCHI, 2014).

A medida da dispersão está relacionada à distribuição de determinada variável, ou seja, à variabilidade desta em torno de um valor padrão. Comumente, essa dispersão é representada pelo desvio padrão, definido como o padrão para se medir desvios em relação a um valor esperado (ASSUNÇÃO, 2017).

É importante frisar que a média, mediana e desvio padrão fazem parte do resumo estatístico do conjunto de dados de determinada variável quantitativa.

O histograma é uma representação gráfica que divide uma série de dados em diferentes classes igualmente espaçadas, mostrando a frequência de valores em cada classe. Ele permite verificar como os dados de uma variável quantitativa (tipicamente contínua) espalham-se no intervalo formado entre o menor e o maior valor de uma amostra, possibilitando a visualização da tendência de (i) acúmulos em uma pequena região, (ii) espalhamento igualitário ou (iii) concentração em mais de uma região, dentro do intervalo delimitado pelos extremos, máximo e mínimo (ASSUNÇÃO, 2017). Os histogramas podem ser simétricos, distorcidos à esquerda ou à direita, achatados, bimodais ou multimodais.

Já o boxplot (ou diagrama de caixa) é um resumo gráfico da dispersão dos dados com alta compressão, usando 5 números apenas, e possibilita mostrar rapidamente se os dados são simétricos, onde estão concentrados e se existem valores extremos, denominados outliers (ASSUNÇÃO, 2017). Ele pode ser usado para comparar certos resultados, uma vez que os dados gráficos apresentados possuem a mesma unidade de medida e a mesma ordem de grandeza (JELIHOVSCHI, 2014).

Os testes de correlação e o diagrama de dispersão são ferramentas utilizadas com frequência para analisar se os dados obtidos de duas variáveis apresentam certa relação entre si, valendo-se do coeficiente de correlação, que é um número que varia entre −1 e 1 e que indica a força da correlação linear entre duas variáveis, e se estas possuem relação positiva ou negativa. Um valor positivo desse coeficiente indica uma correlação linear positiva entre duas variáveis e um valor negativo, uma correlação negativa. Ademais, quanto mais próximo de zero o valor do coeficiente, mais fraca é a relação entre as duas variáveis, e quanto mais perto de 1 ou −1, mais forte a relação linear entre elas (JELIHOVSCHI, 2014).

Os testes de hipóteses são métodos estatísticos importantes para determinar se há efeitos estatisticamente significativos entre observações e estão fundamentados, geralmente, na tomada de decisões com base no resultado do p-valor. Contam com o teste de uma hipótese nula, que possui uma formulação específica para cada teste, e a hipótese alternativa, contrária à hipótese nula (DUTT-ROSS, 2020).

O resultado apresentado pelo p-valor nos testes de hipóteses indica se a hipótese nula deve ser rejeitada ou não. Para tal, o p-valor é comparado com um valor de alpha pré-determinado (geralmente adota-se o valor de 0,05). Assim, se o p-valor para o teste for menor que alpha, rejeita-se a hipótese nula e, em caso contrário (p-valor maior ou igual a alpha) não se rejeita a hipótese nula (DUTT-ROSS, 2020).

No pressente estudo importa mencionar os testes de Kolmogorov-Smirnov, de correlação de Pearson e de Spearman, de Kruscal-Wallis e de comparações múltiplas de Wilcoxon.

O teste de Kolmogorov-Smirnov, a exemplo do teste de Shapiro Wilk, serve para aferir a normalidade dos dados (se a variável segue uma distribuição normal). Suas hipóteses são:

H0: dados seguem uma distribuição normal.
H1: dados não seguem uma distribuição normal.

O teste de correlação de Pearson mede o grau de associação linear entre duas variáveis quantitativas que possuem distribuição normal, além de testar se a correlação é significativa. Suas hipóteses são:

H0: ρ = 0 (as variáveis não estão correlacionadas).
H1: ρ ≠ 0 (as variáveis estão correlacionadas).

O teste de correlação de Spearman também mede o grau de associação linear entre duas variáveis quantitativas, porém para os casos em que uma delas não possua distribuição normal. Suas hipóteses são:

H0: não há associação monotônica entre as variáveis.
H1: há associação monotônica entre as variáveis.

O teste de Kruscal-Wallis é um método não-paramétrico utilizado quando os pressupostos de normalidade ou de homogêneidade de variâncias são violados e pode ser aplicado a variáveis categóricas com mais de dois grupos. Seu resultado informa se existem diferenças entre os grupos, mas não informa quais grupos são diferentes de outros grupos (DUTT-ROSS, 2020). Suas hipóteses são:

H0: grupos amostrados de populações com distribuições idênticas.
H1: grupos amostrados de populações com diferentes distribuições.

O teste de comparações múltiplas de Wilcoxon complementa o teste de Kruscal-Wallis, possibilitando determinar quais grupos se diferenciam de outros, a partir da comparação de cada par de grupos. Para esse teste, o p-valor resultante para cada par indica a existência de diferença entre as distribuições analisadas (p-valor menor que alpha) ou a não existência de diferença entre tais distribuições (p-valor maior que alpha) (DUTT-ROSS, 2020).

5. METODOLOGIA

5.1. Descrição das Bases de Dados

Para o estudo estatístico deste trabalho, foi necessário, incialmente, obter as Bases de Dados (BD) de interesse nos sites correspondentes e prepará-las para que fossem carregadas e utilizadas no software R Studio versão 4.1.0.

Dessa forma, para a primeira BD utilizada, relacionada aos preços de combustíveis fósseis comercializados no Brasil (principal), tomaram-se dois arquivos disponibilizados (em formato de valores separados por vírgula do Microsoft Excel - arquivos .csv), no site da ANP (https://www.gov.br/anp/pt-br/centrais-de-conteudo/dados-abertos/serie-historica-de-precos-de-combustiveis): um com informações do 2º semestre de 2021 (ca-2021-02.csv) e outro com informações do 1º semestre de 2022 (precos-semestrais-ca-2022-01.csv). Ambos foram unidos e, após, selecionados os registros referentes aos meses de interesse (novembro/2021, março/2022 e junho/2022). Ao final, obteve-se uma BD consolidada, no formato .xlsx, com informações de postos comercializadores de combustíveis automotivos de várias cidades brasileiras, contando com 208.830 observações para tais meses, a qual foi carregada no R Studio.

O dicionário de dados dessa primeira BD, que contém 16 variáveis, pode ser observado na Tabela 1, a seguir.

Tabela 1 – Dicionário de dados da BD dos combustíveis utilizada neste estudo.

#---------
# Carregamento das BDs
#---------
Dicio <- read_excel("D:/Curso Adm Publica/Semestre 8/Estatistica/TrabFinal/Precos_combustiveis_postos_2021-2022.xlsx", 
                      sheet = "Dicio")

DT::datatable(Dicio)

As primeiras observações da BD principal, relacionada aos preços de combustíveis fósseis comercializados no Brasil, utilizada neste estudo, pode ser vista a seguir.

#---------
# Carregamento das BDs
#---------
DB_Comb <- read_excel("D:/Curso Adm Publica/Semestre 8/Estatistica/TrabFinal/Precos_combustiveis_postos_2021-2022.xlsx", 
                      sheet = "precos-postos-2021-2022")

DB_Comb %>% head() %>% data.frame() %>% flextable()

Regiao...Sigla	Estado...Sigla	Municipio	Revenda	CNPJ.da.Revenda	Nome.da.Rua	Numero.Rua	Complemento	Bairro	Cep	Produto	Data.da.Coleta	Valor.de.Venda	Unidade.de.Medida	Bandeira
NE	AL	ARAPIRACA	POSTO ARAPIRACA LTDA	12.451.076/0004-65	RODOVIA AL 220	105	KM 68	CANAFISTULA	57302-605	GASOLINA	2021-11-01 00:00:00	6.799	R$ / litro	VIBRA ENERGIA
NE	AL	ARAPIRACA	POSTO ARAPIRACA LTDA	12.451.076/0004-65	RODOVIA AL 220	105	KM 68	CANAFISTULA	57302-605	DIESEL	2021-11-01 00:00:00	5.549	R$ / litro	VIBRA ENERGIA
NE	AL	ARAPIRACA	POSTO ARAPIRACA LTDA	12.451.076/0004-65	RODOVIA AL 220	105	KM 68	CANAFISTULA	57302-605	GASOLINA ADITIVADA	2021-11-01 00:00:00	6.899	R$ / litro	VIBRA ENERGIA
NE	AL	ARAPIRACA	POSTO ARAPIRACA LTDA	12.451.076/0004-65	RODOVIA AL 220	105	KM 68	CANAFISTULA	57302-605	DIESEL S10	2021-11-01 00:00:00	5.649	R$ / litro	VIBRA ENERGIA
NE	AL	DELMIRO GOUVEIA	AUTO POSTO FREITAS & MAIA LTDA	12.436.978/0001-80	RUA FLORIANO PEIXOTO	247		CENTRO	57480-000	GASOLINA	2021-11-01 00:00:00	7.198	R$ / litro	VIBRA ENERGIA
NE	AL	DELMIRO GOUVEIA	AUTO POSTO FREITAS & MAIA LTDA	12.436.978/0001-80	RUA FLORIANO PEIXOTO	247		CENTRO	57480-000	DIESEL	2021-11-01 00:00:00	5.974	R$ / litro	VIBRA ENERGIA

Em relação a outra BD, referente ao índice nacional de preços ao consumidor amplo (IPCA) para as principais capitais brasileiras (secundária), foram tomados dados disponibilizados, em formato do Microsoft Excel (arquivos .xlsx), no site do IBGE (https://www.ibge.gov.br/estatisticas/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo.html?=&t=destaques), estratificados por mês/ano. Foram utilizados os valores de IPCA compreendidos entre os períodos de novembro de 2021 a novembro de 2022 que, após consolidados em um único arquivo (.xlsx), contou com 16 observações. A BD resultante deste arquivo também foi carregada no R Studio.

O dicionário de dados dessa segunda BD pode ser observado na Tabela 2, a seguir. Ela contém 14 variáveis, sendo 13 referentes aos meses de apuração do respectivo IPCA.

Tabela 2 – Dicionário de dados da BD de IPCA utilizada neste estudo.

A BD relacionada ao IPCA mensal das principais capitais brasileiras, utilizada neste estudo, pode ser vista a seguir.

#---------
# Carregamento das BDs
#---------
IPCA <- read_excel("D:/Curso Adm Publica/Semestre 8/Estatistica/TrabFinal/Tab_IPCA_2021-2022.xlsx")

kable(IPCA, row.names = FALSE)%>%
  kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
                 position = "center", fixed_thead = T) %>%
  scroll_box(width = "900px", height = "600px")

Cidade	nov_21	dez_21	jan_22	fev_22	mar_22	abr_22	mai_22	jun_22	jul_22	ago_22	set_22	out_22	nov_22
Aracaju	0.92	0.92	0.90	1.26	1.43	1.36	0.74	0.67	-1.21	-0.50	-0.12	0.58	0.12
Belo Horizonte	0.92	0.75	0.80	1.07	1.44	1.06	0.27	0.83	-1.07	-1.25	-0.35	0.54	0.54
Belem	-0.03	0.95	0.65	0.97	1.47	1.21	0.36	0.26	-1.29	0.18	-0.01	0.51	0.10
Brasilia	1.04	0.46	0.49	0.93	1.41	1.21	0.31	0.81	-0.98	-0.22	-0.26	0.87	1.03
Campo Grande	1.47	0.47	0.62	1.06	1.73	1.21	0.27	0.64	-0.95	-0.39	-0.22	0.47	0.27
Curitiba	1.07	0.51	0.47	1.28	2.40	0.85	0.38	0.65	-1.41	-0.46	-0.16	0.20	0.23
Fortaleza	1.06	0.55	0.73	0.77	1.69	0.98	1.41	0.61	-0.65	-0.74	-0.65	0.61	0.28
Goiania	1.39	0.58	0.74	0.91	2.10	0.81	0.37	0.51	-2.12	-0.32	-0.31	0.53	0.95
Porto Alegre	0.96	0.83	-0.53	0.43	1.61	1.13	0.47	0.70	-0.59	-0.90	-0.46	0.76	0.42
Recife	1.02	1.05	0.41	0.97	1.53	1.12	0.55	1.13	-0.42	-1.40	-0.43	0.95	0.39
Rio Branco	0.82	1.18	0.87	0.93	1.35	0.90	0.21	0.81	-0.92	-0.34	-0.09	0.44	0.12
Rio de Janeiro	0.88	0.70	0.60	1.32	1.67	1.39	0.56	0.39	-0.44	0.01	-0.11	0.41	0.34
Salvador	1.42	1.04	0.86	0.83	1.53	0.67	1.29	1.24	-1.06	-0.17	-0.32	0.61	0.26
Sao Luis	0.73	0.94	0.54	1.33	2.06	1.03	0.28	0.51	-0.63	-1.07	-0.15	0.71	0.36
Sao Paulo	0.86	0.70	0.63	1.05	1.46	1.06	0.35	0.61	-0.07	-0.01	-0.32	0.66	0.40
Vitoria	1.01	0.73	0.57	0.86	1.50	0.83	-0.08	0.61	-1.31	0.46	0.17	0.60	0.09

IPCA$Cidade <- toupper(rm_accent(IPCA$Cidade))

estado <- read_state(code_state="all", year=2019,
                     showProgress = FALSE)

Using year 2019

As variáveis de interesse das BDs para as análises estatísticas efetuadas neste trabalho foram:

Regiao - Sigla, Estado - Sigla, Produto, Data da Coleta, Valor de Venda, Bandeira e Municipio, todas da BD referente aos combustíveis fósseis; e
Cidade e “IPCA” de alguns meses, da BD referente ao IPCA.

5.2. Descrição das etapas de análise

Em um primeiro momento, foram criadas tabelas específicas para o cálculo das médias e dos desvios padrões do valor de venda, além da confecção de gráficos do tipo boxplot, estratificados por região, para cada um dos combustíveis analisados e para cada mês de interesse, utilizando-se a variável qualitativa Regiao - Sigla e a quantitativa Valor de Venda. Foram confeccionados também histogramas para cada combustível e mês de interesse.

Em seguida, partindo-se dos valores das médias da variável Valor de Venda obtidas para cada região brasileira e para cada combustível, dentro dos meses de interesse, foram realizados testes de hipóteses para verificar a existência de diferença nos preços de venda de cada combustível entre as regiões brasileiras.

Posteriormente, foi verificada a quantidade de estabelecimentos de determinada bandeira no Brasil, presente na BD, para cada produto analisado, elaborando-se tabelas em números absoluto e em números relativo. Essas tabelas foram úteis para direcionar a criação de tabelas específicas para o cálculo das médias e dos desvios padrões do valor de venda, além da confecção de gráficos do tipo boxplot, estratificados por bandeira, para cada um dos combustíveis analisados e para cada mês de interesse, utilizando-se a variável qualitativa Bandeira e a quantitativa Valor de Venda.

Ato contínuo, com os valores das médias calculadas da variável Valor de Venda para cada combustível, estratificados por bandeira e dentro dos meses de interesse, foram realizados testes de hipóteses para verificar a existência de diferença nos preços de venda de cada combustível, praticados no Brasil, entre as bandeiras.

Após, foi verificada a quantidade de estabelecimentos de determinada bandeira, estratificada por regiões e para cada produto analisado, presente na BD, elaborando-se tabelas em números absoluto e em números relativo. Essas tabelas foram consideradas para decidir quais as bandeiras deveriam ser escolhidas para os cálculos dos preços médios e desvios padrões de cada região. A partir dessas informações, foram criadas tabelas específicas para tais cálculos e para a confecção de gráficos do tipo boxplot, estratificados por bandeira, para cada região brasileira e para cada combustível analisado, dentro dos meses de interesse, utilizando-se a variável qualitativa Bandeira e a quantitativa Valor de Venda.

Outro cálculo efetuado foi o do preço médio de cada combustível, com o respectivo desvio padrão, para cada estado brasileiro, dentro dos meses de interesse, utilizando-se a variável qualitativa Estado - Sigla e a quantitativa Valor de Venda. Os preços médios de cada estado foram usados para compor vários mapas do Brasil, considerando-se os combustíveis e os meses analisados, buscando facilitar a visualização dos resultados obtidos.

Por último, foi efetuado o cálculo do preço médio do diesel (conjunção do Diesel S10 e Diesel S500) e da gasolina (conjunção da Gasolina comum e Gasolina aditivada), com os respectivos desvios padrões, para cada município e para cada mês de interesse, utilizando-se a variável qualitativa Municipio e a quantitativa Valor de Venda. A tabela gerada a partir desses cálculos foi cruzada com a BD de IPCA, originando uma nova tabela com as principais capitais brasileiras, alguns valores mensais de IPCA de interesse e os preços médios de diesel e de gasolina praticados para os meses analisados. Esses preços médios foram usados para o cálculo de índices de variação do preço do diesel e da gasolina, para os meses novembro/2021-março/2022 e março/2022-junho/2022, a partir da seguinte expressão:

Finalmente, foi averiguada a existência de correlação entre os valores dos índices originados e o IPCA acumulado para os meses novembro/2021 a março/2022 e abril/2022 a junho/2022. Adicionalmente, foi avaliada a existência de correlação entre os valores do índice originado para os meses novembro/2021-março/2022 e o IPCA de março/2022. Para todas as correlações avaliadas, foram realizados testes de hipótese de correlação entre os pares de variáveis de interesse.

6. RESULTADOS

6.1. Análise dos preços por região

A partir das tabelas específicas confeccionadas para o cálculo das médias e desvios padrões do valor de venda, estratificados por região, para cada um dos combustíveis e para cada mês analisados, utilizando-se a variável qualitativa Regiao - Sigla e a quantitativa Valor de Venda, foram obtidos gráficos do tipo boxplot e histogramas, sendo alguns apresentados a seguir. Os demais estão no ANEXO.

#---------
# Análises estatísticas
#-------
# Tabelas com preços médios e desvio padrão 
# por região para os meses de nov/21, mar/22 e
# jun/22, extratificadas pelos 
# produtos D S10, D S500, G comum e G aditivada 
#-------
ftT11BP <- DB_Comb %>% 
  filter(Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01") %>%
  select(`Regiao - Sigla`,`Valor de Venda`) 

ftT11 <- ftT11BP %>% 
  group_by(`Regiao - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftT12BP <- DB_Comb %>% 
  filter(Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-02-28" &
       `Data da Coleta` < "2022-04-01") %>%
  select(`Regiao - Sigla`,`Valor de Venda`) 

ftT12 <- ftT12BP %>% 
  group_by(`Regiao - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftT13BP <- DB_Comb %>% 
  filter(Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30") %>%
  select(`Regiao - Sigla`,`Valor de Venda`) 

ftT13 <- ftT13BP %>% 
  group_by(`Regiao - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

cor_dark <- brewer.pal(7,"Pastel1")

hist(ftT11BP$`Valor de Venda`, main = "Histograma de preços de Diesel S10 - Nov/21", 
     col="skyblue", xlab="R$", ylab="Frequência")

hist(ftT12BP$`Valor de Venda`, main = "Histograma de preços de Diesel S10 - Mar/22", 
     col="skyblue", xlab="R$", ylab="Frequência")

hist(ftT13BP$`Valor de Venda`, main = "Histograma de preços de Diesel S10 - Jun/22", 
     col="skyblue", xlab="R$", ylab="Frequência")

boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT11BP, 
        main="Boxplot de preços de Diesel S10 por região - Nov/21",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT12BP, 
        main="Boxplot de preços de Diesel S10 por região - Mar/22",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT13BP, 
        main="Boxplot de preços de Diesel S10 por região - Jun/22",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftT21BP <- DB_Comb %>% 
  filter(Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01") %>%
  select(`Regiao - Sigla`,`Valor de Venda`) 

ftT21 <- ftT21BP %>% 
  group_by(`Regiao - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftT22BP <- DB_Comb %>% 
  filter(Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-02-28" &
           `Data da Coleta` < "2022-04-01") %>%
  select(`Regiao - Sigla`,`Valor de Venda`) 

ftT22 <- ftT22BP %>% 
  group_by(`Regiao - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftT23BP <- DB_Comb %>% 
  filter(Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30") %>%
  select(`Regiao - Sigla`,`Valor de Venda`) 

ftT23 <- ftT23BP %>% 
  group_by(`Regiao - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftT31BP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01") %>%
  select(`Regiao - Sigla`,`Valor de Venda`) 

ftT31 <- ftT31BP %>% 
  group_by(`Regiao - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftT32BP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-02-28" &
           `Data da Coleta` < "2022-04-01") %>%
  select(`Regiao - Sigla`,`Valor de Venda`) 

ftT32 <- ftT32BP %>% 
  group_by(`Regiao - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftT33BP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30") %>%
  select(`Regiao - Sigla`,`Valor de Venda`) 

ftT33 <- ftT33BP %>% 
  group_by(`Regiao - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

hist(ftT31BP$`Valor de Venda`, main = "Histograma de preços de Gas. comum - Nov/21", 
     col="Red", xlab="R$", ylab="Frequência")

hist(ftT32BP$`Valor de Venda`, main = "Histograma de preços de Gas. comum - Mar/22", 
     col="Red", xlab="R$", ylab="Frequência")

hist(ftT33BP$`Valor de Venda`, main = "Histograma de preços de Gas. comum - Jun/22", 
     col="Red", xlab="R$", ylab="Frequência")

boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT31BP, 
        main="Boxplot de preços de Gas. comum por região - Nov/21",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT32BP, 
        main="Boxplot de preços de Gas. comum por região - Mar/22",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT33BP, 
        main="Boxplot de preços de Gas. comum por região - Jun/22",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftT41BP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01") %>%
  select(`Regiao - Sigla`,`Valor de Venda`) 

ftT41 <- ftT41BP %>% 
  group_by(`Regiao - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftT42BP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-02-28" &
           `Data da Coleta` < "2022-04-01") %>%
  select(`Regiao - Sigla`,`Valor de Venda`) 

ftT42 <- ftT42BP %>% 
  group_by(`Regiao - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftT43BP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30") %>%
  select(`Regiao - Sigla`,`Valor de Venda`) 

ftT43 <- ftT43BP %>% 
  group_by(`Regiao - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame()

As tabelas contendo as médias e desvios padrões do valor de venda, por região, para cada combustível são apresentadas a seguir.

ftT1 <- ftT11 %>% 
  left_join(ftT12, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
  left_join(ftT13, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
  flextable()

ftT1 <- delete_part(ftT1, part = "header")
ftT1 <- add_header(x=ftT1, Regiao...Sigla = "Região",
                  preco_med.x="Preço", desv_pad.x="DP",
                  preco_med.y="Preço", desv_pad.y="DP",
                  preco_med="Preço", desv_pad="DP",
                  top = FALSE) 

ftT1 <- add_header(x=ftT1,
                  preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                  preco_med.y="Março/2022", desv_pad.y="Março/2022",
                  preco_med="Junho/2022", desv_pad="Junho/2022",
                  top = TRUE) 
ftT1 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>%
  set_caption(caption = "Média dos preços do DIESEL S10 por região")

Média dos preços do DIESEL S10 por região
	Novembro/2021	Março/2022	Junho/2022
CO	5.6927	0.2368	6.5279	0.5720	7.3990	0.4318
N	5.7232	0.3334	6.6628	0.5892	7.6092	0.5239
NE	5.5863	0.2091	6.5608	0.5717	7.5494	0.4915
S	5.2913	0.1999	6.2293	0.5325	7.1636	0.4324
SE	5.3954	0.1863	6.2880	0.5090	7.2374	0.4202

ftT2 <- ftT21 %>% 
  left_join(ftT22, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
  left_join(ftT23, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
  flextable()

ftT2 <- delete_part(ftT2, part = "header")
ftT2 <- add_header(x=ftT2, Regiao...Sigla = "Região",
                  preco_med.x="Preço", desv_pad.x="DP",
                  preco_med.y="Preço", desv_pad.y="DP",
                  preco_med="Preço", desv_pad="DP",
                  top = FALSE) 

ftT2 <- add_header(x=ftT2,
                  preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                  preco_med.y="Março/2022", desv_pad.y="Março/2022",
                  preco_med="Junho/2022", desv_pad="Junho/2022",
                  top = TRUE) 
ftT2 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>%
  set_caption(caption = "Média dos preços do DIESEL S500 por região")

Média dos preços do DIESEL S500 por região
	Novembro/2021	Março/2022	Junho/2022
CO	5.5605	0.2548	6.3902	0.5552	7.2352	0.4349
N	5.7067	0.3482	6.6132	0.6015	7.5695	0.5336
NE	5.5422	0.2099	6.5451	0.5437	7.5594	0.4906
S	5.2281	0.2032	6.1413	0.5003	7.0345	0.4286
SE	5.3063	0.1807	6.1860	0.4933	7.1154	0.4220

ftT3 <- ftT31 %>% 
  left_join(ftT32, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
  left_join(ftT33, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
  flextable()

ftT3 <- delete_part(ftT3, part = "header")
ftT3 <- add_header(x=ftT3, Regiao...Sigla = "Região",
                  preco_med.x="Preço", desv_pad.x="DP",
                  preco_med.y="Preço", desv_pad.y="DP",
                  preco_med="Preço", desv_pad="DP",
                  top = FALSE) 

ftT3 <- add_header(x=ftT3,
                  preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                  preco_med.y="Março/2022", desv_pad.y="Março/2022",
                  preco_med="Junho/2022", desv_pad="Junho/2022",
                  top = TRUE) 
ftT3 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>%
  set_caption(caption = "Média dos preços da GASOLINA COMUM por região")

Média dos preços da GASOLINA COMUM por região
	Novembro/2021	Março/2022	Junho/2022
CO	6.9315	0.2966	7.0333	0.4335	7.2600	0.3753
N	6.7752	0.3604	7.1811	0.4952	7.4102	0.4234
NE	6.7996	0.2459	7.2342	0.4937	7.6053	0.4052
S	6.7683	0.3313	6.8507	0.3961	7.0607	0.3245
SE	6.6717	0.4174	6.9408	0.5221	7.1526	0.4855

ftT4 <- ftT41 %>% 
  left_join(ftT42, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
  left_join(ftT43, by = c("Regiao...Sigla" = "Regiao...Sigla")) %>%
  flextable()

ftT4 <- delete_part(ftT4, part = "header")
ftT4 <- add_header(x=ftT4, Regiao...Sigla = "Região",
                  preco_med.x="Preço", desv_pad.x="DP",
                  preco_med.y="Preço", desv_pad.y="DP",
                  preco_med="Preço", desv_pad="DP",
                  top = FALSE) 
  
ftT4 <- add_header(x=ftT4,
                  preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                  preco_med.y="Março/2022", desv_pad.y="Março/2022",
                  preco_med="Junho/2022", desv_pad="Junho/2022",
                  top = TRUE) 
ftT4 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>%
  set_caption(caption = "Média dos preços da GASOLINA ADITIVADA por região")

Média dos preços da GASOLINA ADITIVADA por região
	Novembro/2021	Março/2022	Junho/2022
CO	7.0506	0.3016	7.1517	0.4229	7.3839	0.3629
N	6.8930	0.2617	7.3243	0.3832	7.5592	0.3152
NE	6.9386	0.2737	7.3807	0.4900	7.7359	0.4031
S	6.9095	0.3398	6.9710	0.4141	7.1773	0.3441
SE	6.8401	0.4235	7.1184	0.5302	7.3441	0.4815

Analisando-se os histogramas obtidos, verificou-se, para o Diesel S10, que os preços de venda ficaram concentrados entre 5,2 e 5,6 em Nov/2021, entre 6,4 e 7,0, com uma maior frequência, e entre 5,4 e 6,0, com uma menor frequência, em Mar/2022, e entre 6,6 e 8,0 em Jun/2022. Nenhum deles apresentou simetria e o de Mar/2022 obteve formato bimodal. Para a Gasolina comum, os preços de venda ficaram concentrados entre 6,2 e 7,0 em Nov/2021, entre 6,6 e 7,4 em Mar/2022 e entre 6,8 e 7,6 em Jun/2022. Nenhum deles apresentou simetria.

De acordo com os boxplots obtidos e analisando-se principalmente as medianas, percebeu-se claramente uma evolução acentuada dos preços de venda do Diesel S10 ao longo do período analisado, enquanto os da Gasolina comum aumentaram levemente. Além disso, dentro de cada mês/ano, a diferença de tais preços entre as regiões para esses combustíveis não foi tão discrepante, sobretudo para a Gasolina comum. E todos esses comportamentos são corroborados com os valores das médias dos preços apresentados nas tabelas referentes aos respectivos combustíveis.

Ainda sobre esses boxplots, verificou-se uma grande quantidade de outliers (tanto na faixa superior quanto na inferior) em todas as regiões no mês de Nov/2021 para o combustível Diesel S10, o que indica valores atípicos para os preços de venda praticados. Já no mês de Mar/2022 e ainda para ao Diesel S10, somente a região Sudeste apresentou um único outlier, enquanto em Jun/2022 todas as regiões voltaram a apresentar vários outliers, mas em menor quantidade quando comparado com Nov/2021. Em relação à Gasolina comum, observou-se a presença de outiliers de uma forma mais igualitária em todos os meses analisados, muito embora a região Centro-Oeste não tenha apresentado qualquer outlier em Nov/2021 e em Mar/2022, enquanto o Nordeste não os apresentou em Nov/2021 e em Jun/2022.

Ademais, verificou-se uma alta concentração e uma certa simetria dos valores de venda de Diesel S10 em Nov/2021, enquanto para o mês de Mar/2022 houve um aumento da dispersão e uma assimetria desses valores em todas as regiões. Em Jun/2022, a dispersão voltou a diminuir em todas as regiões, mas ficando maior do que em Nov/2021, e os valores de venda voltaram a apresentar uma certa simetria. Já os preços de venda da Gasolina comum apresentaram uma dispersão mais semelhante nos meses analisados nas cinco regiões, muito embora notou-se uma maior concentração desses valores nas regiões Norte e Nordeste, em Nov/2021, enquanto na região Sul houve uma maior concentração em Jun/2022. Ainda para a Gasolina comum, observou-se uma simetria de seus preços de venda nas regiões Norte, Nordeste e Sul, em Nov/2021 e Jun/2022.

Considerando-se os valores das tabelas referentes aos combustíveis analisados, o primeiro teste de hipótese efetuado para verificar a existência de diferença significativa nos preços de venda de cada combustível entre as regiões brasileiras foi o de normalidade (Kolmogorov-Smirnov), com as seguintes hipóteses nula e alternativa:

H0: Dados seguem uma distribuição normal.
H1: Dados não seguem uma distribuição normal.

O valor de alpha considerado para todos os testes foi de 0,05.

Em todos os casos, o teste de normalidade resultou em um p-valor menor que alpha, devendo-se rejeitar H0, o que significa que os dados não seguem uma distribuição normal, acarretando a violação do pressuposto de normalidade. Então, o teste da ANOVA foi abandonado e seguiu-se para o teste de Kruskal-Wallis com as seguintes hipóteses nula e alternativa:

H0: Todas as regiões têm a mesma distribuição de preços.
H1: Existe ao menos uma região com distribuição de preços diferente.

Em todos os casos, esse teste resultou em um p-valor menor que alpha, devendo-se rejeitar H0, o que significa que os grupos foram amostrados de populações com diferentes distribuições, existindo ao menos uma região com distribuição de preços diferente. Logo, foi necessário realizar o teste de comparações múltiplas de Wilcoxon para complementar o teste de Kruskal-Wallis.

Os resultados obtidos de alguns desses testes de hipótese podem ser vistos a seguir. Os demais estão no ANEXO.

#---------
# Testes de Hipóteses
# alpha:0,05
# Se pvalor for menor que 0,05 Rej H0
# Se pvalor for maior que 0,05 Não Rej H0
#-------
# Verificar se para cada período e combustível
# existe alguma região que pratica preço diferenciado
# (maior ou menor)
#------------------------------------------------------
# Para D. S10 e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModT11 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT11BP)
ResT11 <- residuals(ModT11)
lillie.test(ResT11)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResT11
D = 0.08228, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT11BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 5276.2, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT11 <- pairwise.wilcox.test(ftT11BP$`Valor de Venda`,
                               ftT11BP$`Regiao - Sigla`,
                               p.adjust.method="fdr")
ModT11


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftT11BP$`Valor de Venda` and ftT11BP$`Regiao - Sigla` 

   CO     N      NE     S     
N  0.91   -      -      -     
NE <2e-16 <2e-16 -      -     
S  <2e-16 <2e-16 <2e-16 -     
SE <2e-16 <2e-16 <2e-16 <2e-16

P value adjustment method: fdr

#------------------------------------------------------
# Para D. S10 e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModT12 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT12BP)
ResT12 <- residuals(ModT12)
lillie.test(ResT12)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResT12
D = 0.12054, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT12BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 1475.8, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT12 <- pairwise.wilcox.test(ftT12BP$`Valor de Venda`,
                               ftT12BP$`Regiao - Sigla`,
                               p.adjust.method="fdr")
ModT12


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftT12BP$`Valor de Venda` and ftT12BP$`Regiao - Sigla` 

   CO      N       NE      S      
N  1.7e-08 -       -       -      
NE 0.15    7.7e-07 -       -      
S  < 2e-16 < 2e-16 < 2e-16 -      
SE < 2e-16 < 2e-16 < 2e-16 6.9e-09

P value adjustment method: fdr

#------------------------------------------------------
# Para D. S10 e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModT13 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT13BP)
ResT13 <- residuals(ModT13)
lillie.test(ResT13)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResT13
D = 0.074723, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT13BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 1991.5, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT13 <- pairwise.wilcox.test(ftT13BP$`Valor de Venda`,
                               ftT13BP$`Regiao - Sigla`,
                               p.adjust.method="fdr")
ModT13


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftT13BP$`Valor de Venda` and ftT13BP$`Regiao - Sigla` 

   CO     N      NE     S     
N  <2e-16 -      -      -     
NE <2e-16 0.0011 -      -     
S  <2e-16 <2e-16 <2e-16 -     
SE <2e-16 <2e-16 <2e-16 <2e-16

P value adjustment method: fdr

#------------------------------------------------------
#------------------------------------------------------
# Para G. comum e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModT31 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT31BP)
ResT31 <- residuals(ModT31)
lillie.test(ResT31)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResT31
D = 0.094178, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT31BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 1297.9, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT31 <- pairwise.wilcox.test(ftT31BP$`Valor de Venda`,
                               ftT31BP$`Regiao - Sigla`,
                               p.adjust.method="fdr")
ModT31


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftT31BP$`Valor de Venda` and ftT31BP$`Regiao - Sigla` 

   CO      N       NE      S      
N  < 2e-16 -       -       -      
NE < 2e-16 0.96227 -       -      
S  < 2e-16 0.00067 2.1e-10 -      
SE < 2e-16 < 2e-16 < 2e-16 < 2e-16

P value adjustment method: fdr

#------------------------------------------------------
# Para G. comum e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModT32 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT32BP)
ResT32 <- residuals(ModT32)
lillie.test(ResT32)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResT32
D = 0.044143, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT32BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 1660, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT32 <- pairwise.wilcox.test(ftT32BP$`Valor de Venda`,
                               ftT32BP$`Regiao - Sigla`,
                               p.adjust.method="fdr")
ModT32


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftT32BP$`Valor de Venda` and ftT32BP$`Regiao - Sigla` 

   CO      N       NE      S      
N  < 2e-16 -       -       -      
NE < 2e-16 0.34    -       -      
S  < 2e-16 < 2e-16 < 2e-16 -      
SE < 2e-16 < 2e-16 < 2e-16 3.9e-14

P value adjustment method: fdr

#------------------------------------------------------
# Para G. comum e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModT33 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT33BP)
ResT33 <- residuals(ModT33)
lillie.test(ResT33)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResT33
D = 0.063941, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT33BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 4108.6, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT33 <- pairwise.wilcox.test(ftT33BP$`Valor de Venda`,
                               ftT33BP$`Regiao - Sigla`,
                               p.adjust.method="fdr")
ModT33


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftT33BP$`Valor de Venda` and ftT33BP$`Regiao - Sigla` 

   CO     N      NE     S     
N  <2e-16 -      -      -     
NE <2e-16 <2e-16 -      -     
S  <2e-16 <2e-16 <2e-16 -     
SE <2e-16 <2e-16 <2e-16 <2e-16

P value adjustment method: fdr

#------------------------------------------------------
#------------------------------------------------------

De acordo com os resultados dos testes de hipótese para o Diesel S10, verificou-se o seguinte:

considerando-se o mês de Nov/2021, em virtude do p-valor entre CO e N (0,91) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço nas regiões Norte e Centro-Oeste. Já nas demais regiões, há diferença significativa nessas distribuições. Assim, pode-se dizer que os preços de Diesel S10 praticados nas regiões Norte e Centro-Oeste foram semelhantes entre si e maiores em relação a outras regiões e que houve diferença significativa nos preços desse combustível nas regiões Nordeste, Sul e Sudeste (e destas em relação às regiões Norte e Centro-Oeste).
considerando-se o mês de Mar/2022, em virtude do p-valor entre CO e NE (0,15) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço nas regiões Nordeste e Centro-Oeste. Já nas demais regiões, há diferença significativa nas distribuições do preço de Diesel S10. Assim, pode-se dizer que os preços de Diesel S10 praticados nas regiões Nordeste e Centro-Oeste foram semelhantes entre si, mas foram menores em relação à região Norte e maiores em relação às demais. Além disso, houve diferença significativa nos preços desse combustível nas regiões Norte, Sul e Sudeste (e destas em relação às regiões Nordeste e Centro-Oeste).
para o mês de Jun/2022, realmente existe um p-valor (entre N e NE) bem maior que os demais (0,001), mas ainda está dentro do limite de significância (é menor que alpha). Assim, para todos os pares, inclusive entre as regiões Norte e Nordeste, existiu diferença significativa entre as distribuições do preço de Diesel S10 para todas as regiões, podendo-se dizer que houve diferença significativa nos preços praticados desse combustível em todas as regiões.

Já em relação à Gasolina comum, e ainda de acordo com os resultados dos testes de hipótese, verificou-se o seguinte:

considerando-se o mês de Nov/2021, em virtude do p-valor entre NE e N (0,962) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço nas regiões Norte e Nordeste. Além disso, o p-valor entre S e N é bem maior que os demais (0,00067), excluindo-se aquele entre NE e N, mas ainda está dentro do limite de significância (é menor que alpha). Assim, excluindo-se o par NE e N, há diferença significativa nas distribuições do preço de Gasolina comum nas regiões. Logo, pode-se dizer que os preços de Gasolina comum praticados nas regiões Norte e Nordeste foram semelhantes entre si, mas foram menores em relação à região Centro-Oeste e maiores em relação às demais. Além disso, houve diferença significativa nos preços desse combustível nas regiões Centro-Oeste, Sul e Sudeste (e destas em relação às regiões Nordeste e Norte).
para o mês de Mar/2022, em virtude do p-valor entre NE e N (0,34) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço nas regiões Norte e Nordeste. Já nas demais regiões, há diferença significativa nessas distribuições. Assim, pode-se dizer que os preços de Gasolina comum praticados nas regiões Norte e Nordeste foram semelhantes entre si e maiores em relação a outras regiões e que houve diferença significativa nos preços desse combustível nas regiões Centro-Oeste, Sul e Sudeste (e destas em relação às regiões Norte e Nordeste).
considerando-se o mês de Jun/2022, todos os valores de p-valor para os pares de todas as regiões são muito baixos (< 2e-16). Assim, para todos os pares de regiões existe diferença significativa entre as distribuições do preço. Portanto, pode-se dizer que houve diferença significativa nos preços praticados de Gasolina comum em todas as regiões.

6.2. Análise dos preços no Brasil por bandeiras

Em um primeiro momento, foi verificada a quantidade de estabelecimentos de determinada bandeira no Brasil, na BD, para cada produto analisado, elaborando-se uma tabela em números absoluto e outra em números relativo. Essas tabelas estão apresentadas no ANEXO.

Observou-se, a partir dessas tabelas, que 4 bandeiras foram responsáveis por, aproximadamente, 90% da frequência na BD, sendo que as demais correspondem a percentuais pequenos (alguns menores que 1%). Dessa forma, optou-se por agregar todas essas bandeiras de baixo percentual em uma única modalidade de bandeira, denominada OUTRAS, elaborando-se duas novas tabelas semelhantes às mencionadas anteriormente, apresentadas a seguir (Tabela 3 e Tabela 4).

#---------
# Tabela em num abs
#-------
# Tabelas indicando quantidades de estabelecimentos de
# determinada bandeira no Brasil para os produtos
# D S10, D S500, G comum e G aditivada 
#-------
ftBxP <- DB_Comb %>% 
  filter(Bandeira == 'BRANCA' |
         Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
         Bandeira == 'VIBRA ENERGIA') %>%
  select(Produto,Bandeira) %>%
  data.frame()

ftOBP <- DB_Comb %>% 
  filter(Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA') %>%
  select(Produto,Bandeira) %>%
  data.frame()

ftOBP$Bandeira <- "OUTRAS"
ftBxP <- bind_rows(ftBxP, ftOBP)

ftBxP %>% 
  tabyl(Bandeira,Produto) %>% 
  flextable() %>% theme_zebra() %>% autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>%
  set_caption(caption = "Tabela 3 - Frequência de cada BANDEIRA por PRODUTO na BD")

Tabela 3 - Frequência de cada BANDEIRA por PRODUTO na BD
Bandeira	DIESEL	DIESEL S10	GASOLINA	GASOLINA ADITIVADA
BRANCA	12,229	19,876	26,424	16,021
IPIRANGA	4,835	9,751	11,240	9,591
OUTRAS	3,240	5,376	6,361	4,684
RAIZEN	4,414	9,072	10,644	9,249
VIBRA ENERGIA	6,466	12,877	14,282	12,198

# Tabela em num relativos - por coluna
#-------
# Tabelas indicando percentuais de estabelecimentos de
# determinada bandeira no Brasil para os produtos
# D S10, D S500, G comum e G aditivada 
#-------
ftBxP %>% 
  tabyl(Bandeira,Produto) %>% 
  adorn_percentages("col") %>%
  adorn_pct_formatting(digits = 2) %>%
  flextable() %>% theme_zebra() %>% autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>%
  set_caption(caption = "Tabela 4 - Frequência relativa de cada BANDEIRA por PRODUTO na BD")

Tabela 4 - Frequência relativa de cada BANDEIRA por PRODUTO na BD
Bandeira	DIESEL	DIESEL S10	GASOLINA	GASOLINA ADITIVADA
BRANCA	39.22%	34.90%	38.32%	30.96%
IPIRANGA	15.50%	17.12%	16.30%	18.54%
OUTRAS	10.39%	9.44%	9.23%	9.05%
RAIZEN	14.15%	15.93%	15.44%	17.87%
VIBRA ENERGIA	20.73%	22.61%	20.71%	23.57%

Considerando-se os resultados dessas tabelas, foram criadas as tabelas específicas para cálculo das médias e desvios padrões, estratificados por bandeiras, para cada um dos combustíveis e para cada mês analisados, utilizando-se a variável qualitativa Bandeira e a quantitativa Valor de Venda, obtendo-se gráficos do tipo boxplot, apresentados no ANEXO, e tabelas contendo as médias e desvios padrões do valor de venda, por bandeira, apresentadas a seguir.

#-------
# Tabelas com preços médios e desvio padrão 
# por bandeira no Brasil para os meses de 
# nov/21, mar/22 e jun/22, extratificadas pelos 
# produtos D S10, D S500, G comum e G aditivada 
#-------
ftB11BP <- DB_Comb %>% 
  filter(Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ftB11OBP <- DB_Comb %>% 
  filter(Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ftB11OBP$Bandeira <- "OUTRAS"

ftB11BP <- bind_rows(ftB11BP, ftB11OBP)

ftB11 <- ftB11BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftB12BP <- DB_Comb %>% 
  filter(Produto == 'DIESEL S10' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ftB12OBP <- DB_Comb %>% 
  filter(Produto == 'DIESEL S10' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ftB12OBP$Bandeira <- "OUTRAS"

ftB12BP <- bind_rows(ftB12BP, ftB12OBP)

ftB12 <- ftB12BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftB13BP <- DB_Comb %>% 
  filter(Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ftB13OBP <- DB_Comb %>% 
  filter(Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ftB13OBP$Bandeira <- "OUTRAS"

ftB13BP <- bind_rows(ftB13BP, ftB13OBP)

ftB13 <- ftB13BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftB1 <- ftB11 %>% 
  left_join(ftB12, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ftB13, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftB1 <- delete_part(ftB1, part = "header")
ftB1 <- add_header(x=ftB1, Bandeira = "Bandeira",
                  preco_med.x="Preço", desv_pad.x="DP",
                  preco_med.y="Preço", desv_pad.y="DP",
                  preco_med="Preço", desv_pad="DP",
                  top = FALSE) 

ftB1 <- add_header(x=ftB1,
                  preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                  preco_med.y="Março/2022", desv_pad.y="Março/2022",
                  preco_med="Junho/2022", desv_pad="Junho/2022",
                  top = TRUE) 
ftB1 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Média dos preços do DIESEL S10 por BANDEIRA no Brasil")

Média dos preços do DIESEL S10 por BANDEIRA no Brasil
	Novembro/2021	Março/2022	Junho/2022
BRANCA	5.4280	0.2346	6.3559	0.5761	7.2758	0.4709
IPIRANGA	5.4399	0.2509	6.3651	0.5395	7.3499	0.4749
OUTRAS	5.4938	0.2795	6.4062	0.5854	7.3800	0.4874
RAIZEN	5.4434	0.2172	6.3642	0.5293	7.3281	0.4599
VIBRA ENERGIA	5.5431	0.2702	6.4429	0.5488	7.4113	0.4788

ftB21BP <- DB_Comb %>% 
  filter(Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ftB21OBP <- DB_Comb %>% 
  filter(Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ftB21OBP$Bandeira <- "OUTRAS"

ftB21BP <- bind_rows(ftB21BP, ftB21OBP)

ftB21 <- ftB21BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftB22BP <- DB_Comb %>% 
  filter(Produto == 'DIESEL' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ftB22OBP <- DB_Comb %>% 
  filter(Produto == 'DIESEL' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ftB22OBP$Bandeira <- "OUTRAS"

ftB22BP <- bind_rows(ftB22BP, ftB22OBP)

ftB22 <- ftB22BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftB23BP <- DB_Comb %>% 
  filter(Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ftB23OBP <- DB_Comb %>% 
  filter(Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ftB23OBP$Bandeira <- "OUTRAS"

ftB23BP <- bind_rows(ftB23BP, ftB23OBP)

ftB23 <- ftB23BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftB2 <- ftB21 %>% 
  left_join(ftB22, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ftB23, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftB2 <- delete_part(ftB2, part = "header")
ftB2 <- add_header(x=ftB2, Bandeira = "Bandeira",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftB2 <- add_header(x=ftB2,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftB2 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>%
  set_caption(caption = "Média dos preços do DIESEL S500 por BANDEIRA no Brasil")

Média dos preços do DIESEL S500 por BANDEIRA no Brasil
	Novembro/2021	Março/2022	Junho/2022
BRANCA	5.3274	0.2366	6.2680	0.5562	7.1743	0.4949
IPIRANGA	5.3778	0.2643	6.2728	0.5280	7.2552	0.4829
OUTRAS	5.4534	0.2900	6.3591	0.5782	7.3223	0.4932
RAIZEN	5.3556	0.2152	6.2330	0.5108	7.1883	0.4684
VIBRA ENERGIA	5.4853	0.2976	6.3501	0.5436	7.3080	0.4990

ftB31BP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ftB31OBP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ftB31OBP$Bandeira <- "OUTRAS"

ftB31BP <- bind_rows(ftB31BP, ftB31OBP)

ftB31 <- ftB31BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftB32BP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ftB32OBP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ftB32OBP$Bandeira <- "OUTRAS"

ftB32BP <- bind_rows(ftB32BP, ftB32OBP)

ftB32 <- ftB32BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftB33BP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ftB33OBP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ftB33OBP$Bandeira <- "OUTRAS"

ftB33BP <- bind_rows(ftB33BP, ftB33OBP)

ftB33 <- ftB33BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftB3 <- ftB31 %>% 
  left_join(ftB32, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ftB33, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftB3 <- delete_part(ftB3, part = "header")
ftB3 <- add_header(x=ftB3, Bandeira = "Bandeira",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftB3 <- add_header(x=ftB3,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftB3 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Média dos preços da GASOLINA COMUM por BANDEIRA no Brasil")

Média dos preços da GASOLINA COMUM por BANDEIRA no Brasil
	Novembro/2021	Março/2022	Junho/2022
BRANCA	6.6666	0.3838	6.9283	0.5190	7.1844	0.5067
IPIRANGA	6.7511	0.3646	6.9924	0.4831	7.2217	0.4318
OUTRAS	6.7895	0.3012	7.0918	0.4589	7.3498	0.3911
RAIZEN	6.7535	0.3682	7.0091	0.4952	7.2664	0.4588
VIBRA ENERGIA	6.8430	0.3549	7.1197	0.5018	7.3740	0.4569

ftB41BP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ftB41OBP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ftB41OBP$Bandeira <- "OUTRAS"

ftB41BP <- bind_rows(ftB41BP, ftB41OBP)

ftB41 <- ftB41BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftB42BP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA ADITIVADA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ftB42OBP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA ADITIVADA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ftB42OBP$Bandeira <- "OUTRAS"

ftB42BP <- bind_rows(ftB42BP, ftB42OBP)

ftB42 <- ftB42BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftB43BP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ftB43OBP <- DB_Comb %>% 
  filter(Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ftB43OBP$Bandeira <- "OUTRAS"

ftB43BP <- bind_rows(ftB43BP, ftB43OBP)

ftB43 <- ftB43BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftB4 <- ftB41 %>% 
  left_join(ftB42, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ftB43, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftB4 <- delete_part(ftB4, part = "header")
ftB4 <- add_header(x=ftB4, Bandeira = "Bandeira",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftB4 <- add_header(x=ftB4,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftB4 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Média dos preços da GASOLINA ADITIVADA por BANDEIRA no Brasil")

Média dos preços da GASOLINA ADITIVADA por BANDEIRA no Brasil
	Novembro/2021	Março/2022	Junho/2022
BRANCA	6.7661	0.3711	7.0298	0.5104	7.2988	0.4935
IPIRANGA	6.9250	0.3522	7.1636	0.4724	7.3961	0.4198
OUTRAS	6.8710	0.3080	7.1932	0.4586	7.4279	0.3857
RAIZEN	6.9599	0.3554	7.2150	0.5013	7.4826	0.4650
VIBRA ENERGIA	6.9863	0.3685	7.2581	0.5098	7.5146	0.4524

Considerando-se os valores das tabelas referentes aos combustíveis analisados, foram realizados os mesmos testes de hipótese da seção anterior referente à análise dos preços por região, só que agora para verificar a existência de diferença nos preços de venda de cada combustível, praticados no Brasil, entre as bandeiras.

Semelhantemente à seção anterior, em todos os casos, o teste de normalidade resultou em um p-valor menor que alpha, devendo-se rejeitar H0, o que significa que os dados não seguem uma distribuição normal, acarretando a violação do pressuposto de normalidade. Então, o teste da ANOVA foi abandonado e seguiu-se para o teste de Kruskal-Wallis com as seguintes hipóteses nula e alternativa:

H0: Todas as bandeiras apresentam a mesma distribuição de preços.
H1: Existe ao menos uma bandeira com distribuição de preços diferente.

Em todos os casos, esse teste resultou em um p-valor menor que alpha, devendo-se rejeitar H0, o que significa que os grupos foram amostrados de populações com diferentes distribuições, existindo ao menos uma bandeira com distribuição de preços diferente, sendo necessário realizar o teste de comparações múltiplas de Wilcoxon para complementar o teste de Kruskal-Wallis.

Os resultados obtidos de alguns desses testes de hipótese podem ser vistos a seguir. Os demais estão no ANEXO.

#---------  
# Testes de Hipóteses
# alpha:0,05
# Se pvalor for menor que 0,05 Rej H0
# Se pvalor for maior que 0,05 Não Rej H0
#-------
# Verificar se para cada período e combustível
# existe alguma bandeira que pratica preço diferenciado
# (maior ou menor)
#------------------------------------------------------
# Para D. S10 e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModB11 <- aov(`Valor de Venda`~Bandeira,data=ftB11BP)
ResB11 <- residuals(ModB11)
lillie.test(ResB11)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResB11
D = 0.089787, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB11BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 523.82, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB11 <- pairwise.wilcox.test(ftB11BP$`Valor de Venda`,
                               ftB11BP$Bandeira,
                               p.adjust.method="fdr")
ModB11


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftB11BP$`Valor de Venda` and ftB11BP$Bandeira 

              BRANCA  IPIRANGA OUTRAS  RAIZEN 
IPIRANGA      0.014   -        -       -      
OUTRAS        < 2e-16 1.9e-09  -       -      
RAIZEN        1.7e-05 0.111    6.8e-07 -      
VIBRA ENERGIA < 2e-16 < 2e-16  1.9e-09 < 2e-16

P value adjustment method: fdr

#------------------------------------------------------
# Para D. S10 e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModB12 <- aov(`Valor de Venda`~Bandeira,data=ftB12BP)
ResB12 <- residuals(ModB12)
lillie.test(ResB12)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResB12
D = 0.095093, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB12BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 79.584, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB12 <- pairwise.wilcox.test(ftB12BP$`Valor de Venda`,
                               ftB12BP$Bandeira,
                               p.adjust.method="fdr")
ModB12


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftB12BP$`Valor de Venda` and ftB12BP$Bandeira 

              BRANCA  IPIRANGA OUTRAS RAIZEN 
IPIRANGA      0.3669  -        -      -      
OUTRAS        0.0022  0.0235   -      -      
RAIZEN        0.5888  0.6670   0.0155 -      
VIBRA ENERGIA 7.8e-15 2.0e-09  0.0397 5.8e-10

P value adjustment method: fdr

#------------------------------------------------------
# Para D. S10 e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModB13 <- aov(`Valor de Venda`~Bandeira,data=ftB13BP)
ResB13 <- residuals(ModB13)
lillie.test(ResB13)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResB13
D = 0.078486, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB13BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 240.28, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB13 <- pairwise.wilcox.test(ftB13BP$`Valor de Venda`,
                               ftB13BP$Bandeira,
                               p.adjust.method="fdr")
ModB13


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftB13BP$`Valor de Venda` and ftB13BP$Bandeira 

              BRANCA  IPIRANGA OUTRAS RAIZEN 
IPIRANGA      6.0e-14 -        -      -      
OUTRAS        2.3e-16 0.0560   -      -      
RAIZEN        1.6e-08 0.0812   0.0013 -      
VIBRA ENERGIA < 2e-16 1.8e-07  0.0220 6.2e-12

P value adjustment method: fdr

#------------------------------------------------------
#------------------------------------------------------
# Para G. comum e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModB31 <- aov(`Valor de Venda`~Bandeira,data=ftB31BP)
ResB31 <- residuals(ModB31)
lillie.test(ResB31)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResB31
D = 0.073524, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB31BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 723.9, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB31 <- pairwise.wilcox.test(ftB31BP$`Valor de Venda`,
                               ftB31BP$Bandeira,
                               p.adjust.method="fdr")
ModB31


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftB31BP$`Valor de Venda` and ftB31BP$Bandeira 

              BRANCA  IPIRANGA OUTRAS  RAIZEN 
IPIRANGA      < 2e-16 -        -       -      
OUTRAS        < 2e-16 1.3e-08  -       -      
RAIZEN        < 2e-16 0.77     2.8e-06 -      
VIBRA ENERGIA < 2e-16 < 2e-16  3.8e-08 < 2e-16

P value adjustment method: fdr

#------------------------------------------------------
# Para G. comum e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModB32 <- aov(`Valor de Venda`~Bandeira,data=ftB32BP)
ResB32 <- residuals(ModB32)
lillie.test(ResB32)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResB32
D = 0.038673, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB32BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 510.71, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB32 <- pairwise.wilcox.test(ftB32BP$`Valor de Venda`,
                               ftB32BP$Bandeira,
                               p.adjust.method="fdr")
ModB32


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftB32BP$`Valor de Venda` and ftB32BP$Bandeira 

              BRANCA  IPIRANGA OUTRAS  RAIZEN 
IPIRANGA      2.9e-10 -        -       -      
OUTRAS        < 2e-16 3.4e-15  -       -      
RAIZEN        1.4e-14 0.16     9.6e-11 -      
VIBRA ENERGIA < 2e-16 < 2e-16  0.03    < 2e-16

P value adjustment method: fdr

#------------------------------------------------------
# Para G. comum e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModB33 <- aov(`Valor de Venda`~Bandeira,data=ftB33BP)
ResB33 <- residuals(ModB33)
lillie.test(ResB33)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResB33
D = 0.058661, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB33BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 651.07, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB33 <- pairwise.wilcox.test(ftB33BP$`Valor de Venda`,
                               ftB33BP$Bandeira,
                               p.adjust.method="fdr")
ModB33


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftB33BP$`Valor de Venda` and ftB33BP$Bandeira 

              BRANCA  IPIRANGA OUTRAS  RAIZEN 
IPIRANGA      3.1e-05 -        -       -      
OUTRAS        < 2e-16 < 2e-16  -       -      
RAIZEN        < 2e-16 0.00014  3.0e-16 -      
VIBRA ENERGIA < 2e-16 < 2e-16  0.01585 < 2e-16

P value adjustment method: fdr

#------------------------------------------------------
#------------------------------------------------------

De acordo com os resultados dos testes de hipótese para o Diesel S10, verificou-se o seguinte:

considerando-se o mês de Nov/2021, em virtude do p-valor entre IPIRANGA e RAIZEN (0,111) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço para as bandeiras IPIRANGA e RAIZEN. Já para as demais bandeiras, há diferença significativa nessas distribuições. Assim, pode-se dizer que os preços praticados pelas bandeiras IPIRANGA e RAIZEN foram semelhantes entre si, mas foram menores em relação às bandeiras OUTRAS e VIBRA ENERGIA e maiores em relação à BRANCA. Além disso, houve diferença significativa nos preços para as bandeiras BRANCA, OUTRAS e VIBRA ENERGIA (e destas em relação às bandeiras IPIRANGA e RAIZEN).
considerando-se o mês de Mar/2022, em virtude do p-valor entre BRANCA e IPIRANGA (0,3669), BRANCA e RAIZEN (0,5888) e IPIRANGA e RAIZEN (0,667) serem maiores que alpha para esses pares, não existe diferença significativa entre as distribuições do preço para as bandeiras BRANCA, IPIRANGA e RAIZEN. Assim, pode-se dizer que os preços praticados por essas bandeiras foram semelhantes entre si e menores em relação às demais. Além disso, houve diferença significativa nos preços para as bandeiras OUTRAS e VIBRA ENERGIA (e destas em relação às bandeiras BRANCA, IPIRANGA e RAIZEN).
para o mês de Jun/2022, em virtude do p-valor entre IPIRANGA e OUTRAS (0,056) e IPIRANGA e RAIZEN (0,0812) serem maiores que alpha para esses pares, não existe diferença significativa entre as distribuições do preço para as bandeiras IPIRANGA e OUTRAS e para IPIRANGA e RAIZEN. Assim, pode-se dizer que os preços praticados pelas bandeiras IPIRANGA e OUTRAS foram semelhantes entre si e que os preços praticados pelas bandeiras IPIRANGA e RAIZEN foram semelhantes entre si. Além disso, houve diferença significativa nos preços para as bandeiras BRANCA, VIBRA ENERGIA e os pares IPIRANGA e OUTRAS e IPIRANGA e RAIZEN, sendo que a VIBRA ENERGIA pratica o maior preço e a BRANCA, o menor.

Já em relação à Gasolina comum, e ainda de acordo com os resultados dos testes de hipótese, verificou-se o seguinte:

considerando-se o mês de Nov/2021, em virtude do p-valor entre IPIRANGA e RAIZEN (0,77) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço para as bandeiras IPIRANGA e RAIZEN. Já para as demais bandeiras, há diferença significativa nessas distribuições. Assim, pode-se dizer que os preços praticados pelas bandeiras IPIRANGA e RAIZEN foram semelhantes entre si, mas foram menores em relação às bandeiras OUTRAS e VIBRA ENERGIA e maiores em relação à BRANCA. Além disso, houve diferença significativa nos preços para as bandeiras BRANCA, OUTRAS e VIBRA ENERGIA (e destas em relação às bandeiras IPIRANGA e RAIZEN).
considerando-se o mês de Mar/2022, em virtude do p-valor entre IPIRANGA e RAIZEN (0,16) ser maior que alpha para esse par, não existe diferença significativa entre as distribuições do preço para as bandeiras IPIRANGA e RAIZEN. Já para as demais bandeiras, há diferença significativa nessas distribuições, sendo que o comportamento dos preços foi semelhante ao de Nov/2021.
para o mês de Jun/2022, realmente existe um p-valor (entre OUTRAS e VIBRA ENERGIA) maior que os demais (0,01585), mas ainda está dentro do limite de significância (é menor que alpha). Assim, para todos os pares, inclusive entre as as bandeiras OUTRAS e VIBRA ENERGIA, existiu diferença significativa entre as distribuições do preço de Gasolina comum para todas as bandeiras, podendo-se dizer que houve diferença significativa nos preços praticados desse combustível para todas as bandeiras.

6.3. Análise dos preços por estado

Os mapas do Brasil confeccionados a partir das tabelas contendo as médias e os desvios padrões do valor de venda, para cada um dos combustíveis e para cada mês analisados, utilizando-se a variável qualitativa Estado - Sigla e a quantitativa Valor de Venda, são apresentados seguir. Já as tabelas estão no ANEXO.

#-------
# Tabela com preços médios e desvio padrão 
# por estado para os meses de 
# nov/21, mar/22 e jun/22, extratificadas pelos 
# produtos D S10, D S500, G comum e G aditivada 
#-------
ftE11 <- DB_Comb %>% 
  select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>% 
  filter(Produto == 'DIESEL S10' &
           `Data da Coleta` <= "2022-01-01") %>% 
  group_by(`Estado - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftE12 <- DB_Comb %>% 
  select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>% 
  filter(Produto == 'DIESEL S10' &
           (`Data da Coleta` > "2022-02-28" &
                `Data da Coleta` < "2022-04-01")) %>%
  group_by(`Estado - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftE13 <- DB_Comb %>% 
  select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>% 
  filter(Produto == 'DIESEL S10' &
           `Data da Coleta` > "2022-05-30") %>% 
  group_by(`Estado - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftE21 <- DB_Comb %>% 
  select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>% 
  filter(Produto == 'DIESEL' &
          `Data da Coleta` <= "2022-01-01") %>% 
  group_by(`Estado - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftE22 <- DB_Comb %>% 
  select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>% 
  filter(Produto == 'DIESEL' &
           (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01")) %>%
  group_by(`Estado - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftE23 <- DB_Comb %>% 
  select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>% 
  filter(Produto == 'DIESEL' &
           `Data da Coleta`  > "2022-05-30") %>% 
  group_by(`Estado - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftE31 <- DB_Comb %>% 
  select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>% 
  filter(Produto == 'GASOLINA' &
           `Data da Coleta` <= "2022-01-01") %>% 
  group_by(`Estado - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftE32 <- DB_Comb %>% 
  select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>% 
  filter(Produto == 'GASOLINA' &
           (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01")) %>%
  group_by(`Estado - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftE33 <- DB_Comb %>% 
  select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>% 
  filter(Produto == 'GASOLINA' &
           `Data da Coleta` > "2022-05-30") %>% 
  group_by(`Estado - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftE41 <- DB_Comb %>% 
  select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>% 
  filter(Produto == 'GASOLINA ADITIVADA' &
           `Data da Coleta` <= "2022-01-01") %>% 
  group_by(`Estado - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftE42 <- DB_Comb %>% 
  select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>% 
  filter(Produto == 'GASOLINA ADITIVADA' &
           (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01")) %>%
  group_by(`Estado - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftE43 <- DB_Comb %>% 
  select(`Estado - Sigla`,Produto,`Valor de Venda`,`Data da Coleta`) %>% 
  filter(Produto == 'GASOLINA ADITIVADA' &
           `Data da Coleta` > "2022-05-30") %>% 
  group_by(`Estado - Sigla`) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 
#-------
# Apresentar os preços médios dos estados em mapas,
# para os meses de nov/21, mar/22 e jun/22, 
# extratificadas pelos 
# produtos D S10, D S500, G comum e G aditivada 
#-------
# Código do MAPA s10 - Nov/21
mapa1_s10 <- estado %>% 
        left_join(ftE11, by = c("abbrev_state" = "Estado...Sigla"))

ggplot() +
  geom_sf(data=mapa1_s10, aes(fill=preco_med), 
       color= "black", size=.15) + 
  labs(subtitle="Mapa 1 - Preço de diesel S10 por estado e DF - Nov/21",
       size=10) +
  geom_sf_text(data=mapa1_s10,aes(label = abbrev_state), 
       size=2, color= "black") +
  scale_fill_distiller(palette = "Blues", 
       direction = 1, name="Preço médio", 
       limits = c(5.2,8.2)) +
  theme_minimal()

# Código do MAPA s10 - Mar/22
mapa2_s10 <- estado %>% 
  left_join(ftE12, by = c("abbrev_state" = "Estado...Sigla"))

ggplot() +
  geom_sf(data=mapa2_s10, aes(fill=preco_med), 
       color= "black", size=.15) + 
  labs(subtitle="Mapa 2 - Preço de diesel S10 por estado e DF - Mar/22",
       size=10) +
  geom_sf_text(data=mapa2_s10,aes(label = abbrev_state), 
       size=2, color= "black") +
  scale_fill_distiller(palette = "Blues", 
       direction = 1, name="Preço médio", 
       limits = c(5.2,8.2)) +
  theme_minimal()

# Código do MAPA s10 - Jun/22
mapa3_s10 <- estado %>% 
  left_join(ftE13, by = c("abbrev_state" = "Estado...Sigla"))

ggplot() +
  geom_sf(data=mapa3_s10, aes(fill=preco_med), 
          color= "black", size=.15) + 
  labs(subtitle="Mapa 3 - Preço de diesel S10 por estado e DF - Jun/22",
       size=10) +
  geom_sf_text(data=mapa3_s10,aes(label = abbrev_state), 
       size=2, color= "black") +
  scale_fill_distiller(palette = "Blues", 
       direction = 1, name="Preço médio", 
       limits = c(5.2,8.2)) +
  theme_minimal()

# Código do MAPA s500 - Nov/21
mapa1_s500 <- estado %>% 
  left_join(ftE21, by = c("abbrev_state" = "Estado...Sigla"))

ggplot() +
  geom_sf(data=mapa1_s500, aes(fill=preco_med), 
       color= "black", size=.15) + 
  labs(subtitle="Mapa 4 - Preço de diesel S500 por estado e DF - Nov/21",
       size=10) +
  geom_sf_text(data=mapa1_s500,aes(label = abbrev_state), 
       size=2, color= "black") +
  scale_fill_distiller(palette = "Greens", 
       direction = 1, name="Preço médio", 
       limits = c(5.1,8.2)) +
  theme_minimal()

# Código do MAPA s500 - Mar/22
mapa2_s500 <- estado %>% 
  left_join(ftE22, by = c("abbrev_state" = "Estado...Sigla"))

ggplot() +
  geom_sf(data=mapa2_s500, aes(fill=preco_med), 
       color= "black", size=.15) + 
  labs(subtitle="Mapa 5 - Preço de diesel S500 por estado e DF - Mar/22",
       size=10) +
  geom_sf_text(data=mapa2_s500,aes(label = abbrev_state), 
       size=2, color= "black") +
  scale_fill_distiller(palette = "Greens", 
       direction = 1, name="Preço médio", 
       limits = c(5.1,8.2)) +
  theme_minimal()

# Código do MAPA s500 - Jun/22
mapa3_s500 <- estado %>% 
  left_join(ftE23, by = c("abbrev_state" = "Estado...Sigla"))

ggplot() +
  geom_sf(data=mapa3_s500, aes(fill=preco_med), 
          color= "black", size=.15) + 
  labs(subtitle="Mapa 6 - Preço de diesel S500 por estado e DF - Jun/22",
       size=10) +
  geom_sf_text(data=mapa3_s500,aes(label = abbrev_state), 
       size=2, color= "black") +
  scale_fill_distiller(palette = "Greens", 
       direction = 1, name="Preço médio", 
       limits = c(5.1,8.2)) +
  theme_minimal()

# Código do MAPA G.C - Nov/21
mapa1_GC <- estado %>% 
  left_join(ftE31, by = c("abbrev_state" = "Estado...Sigla"))

ggplot() +
  geom_sf(data=mapa1_GC, aes(fill=preco_med), 
       color= "black", size=.15) + 
  labs(subtitle="Mapa 7 - Preço de G. comum por estado e DF - Nov/21",
       size=10) +
  geom_sf_text(data=mapa1_GC,aes(label = abbrev_state), 
       size=2, color= "black") +
  scale_fill_distiller(palette = "Reds", 
       direction = 1, name="Preço médio", 
       limits = c(5.9,8)) +
  theme_minimal()

# Código do MAPA G.C - Mar/22
mapa2_GC <- estado %>% 
  left_join(ftE32, by = c("abbrev_state" = "Estado...Sigla"))

ggplot() +
  geom_sf(data=mapa2_GC, aes(fill=preco_med), 
       color= "black", size=.15) + 
  labs(subtitle="Mapa 8 - Preço de G. comum por estado e DF - Mar/22",
       size=10) +
  geom_sf_text(data=mapa2_GC,aes(label = abbrev_state), 
       size=2, color= "black") +
  scale_fill_distiller(palette = "Reds", 
       direction = 1, name="Preço médio", 
       limits = c(5.9,8)) +
  theme_minimal()

# Código do MAPA G.C - Jun/22
mapa3_GC <- estado %>% 
  left_join(ftE33, by = c("abbrev_state" = "Estado...Sigla"))

ggplot() +
  geom_sf(data=mapa3_GC, aes(fill=preco_med), 
          color= "black", size=.15) + 
  labs(subtitle="Mapa 9 - Preço de G. comum por estado e DF - Jun/22",
       size=10) +
  geom_sf_text(data=mapa3_GC,aes(label = abbrev_state), 
       size=2, color= "black") +
  scale_fill_distiller(palette = "Reds", 
       direction = 1, name="Preço médio", 
       limits = c(5.9,8)) +
  theme_minimal()

# Código do MAPA G.A - Nov/21
mapa1_GA <- estado %>% 
  left_join(ftE41, by = c("abbrev_state" = "Estado...Sigla"))

ggplot() +
  geom_sf(data=mapa1_GA, aes(fill=preco_med), 
       color= "black", size=.15) + 
  labs(subtitle="Mapa 10 - Preço de G. aditivada por estado e DF - Nov/21",
       size=10) +
  geom_sf_text(data=mapa1_GA,aes(label = abbrev_state), 
       size=2, color= "black") +
  scale_fill_distiller(palette = "Oranges", 
       direction = 1, name="Preço médio", 
       limits = c(6.3,8.1)) +
  theme_minimal()

# Código do MAPA G.A - Mar/22
mapa2_GA <- estado %>% 
  left_join(ftE42, by = c("abbrev_state" = "Estado...Sigla"))

ggplot() +
  geom_sf(data=mapa2_GA, aes(fill=preco_med), 
       color= "black", size=.15) + 
  labs(subtitle="Mapa 11 - Preço de G. aditivada por estado e DF - Mar/22",
       size=10) +
  geom_sf_text(data=mapa2_GA,aes(label = abbrev_state), 
       size=2, color= "black") +
  scale_fill_distiller(palette = "Oranges", 
       direction = 1, name="Preço médio", 
       limits = c(6.3,8.1)) +
  theme_minimal()

# Código do MAPA G.A - Jun/22
mapa3_GA <- estado %>% 
  left_join(ftE43, by = c("abbrev_state" = "Estado...Sigla"))

ggplot() +
  geom_sf(data=mapa3_GA, aes(fill=preco_med), 
          color= "black", size=.15) + 
  labs(subtitle="Mapa 12 - Preço de G. aditivada por estado e DF - Jun/22",
       size=10) +
  geom_sf_text(data=mapa3_GA,aes(label = abbrev_state), 
       size=2, color= "black") +
  scale_fill_distiller(palette = "Oranges", 
       direction = 1, name="Preço médio", 
       limits = c(6.3,8.1)) +
  theme_minimal()

Analisando-se os mapas gerados, constatou-se facilmente uma elevação dos preços médios de venda de todos os combustíveis líquidos fósseis, de uma maneira geral, nos estados brasileiros, ao longo do período considerado no estudo. As escalas utilizadas nos mapas foram fixadas para cada combustível para facilitar tal constatação a partir da simples visualização dos mapas.

Alguns fatos chamaram a atenção em relação aos mapas gerados:

No estado do Acre, os preços de venda sempre estiveram elevados ao longo de todo o período analisado, para todos os combustíveis, principalmente o diesel, mas não foi o que experimentou os maiores aumentos nos preços.
Nos estados de Goiás, do Rio Grande do Norte, do Piauí, de Minas Gerais e do Rio de Janeiro, os preços de venda para a gasolina sempre estiveram mais elevados em relação aos demais estados ao longo de todo o período analisado.
No estado do Rio Grande do Sul, os preços de venda do diesel aumentaram, enquanto os da gasolina diminuíram, nos meses analisados.
Nos estados da Bahia e do Piauí, houve os maiores aumentos nos preços dos combustíveis, sobretudo para a gasolina, ao longo de todo o período analisado.

6.4. Análise de correlação

Utilizando-se a expressão para o cálculo de índices de variação do preço do diesel e da gasolina, para os meses novembro/2021-março/2022 e março/2022-junho/2022, obteve-se a tabela a seguir, que contém, além dos referidos índices, o IPCA acumulado entre os meses Nov/2021-Mar/2022 e Abr/2022-Jun/2022, para as principais capitais brasileiras.

#===========
# Análises para Municípios
#===========
ftM11t <- DB_Comb %>% 
  filter((Produto == 'DIESEL S10' | Produto == 'DIESEL')
         & `Data da Coleta` <= "2022-01-01") %>%
  select(Municipio,`Valor de Venda`) %>%
  group_by(Municipio) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftM12t <- DB_Comb %>% 
  filter((Produto == 'DIESEL S10' | Produto == 'DIESEL') 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01")) %>%
  select(Municipio,`Valor de Venda`) %>%
  group_by(Municipio) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftM13t <- DB_Comb %>% 
  filter((Produto == 'DIESEL S10' | Produto == 'DIESEL') 
         & `Data da Coleta` > "2022-05-30") %>%
  select(Municipio,`Valor de Venda`) %>%
  group_by(Municipio) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftM11 <- as_tibble(IPCA$Cidade)
colnames(ftM11)=c("Cidade")
ftM11 <- ftM11 %>% 
  left_join(ftM11t, by = c("Cidade" = "Municipio")) %>%
  left_join(ftM12t, by = c("Cidade" = "Municipio")) %>%
  left_join(ftM13t, by = c("Cidade" = "Municipio"))
  
ftM11[length(ftM11)+1] <- 
  round((ftM11$preco_med.y - ftM11$preco_med.x)/ftM11$preco_med.x,4)*100 

ftM11[length(ftM11)+1] <- 
  round((ftM11$preco_med - ftM11$preco_med.y)/ftM11$preco_med.y,4)*100

x=names(ftM11)
x[length(ftM11)-1] = "varD_N_M"
x[length(ftM11)] = "varD_M_J"
colnames(ftM11) = x

ftM21t <- DB_Comb %>% 
  filter((Produto == 'GASOLINA' | Produto == 'GASOLINA ADITIVADA')
         & `Data da Coleta` <= "2022-01-01") %>%
  select(Municipio,`Valor de Venda`) %>%
  group_by(Municipio) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftM22t <- DB_Comb %>% 
  filter((Produto == 'GASOLINA' | Produto == 'GASOLINA ADITIVADA') 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01")) %>%
  select(Municipio,`Valor de Venda`) %>%
  group_by(Municipio) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftM23t <- DB_Comb %>% 
  filter((Produto == 'GASOLINA' | Produto == 'GASOLINA ADITIVADA') 
         & `Data da Coleta` > "2022-05-30") %>%
  select(Municipio,`Valor de Venda`) %>%
  group_by(Municipio) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

ftM21 <- as_tibble(IPCA$Cidade)
colnames(ftM21)=c("Cidade")
ftM21 <- ftM21 %>% 
  left_join(ftM21t, by = c("Cidade" = "Municipio")) %>%
  left_join(ftM22t, by = c("Cidade" = "Municipio")) %>%
  left_join(ftM23t, by = c("Cidade" = "Municipio"))

ftM21[length(ftM21)+1] <- 
  round((ftM21$preco_med.y - ftM21$preco_med.x)/ftM21$preco_med.x,4)*100 

ftM21[length(ftM21)+1] <- 
  round((ftM21$preco_med - ftM21$preco_med.y)/ftM21$preco_med.y,4)*100

x=names(ftM21)
x[length(ftM21)-1] = "varG_N_M"
x[length(ftM21)] = "varG_M_J"
colnames(ftM21) = x

IPCA[length(IPCA)+1] <- 
  round((1+IPCA$nov_21/100)*(1+IPCA$dez_21/100)*(1+IPCA$jan_22/100)*
          (1+IPCA$fev_22/100)*(1+IPCA$mar_22/100)-1,4)*100 

IPCA[length(IPCA)+1] <- 
  round((1+IPCA$abr_22/100)*(1+IPCA$mai_22/100)*(1+IPCA$jun_22/100)-1,4)*100

x=names(IPCA)
x[length(IPCA)-1] = "acum_N_M"
x[length(IPCA)] = "acum_A_J"
colnames(IPCA) = x

ftIPCA <- IPCA %>% 
  left_join(ftM11, by = c("Cidade" = "Cidade")) %>%
  left_join(ftM21, by = c("Cidade" = "Cidade"))

ftVIPCA <- ftIPCA %>% 
  select(Cidade, acum_N_M, varD_N_M, varG_N_M, acum_A_J, 
         varD_M_J, varG_M_J) %>% 
  data_frame() 

ftVIPCA <- ftVIPCA[order(ftVIPCA$acum_N_M, decreasing=c(TRUE)),]

ftVIPCA <- ftVIPCA %>% flextable()

ftVIPCA <- delete_part(ftVIPCA, part = "header")
ftVIPCA <- add_header(x=ftVIPCA, "Cidade" = "Cidade",
                      acum_N_M="IPCA Acum.", varD_N_M="Var. Diesel",
                      varG_N_M="Var. Gasolina", acum_A_J="IPCA Acum.",
                      varD_M_J="Var. Diesel", varG_M_J="Var. Gasolina",
                   top = FALSE) 

ftVIPCA <- add_header(x=ftVIPCA,
                   acum_N_M="Nov/21 a Mar/22", varD_N_M="Nov/21 a Mar/22",
                   varG_N_M="Nov/21 a Mar/22", acum_A_J="Abr/22 a Jun/22",
                   varD_M_J="Abr/22 a Jun/22", varG_M_J="Abr/22 a Jun/22",
                   top = TRUE) 
ftVIPCA %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Variação acumulada do IPCA e índice de variação dos combustíveis nas capitais")

Variação acumulada do IPCA e índice de variação dos combustíveis nas capitais
	Nov/21 a Mar/22	Abr/22 a Jun/22
CURITIBA	5.85	23.28	10.82	1.89	14.97	2.98
GOIANIA	5.84	15.37	-0.49	1.70	12.59	1.64
SALVADOR	5.81	20.75	7.82	3.23	14.50	7.94
SAO LUIS	5.72	21.27	6.85	1.83	9.95	0.69
ARACAJU	5.55	12.75	3.80	2.79	12.13	3.48
CAMPO GRANDE	5.46	15.44	2.68	2.13	16.20	2.55
RIO DE JANEIRO	5.27	18.42	3.21	2.36	13.01	2.80
RIO BRANCO	5.26	14.41	4.29	1.93	14.10	4.29
BELO HORIZONTE	5.08	16.62	4.99	2.17	14.73	2.55
RECIFE	5.08	14.97	4.61	2.83	14.81	5.96
FORTALEZA	4.89	15.15	2.64	3.03	15.06	4.76
SAO PAULO	4.79	17.40	5.02	2.03	13.14	1.85
VITORIA	4.76	14.96	4.71	1.36	17.91	3.52
BRASILIA	4.40	13.77	0.40	2.35	13.54	4.66
BELEM	4.07	17.27	5.76	1.84	13.42	1.34
PORTO ALEGRE	3.33	14.93	-7.83	2.32	14.93	4.03

Com as informações da tabela anterior e com outros índices de ICPA mensais, foram elaboradas as seguintes matrizes de correlação. Ademais, foram realizados os testes de hipótese de correlação para as variáveis de interesse, procedendo-se, inicialmente, aos testes de normalidade de Shapiro Wilk, com as seguintes hipóteses nula e alternativa:

H0: Dados seguem uma distribuição normal.
H1: Dados não seguem uma distribuição normal.

Em seguida, para as análises de correlações que envolveram somente variáveis com distribuição normal, foram realizados os testes de hipótese de Pearson, com as seguintes hipóteses nula e alternativa:

H0: ρ = 0 (as variáveis não estão correlacionadas).
H1: ρ ≠ 0 (as variáveis estão correlacionadas).

E para as análises de correlações que envolveram ao menos uma variável com distribuição não normal, foram realizados os testes de hipótese de Spearman, com as seguintes hipóteses nula e alternativa:

H0: não há associação monotônica entre as variáveis.
H1: há associação monotônica entre as variáveis.

Os resultados dos testes de hipótese para verificar a existência de correlação entre as variáveis consideradas nas Matrizes de Correlação estão apresentados no ANEXO.

#===========
# Matriz de correlação utilizando-se os dados para os Municípios
#===========

MC_N_M <- ftIPCA %>% 
  select(varD_N_M, varG_N_M, acum_N_M) %>% cor()
MC_N_M

          varD_N_M  varG_N_M  acum_N_M
varD_N_M 1.0000000 0.6261219 0.4131660
varG_N_M 0.6261219 1.0000000 0.6259379
acum_N_M 0.4131660 0.6259379 1.0000000

par(cex.main=1)
corrplot.mixed(MC_N_M, mar = c(0,0,1,0), lower.col = "black", title=
          "Matriz de Correlação entre preços de combustíveis e IPCA - Nov/21 a Mar/22")

MC_M_J <- ftIPCA %>% 
  select(varD_M_J, varG_M_J, acum_A_J) %>% cor()
MC_M_J

            varD_M_J  varG_M_J    acum_A_J
varD_M_J  1.00000000 0.3991022 -0.04180144
varG_M_J  0.39910222 1.0000000  0.73074661
acum_A_J -0.04180144 0.7307466  1.00000000

corrplot.mixed(MC_M_J, mar = c(0,0,1,0), lower.col = "black", title=
           "Matriz de Correlação entre preços de combustíveis e IPCA - Abr/22 a Jun/22")

#var de preços de Nov a Mar e IPCA de Mar 
MC_N_M_Mar <- ftIPCA %>% 
  select(varD_N_M, varG_N_M, mar_22) %>% cor()
MC_N_M_Mar

          varD_N_M  varG_N_M    mar_22
varD_N_M 1.0000000 0.6261219 0.6313076
varG_N_M 0.6261219 1.0000000 0.2221243
mar_22   0.6313076 0.2221243 1.0000000

corrplot.mixed(MC_N_M_Mar, mar = c(0,0,1,0), lower.col = "black", title=
                 "Matriz de Correlação entre preços de combustíveis e IPCA de Mar/22")

Analisando-se a Matriz de Correlação entre o IPCA acumulado e os índices de variação dos combustíveis para o período Nov/2021 a Mar/2022, observou-se uma correlação positiva e moderada entre o IPCA acumulado no período e os índices de variação dos preços dos combustíveis, sendo que o coeficiente de correlação para o índice da gasolina e o IPCA acumulado (0,63) foi maior do que para o índice do diesel e o IPCA acumulado (0,41).

Em relação à Matriz de Correlação para o período Abr/2022 a Jun/2022, verificou-se uma correlação forte e positiva entre o IPCA acumulado no período e o índice de variação dos preços de gasolina (0,73). Já entre o IPCA acumulado e o índice de variação dos preços de diesel praticamente não houve correlação para o período.

Finalmente, a partir da Matriz de Correlação entre o IPCA do mês de Março/2022 e os índices de variação dos combustíveis para o período Nov/2021 a Mar/2022, notou-se uma correlação positiva e moderada entre tal IPCA e o índice de variação dos preços de diesel (0,63) e uma correlação fraca e positiva entre aquele IPCA e o índice de variação dos preços de gasolina (0,22).

Com exceção da variável correspondente ao IPCA de Março/2022 (que resultou em um p-valor menor que alpha no teste de normalidade, rejeitando a hipótese nula, de normalidade), todas as outras apresentaram distribuição normal, já que seus testes de normalidade resultaram em um p-valor maior que alpha, não rejeitando a hipótese nula de normalidade. Assim, para os testes de hipótese de correlação envolvendo esse IPCA, utilizou-se o método de Spearman, ao passo que para os demais, utilizou-se o método de Pearson.

Verificando-se tais testes, foi possível concluir que existe correlação entre o IPCA acumulado e o índice de variação dos preços de gasolina para os dois períodos analisados nas correlações (Nov/2021 a Mar/2022 e Abr/2022 a Jun/2022), dado que os p-valor resultantes para esses testes foram menores que alpha, devendo-se rejeitar a hipótese nula em favor da alternativa, que diz existir correlação entre as variáveis. De forma semelhante, foi possível concluir que existe correlação entre o IPCA de Mar/2022 e o índice de variação dos preços de diesel para o período de Nov/2021 a Mar/2022, pois o p-valor resultante para esse teste foi menor que alpha, devendo-se rejeitar a hipótese nula. Para os demais testes, como os p-valor resultantes foram maiores que alpha, a hipótese nula não foi rejeitada, o que significa que não há correlação ou associação entre as variáveis.

7. DISCUSSÃO

De uma maneira geral, muito embora exista diferença nos preços de venda dos combustíveis entre revendedores de bandeiras distintas, conforme foi constatado na análise dos resultados, tal diferença se mostra tímida, salvo algumas raras exceções. Como foi visto anteriormente, cerca de 50% desse mercado é dominado por três agentes econômicos (VIBRA ENERGIA, RAIZEN e IPIRANGA), sendo que os revendedores sem bandeira (BRANCA), que perfazem de 30% a 40% do mercado, podem optar por adquirir o combustível de uma distribuidora ligada àqueles agentes dominantes. O resultado seria, realmente, um preço de venda praticado mais equilibrado entre as bandeiras.

O fato de que grande parte do combustível refinado no Brasil esteja concentrado em um agente dominante, que fornece derivados às distribuidoras, também pode contribuir para esse equilíbrio de preços.

De qualquer maneira, invariavelmente, os preços dos combustíveis da VIBRA ENERGIA sempre estiveram, isolada ou conjugadamente, entre os mais elevados, considerando-se o período analisado. Contudo, seria necessário analisar com maiores detalhes o comportamento dos preços de combustíveis, para cada região em separado, para confirmar se essa bandeira pratica, efetivamente, preços mais altos em relação às demais.

Outro ponto importante em relação às bandeiras se deve ao fato de que nem sempre um posto não bandeirado (BRANCA) pratica os menores preços de venda. Além disso, a pulverização desse mercado associada ao baixo Market Share de cada agente não garante uma redução de preços, como foi constatado nas análises dos resultados, haja vista que os preços praticados pela categoria OUTRAS (integração de todos os postos com baixa concentração de mercado) não figuraram, via de regra, entre os mais baixos.

Diversamente da situação relacionada às bandeiras, os preços de venda dos combustíveis praticados nas diferentes regiões brasileiras parecem apresentar maiores desigualdades. De acordo com os resultados analisados, as regiões Norte e Nordeste apresentaram, sobretudo nos meses de 2022 considerados no estudo, preços mais elevados em relação as outras regiões. Do lado oposto, as regiões Sul e Sudeste praticaram preços mais baixos em todo o período analisado.

E é da região Nordeste os estados onde os preços dos combustíveis sofreram maiores aumentos, em especial Bahia e Piauí, como foi verificado na visualização dos mapas mostrados nos resultados. Isso pode estar relacionado à venda da refinaria RLAM pela Petrobras, que está localizada justamente na Bahia e cuja conclusão do negócio foi em novembro de 2021. Ressalta-se que uma empresa privada busca repassar com maior rapidez os aumentos de custos no processo, como os ocorridos em virtude da crise energética gerada pelo conflito entre Rússia e Ucrânia, e ampliar as margens de lucros. E isso pode ser mais relevante no caso de existir poucas (ou nenhuma outra) opções para o fornecimento de derivados refinados, a não ser da refinaria alienada.

Por certo, o destacado privilégio de ampliação das margens de lucros não se reservou somente àquela refinaria privada, mas também à Petrobras, quando passou a adotar a política do PPI, deixando à margem as funções sociais inerentes a essa espécie societária.

Analisando-se de forma ampla, era de se esperar que o efeito do cenário formado, sobretudo em consequência do conflito entre Rússia e Ucrânia, levaria ao aumento dos custos do transporte no Brasil, dado que este é sobremaneira rodoviário e, no caso do transporte de cargas, à base do diesel, que possui maior dependência externa. Tal aumento poderia induzir, por conseguinte, uma elevação do preço dos produtos e dos serviços consumidos pela sociedade, pressionando os índices inflacionários nacionais.

E como foi verificado nos resultados, ocorreu um aumento generalizado dos preços dos combustíveis no Brasil. Além disso, analisando-se os testes de correlação, realmente parece existir uma relação entre o aumento dos preços dos combustíveis e a elevação da inflação para o período estudado, muito embora estudos mais completos devessem ser realizados para confirmar essa tendência e em que janela de tempo se processa, utilizando-se, por exemplo, testes de sensibilidade.

Em todo o caso, a degradação das condições econômicas e sociais no Brasil ocasionada pelo cenário global e, mais especificamente pela elevação dos preços dos combustíveis e da inflação, a partir do final de 2021, poderia ser minimizada com ações mais assertivas e adequadas, por parte das autoridades governamentais, amparadas na “nova” característica de essencialidade conferida aos combustíveis.

8. CONCLUSÃO

Apesar deste estudo focar na análise estatística de períodos temporais curtos e específicos, resta demonstrado que é necessária uma reflexão sobre a condução da política da Petrobras e da estrutura do mercado de refino e de derivados de petróleo no Brasil, sobretudo por parte das autoridades governamentais, executivas e legislativas.

A alienação dos ativos da Petrobras, pertencentes aos elos mais próximos ao consumidor, vem se demonstrando ineficaz, ao menos no curto prazo, uma vez que a finalidade principal buscada não está sendo alcançada: a redução dos preços praticados no mercado de derivados do petróleo, o que poderia induzir uma melhora do bem estar social da população brasileira.

Outrossim, a política de precificação adotada por essa empresa de economia mista não só vem sendo ineficaz quanto as suas funções sociais, mas também deletéria às condições econômicas e sociais brasileiras a partir da implementação do Preço de Paridade de Importação. A crise nacional dos combustíveis gerada pelo cenário internacional, especialmente pelo conflito entre Rússia e Ucrânia, é mais que suficiente para evidenciar que essa espécie de sociedade, dominada de certa forma pelo Governo, não pode escantear certos preceitos constitucionais e legais relacionados à função social pretendida por empresas assim constituídas pelo Estado brasileiro.

Portanto, as autoridades governamentais brasileiras devem tomar uma decisão em relação à condução das políticas delineadas pela Petrobras e à reestruturação do mercado nacional de petróleo. Optando pela continuidade dos planos associados a esse tema e iniciados em 2016, deveriam ser modificados e/ou criados institutos legais que possam garantir uma atuação dos agentes econômicos no sentido de propiciar uma efetiva melhora do bem estar social para toda a população brasileira e não somente para a sociedade empresária.

9. REFERÊNCIAS

ANP - Agência Nacional do Petróleo, Gás Natural e Biocombustíveis (2022a). Relatório de Gestão da ANP 2021. Disponível em https://www.gov.br/anp/pt-br/acesso-a-informacao/transparencia/rg/relatoriogestao-2021-pdf.pdf. Acesso em: 28 de jan 2023.

ANP - Agência Nacional do Petróleo, Gás Natural e Biocombustíveis (2022b). Síntese Mensal de Comercialização de Combustíveis. Disponível em https://www.gov.br/anp/pt-br/centrais-de-conteudo/publicacoes/sinteses/scc/2022/sintese-volume-novembro.pdf. Acesso em: 28 de jan 2023.

ANP - Agência Nacional do Petróleo, Gás Natural e Biocombustíveis (2021). Síntese Mensal de Comercialização de Combustíveis. Disponível em https://www.gov.br/anp/pt-br/centrais-de-conteudo/publicacoes/sinteses/scc/2021/sintese-volume-dezembro-2021.pdf. Acesso em: 28 de jan 2023.

EPE - Empresa de Pesquisa Energética (2022). Perspectivas para o Mercado Brasileiro de Combustíveis no Curto Prazo. Disponível em: https://www.epe.gov.br/sites-pt/publicacoes-dados-abertos/publicacoes/PublicacoesArquivos/publicacao-594/topico-620/Perspectivas%20para%20o%20Mercado%20Brasileiro%20de%20Combust%C3%ADveis%20no%20Curto%20Prazo_2022-12.pdf. Acesso em: 28 jan 2023.

MINISTÉRIO DE MINAS E ENERGIA (2019). Estudos do art. 2º da Resolução CNPE nº 12/2019. Disponível em: https://www.gov.br/mme/pt-br/assuntos/secretarias/petroleo-gas-natural-e-biocombustiveis/abastece-brasil/resolucao-cnpe-no-12-2019/RelatrioRCNPE122019v12.pdf. Acesso em: 28 jan 2023.

PETROBRAS - PETRÓLEO BRASILEIRO S.A. (2019). Plano de Negócios e Gestão 2019 - Plano de Negócios e Gestão 2017-2021 (PNG 2017-2021). Disponível em: https://www.investidorpetrobras.com.br/apresentacoes-relatorios-e-eventos/apresentacoes/. Acesso em: 27 de jan. 2023.

MINISTÉRIO DE MINAS E ENERGIA (2020). Subcomitê Novo Cenário Downstream - Tema: Infraestrutura para movimentação de derivados de petróleo. Disponível em: < https://www.gov.br/mme/pt-br/assuntos/secretarias/petroleo-gas-natural-e-biocombustiveis/abastece-brasil/subcomites/RelatrioSubcomitNovoCenrioDownstreamInfraestruturav19v2final.pdf>. Acesso em: 28 jan 2023.

ALVARENGA, D. Petrobras em números: veja evolução do lucro, produção, dividendos, nº de funcionários e valor de mercado. G1, 2022. Disponível em: < https://g1.globo.com/economia/noticia/2022/03/31/petrobras-em-numeros-veja-evolucao-do-lucro-producao-dividendos-no-de-funcionarios-e-valor-de-mercado.ghtml>. Acesso em: 29 jan 2023.

PAMPLONA, N. Petrobras tem lucro recorde de R$ 106 bi e anuncia mais R$ 37 bi em dividendos. Folha, 2022. Disponível em: https://www1.folha.uol.com.br/mercado/2022/02/lucro-da-petrobras-passa-de-r-100-bilhoes-e-empresa-anuncia-mais-r-37-bilhoes-em-dividendos.shtml. Acesso em: 29 jan 2023.

FERRARI, H. Petrobras não é mais sócia da BR Distribuidora e recebe R$ 11,4 bilhões. Poder360, 2021. Disponível em: <https://www.poder360.com.br/economia/petrobras-nao-e-mais-socia-da-br-distribuidora-e-recebe-r-114-bilhoes/ >. Acesso em: 28 jan 2023.

PETROBRAS - PETRÓLEO BRASILEIRO S.A. (2019). Fatos e Dados - Concluímos venda da Refinaria Landulpho Alves (RLAM) para o Mubadala Capital. Disponível em: https://petrobras.com.br/fatos-e-dados/concluimos-venda-da-refinaria-landulpho-alves-rlam-para-o-mubadala-capital.htm. Acesso em: 29 de jan. 2023.

DUTT-ROSS, S. Manual de Análise de Dados. Rio de Janeiro, 2020. JELIHOVSCHI, E. Análise Exploratória de Dados usando o R. Bahia: Editora da UESC, 2014.

ASSUNÇÃO, R. Fundamentos Estatísticos de Ciência dos Dados - voltado para aplicações. 2017.

ANEXO

Os demais resultados obtidos a partir das análises e não apresentados na seção Resultados podem ser vistos a seguir. Adicionalmente, foram gerados resultados para uma avaliação dos preços nas regiões brasileiras por bandeira, porém, não foram analisados em virtude da complexidade que geraria, fugindo ao propósito do trabalho. Contudo, para a complementação e detalhamento de análises, discussões e conclusões, recomenda-se a análise de tal tópico.

Resultados referentes às análises dos preços por região. Histogramas e boxplots:

#-------
# Boxplots e Histogramas referentes às Tabelas
# com preços médios e desvio padrão 
# por região para os meses de nov/21, mar/22 e
# jun/22, extratificadas pelos 
# produtos D S10, D S500, G comum e G aditivada 
#-------
hist(ftT21BP$`Valor de Venda`, main = "Histograma de preços de Diesel S500 - Nov/21", 
     col="Green", xlab="R$", ylab="Frequência")

hist(ftT22BP$`Valor de Venda`, main = "Histograma de preços de Diesel S500 - Mar/22", 
     col="Green", xlab="R$", ylab="Frequência")

hist(ftT23BP$`Valor de Venda`, main = "Histograma de preços de Diesel S500 - Jun/22", 
     col="Green", xlab="R$", ylab="Frequência")

hist(ftT41BP$`Valor de Venda`, main = "Histograma de preços de Gas. aditivada - Nov/21", 
     col="Orange", xlab="R$", ylab="Frequência")

hist(ftT42BP$`Valor de Venda`, main = "Histograma de preços de Gas. aditivada - Mar/22", 
     col="Orange", xlab="R$", ylab="Frequência")

hist(ftT43BP$`Valor de Venda`, main = "Histograma de preços de Gas. aditivada - Jun/22", 
     col="Orange", xlab="R$", ylab="Frequência")

boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT21BP, 
        main="Boxplot de preços de Diesel S500 por região - Nov/21",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT22BP, 
        main="Boxplot de preços de Diesel S500 por região - Mar/22",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT23BP, 
        main="Boxplot de preços de Diesel S500 por região - Jun/22",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT41BP, 
        main="Boxplot de preços de Gas. aditivada por região - Nov/21",
        ylim = c(5.5,9.5), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT42BP, 
        main="Boxplot de preços de Gas. aditivada por região - Mar/22",
        ylim = c(5.5,9.5), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~`Regiao - Sigla`,data=ftT43BP, 
        main="Boxplot de preços de Gas. aditivada por região - Jun/22",
        ylim = c(5.5,9.5), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

Testes de hipóteses:

#---------
# Testes de Hipóteses
#-------
# Verificar se para cada período e combustível
# existe alguma região que pratica preço diferenciado
# (maior ou menor)
#------------------------------------------------------
# Para D. S500 e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModT21 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT21BP)
ResT21 <- residuals(ModT21)
lillie.test(ResT21)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResT21
D = 0.058715, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT21BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 3156.3, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT21 <- pairwise.wilcox.test(ftT21BP$`Valor de Venda`,
                               ftT21BP$`Regiao - Sigla`,
                               p.adjust.method="fdr")
ModT21


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftT21BP$`Valor de Venda` and ftT21BP$`Regiao - Sigla` 

   CO     N      NE     S     
N  <2e-16 -      -      -     
NE 0.0099 <2e-16 -      -     
S  <2e-16 <2e-16 <2e-16 -     
SE <2e-16 <2e-16 <2e-16 <2e-16

P value adjustment method: fdr

# De acordo com o resultado desse teste, realmente existe um p-valor
# (entre CO e NE) que é bem maior que  os demais (0,0099), mas 
# ainda está dentro do limite de significância (é menor que alpha)
# Assim, deve-se Rej H0 para todos os pares, inclusive entre as 
# regiões Centro-Oeste e Nordeste, indicando que existe diferença 
# significativa entre as distribuições do preço de D.S500 para todas
# as regiões. Assim, pode-se dizer que há diferença significativa  
# nos preços praticados desse combustível em todas as regiões,
# considerando-se o mês de nov/2021.
#------------------------------------------------------
# Para D. S500 e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModT22 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT22BP)
ResT22 <- residuals(ModT22)
lillie.test(ResT22)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResT22
D = 0.10956, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT22BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 991.96, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT22 <- pairwise.wilcox.test(ftT22BP$`Valor de Venda`,
                               ftT22BP$`Regiao - Sigla`,
                               p.adjust.method="fdr")
ModT22


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftT22BP$`Valor de Venda` and ftT22BP$`Regiao - Sigla` 

   CO      N       NE      S      
N  < 2e-16 -       -       -      
NE 2.4e-10 0.0036  -       -      
S  < 2e-16 < 2e-16 < 2e-16 -      
SE < 2e-16 < 2e-16 < 2e-16 4.2e-05

P value adjustment method: fdr

# De acordo com o resultado desse teste, realmente existe um p-valor
# (entre N e NE) que é maior que  os demais (0,0036), mas 
# ainda está dentro do limite de significância (é menor que alpha)
# Assim, deve-se Rej H0 para todos os pares, inclusive entre as 
# regiões Norte e Nordeste, indicando que existe diferença 
# significativa entre as distribuições do preço de D.S500 para todas
# as regiões. Assim, pode-se dizer que há diferença significativa  
# nos preços praticados desse combustível em todas as regiões,
# considerando-se o mês de mar/2022.
#------------------------------------------------------
# Para D. S500 e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModT23 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT23BP)
ResT23 <- residuals(ModT23)
lillie.test(ResT23)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResT23
D = 0.062565, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT23BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 1705, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT23 <- pairwise.wilcox.test(ftT23BP$`Valor de Venda`,
                               ftT23BP$`Regiao - Sigla`,
                               p.adjust.method="fdr")
ModT23


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftT23BP$`Valor de Venda` and ftT23BP$`Regiao - Sigla` 

   CO      N       NE      S      
N  < 2e-16 -       -       -      
NE < 2e-16 0.79    -       -      
S  < 2e-16 < 2e-16 < 2e-16 -      
SE < 2e-16 < 2e-16 < 2e-16 7.2e-13

P value adjustment method: fdr

# De acordo com o resultado desse teste, em virtude dO p-valor
# entre NE e N (0,79) ser maior que alpha, não se deve Rej H0
# para esse par, indicando que não existe diferença significativa
# entre as distribuições do preço de D.S500 nas regiões Norte e 
# Nordeste. Já nas demais regiões, há diferença significativa
# nas distribuições do preço de D.S500. Assim, pode-se dizer que 
# os preços de D.S500 praticados nas regiões Norte e Nordeste são
# semelhantes entre si e maiores em relação a outras regiões e que 
# há diferença significativa nos preços desse combustível nas 
# regiões Centro-Oeste, Sul e Sudeste (e destas em relação às regiões
# Norte e Nordeste), considerando-se o mês de jun/2022.
#------------------------------------------------------
#------------------------------------------------------
# Para G. aditivada e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModT41 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT41BP)
ResT41 <- residuals(ModT41)
lillie.test(ResT41)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResT41
D = 0.081472, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT41BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 573.85, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT41 <- pairwise.wilcox.test(ftT41BP$`Valor de Venda`,
                               ftT41BP$`Regiao - Sigla`,
                               p.adjust.method="fdr")
ModT41


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftT41BP$`Valor de Venda` and ftT41BP$`Regiao - Sigla` 

   CO      N       NE      S      
N  < 2e-16 -       -       -      
NE < 2e-16 1.3e-05 -       -      
S  < 2e-16 0.41    1.1e-06 -      
SE < 2e-16 1.0e-09 < 2e-16 < 2e-16

P value adjustment method: fdr

# De acordo com o resultado desse teste, em virtude dO p-valor
# entre S e N (0,41) ser maior que alpha, não se deve Rej H0
# para esse par, indicando que não existe diferença significativa
# entre as distribuições do preço de G.aditivada nas regiões Norte 
# e Sul. Assim, excluindo-se o par S e N, há diferença significativa nas
# distribuições do preço de G.aditivada nas regiões. Logo, pode-se dizer 
# que os preços de G.aditivada praticados nas regiões Norte e Sul são
# semelhantes entre si, mas são maiores em relação à região Sudeste 
# e menores em relação às demais. Além disso,  
# há diferença significativa nos preços desse combustível nas 
# regiões Centro-Oeste, Nordeste e Sudeste (e destas em relação às regiões
# Norte e Sul), considerando-se o mês de nov/2021.
#------------------------------------------------------
# Para G. aditivada e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModT42 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT42BP)
ResT42 <- residuals(ModT42)
lillie.test(ResT42)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResT42
D = 0.03309, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT42BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 1293.4, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT42 <- pairwise.wilcox.test(ftT42BP$`Valor de Venda`,
                               ftT42BP$`Regiao - Sigla`,
                               p.adjust.method="fdr")
ModT42


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftT42BP$`Valor de Venda` and ftT42BP$`Regiao - Sigla` 

   CO     N      NE     S     
N  <2e-16 -      -      -     
NE <2e-16 0.0067 -      -     
S  <2e-16 <2e-16 <2e-16 -     
SE 0.0012 <2e-16 <2e-16 <2e-16

P value adjustment method: fdr

# De acordo com o resultado desse teste, realmente existe dois p-valor
# (entre N e NE e entre CO e SE) que são maiores que os demais (0,0067
# e 0,0012), mas ainda estão dentro do limite de significância
# (é menor que alpha). Assim, deve-se Rej H0 para todos os pares, 
# inclusive entre as regiões Norte e Nordeste e Centro-Oeste e Sudeste, 
# indicando que existe diferença significativa entre as distribuições 
# do preço de G.aditivada para todas as regiões.
# Assim, pode-se dizer que há diferença significativa  
# nos preços praticados desse combustível em todas as regiões,
# considerando-se o mês de mar/2022.
#------------------------------------------------------
# Para G. aditivada e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModT43 <- aov(`Valor de Venda`~`Regiao - Sigla`,data=ftT43BP)
ResT43 <- residuals(ModT43)
lillie.test(ResT43)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResT43
D = 0.045141, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~`Regiao - Sigla`,data=ftT43BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Regiao - Sigla
Kruskal-Wallis chi-squared = 3193.4, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModT43 <- pairwise.wilcox.test(ftT43BP$`Valor de Venda`,
                               ftT43BP$`Regiao - Sigla`,
                               p.adjust.method="fdr")
ModT43


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftT43BP$`Valor de Venda` and ftT43BP$`Regiao - Sigla` 

   CO      N       NE      S      
N  < 2e-16 -       -       -      
NE < 2e-16 < 2e-16 -       -      
S  < 2e-16 < 2e-16 < 2e-16 -      
SE 9.2e-05 < 2e-16 < 2e-16 < 2e-16

P value adjustment method: fdr

# De acordo com o resultado desse teste, todos os valores
# de p-valor para os pares de todas as regiões estão 
# abaixo de alpha. Assim, deve-se Rej H0 para todos os
# pares de regiões, indicando que existe diferença 
# significativa entre as distribuições do preço de 
# G.aditivada para todas as regiões.
# Assim, pode-se dizer que há diferença significativa nos 
# preços praticados desse combustível em todas as regiões,
# considerando-se o mês de jun/2022.
#------------------------------------------------------
#------------------------------------------------------

Resultados referentes às análises dos preços no Brasil por bandeiras. Tabelas:

#---------
# Tabela em num abs
#-------
# Tabelas indicando quantidades de estabelecimentos de
# determinada bandeira no Brasil para os produtos
# D S10, D S500, G comum e G aditivada 
#-------
DB_Comb %>% 
  tabyl(Bandeira,Produto) %>% 
  flextable() %>% theme_zebra() %>%
  set_caption(caption = "Frequência de cada BANDEIRA por PRODUTO na BD")

Frequência de cada BANDEIRA por PRODUTO na BD
Bandeira	DIESEL	DIESEL S10	GASOLINA	GASOLINA ADITIVADA
ALESAT	724	1,253	1,614	1,003
AMERICANOIL	39	39	34	43
ATEMS	234	274	335	266
ATLÂNTICA	35	59	65	50
BRANCA	12,229	19,876	26,424	16,021
CHARRUA	73	93	119	116
CIAPETRO	96	125	129	82
DIBRAPE	28	39	42	37
DISLUB	24	110	125	103
EQUADOR	208	230	267	221
ESTRADA	1	1	1	1
FAN	24	38	46	15
FEDERAL ENERGIA	23	28	41	18
IDAZA	86	116	119	96
IPIRANGA	4,835	9,751	11,240	9,591
LARCO	25	30	30	28
MASUT DISTRIBUIDORA	27	30	33	24
MAXSUL	18	89	84	88
MONTEPETRO	24	24	24	24
PELIKANO	9	9	9	9
PETROBAHIA	19	38	41	32
PETROSERRA	25	17	31	17
PETROX DISTRIBUIDORA	31	109	111	96
PODIUM	0	1	1	1
POTENCIAL	41	50	64	60
RAIZEN	4,414	9,072	10,644	9,249
RAIZEN MIME	84	271	373	307
REJAILE	4	11	11	11
RIO BRANCO	57	76	89	59
RODOIL	185	310	387	369
ROYAL FIC	18	10	18	18
RUFF C.J.	0	11	11	0
RZD DISTRIBUIDORA	0	16	16	16
SABBÁ	495	821	904	742
SETTA DISTRIBUIDORA	15	66	65	36
SIMARELLI	38	69	65	43
SMALL	19	20	31	27
SP	72	273	301	186
STANG	102	132	141	135
SUL COMBUSTÍVEIS	30	32	33	31
TAURUS	200	221	245	72
TDC DISTRIBUIDORA	2	51	64	60
TEMAPE	13	41	55	38
TOBRAS	0	2	4	2
TORRAO	6	20	22	19
TOTALENERGIES	52	80	116	50
UNI	0	7	11	11
VIBRA ENERGIA	6,466	12,877	14,282	12,198
WALENDOWSKY	12	12	12	12
WATT	22	22	22	10

# Tabela em num relativos - por coluna
#-------
# Tabelas indicando percentuais de estabelecimentos de
# determinada bandeira no Brasil para os produtos
# D S10, D S500, G comum e G aditivada 
#-------
DB_Comb %>% 
  tabyl(Bandeira,Produto)  %>%
  adorn_percentages("col") %>%
  adorn_pct_formatting(digits = 2) %>%
  flextable() %>% theme_zebra() %>%
  set_caption(caption = "Frequência relativa de cada BANDEIRA por PRODUTO na BD")

Frequência relativa de cada BANDEIRA por PRODUTO na BD
Bandeira	DIESEL	DIESEL S10	GASOLINA	GASOLINA ADITIVADA
ALESAT	2.32%	2.20%	2.34%	1.94%
AMERICANOIL	0.13%	0.07%	0.05%	0.08%
ATEMS	0.75%	0.48%	0.49%	0.51%
ATLÂNTICA	0.11%	0.10%	0.09%	0.10%
BRANCA	39.22%	34.90%	38.32%	30.96%
CHARRUA	0.23%	0.16%	0.17%	0.22%
CIAPETRO	0.31%	0.22%	0.19%	0.16%
DIBRAPE	0.09%	0.07%	0.06%	0.07%
DISLUB	0.08%	0.19%	0.18%	0.20%
EQUADOR	0.67%	0.40%	0.39%	0.43%
ESTRADA	0.00%	0.00%	0.00%	0.00%
FAN	0.08%	0.07%	0.07%	0.03%
FEDERAL ENERGIA	0.07%	0.05%	0.06%	0.03%
IDAZA	0.28%	0.20%	0.17%	0.19%
IPIRANGA	15.50%	17.12%	16.30%	18.54%
LARCO	0.08%	0.05%	0.04%	0.05%
MASUT DISTRIBUIDORA	0.09%	0.05%	0.05%	0.05%
MAXSUL	0.06%	0.16%	0.12%	0.17%
MONTEPETRO	0.08%	0.04%	0.03%	0.05%
PELIKANO	0.03%	0.02%	0.01%	0.02%
PETROBAHIA	0.06%	0.07%	0.06%	0.06%
PETROSERRA	0.08%	0.03%	0.04%	0.03%
PETROX DISTRIBUIDORA	0.10%	0.19%	0.16%	0.19%
PODIUM	0.00%	0.00%	0.00%	0.00%
POTENCIAL	0.13%	0.09%	0.09%	0.12%
RAIZEN	14.15%	15.93%	15.44%	17.87%
RAIZEN MIME	0.27%	0.48%	0.54%	0.59%
REJAILE	0.01%	0.02%	0.02%	0.02%
RIO BRANCO	0.18%	0.13%	0.13%	0.11%
RODOIL	0.59%	0.54%	0.56%	0.71%
ROYAL FIC	0.06%	0.02%	0.03%	0.03%
RUFF C.J.	0.00%	0.02%	0.02%	0.00%
RZD DISTRIBUIDORA	0.00%	0.03%	0.02%	0.03%
SABBÁ	1.59%	1.44%	1.31%	1.43%
SETTA DISTRIBUIDORA	0.05%	0.12%	0.09%	0.07%
SIMARELLI	0.12%	0.12%	0.09%	0.08%
SMALL	0.06%	0.04%	0.04%	0.05%
SP	0.23%	0.48%	0.44%	0.36%
STANG	0.33%	0.23%	0.20%	0.26%
SUL COMBUSTÍVEIS	0.10%	0.06%	0.05%	0.06%
TAURUS	0.64%	0.39%	0.36%	0.14%
TDC DISTRIBUIDORA	0.01%	0.09%	0.09%	0.12%
TEMAPE	0.04%	0.07%	0.08%	0.07%
TOBRAS	0.00%	0.00%	0.01%	0.00%
TORRAO	0.02%	0.04%	0.03%	0.04%
TOTALENERGIES	0.17%	0.14%	0.17%	0.10%
UNI	0.00%	0.01%	0.02%	0.02%
VIBRA ENERGIA	20.73%	22.61%	20.71%	23.57%
WALENDOWSKY	0.04%	0.02%	0.02%	0.02%
WATT	0.07%	0.04%	0.03%	0.02%

Boxplots:

#-------
# Tabelas com preços médios e desvio padrão 
# por bandeira no Brasil para os meses de 
# nov/21, mar/22 e jun/22, extratificadas pelos 
# produtos D S10, D S500, G comum e G aditivada 
#-------
boxplot(`Valor de Venda`~Bandeira,data=ftB11BP, 
        main="Boxplot de preços de D.S10 por bandeira - Nov/21",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~Bandeira,data=ftB12BP, 
        main="Boxplot de preços de D.S10 por bandeira - Mar/22",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~Bandeira,data=ftB13BP, 
        main="Boxplot de preços de D.S10 por bandeira - Jun/22",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~Bandeira,data=ftB21BP, 
        main="Boxplot de preços de D.S500 por bandeira - Nov/21",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~Bandeira,data=ftB22BP, 
        main="Boxplot de preços de D.S500 por bandeira - Mar/22",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~Bandeira,data=ftB23BP, 
        main="Boxplot de preços de D.S500 por bandeira - Jun/22",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~Bandeira,data=ftB31BP, 
        main="Boxplot de preços de G.comum por bandeira - Nov/21",
        ylim = c(5,10), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~Bandeira,data=ftB32BP, 
        main="Boxplot de preços de G.comum por bandeira - Mar/22",
        ylim = c(5,10), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~Bandeira,data=ftB33BP, 
        main="Boxplot de preços de G.comum por bandeira - Jun/22",
        ylim = c(5,10), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~Bandeira,data=ftB41BP, 
        main="Boxplot de preços de G.aditivada por bandeira - Nov/21",
        ylim = c(5,10), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~Bandeira,data=ftB42BP, 
        main="Boxplot de preços de G.aditivada por bandeira - Mar/22",
        ylim = c(5,10), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

boxplot(`Valor de Venda`~Bandeira,data=ftB43BP, 
        main="Boxplot de preços de G.aditivada por bandeira - Jun/22",
        ylim = c(5,10), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

Testes de hipóteses:

#---------  
# Testes de Hipóteses
# alpha:0,05
# Se pvalor for menor que 0,05 Rej H0
# Se pvalor for maior que 0,05 Não Rej H0
#-------
# Verificar se para cada período e combustível
# existe alguma bandeira que pratica preço diferenciado
# (maior ou menor)
#------------------------------------------------------
# Para D. S500 e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModB21 <- aov(`Valor de Venda`~Bandeira,data=ftB21BP)
ResB21 <- residuals(ModB21)
lillie.test(ResB21)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResB21
D = 0.068897, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB21BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 497.73, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB21 <- pairwise.wilcox.test(ftB21BP$`Valor de Venda`,
                               ftB21BP$Bandeira,
                               p.adjust.method="fdr")
ModB21


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftB21BP$`Valor de Venda` and ftB21BP$Bandeira 

              BRANCA  IPIRANGA OUTRAS  RAIZEN 
IPIRANGA      3.2e-09 -        -       -      
OUTRAS        < 2e-16 2.6e-12  -       -      
RAIZEN        7.7e-07 0.396    2.8e-15 -      
VIBRA ENERGIA < 2e-16 < 2e-16  0.038   < 2e-16

P value adjustment method: fdr

#------------------------------------------------------
# Para D. S500 e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModB22 <- aov(`Valor de Venda`~Bandeira,data=ftB22BP)
ResB22 <- residuals(ModB22)
lillie.test(ResB22)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResB22
D = 0.078789, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB22BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 66.321, df = 4, p-value = 1.356e-13

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB22 <- pairwise.wilcox.test(ftB22BP$`Valor de Venda`,
                               ftB22BP$Bandeira,
                               p.adjust.method="fdr")
ModB22


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftB22BP$`Valor de Venda` and ftB22BP$Bandeira 

              BRANCA  IPIRANGA OUTRAS  RAIZEN 
IPIRANGA      0.58610 -        -       -      
OUTRAS        5.9e-06 0.00021  -       -      
RAIZEN        0.03636 0.02508  6.4e-08 -      
VIBRA ENERGIA 1.2e-07 8.3e-05  0.58610 7.4e-10

P value adjustment method: fdr

#------------------------------------------------------
# Para D. S500 e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModB23 <- aov(`Valor de Venda`~Bandeira,data=ftB23BP)
ResB23 <- residuals(ModB23)
lillie.test(ResB23)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResB23
D = 0.066179, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB23BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 165.86, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB23 <- pairwise.wilcox.test(ftB23BP$`Valor de Venda`,
                               ftB23BP$Bandeira,
                               p.adjust.method="fdr")
ModB23


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftB23BP$`Valor de Venda` and ftB23BP$Bandeira 

              BRANCA  IPIRANGA OUTRAS  RAIZEN 
IPIRANGA      3.2e-09 -        -       -      
OUTRAS        < 2e-16 0.00073  -       -      
RAIZEN        0.08973 0.00041  5.2e-11 -      
VIBRA ENERGIA < 2e-16 0.00324  0.34902 3.7e-11

P value adjustment method: fdr

#------------------------------------------------------
#------------------------------------------------------
# Para G. aditivada e Nov/21
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModB41 <- aov(`Valor de Venda`~Bandeira,data=ftB41BP)
ResB41 <- residuals(ModB41)
lillie.test(ResB41)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResB41
D = 0.064691, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB41BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 857.96, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB41 <- pairwise.wilcox.test(ftB41BP$`Valor de Venda`,
                               ftB41BP$Bandeira,
                               p.adjust.method="fdr")
ModB41


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftB41BP$`Valor de Venda` and ftB41BP$Bandeira 

              BRANCA  IPIRANGA OUTRAS  RAIZEN
IPIRANGA      < 2e-16 -        -       -     
OUTRAS        < 2e-16 2e-04    -       -     
RAIZEN        < 2e-16 1.8e-05  2.9e-13 -     
VIBRA ENERGIA < 2e-16 5.8e-12  < 2e-16 2e-02 

P value adjustment method: fdr

#------------------------------------------------------
# Para G. aditivada e Mar/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModB42 <- aov(`Valor de Venda`~Bandeira,data=ftB42BP)
ResB42 <- residuals(ModB42)
lillie.test(ResB42)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResB42
D = 0.033396, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB42BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 511.86, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB42 <- pairwise.wilcox.test(ftB42BP$`Valor de Venda`,
                               ftB42BP$Bandeira,
                               p.adjust.method="fdr")
ModB42


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftB42BP$`Valor de Venda` and ftB42BP$Bandeira 

              BRANCA  IPIRANGA OUTRAS  RAIZEN 
IPIRANGA      < 2e-16 -        -       -      
OUTRAS        < 2e-16 0.01018  -       -      
RAIZEN        < 2e-16 8.9e-05  0.40497 -      
VIBRA ENERGIA < 2e-16 1.6e-15  8.9e-05 0.00057

P value adjustment method: fdr

#------------------------------------------------------
# Para G. aditivada e Jun/22
# Pressuposto 1
# H0: dados seguem distribuição  normal
# H1: dados não seguem distribuição normal
ModB43 <- aov(`Valor de Venda`~Bandeira,data=ftB43BP)
ResB43 <- residuals(ModB43)
lillie.test(ResB43)


    Lilliefors (Kolmogorov-Smirnov) normality test

data:  ResB43
D = 0.045707, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> os residuos não têm distribuição normal
# Então, o aov deve ser abandonado e partir para o teste de Kruskal-Wallis 
# H0: Todas as regiões têm a mesma distribuição de preços
# H1: Existe ao menos uma região com distribuição de preços diferente 
#     (valor maior ou menor que as outras)
kruskal.test(`Valor de Venda`~Bandeira,data=ftB43BP)


    Kruskal-Wallis rank sum test

data:  Valor de Venda by Bandeira
Kruskal-Wallis chi-squared = 548.1, df = 4, p-value < 2.2e-16

# O p-value < 2.2e-16 --> Rej H0 --> Wilcoxon múltiplo
ModB43 <- pairwise.wilcox.test(ftB43BP$`Valor de Venda`,
                               ftB43BP$Bandeira,
                               p.adjust.method="fdr")
ModB43


    Pairwise comparisons using Wilcoxon rank sum test with continuity correction 

data:  ftB43BP$`Valor de Venda` and ftB43BP$Bandeira 

              BRANCA  IPIRANGA OUTRAS  RAIZEN 
IPIRANGA      < 2e-16 -        -       -      
OUTRAS        < 2e-16 0.00013  -       -      
RAIZEN        < 2e-16 5.2e-13  0.00548 -      
VIBRA ENERGIA < 2e-16 < 2e-16  6.2e-11 0.00067

P value adjustment method: fdr

#------------------------------------------------------
#------------------------------------------------------

Resultados referentes às análises dos preços por estados. Tabelas:

#-------
# Tabela com preços médios e desvio padrão 
# por estado para os meses de 
# nov/21, mar/22 e jun/22, extratificadas pelos 
# produtos D S10, D S500, G comum e G aditivada 
#-------
ftE1 <- ftE11 %>% 
  left_join(ftE12, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
  left_join(ftE13, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
  flextable()

ftE1 <- delete_part(ftE1, part = "header")
ftE1 <- add_header(x=ftE1, Estado...Sigla = "Estado",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftE1 <- add_header(x=ftE1,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftE1 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios do DIESEL S10 por ESTADO")

Preços médios do DIESEL S10 por ESTADO
	Novembro/2021	Março/2022	Junho/2022
AC	6.2445	0.2619	7.1195	0.5599	8.1442	0.4384
AL	5.6766	0.2059	6.7044	0.5955	7.5265	0.4861
AM	5.5266	0.3011	6.5130	0.5621	7.4607	0.5390
AP	5.5725	0.3164	6.2785	0.4563	7.3349	0.4192
BA	5.5597	0.1620	6.7885	0.4872	7.8434	0.4903
CE	5.7415	0.1580	6.5928	0.5787	7.6167	0.4274
DF	5.6777	0.1604	6.4278	0.6215	7.3227	0.3877
ES	5.2339	0.1565	6.0525	0.4736	7.0890	0.4428
GO	5.6878	0.1942	6.5703	0.6011	7.3362	0.3915
MA	5.4165	0.1094	6.5953	0.5559	7.4056	0.4092
MG	5.4670	0.1513	6.3785	0.5313	7.3407	0.3989
MS	5.3746	0.1809	6.2901	0.5266	7.2130	0.3787
MT	5.8196	0.1878	6.6421	0.4903	7.5864	0.4464
PA	5.7232	0.2109	6.7216	0.5766	7.6264	0.4997
PB	5.5230	0.1239	6.4729	0.5070	7.4160	0.3747
PE	5.3956	0.1192	6.1990	0.5363	7.1712	0.3727
PI	5.6308	0.1619	6.6405	0.5637	7.5791	0.3365
PR	5.2214	0.1712	6.2729	0.5541	7.2038	0.4133
RJ	5.3597	0.1775	6.2971	0.4971	7.2453	0.4072
RN	5.8931	0.1645	6.6089	0.5030	7.6721	0.3952
RO	5.6701	0.2107	6.5223	0.4660	7.6135	0.4243
RR	5.6741	0.0785	6.4752	0.4601	7.5772	0.3430
RS	5.3497	0.2208	6.2133	0.4948	7.1032	0.4512
SC	5.3024	0.1706	6.1887	0.5533	7.2017	0.4179
SE	5.6666	0.1869	6.4578	0.5372	7.1454	0.4266
SP	5.3943	0.1896	6.2748	0.4993	7.2093	0.4221
TO	5.4788	0.1722	6.4978	0.6004	7.2350	0.3776

ftE2 <- ftE21 %>% 
  left_join(ftE22, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
  left_join(ftE23, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
  flextable()

ftE2 <- delete_part(ftE2, part = "header")
ftE2 <- add_header(x=ftE2, Estado...Sigla = "Estado",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftE2 <- add_header(x=ftE2,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftE2 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios do DIESEL S500 por ESTADO")

Preços médios do DIESEL S500 por ESTADO
	Novembro/2021	Março/2022	Junho/2022
AC	6.2302	0.2706	7.0672	0.5520	8.1192	0.4404
AL	5.6946	0.2417	6.7111	0.6295	7.5215	0.5057
AM	5.4836	0.2557	6.4396	0.5481	7.3457	0.5236
AP	5.3957	0.1482	6.0086	0.3925	7.0747	0.3945
BA	5.4882	0.1376	6.6360	0.4720	7.7790	0.4807
CE	5.7586	0.1822	6.6953	0.5923	7.5660	0.3425
DF	5.5448	0.1425	6.3500	0.6376	7.1829	0.4113
ES	5.1234	0.1637	5.9191	0.4515	6.9708	0.4215
GO	5.5235	0.1677	6.4424	0.5542	7.1746	0.4156
MA	5.4085	0.1252	6.5676	0.5684	7.3484	0.4216
MG	5.3964	0.1525	6.2774	0.5105	7.2201	0.4067
MS	5.2718	0.1579	6.1702	0.5111	7.0948	0.3739
MT	5.7565	0.2247	6.5205	0.5022	7.4542	0.4370
PA	5.7033	0.2129	6.7033	0.5874	7.6360	0.4803
PB	5.3692	0.0885	6.3711	0.5274	7.2388	0.4184
PE	5.3559	0.2629	6.1714	0.5359	7.3516	0.4078
PI	5.5798	0.1592	6.5624	0.5700	7.4825	0.3594
PR	5.1396	0.1626	6.1892	0.5278	7.0229	0.4054
RJ	5.2789	0.1738	6.2021	0.4925	7.1066	0.4201
RN	5.6616	0.2111	6.3848	0.5177	7.3544	0.3975
RO	5.6280	0.1929	6.4766	0.4652	7.5881	0.4121
RR	5.6188	0.1200	6.4292	0.4373	7.5248	0.3651
RS	5.2768	0.2175	6.1326	0.4752	7.0181	0.4511
SC	5.2534	0.1741	6.0832	0.5097	7.1026	0.4038
SE	5.5539	0.1799	6.4167	0.4572	7.2458	0.4729
SP	5.2855	0.1778	6.1585	0.4776	7.0753	0.4200
TO	5.4608	0.1907	6.4576	0.6131	7.1614	0.3625

ftE3 <- ftE31 %>% 
  left_join(ftE32, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
  left_join(ftE33, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
  flextable()

ftE3 <- delete_part(ftE3, part = "header")
ftE3 <- add_header(x=ftE3, Estado...Sigla = "Estado",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftE3 <- add_header(x=ftE3,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftE3 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios da GASOLINA COMUM por ESTADO")

Preços médios da GASOLINA COMUM por ESTADO
	Novembro/2021	Março/2022	Junho/2022
AC	7.1221	0.2591	7.3658	0.3242	7.6791	0.2078
AL	6.7157	0.2861	7.1811	0.4350	7.4406	0.3339
AM	6.7373	0.2493	7.2778	0.4344	7.4643	0.3581
AP	5.9314	0.1124	6.1093	0.2735	6.4387	0.2568
BA	6.7886	0.1800	7.4255	0.4059	7.9744	0.2597
CE	6.9599	0.1173	7.2111	0.5131	7.5680	0.3578
DF	7.1018	0.1970	7.1347	0.3835	7.4778	0.2728
ES	6.7666	0.1455	7.1098	0.3240	7.3649	0.2213
GO	7.1877	0.1921	7.2325	0.3505	7.4350	0.3103
MA	6.5138	0.1033	7.0756	0.4195	7.2526	0.3446
MG	7.0882	0.1926	7.3097	0.3779	7.5371	0.2326
MS	6.5910	0.1683	6.9340	0.4362	7.1681	0.3778
MT	6.7626	0.1650	6.7663	0.3976	7.0146	0.3156
PA	6.8493	0.2442	7.3098	0.3937	7.5133	0.3753
PB	6.5284	0.1079	6.9329	0.3389	7.1838	0.2105
PE	6.6836	0.2118	7.0009	0.4443	7.4133	0.2971
PI	7.1411	0.1278	7.6443	0.4936	7.9016	0.1871
PR	6.5537	0.2244	6.9264	0.3837	7.1611	0.2940
RJ	7.2967	0.2272	7.5766	0.4103	7.7811	0.2828
RN	7.1278	0.1359	7.4771	0.4503	7.5827	0.2394
RO	6.7731	0.2169	7.2032	0.3838	7.4043	0.2849
RR	6.3837	0.0626	6.8182	0.3257	7.0656	0.0948
RS	7.0901	0.2219	6.7828	0.4144	6.9486	0.3366
SC	6.5815	0.1629	6.8399	0.3636	7.0870	0.2924
SE	6.7329	0.1925	7.0210	0.4378	7.2799	0.1259
SP	6.4133	0.2195	6.6634	0.3746	6.8462	0.3224
TO	6.9742	0.1269	7.2986	0.3269	7.4836	0.1652

ftE4 <- ftE41 %>% 
  left_join(ftE42, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
  left_join(ftE43, by = c("Estado...Sigla" = "Estado...Sigla")) %>%
  flextable()

ftE4 <- delete_part(ftE4, part = "header")
ftE4 <- add_header(x=ftE4, Estado...Sigla = "Estado",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftE4 <- add_header(x=ftE4,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftE4 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios da GASOLINA ADITIVADA por ESTADO")

Preços médios da GASOLINA ADITIVADA por ESTADO
	Novembro/2021	Março/2022	Junho/2022
AC	7.1209	0.1761	7.4029	0.3008	7.7185	0.1583
AL	6.7982	0.2673	7.2772	0.4034	7.5424	0.3188
AM	6.6872	0.1341	7.2205	0.3906	7.4540	0.2929
AP	6.3200	0.1085	6.4764	0.2242	6.8094	0.2395
BA	6.8872	0.2307	7.5045	0.4219	8.0545	0.2754
CE	7.0890	0.1564	7.3646	0.5124	7.7241	0.3691
DF	7.2170	0.2211	7.2360	0.3782	7.5612	0.2818
ES	6.8894	0.1470	7.2258	0.3503	7.4850	0.2309
GO	7.2957	0.1944	7.3422	0.3526	7.5484	0.3021
MA	6.6525	0.1755	7.2010	0.4253	7.3556	0.3253
MG	7.2054	0.1870	7.4531	0.3803	7.6814	0.2396
MS	6.7168	0.1579	7.0518	0.4149	7.2765	0.3578
MT	6.8709	0.1802	6.9003	0.3980	7.1538	0.3196
PA	6.9759	0.2232	7.4087	0.3652	7.6511	0.3426
PB	6.6583	0.1173	7.0648	0.3217	7.3234	0.1973
PE	6.8233	0.2395	7.1848	0.4321	7.5401	0.2869
PI	7.3454	0.1912	7.8005	0.5202	8.0781	0.2508
PR	6.6955	0.2273	7.0648	0.4156	7.3036	0.3202
RJ	7.4174	0.2505	7.7076	0.4094	7.9107	0.2919
RN	7.1991	0.1589	7.5684	0.4445	7.6361	0.2484
RO	6.8743	0.2378	7.3121	0.3680	7.5443	0.2660
RR	6.5113	0.0900	6.9502	0.3355	7.2068	0.1033
RS	7.2129	0.2372	6.9161	0.4270	7.0831	0.3564
SC	6.6746	0.1668	6.9426	0.3674	7.1797	0.2977
SE	6.8526	0.2036	7.1096	0.4347	7.3542	0.1625
SP	6.5965	0.2794	6.8600	0.4199	7.0570	0.3585
TO	7.0601	0.1438	7.4230	0.3170	7.5621	0.1999

Resultados referentes às análises dos preços para municípios. Testes de hipótese:

#===========
# Testes de hipóteses de correlação utilizando-se os dados
# para os Municípios
#===========
shapiro.test(ftIPCA$acum_N_M)


    Shapiro-Wilk normality test

data:  ftIPCA$acum_N_M
W = 0.91027, p-value = 0.1175

shapiro.test(ftIPCA$acum_A_J)


    Shapiro-Wilk normality test

data:  ftIPCA$acum_A_J
W = 0.95756, p-value = 0.6178

shapiro.test(ftIPCA$varD_N_M)


    Shapiro-Wilk normality test

data:  ftIPCA$varD_N_M
W = 0.89615, p-value = 0.06976

shapiro.test(ftIPCA$varD_M_J)


    Shapiro-Wilk normality test

data:  ftIPCA$varD_M_J
W = 0.96383, p-value = 0.7315

shapiro.test(ftIPCA$varG_N_M)


    Shapiro-Wilk normality test

data:  ftIPCA$varG_N_M
W = 0.89224, p-value = 0.06045

shapiro.test(ftIPCA$varG_M_J)


    Shapiro-Wilk normality test

data:  ftIPCA$varG_M_J
W = 0.9554, p-value = 0.5798

shapiro.test(ftIPCA$mar_22)  # menor que alpha... usar spearman


    Shapiro-Wilk normality test

data:  ftIPCA$mar_22
W = 0.81866, p-value = 0.004872

cor.test(ftIPCA$acum_N_M, ftIPCA$varD_N_M, method = "pearson")


    Pearson's product-moment correlation

data:  ftIPCA$acum_N_M and ftIPCA$varD_N_M
t = 1.6976, df = 14, p-value = 0.1117
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.1037981  0.7543699
sample estimates:
     cor 
0.413166

#não estão correlacionados
cor.test(ftIPCA$acum_N_M, ftIPCA$varG_N_M, method = "pearson")


    Pearson's product-moment correlation

data:  ftIPCA$acum_N_M and ftIPCA$varG_N_M
t = 3.0031, df = 14, p-value = 0.009493
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.1888196 0.8560327
sample estimates:
      cor 
0.6259379

#estão correlacionados
cor.test(ftIPCA$acum_A_J, ftIPCA$varD_M_J, method = "pearson")


    Pearson's product-moment correlation

data:  ftIPCA$acum_A_J and ftIPCA$varD_M_J
t = -0.15654, df = 14, p-value = 0.8778
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.5265951  0.4635083
sample estimates:
        cor 
-0.04180144

#não estão correlacionados
cor.test(ftIPCA$acum_A_J, ftIPCA$varG_M_J, method = "pearson")


    Pearson's product-moment correlation

data:  ftIPCA$acum_A_J and ftIPCA$varG_M_J
t = 4.0053, df = 14, p-value = 0.001302
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.3685390 0.9003233
sample estimates:
      cor 
0.7307466

#estão correlacionados
cor.test(ftIPCA$mar_22, ftIPCA$varD_N_M, method = "spearman")


    Spearman's rank correlation rho

data:  ftIPCA$mar_22 and ftIPCA$varD_N_M
S = 289.71, p-value = 0.02008
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
0.5739516

#estão correlacionados
cor.test(ftIPCA$mar_22, ftIPCA$varG_N_M, method = "spearman")


    Spearman's rank correlation rho

data:  ftIPCA$mar_22 and ftIPCA$varG_N_M
S = 667.99, p-value = 0.9482
alternative hypothesis: true rho is not equal to 0
sample estimates:
       rho 
0.01766005

#não estão correlacionados

Preços nas regiões brasileiras por bandeiras

Foi verificada a quantidade de estabelecimentos de determinada banderia, na BD, estratificada por regiões e para cada produto analisado, elaborando-se uma tabela em números absoluto e outra em números relativo. Essas tabelas são apresentadas a seguir e foram consideradas para decidir quais as banderias deveriam ser escolhidas para os cálculos dos preços médios e desvios padrões de cada região. O critério de decisão para tal escolha se refere ao precentual de aparição na BD, sendo descartadas as bandeiras que apresentaram baixos percentuais (abaixo de 5%).

#-------
# Tabela em num abs
#-------
# Tabelas indicando quantidades de estabelecimentos de
# determinada bandeira por regiões para os produtos
# D S10, D S500, G comum e G aditivada 
#-------

DB_Comb %>% filter(Produto == 'DIESEL S10') %>%
  tabyl(Bandeira,`Regiao - Sigla`) %>% 
  flextable() %>% theme_zebra() %>%
  set_caption(caption = "Frequência de cada BANDEIRA por região de DIESEL S10 na BD")

Frequência de cada BANDEIRA por região de DIESEL S10 na BD
Bandeira	CO	N	NE	S	SE
ALESAT	101	47	401	117	587
AMERICANOIL	0	0	0	39	0
ATEMS	0	274	0	0	0
ATLÂNTICA	0	0	0	0	59
BRANCA	2,016	848	4,626	2,741	9,645
CHARRUA	0	0	0	93	0
CIAPETRO	9	0	0	92	24
DIBRAPE	0	0	0	39	0
DISLUB	0	0	110	0	0
EQUADOR	0	230	0	0	0
ESTRADA	0	0	0	1	0
FAN	0	0	38	0	0
FEDERAL ENERGIA	0	0	28	0	0
IDAZA	83	0	0	33	0
IPIRANGA	743	703	1,042	2,575	4,688
LARCO	2	0	28	0	0
MASUT DISTRIBUIDORA	30	0	0	0	0
MAXSUL	0	0	0	89	0
MONTEPETRO	0	0	0	0	24
PELIKANO	0	0	0	9	0
PETROBAHIA	0	0	38	0	0
PETROSERRA	0	0	17	0	0
PETROX DISTRIBUIDORA	0	0	109	0	0
PODIUM	0	0	0	0	1
POTENCIAL	0	0	0	50	0
RAIZEN	686	100	1,926	1,331	5,029
RAIZEN MIME	0	0	0	271	0
REJAILE	0	0	0	11	0
RIO BRANCO	3	0	0	0	73
RODOIL	0	0	0	310	0
ROYAL FIC	10	0	0	0	0
RUFF C.J.	0	0	0	0	11
RZD DISTRIBUIDORA	0	16	0	0	0
SABBÁ	0	505	316	0	0
SETTA DISTRIBUIDORA	0	0	66	0	0
SIMARELLI	59	10	0	0	0
SMALL	16	0	0	0	4
SP	0	2	271	0	0
STANG	0	0	0	132	0
SUL COMBUSTÍVEIS	0	0	0	32	0
TAURUS	203	0	0	0	18
TDC DISTRIBUIDORA	0	0	51	0	0
TEMAPE	0	0	41	0	0
TOBRAS	0	0	0	0	2
TORRAO	0	0	0	0	20
TOTALENERGIES	11	0	0	0	69
UNI	0	0	0	7	0
VIBRA ENERGIA	1,195	1,017	3,348	1,836	5,481
WALENDOWSKY	0	0	0	12	0
WATT	22	0	0	0	0

DB_Comb %>% filter(Produto == 'DIESEL') %>%
  tabyl(Bandeira,`Regiao - Sigla`) %>% 
  flextable() %>% theme_zebra() %>%
  set_caption(caption = "Frequência de cada BANDEIRA por região de DIESEL S500 na BD")

Frequência de cada BANDEIRA por região de DIESEL S500 na BD
Bandeira	CO	N	NE	S	SE
ALESAT	74	25	153	64	408
AMERICANOIL	0	0	0	39	0
ATEMS	0	234	0	0	0
ATLÂNTICA	0	0	0	0	35
BRANCA	1,518	698	2,059	1,893	6,061
CHARRUA	0	0	0	73	0
CIAPETRO	10	0	0	76	10
DIBRAPE	0	0	0	28	0
DISLUB	0	0	24	0	0
EQUADOR	0	208	0	0	0
ESTRADA	0	0	0	1	0
FAN	0	0	24	0	0
FEDERAL ENERGIA	12	0	11	0	0
IDAZA	68	0	0	18	0
IPIRANGA	391	452	384	1,503	2,105
LARCO	2	0	23	0	0
MASUT DISTRIBUIDORA	27	0	0	0	0
MAXSUL	0	0	0	18	0
MONTEPETRO	0	0	0	0	24
PELIKANO	0	0	0	9	0
PETROBAHIA	0	0	19	0	0
PETROSERRA	0	0	25	0	0
PETROX DISTRIBUIDORA	0	0	31	0	0
POTENCIAL	0	0	0	41	0
RAIZEN	470	44	543	863	2,494
RAIZEN MIME	0	0	0	84	0
REJAILE	0	0	0	4	0
RIO BRANCO	8	0	0	0	49
RODOIL	0	0	0	185	0
ROYAL FIC	18	0	0	0	0
SABBÁ	0	375	120	0	0
SETTA DISTRIBUIDORA	0	0	15	0	0
SIMARELLI	28	10	0	0	0
SMALL	15	0	0	0	4
SP	0	0	72	0	0
STANG	0	0	0	102	0
SUL COMBUSTÍVEIS	0	0	0	30	0
TAURUS	184	0	0	0	16
TDC DISTRIBUIDORA	0	0	2	0	0
TEMAPE	0	0	13	0	0
TORRAO	0	0	0	0	6
TOTALENERGIES	24	0	0	0	28
VIBRA ENERGIA	717	815	1,114	1,105	2,715
WALENDOWSKY	0	0	0	12	0
WATT	22	0	0	0	0

DB_Comb %>% filter(Produto == 'GASOLINA') %>%
  tabyl(Bandeira,`Regiao - Sigla`) %>% 
  flextable() %>% theme_zebra() %>%
  set_caption(caption = "Frequência de cada BANDEIRA por região de GASOLINA COMUM na BD")

Frequência de cada BANDEIRA por região de GASOLINA COMUM na BD
Bandeira	CO	N	NE	S	SE
ALESAT	146	50	458	148	812
AMERICANOIL	0	0	0	34	0
ATEMS	0	335	0	0	0
ATLÂNTICA	0	0	0	0	65
BRANCA	2,577	1,247	5,179	3,566	13,855
CHARRUA	0	0	0	119	0
CIAPETRO	10	0	0	90	29
DIBRAPE	0	0	0	42	0
DISLUB	0	0	125	0	0
EQUADOR	0	267	0	0	0
ESTRADA	0	0	0	1	0
FAN	0	0	46	0	0
FEDERAL ENERGIA	12	0	29	0	0
IDAZA	83	0	0	36	0
IPIRANGA	849	741	1,117	2,872	5,661
LARCO	2	0	28	0	0
MASUT DISTRIBUIDORA	33	0	0	0	0
MAXSUL	0	0	0	84	0
MONTEPETRO	0	0	0	0	24
PELIKANO	0	0	0	9	0
PETROBAHIA	0	0	41	0	0
PETROSERRA	0	0	31	0	0
PETROX DISTRIBUIDORA	0	0	111	0	0
PODIUM	0	0	0	0	1
POTENCIAL	0	0	0	64	0
RAIZEN	824	107	2,026	1,495	6,192
RAIZEN MIME	0	0	0	373	0
REJAILE	0	0	0	11	0
RIO BRANCO	9	0	0	0	80
RODOIL	0	0	0	387	0
ROYAL FIC	18	0	0	0	0
RUFF C.J.	0	0	0	0	11
RZD DISTRIBUIDORA	0	16	0	0	0
SABBÁ	0	586	318	0	0
SETTA DISTRIBUIDORA	0	0	65	0	0
SIMARELLI	61	4	0	0	0
SMALL	27	0	0	0	4
SP	0	5	296	0	0
STANG	0	0	0	141	0
SUL COMBUSTÍVEIS	0	0	0	33	0
TAURUS	214	0	0	0	31
TDC DISTRIBUIDORA	0	0	64	0	0
TEMAPE	0	0	55	0	0
TOBRAS	0	0	0	0	4
TORRAO	0	0	0	0	22
TOTALENERGIES	26	0	0	0	90
UNI	0	0	0	11	0
VIBRA ENERGIA	1,341	1,128	3,490	2,071	6,252
WALENDOWSKY	0	0	0	12	0
WATT	22	0	0	0	0

DB_Comb %>% filter(Produto == 'GASOLINA ADITIVADA') %>%
  tabyl(Bandeira,`Regiao - Sigla`) %>% 
  flextable() %>% theme_zebra() %>%
  set_caption(caption = "Frequência de cada BANDEIRA por região de GASOLINA ADITIVADA na BD")

Frequência de cada BANDEIRA por região de GASOLINA ADITIVADA na BD
Bandeira	CO	N	NE	S	SE
ALESAT	43	23	257	144	536
AMERICANOIL	0	0	0	43	0
ATEMS	0	266	0	0	0
ATLÂNTICA	0	0	0	0	50
BRANCA	1,203	454	3,782	2,901	7,681
CHARRUA	0	0	0	116	0
CIAPETRO	0	0	0	71	11
DIBRAPE	0	0	0	37	0
DISLUB	0	0	103	0	0
EQUADOR	0	221	0	0	0
ESTRADA	0	0	0	1	0
FAN	0	0	15	0	0
FEDERAL ENERGIA	0	0	18	0	0
IDAZA	59	0	0	37	0
IPIRANGA	576	580	912	2,710	4,813
LARCO	0	0	28	0	0
MASUT DISTRIBUIDORA	24	0	0	0	0
MAXSUL	0	0	0	88	0
MONTEPETRO	0	0	0	0	24
PELIKANO	0	0	0	9	0
PETROBAHIA	0	0	32	0	0
PETROSERRA	0	0	17	0	0
PETROX DISTRIBUIDORA	0	0	96	0	0
PODIUM	0	0	0	0	1
POTENCIAL	0	0	0	60	0
RAIZEN	642	96	1,788	1,362	5,361
RAIZEN MIME	0	0	0	307	0
REJAILE	0	0	0	11	0
RIO BRANCO	0	0	0	0	59
RODOIL	0	0	0	369	0
ROYAL FIC	18	0	0	0	0
RZD DISTRIBUIDORA	0	16	0	0	0
SABBÁ	0	476	266	0	0
SETTA DISTRIBUIDORA	0	0	36	0	0
SIMARELLI	37	6	0	0	0
SMALL	27	0	0	0	0
SP	0	6	180	0	0
STANG	0	0	0	135	0
SUL COMBUSTÍVEIS	0	0	0	31	0
TAURUS	69	0	0	0	3
TDC DISTRIBUIDORA	0	0	60	0	0
TEMAPE	0	0	38	0	0
TOBRAS	0	0	0	0	2
TORRAO	0	0	0	0	19
TOTALENERGIES	18	0	0	0	32
UNI	0	0	0	11	0
VIBRA ENERGIA	1,008	785	3,139	1,962	5,304
WALENDOWSKY	0	0	0	12	0
WATT	10	0	0	0	0

# Tabela em num relativos - por coluna
#-------
# Tabelas indicando percentuais de estabelecimentos de
# determinada bandeira por regiões para os produtos
# D S10, D S500, G comum e G aditivada 
#-------
DB_Comb %>% filter(Produto == 'DIESEL S10') %>%
  tabyl(Bandeira,`Regiao - Sigla`)  %>%
  adorn_percentages("col") %>%
  adorn_pct_formatting(digits = 2) %>%
  flextable() %>% theme_zebra() %>%
  set_caption(caption = "Frequência relativa de cada BANDEIRA por região de DIESEL S10 na BD")

Frequência relativa de cada BANDEIRA por região de DIESEL S10 na BD
Bandeira	CO	N	NE	S	SE
ALESAT	1.95%	1.25%	3.22%	1.19%	2.28%
AMERICANOIL	0.00%	0.00%	0.00%	0.40%	0.00%
ATEMS	0.00%	7.30%	0.00%	0.00%	0.00%
ATLÂNTICA	0.00%	0.00%	0.00%	0.00%	0.23%
BRANCA	38.85%	22.60%	37.14%	27.91%	37.48%
CHARRUA	0.00%	0.00%	0.00%	0.95%	0.00%
CIAPETRO	0.17%	0.00%	0.00%	0.94%	0.09%
DIBRAPE	0.00%	0.00%	0.00%	0.40%	0.00%
DISLUB	0.00%	0.00%	0.88%	0.00%	0.00%
EQUADOR	0.00%	6.13%	0.00%	0.00%	0.00%
ESTRADA	0.00%	0.00%	0.00%	0.01%	0.00%
FAN	0.00%	0.00%	0.31%	0.00%	0.00%
FEDERAL ENERGIA	0.00%	0.00%	0.22%	0.00%	0.00%
IDAZA	1.60%	0.00%	0.00%	0.34%	0.00%
IPIRANGA	14.32%	18.74%	8.37%	26.22%	18.22%
LARCO	0.04%	0.00%	0.22%	0.00%	0.00%
MASUT DISTRIBUIDORA	0.58%	0.00%	0.00%	0.00%	0.00%
MAXSUL	0.00%	0.00%	0.00%	0.91%	0.00%
MONTEPETRO	0.00%	0.00%	0.00%	0.00%	0.09%
PELIKANO	0.00%	0.00%	0.00%	0.09%	0.00%
PETROBAHIA	0.00%	0.00%	0.31%	0.00%	0.00%
PETROSERRA	0.00%	0.00%	0.14%	0.00%	0.00%
PETROX DISTRIBUIDORA	0.00%	0.00%	0.88%	0.00%	0.00%
PODIUM	0.00%	0.00%	0.00%	0.00%	0.00%
POTENCIAL	0.00%	0.00%	0.00%	0.51%	0.00%
RAIZEN	13.22%	2.67%	15.46%	13.55%	19.54%
RAIZEN MIME	0.00%	0.00%	0.00%	2.76%	0.00%
REJAILE	0.00%	0.00%	0.00%	0.11%	0.00%
RIO BRANCO	0.06%	0.00%	0.00%	0.00%	0.28%
RODOIL	0.00%	0.00%	0.00%	3.16%	0.00%
ROYAL FIC	0.19%	0.00%	0.00%	0.00%	0.00%
RUFF C.J.	0.00%	0.00%	0.00%	0.00%	0.04%
RZD DISTRIBUIDORA	0.00%	0.43%	0.00%	0.00%	0.00%
SABBÁ	0.00%	13.46%	2.54%	0.00%	0.00%
SETTA DISTRIBUIDORA	0.00%	0.00%	0.53%	0.00%	0.00%
SIMARELLI	1.14%	0.27%	0.00%	0.00%	0.00%
SMALL	0.31%	0.00%	0.00%	0.00%	0.02%
SP	0.00%	0.05%	2.18%	0.00%	0.00%
STANG	0.00%	0.00%	0.00%	1.34%	0.00%
SUL COMBUSTÍVEIS	0.00%	0.00%	0.00%	0.33%	0.00%
TAURUS	3.91%	0.00%	0.00%	0.00%	0.07%
TDC DISTRIBUIDORA	0.00%	0.00%	0.41%	0.00%	0.00%
TEMAPE	0.00%	0.00%	0.33%	0.00%	0.00%
TOBRAS	0.00%	0.00%	0.00%	0.00%	0.01%
TORRAO	0.00%	0.00%	0.00%	0.00%	0.08%
TOTALENERGIES	0.21%	0.00%	0.00%	0.00%	0.27%
UNI	0.00%	0.00%	0.00%	0.07%	0.00%
VIBRA ENERGIA	23.03%	27.11%	26.88%	18.70%	21.30%
WALENDOWSKY	0.00%	0.00%	0.00%	0.12%	0.00%
WATT	0.42%	0.00%	0.00%	0.00%	0.00%

DB_Comb %>% filter(Produto == 'DIESEL') %>%
  tabyl(Bandeira,`Regiao - Sigla`)  %>%
  adorn_percentages("col") %>%
  adorn_pct_formatting(digits = 2) %>%
  flextable() %>% theme_zebra() %>%
  set_caption(caption = "Frequência relativa de cada BANDEIRA por região de DIESEL S500 na BD")

Frequência relativa de cada BANDEIRA por região de DIESEL S500 na BD
Bandeira	CO	N	NE	S	SE
ALESAT	2.06%	0.87%	3.30%	1.04%	2.92%
AMERICANOIL	0.00%	0.00%	0.00%	0.63%	0.00%
ATEMS	0.00%	8.18%	0.00%	0.00%	0.00%
ATLÂNTICA	0.00%	0.00%	0.00%	0.00%	0.25%
BRANCA	42.31%	24.40%	44.45%	30.79%	43.43%
CHARRUA	0.00%	0.00%	0.00%	1.19%	0.00%
CIAPETRO	0.28%	0.00%	0.00%	1.24%	0.07%
DIBRAPE	0.00%	0.00%	0.00%	0.46%	0.00%
DISLUB	0.00%	0.00%	0.52%	0.00%	0.00%
EQUADOR	0.00%	7.27%	0.00%	0.00%	0.00%
ESTRADA	0.00%	0.00%	0.00%	0.02%	0.00%
FAN	0.00%	0.00%	0.52%	0.00%	0.00%
FEDERAL ENERGIA	0.33%	0.00%	0.24%	0.00%	0.00%
IDAZA	1.90%	0.00%	0.00%	0.29%	0.00%
IPIRANGA	10.90%	15.80%	8.29%	24.45%	15.08%
LARCO	0.06%	0.00%	0.50%	0.00%	0.00%
MASUT DISTRIBUIDORA	0.75%	0.00%	0.00%	0.00%	0.00%
MAXSUL	0.00%	0.00%	0.00%	0.29%	0.00%
MONTEPETRO	0.00%	0.00%	0.00%	0.00%	0.17%
PELIKANO	0.00%	0.00%	0.00%	0.15%	0.00%
PETROBAHIA	0.00%	0.00%	0.41%	0.00%	0.00%
PETROSERRA	0.00%	0.00%	0.54%	0.00%	0.00%
PETROX DISTRIBUIDORA	0.00%	0.00%	0.67%	0.00%	0.00%
POTENCIAL	0.00%	0.00%	0.00%	0.67%	0.00%
RAIZEN	13.10%	1.54%	11.72%	14.04%	17.87%
RAIZEN MIME	0.00%	0.00%	0.00%	1.37%	0.00%
REJAILE	0.00%	0.00%	0.00%	0.07%	0.00%
RIO BRANCO	0.22%	0.00%	0.00%	0.00%	0.35%
RODOIL	0.00%	0.00%	0.00%	3.01%	0.00%
ROYAL FIC	0.50%	0.00%	0.00%	0.00%	0.00%
SABBÁ	0.00%	13.11%	2.59%	0.00%	0.00%
SETTA DISTRIBUIDORA	0.00%	0.00%	0.32%	0.00%	0.00%
SIMARELLI	0.78%	0.35%	0.00%	0.00%	0.00%
SMALL	0.42%	0.00%	0.00%	0.00%	0.03%
SP	0.00%	0.00%	1.55%	0.00%	0.00%
STANG	0.00%	0.00%	0.00%	1.66%	0.00%
SUL COMBUSTÍVEIS	0.00%	0.00%	0.00%	0.49%	0.00%
TAURUS	5.13%	0.00%	0.00%	0.00%	0.11%
TDC DISTRIBUIDORA	0.00%	0.00%	0.04%	0.00%	0.00%
TEMAPE	0.00%	0.00%	0.28%	0.00%	0.00%
TORRAO	0.00%	0.00%	0.00%	0.00%	0.04%
TOTALENERGIES	0.67%	0.00%	0.00%	0.00%	0.20%
VIBRA ENERGIA	19.98%	28.49%	24.05%	17.97%	19.46%
WALENDOWSKY	0.00%	0.00%	0.00%	0.20%	0.00%
WATT	0.61%	0.00%	0.00%	0.00%	0.00%

DB_Comb %>% filter(Produto == 'GASOLINA') %>%
  tabyl(Bandeira,`Regiao - Sigla`)  %>%
  adorn_percentages("col") %>%
  adorn_pct_formatting(digits = 2) %>%
  flextable() %>% theme_zebra() %>%
  set_caption(caption = "Frequência relativa de cada BANDEIRA por região de GASOLINA COMUM na BD")

Frequência relativa de cada BANDEIRA por região de GASOLINA COMUM na BD
Bandeira	CO	N	NE	S	SE
ALESAT	2.33%	1.11%	3.40%	1.28%	2.45%
AMERICANOIL	0.00%	0.00%	0.00%	0.29%	0.00%
ATEMS	0.00%	7.47%	0.00%	0.00%	0.00%
ATLÂNTICA	0.00%	0.00%	0.00%	0.00%	0.20%
BRANCA	41.21%	27.80%	38.42%	30.74%	41.82%
CHARRUA	0.00%	0.00%	0.00%	1.03%	0.00%
CIAPETRO	0.16%	0.00%	0.00%	0.78%	0.09%
DIBRAPE	0.00%	0.00%	0.00%	0.36%	0.00%
DISLUB	0.00%	0.00%	0.93%	0.00%	0.00%
EQUADOR	0.00%	5.95%	0.00%	0.00%	0.00%
ESTRADA	0.00%	0.00%	0.00%	0.01%	0.00%
FAN	0.00%	0.00%	0.34%	0.00%	0.00%
FEDERAL ENERGIA	0.19%	0.00%	0.22%	0.00%	0.00%
IDAZA	1.33%	0.00%	0.00%	0.31%	0.00%
IPIRANGA	13.58%	16.52%	8.29%	24.76%	17.09%
LARCO	0.03%	0.00%	0.21%	0.00%	0.00%
MASUT DISTRIBUIDORA	0.53%	0.00%	0.00%	0.00%	0.00%
MAXSUL	0.00%	0.00%	0.00%	0.72%	0.00%
MONTEPETRO	0.00%	0.00%	0.00%	0.00%	0.07%
PELIKANO	0.00%	0.00%	0.00%	0.08%	0.00%
PETROBAHIA	0.00%	0.00%	0.30%	0.00%	0.00%
PETROSERRA	0.00%	0.00%	0.23%	0.00%	0.00%
PETROX DISTRIBUIDORA	0.00%	0.00%	0.82%	0.00%	0.00%
PODIUM	0.00%	0.00%	0.00%	0.00%	0.00%
POTENCIAL	0.00%	0.00%	0.00%	0.55%	0.00%
RAIZEN	13.18%	2.39%	15.03%	12.89%	18.69%
RAIZEN MIME	0.00%	0.00%	0.00%	3.22%	0.00%
REJAILE	0.00%	0.00%	0.00%	0.09%	0.00%
RIO BRANCO	0.14%	0.00%	0.00%	0.00%	0.24%
RODOIL	0.00%	0.00%	0.00%	3.34%	0.00%
ROYAL FIC	0.29%	0.00%	0.00%	0.00%	0.00%
RUFF C.J.	0.00%	0.00%	0.00%	0.00%	0.03%
RZD DISTRIBUIDORA	0.00%	0.36%	0.00%	0.00%	0.00%
SABBÁ	0.00%	13.06%	2.36%	0.00%	0.00%
SETTA DISTRIBUIDORA	0.00%	0.00%	0.48%	0.00%	0.00%
SIMARELLI	0.98%	0.09%	0.00%	0.00%	0.00%
SMALL	0.43%	0.00%	0.00%	0.00%	0.01%
SP	0.00%	0.11%	2.20%	0.00%	0.00%
STANG	0.00%	0.00%	0.00%	1.22%	0.00%
SUL COMBUSTÍVEIS	0.00%	0.00%	0.00%	0.28%	0.00%
TAURUS	3.42%	0.00%	0.00%	0.00%	0.09%
TDC DISTRIBUIDORA	0.00%	0.00%	0.47%	0.00%	0.00%
TEMAPE	0.00%	0.00%	0.41%	0.00%	0.00%
TOBRAS	0.00%	0.00%	0.00%	0.00%	0.01%
TORRAO	0.00%	0.00%	0.00%	0.00%	0.07%
TOTALENERGIES	0.42%	0.00%	0.00%	0.00%	0.27%
UNI	0.00%	0.00%	0.00%	0.09%	0.00%
VIBRA ENERGIA	21.44%	25.14%	25.89%	17.85%	18.87%
WALENDOWSKY	0.00%	0.00%	0.00%	0.10%	0.00%
WATT	0.35%	0.00%	0.00%	0.00%	0.00%

DB_Comb %>% filter(Produto == 'GASOLINA ADITIVADA') %>%
  tabyl(Bandeira,`Regiao - Sigla`)  %>%
  adorn_percentages("col") %>%
  adorn_pct_formatting(digits = 2) %>%
  flextable() %>% theme_zebra() %>%
  set_caption(caption = "Frequência relativa de cada BANDEIRA por região de GASOLINA ADITIVADA na BD")

Frequência relativa de cada BANDEIRA por região de GASOLINA ADITIVADA na BD
Bandeira	CO	N	NE	S	SE
ALESAT	1.15%	0.79%	2.39%	1.38%	2.24%
AMERICANOIL	0.00%	0.00%	0.00%	0.41%	0.00%
ATEMS	0.00%	9.08%	0.00%	0.00%	0.00%
ATLÂNTICA	0.00%	0.00%	0.00%	0.00%	0.21%
BRANCA	32.22%	15.50%	35.13%	27.85%	32.14%
CHARRUA	0.00%	0.00%	0.00%	1.11%	0.00%
CIAPETRO	0.00%	0.00%	0.00%	0.68%	0.05%
DIBRAPE	0.00%	0.00%	0.00%	0.36%	0.00%
DISLUB	0.00%	0.00%	0.96%	0.00%	0.00%
EQUADOR	0.00%	7.55%	0.00%	0.00%	0.00%
ESTRADA	0.00%	0.00%	0.00%	0.01%	0.00%
FAN	0.00%	0.00%	0.14%	0.00%	0.00%
FEDERAL ENERGIA	0.00%	0.00%	0.17%	0.00%	0.00%
IDAZA	1.58%	0.00%	0.00%	0.36%	0.00%
IPIRANGA	15.43%	19.80%	8.47%	26.02%	20.14%
LARCO	0.00%	0.00%	0.26%	0.00%	0.00%
MASUT DISTRIBUIDORA	0.64%	0.00%	0.00%	0.00%	0.00%
MAXSUL	0.00%	0.00%	0.00%	0.84%	0.00%
MONTEPETRO	0.00%	0.00%	0.00%	0.00%	0.10%
PELIKANO	0.00%	0.00%	0.00%	0.09%	0.00%
PETROBAHIA	0.00%	0.00%	0.30%	0.00%	0.00%
PETROSERRA	0.00%	0.00%	0.16%	0.00%	0.00%
PETROX DISTRIBUIDORA	0.00%	0.00%	0.89%	0.00%	0.00%
PODIUM	0.00%	0.00%	0.00%	0.00%	0.00%
POTENCIAL	0.00%	0.00%	0.00%	0.58%	0.00%
RAIZEN	17.19%	3.28%	16.61%	13.07%	22.43%
RAIZEN MIME	0.00%	0.00%	0.00%	2.95%	0.00%
REJAILE	0.00%	0.00%	0.00%	0.11%	0.00%
RIO BRANCO	0.00%	0.00%	0.00%	0.00%	0.25%
RODOIL	0.00%	0.00%	0.00%	3.54%	0.00%
ROYAL FIC	0.48%	0.00%	0.00%	0.00%	0.00%
RZD DISTRIBUIDORA	0.00%	0.55%	0.00%	0.00%	0.00%
SABBÁ	0.00%	16.25%	2.47%	0.00%	0.00%
SETTA DISTRIBUIDORA	0.00%	0.00%	0.33%	0.00%	0.00%
SIMARELLI	0.99%	0.20%	0.00%	0.00%	0.00%
SMALL	0.72%	0.00%	0.00%	0.00%	0.00%
SP	0.00%	0.20%	1.67%	0.00%	0.00%
STANG	0.00%	0.00%	0.00%	1.30%	0.00%
SUL COMBUSTÍVEIS	0.00%	0.00%	0.00%	0.30%	0.00%
TAURUS	1.85%	0.00%	0.00%	0.00%	0.01%
TDC DISTRIBUIDORA	0.00%	0.00%	0.56%	0.00%	0.00%
TEMAPE	0.00%	0.00%	0.35%	0.00%	0.00%
TOBRAS	0.00%	0.00%	0.00%	0.00%	0.01%
TORRAO	0.00%	0.00%	0.00%	0.00%	0.08%
TOTALENERGIES	0.48%	0.00%	0.00%	0.00%	0.13%
UNI	0.00%	0.00%	0.00%	0.11%	0.00%
VIBRA ENERGIA	27.00%	26.80%	29.15%	18.83%	22.20%
WALENDOWSKY	0.00%	0.00%	0.00%	0.12%	0.00%
WATT	0.27%	0.00%	0.00%	0.00%	0.00%

As tabelas com o cálculo das médias e desvios padrões, além dos gráficos tipo boxplot, dos combustíveis analisados, estratificados por bandeiras para cada região estão apresentados a seguir. Não foram feitas quaisquer análises acerca desses reultados.

#-------
# Tabelas com preços médios e desvio padrão 
# por bandeira da região norte para os meses de 
# nov/21, mar/22 e jun/22, extratificadas pelos 
# produtos D S10, D S500, G comum e G aditivada 
#-------
ft111BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
            Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
            Bandeira == 'VIBRA ENERGIA' | 
            Bandeira == 'EQUADOR') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft111OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
              Bandeira != 'VIBRA ENERGIA' & 
              Bandeira != 'EQUADOR')) %>%
  select(Bandeira,`Valor de Venda`) 

ft111OBP$Bandeira <- "OUTRAS"

ft111BP <- bind_rows(ft111BP, ft111OBP)

ft111 <- ft111BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft111BP, 
        main="Boxplot de preços de D.S10 por bandeira - Norte (Nov/21)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft112BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL S10' 
         & (`Data da Coleta` > "2022-02-28" &
           `Data da Coleta` < "2022-04-01") &
         (Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
          Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
          Bandeira == 'VIBRA ENERGIA' | 
          Bandeira == 'EQUADOR') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft112OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL S10' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
              Bandeira != 'VIBRA ENERGIA' & 
              Bandeira != 'EQUADOR')) %>%
  select(Bandeira,`Valor de Venda`) 

ft112OBP$Bandeira <- "OUTRAS"

ft112BP <- bind_rows(ft112BP, ft112OBP)

ft112 <- ft112BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft112BP, 
        main="Boxplot de preços de D.S10 por bandeira - Norte (Mar/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft113BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
              Bandeira == 'VIBRA ENERGIA' | 
              Bandeira == 'EQUADOR') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft113OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
              Bandeira != 'VIBRA ENERGIA' & 
              Bandeira != 'EQUADOR')) %>%
  select(Bandeira,`Valor de Venda`) 

ft113OBP$Bandeira <- "OUTRAS"

ft113BP <- bind_rows(ft113BP, ft113OBP)

ft113 <- ft113BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft113BP, 
        main="Boxplot de preços de D.S10 por bandeira - Norte (Jun/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftN1 <- ft111 %>% 
  left_join(ft112, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft113, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftN1 <- delete_part(ftN1, part = "header")
ftN1 <- add_header(x=ftN1, Bandeira = "Bandeira",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftN1 <- add_header(x=ftN1,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftN1 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios do DIESEL S10 por BANDEIRA no Norte")

Preços médios do DIESEL S10 por BANDEIRA no Norte
	Novembro/2021	Março/2022	Junho/2022
ATEMS	5.5482	0.2618	6.4464	0.5108	7.5210	0.5136
BRANCA	5.6951	0.3199	6.6399	0.6212	7.5201	0.5231
EQUADOR	5.7808	0.2820	6.7211	0.5629	7.7305	0.5268
IPIRANGA	5.7541	0.3164	6.6682	0.5581	7.6512	0.4915
OUTRAS	5.5652	0.2329	6.7285	0.5935	7.5179	0.5150
SABBÁ	5.6448	0.2799	6.6125	0.5838	7.6070	0.5136
VIBRA ENERGIA	5.8251	0.3793	6.7410	0.5961	7.6663	0.5427

ft121BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
              Bandeira == 'VIBRA ENERGIA' | 
              Bandeira == 'EQUADOR') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft121OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
              Bandeira != 'VIBRA ENERGIA' & 
              Bandeira != 'EQUADOR')) %>%
  select(Bandeira,`Valor de Venda`) 

ft121OBP$Bandeira <- "OUTRAS"

ft121BP <- bind_rows(ft121BP, ft121OBP)

ft121 <- ft121BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft121BP, 
        main="Boxplot de preços de D.S500 por bandeira - Norte (Nov/21)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft122BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
              Bandeira == 'VIBRA ENERGIA' | 
              Bandeira == 'EQUADOR') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft122OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
              Bandeira != 'VIBRA ENERGIA' & 
              Bandeira != 'EQUADOR')) %>%
  select(Bandeira,`Valor de Venda`) 

ft122OBP$Bandeira <- "OUTRAS"

ft122BP <- bind_rows(ft122BP, ft122OBP)

ft122 <- ft122BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft122BP, 
        main="Boxplot de preços de D.S500 por bandeira - Norte (Mar/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft123BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
              Bandeira == 'VIBRA ENERGIA' | 
              Bandeira == 'EQUADOR') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft123OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
              Bandeira != 'VIBRA ENERGIA' & 
              Bandeira != 'EQUADOR')) %>%
  select(Bandeira,`Valor de Venda`) 

ft123OBP$Bandeira <- "OUTRAS"

ft123BP <- bind_rows(ft123BP, ft123OBP)

ft123 <- ft123BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft123BP, 
        main="Boxplot de preços de D.S500 por bandeira - Norte (Jun/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftN2 <- ft121 %>% 
  left_join(ft122, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft123, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftN2 <- delete_part(ftN2, part = "header")
ftN2 <- add_header(x=ftN2, Bandeira = "Bandeira",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftN2 <- add_header(x=ftN2,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftN2 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios do DIESEL S500 por BANDEIRA no Norte")

Preços médios do DIESEL S500 por BANDEIRA no Norte
	Novembro/2021	Março/2022	Junho/2022
ATEMS	5.5400	0.3050	6.4053	0.5169	7.4100	0.4727
BRANCA	5.6350	0.3138	6.5579	0.6489	7.5062	0.5316
EQUADOR	5.7871	0.2409	6.7374	0.5575	7.6786	0.5362
IPIRANGA	5.7922	0.3423	6.6067	0.5603	7.5702	0.5265
OUTRAS	5.5037	0.1456	6.5025	0.5853	7.3568	0.5049
SABBÁ	5.6391	0.2743	6.6636	0.5664	7.6277	0.4835
VIBRA ENERGIA	5.8151	0.4084	6.6829	0.6161	7.6280	0.5615

ft131BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
              Bandeira == 'VIBRA ENERGIA' | 
              Bandeira == 'EQUADOR') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft131OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
              Bandeira != 'VIBRA ENERGIA' & 
              Bandeira != 'EQUADOR')) %>%
  select(Bandeira,`Valor de Venda`) 

ft131OBP$Bandeira <- "OUTRAS"

ft131BP <- bind_rows(ft131BP, ft131OBP)

ft131 <- ft131BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft131BP, 
        main="Boxplot de preços de G.C por bandeira - Norte (Nov/21)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft132BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
              Bandeira == 'VIBRA ENERGIA' | 
              Bandeira == 'EQUADOR') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft132OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
              Bandeira != 'VIBRA ENERGIA' & 
              Bandeira != 'EQUADOR')) %>%
  select(Bandeira,`Valor de Venda`) 

ft132OBP$Bandeira <- "OUTRAS"

ft132BP <- bind_rows(ft132BP, ft132OBP)

ft132 <- ft132BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft132BP, 
        main="Boxplot de preços de G.C por bandeira - Norte (Mar/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft133BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
              Bandeira == 'VIBRA ENERGIA' | 
              Bandeira == 'EQUADOR') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft133OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
              Bandeira != 'VIBRA ENERGIA' & 
              Bandeira != 'EQUADOR')) %>%
  select(Bandeira,`Valor de Venda`) 

ft133OBP$Bandeira <- "OUTRAS"

ft133BP <- bind_rows(ft133BP, ft133OBP)

ft133 <- ft133BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft133BP, 
        main="Boxplot de preços de G.C por bandeira - Norte (Jun/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftN3 <- ft131 %>% 
  left_join(ft132, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft133, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftN3 <- delete_part(ftN3, part = "header")
ftN3 <- add_header(x=ftN3, Bandeira = "Bandeira",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftN3 <- add_header(x=ftN3,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftN3 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios da GASOLINA COMUM por BANDEIRA no Norte")

Preços médios da GASOLINA COMUM por BANDEIRA no Norte
	Novembro/2021	Março/2022	Junho/2022
ATEMS	6.6923	0.2661	7.1455	0.4073	7.3664	0.3477
BRANCA	6.7362	0.4597	7.1145	0.5964	7.3655	0.5121
EQUADOR	6.8708	0.2502	7.3409	0.4379	7.5699	0.3567
IPIRANGA	6.8071	0.3423	7.2090	0.4771	7.4220	0.3961
OUTRAS	6.8752	0.2043	7.2993	0.3375	7.4517	0.2537
SABBÁ	6.7222	0.1604	7.1990	0.3598	7.4111	0.3166
VIBRA ENERGIA	6.8072	0.3822	7.1859	0.4799	7.4195	0.4322

ft141BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
              Bandeira == 'VIBRA ENERGIA' | 
              Bandeira == 'EQUADOR') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft141OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
              Bandeira != 'VIBRA ENERGIA' & 
              Bandeira != 'EQUADOR')) %>%
  select(Bandeira,`Valor de Venda`) 

ft141OBP$Bandeira <- "OUTRAS"

ft141BP <- bind_rows(ft141BP, ft141OBP)

ft141 <- ft141BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft141BP, 
        main="Boxplot de preços de G.A por bandeira - Norte (Nov/21)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft142BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA ADITIVADA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
              Bandeira == 'VIBRA ENERGIA' | 
              Bandeira == 'EQUADOR') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft142OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA ADITIVADA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
              Bandeira != 'VIBRA ENERGIA' & 
              Bandeira != 'EQUADOR')) %>%
  select(Bandeira,`Valor de Venda`) 

ft142OBP$Bandeira <- "OUTRAS"

ft142BP <- bind_rows(ft142BP, ft142OBP)

ft142 <- ft142BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft142BP, 
        main="Boxplot de preços de G.A por bandeira - Norte (Mar/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft143BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'ATEMS' | Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'SABBÁ' |
              Bandeira == 'VIBRA ENERGIA' | 
              Bandeira == 'EQUADOR') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft143OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'N' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'ATEMS' & Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'SABBÁ' &
              Bandeira != 'VIBRA ENERGIA' & 
              Bandeira != 'EQUADOR')) %>%
  select(Bandeira,`Valor de Venda`) 

ft143OBP$Bandeira <- "OUTRAS"

ft143BP <- bind_rows(ft143BP, ft143OBP)

ft143 <- ft143BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft143BP, 
        main="Boxplot de preços de G.A por bandeira - Norte (Jun/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftN4 <- ft141 %>% 
  left_join(ft142, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft143, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftN4 <- delete_part(ftN4, part = "header")
ftN4 <- add_header(x=ftN4, Bandeira = "Bandeira",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftN4 <- add_header(x=ftN4,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftN4 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios da GASOLINA ADITIVADA por BANDEIRA no Norte")

Preços médios da GASOLINA ADITIVADA por BANDEIRA no Norte
	Novembro/2021	Março/2022	Junho/2022
ATEMS	6.6358	0.1485	7.1174	0.3825	7.3380	0.3018
BRANCA	6.9246	0.2992	7.3086	0.3981	7.5214	0.3333
EQUADOR	6.8769	0.2043	7.3442	0.3965	7.6281	0.2844
IPIRANGA	6.9598	0.2610	7.3660	0.3724	7.6043	0.3114
OUTRAS	6.9913	0.2755	7.4757	0.3617	7.5962	0.2718
SABBÁ	6.8878	0.2021	7.3505	0.3516	7.5843	0.2988
VIBRA ENERGIA	6.9101	0.2652	7.3217	0.3769	7.5789	0.3057

#-------
# Tabelas com preços médios e desvio padrão 
# por bandeira da região nordeste para os meses de 
# nov/21, mar/22 e jun/22, extratificadas pelos 
# produtos D S10, D S500, G comum e G aditivada 
#-------
ft211BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft211OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft211OBP$Bandeira <- "OUTRAS"

ft211BP <- bind_rows(ft211BP, ft211OBP)

ft211 <- ft211BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft211BP, 
        main="Boxplot de preços de D.S10 por bandeira - Nordeste (Nov/21)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft212BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL S10' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft212OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL S10' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft212OBP$Bandeira <- "OUTRAS"

ft212BP <- bind_rows(ft212BP, ft212OBP)

ft212 <- ft212BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft212BP, 
        main="Boxplot de preços de D.S10 por bandeira - Nordeste (Mar/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft213BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft213OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft213OBP$Bandeira <- "OUTRAS"

ft213BP <- bind_rows(ft213BP, ft213OBP)

ft213 <- ft213BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft213BP, 
        main="Boxplot de preços de D.S10 por bandeira - Nordeste (Jun/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftNE1 <- ft211 %>% 
  left_join(ft212, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft213, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftNE1 <- delete_part(ftNE1, part = "header")
ftNE1 <- add_header(x=ftNE1, Bandeira = "Bandeira",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftNE1 <- add_header(x=ftNE1,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftNE1 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios do DIESEL S10 por BANDEIRA no Nordeste")

Preços médios do DIESEL S10 por BANDEIRA no Nordeste
	Novembro/2021	Março/2022	Junho/2022
BRANCA	5.5420	0.2047	6.5503	0.5797	7.5448	0.4951
IPIRANGA	5.5691	0.2023	6.5937	0.5800	7.5749	0.5071
OUTRAS	5.5804	0.2153	6.5299	0.5882	7.4862	0.4505
RAIZEN	5.5854	0.1829	6.5515	0.5559	7.5800	0.4910
VIBRA ENERGIA	5.6527	0.2121	6.5835	0.5596	7.5590	0.4967

ft221BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft221OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft221OBP$Bandeira <- "OUTRAS"

ft221BP <- bind_rows(ft221BP, ft221OBP)

ft221 <- ft221BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft221BP, 
        main="Boxplot de preços de D.S500 por bandeira - Nordeste (Nov/21)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft222BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft222OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft222OBP$Bandeira <- "OUTRAS"

ft222BP <- bind_rows(ft222BP, ft222OBP)

ft222 <- ft222BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft222BP, 
        main="Boxplot de preços de D.S500 por bandeira - Nordeste (Mar/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft223BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft223OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft223OBP$Bandeira <- "OUTRAS"

ft223BP <- bind_rows(ft223BP, ft223OBP)

ft223 <- ft223BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft223BP, 
        main="Boxplot de preços de D.S500 por bandeira - Nordeste (Jun/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftNE2 <- ft221 %>% 
  left_join(ft222, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft223, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftNE2 <- delete_part(ftNE2, part = "header")
ftNE2 <- add_header(x=ftNE2, Bandeira = "Bandeira",
                    preco_med.x="Preço", desv_pad.x="DP",
                    preco_med.y="Preço", desv_pad.y="DP",
                    preco_med="Preço", desv_pad="DP",
                    top = FALSE) 

ftNE2 <- add_header(x=ftNE2,
                    preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                    preco_med.y="Março/2022", desv_pad.y="Março/2022",
                    preco_med="Junho/2022", desv_pad="Junho/2022",
                    top = TRUE) 
ftNE2 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios do DIESEL S500 por BANDEIRA no Nordeste")

Preços médios do DIESEL S500 por BANDEIRA no Nordeste
	Novembro/2021	Março/2022	Junho/2022
BRANCA	5.4975	0.2114	6.5649	0.5414	7.5883	0.4981
IPIRANGA	5.5399	0.2072	6.5435	0.5630	7.5564	0.5194
OUTRAS	5.5253	0.2040	6.5164	0.5778	7.4730	0.4202
RAIZEN	5.5496	0.2094	6.4815	0.5636	7.5845	0.5196
VIBRA ENERGIA	5.6167	0.1901	6.5529	0.5146	7.5307	0.4776

ft231BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft231OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft231OBP$Bandeira <- "OUTRAS"

ft231BP <- bind_rows(ft231BP, ft231OBP)

ft231 <- ft231BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft231BP, 
        main="Boxplot de preços de G.C por bandeira - Nordeste (Nov/21)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft232BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft232OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft232OBP$Bandeira <- "OUTRAS"

ft232BP <- bind_rows(ft232BP, ft232OBP)

ft232 <- ft232BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft232BP, 
        main="Boxplot de preços de G.C por bandeira - Nordeste (Mar/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft233BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft233OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft233OBP$Bandeira <- "OUTRAS"

ft233BP <- bind_rows(ft233BP, ft233OBP)

ft233 <- ft233BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft233BP, 
        main="Boxplot de preços de G.C por bandeira - Nordeste (Jun/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftNE3 <- ft231 %>% 
  left_join(ft232, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft233, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftNE3 <- delete_part(ftNE3, part = "header")
ftNE3 <- add_header(x=ftNE3, Bandeira = "Bandeira",
                    preco_med.x="Preço", desv_pad.x="DP",
                    preco_med.y="Preço", desv_pad.y="DP",
                    preco_med="Preço", desv_pad="DP",
                    top = FALSE) 

ftNE3 <- add_header(x=ftNE3,
                    preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                    preco_med.y="Março/2022", desv_pad.y="Março/2022",
                    preco_med="Junho/2022", desv_pad="Junho/2022",
                    top = TRUE) 
ftNE3 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios da GASOLINA COMUM por BANDEIRA no Nordeste")

Preços médios da GASOLINA COMUM por BANDEIRA no Nordeste
	Novembro/2021	Março/2022	Junho/2022
BRANCA	6.7554	0.2398	7.2218	0.4796	7.6191	0.4037
IPIRANGA	6.8149	0.2596	7.2909	0.5381	7.5904	0.4437
OUTRAS	6.8112	0.2606	7.2059	0.4976	7.5098	0.3910
RAIZEN	6.8046	0.2260	7.2060	0.4802	7.6405	0.4103
VIBRA ENERGIA	6.8482	0.2438	7.2631	0.5028	7.6137	0.3909

ft241BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft241OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft241OBP$Bandeira <- "OUTRAS"

ft241BP <- bind_rows(ft241BP, ft241OBP)

ft241 <- ft241BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft241BP, 
        main="Boxplot de preços de G.A por bandeira - Nordeste (Nov/21)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft242BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA ADITIVADA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft242OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA ADITIVADA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft242OBP$Bandeira <- "OUTRAS"

ft242BP <- bind_rows(ft242BP, ft242OBP)

ft242 <- ft242BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft242BP, 
        main="Boxplot de preços de G.A por bandeira - Nordeste (Mar/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft243BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft243OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'NE' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft243OBP$Bandeira <- "OUTRAS"

ft243BP <- bind_rows(ft243BP, ft243OBP)

ft243 <- ft243BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft243BP, 
        main="Boxplot de preços de G.A por bandeira - Nordeste (Jun/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftNE4 <- ft241 %>% 
  left_join(ft242, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft243, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftNE4 <- delete_part(ftNE4, part = "header")
ftNE4 <- add_header(x=ftNE4, Bandeira = "Bandeira",
                    preco_med.x="Preço", desv_pad.x="DP",
                    preco_med.y="Preço", desv_pad.y="DP",
                    preco_med="Preço", desv_pad="DP",
                    top = FALSE) 

ftNE4 <- add_header(x=ftNE4,
                    preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                    preco_med.y="Março/2022", desv_pad.y="Março/2022",
                    preco_med="Junho/2022", desv_pad="Junho/2022",
                    top = TRUE) 
ftNE4 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios da GASOLINA ADITIVADA por BANDEIRA no Nordeste")

Preços médios da GASOLINA ADITIVADA por BANDEIRA no Nordeste
	Novembro/2021	Março/2022	Junho/2022
BRANCA	6.8232	0.2529	7.3080	0.4594	7.6942	0.3970
IPIRANGA	7.0103	0.2834	7.4782	0.5282	7.7549	0.4381
OUTRAS	6.9352	0.2801	7.3592	0.4997	7.6293	0.3699
RAIZEN	7.0471	0.2221	7.4645	0.4868	7.8920	0.4041
VIBRA ENERGIA	6.9881	0.2718	7.4009	0.4994	7.7335	0.3856

#-------
# Tabelas com preços médios e desvio padrão 
# por bandeira da região centro oeste para os meses de 
# nov/21, mar/22 e jun/22, extratificadas pelos 
# produtos D S10, D S500, G comum e G aditivada 
#-------
ft311BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft311OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft311OBP$Bandeira <- "OUTRAS"

ft311BP <- bind_rows(ft311BP, ft311OBP)

ft311 <- ft311BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft311BP, 
        main="Boxplot de preços de D.S10 por bandeira - Centro Oeste (Nov/21)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft312BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL S10' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft312OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL S10' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft312OBP$Bandeira <- "OUTRAS"

ft312BP <- bind_rows(ft312BP, ft312OBP)

ft312 <- ft312BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft312BP, 
        main="Boxplot de preços de D.S10 por bandeira - Centro Oeste (Mar/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft313BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft313OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft313OBP$Bandeira <- "OUTRAS"

ft313BP <- bind_rows(ft313BP, ft313OBP)

ft313 <- ft313BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft313BP, 
        main="Boxplot de preços de D.S10 por bandeira - Centro Oeste (Jun/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftCO1 <- ft311 %>% 
  left_join(ft312, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft313, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftCO1 <- delete_part(ftCO1, part = "header")
ftCO1 <- add_header(x=ftCO1, Bandeira = "Bandeira",
                    preco_med.x="Preço", desv_pad.x="DP",
                    preco_med.y="Preço", desv_pad.y="DP",
                    preco_med="Preço", desv_pad="DP",
                    top = FALSE) 

ftCO1 <- add_header(x=ftCO1,
                    preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                    preco_med.y="Março/2022", desv_pad.y="Março/2022",
                    preco_med="Junho/2022", desv_pad="Junho/2022",
                    top = TRUE) 
ftCO1 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios do DIESEL S10 por BANDEIRA no Centro Oeste")

Preços médios do DIESEL S10 por BANDEIRA no Centro Oeste
	Novembro/2021	Março/2022	Junho/2022
BRANCA	5.6953	0.1898	6.5643	0.6003	7.3501	0.3874
IPIRANGA	5.6472	0.2539	6.4187	0.5501	7.4013	0.4292
OUTRAS	5.6570	0.2874	6.4980	0.5914	7.4196	0.4933
RAIZEN	5.7063	0.1875	6.5195	0.5260	7.4010	0.3833
VIBRA ENERGIA	5.7258	0.2893	6.5542	0.5454	7.4680	0.4867

ft321BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft321OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft321OBP$Bandeira <- "OUTRAS"

ft321BP <- bind_rows(ft321BP, ft321OBP)

ft321 <- ft321BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft321BP, 
        main="Boxplot de preços de D.S500 por bandeira - Centro Oeste (Nov/21)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft322BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft322OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft322OBP$Bandeira <- "OUTRAS"

ft322BP <- bind_rows(ft322BP, ft322OBP)

ft322 <- ft322BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft322BP, 
        main="Boxplot de preços de D.S500 por bandeira - Centro Oeste (Mar/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft323BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft323OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft323OBP$Bandeira <- "OUTRAS"

ft323BP <- bind_rows(ft323BP, ft323OBP)

ft323 <- ft323BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft323BP, 
        main="Boxplot de preços de D.S500 por bandeira - Centro Oeste (Jun/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftCO2 <- ft321 %>% 
  left_join(ft322, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft323, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftCO2 <- delete_part(ftCO2, part = "header")
ftCO2 <- add_header(x=ftCO2, Bandeira = "Bandeira",
                    preco_med.x="Preço", desv_pad.x="DP",
                    preco_med.y="Preço", desv_pad.y="DP",
                    preco_med="Preço", desv_pad="DP",
                    top = FALSE) 

ftCO2 <- add_header(x=ftCO2,
                    preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                    preco_med.y="Março/2022", desv_pad.y="Março/2022",
                    preco_med="Junho/2022", desv_pad="Junho/2022",
                    top = TRUE) 
ftCO2 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios do DIESEL S500 por BANDEIRA no Centro Oeste")

Preços médios do DIESEL S500 por BANDEIRA no Centro Oeste
	Novembro/2021	Março/2022	Junho/2022
BRANCA	5.5267	0.1876	6.4004	0.5619	7.1575	0.4063
IPIRANGA	5.5568	0.2250	6.3397	0.5341	7.3515	0.4088
OUTRAS	5.5519	0.2870	6.3562	0.5780	7.2815	0.4801
RAIZEN	5.5452	0.2044	6.3637	0.5308	7.2833	0.4032
VIBRA ENERGIA	5.6435	0.3531	6.4404	0.5517	7.2761	0.4699

ft331BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft331OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft331OBP$Bandeira <- "OUTRAS"

ft331BP <- bind_rows(ft331BP, ft331OBP)

ft331 <- ft331BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft331BP, 
        main="Boxplot de preços de G.C por bandeira - Centro Oeste (Nov/21)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft332BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft332OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft332OBP$Bandeira <- "OUTRAS"

ft332BP <- bind_rows(ft332BP, ft332OBP)

ft332 <- ft332BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft332BP, 
        main="Boxplot de preços de G.C por bandeira - Centro Oeste (Mar/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft333BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft333OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft333OBP$Bandeira <- "OUTRAS"

ft333BP <- bind_rows(ft333BP, ft333OBP)

ft333 <- ft333BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft333BP, 
        main="Boxplot de preços de G.C por bandeira - Centro Oeste (Jun/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftCO3 <- ft331 %>% 
  left_join(ft332, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft333, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftCO3 <- delete_part(ftCO3, part = "header")
ftCO3 <- add_header(x=ftCO3, Bandeira = "Bandeira",
                    preco_med.x="Preço", desv_pad.x="DP",
                    preco_med.y="Preço", desv_pad.y="DP",
                    preco_med="Preço", desv_pad="DP",
                    top = FALSE) 

ftCO3 <- add_header(x=ftCO3,
                    preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                    preco_med.y="Março/2022", desv_pad.y="Março/2022",
                    preco_med="Junho/2022", desv_pad="Junho/2022",
                    top = TRUE) 
ftCO3 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios da GASOLINA COMUM por BANDEIRA no Centro Oeste")

Preços médios da GASOLINA COMUM por BANDEIRA no Centro Oeste
	Novembro/2021	Março/2022	Junho/2022
BRANCA	6.9360	0.3046	7.0160	0.4270	7.2099	0.3899
IPIRANGA	6.9894	0.3158	7.0642	0.4305	7.3057	0.3542
OUTRAS	6.8435	0.2653	6.9851	0.4095	7.2931	0.3442
RAIZEN	6.9435	0.2889	7.0233	0.4473	7.2557	0.3443
VIBRA ENERGIA	6.9255	0.2795	7.0760	0.4473	7.3143	0.3799

ft341BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft341OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft341OBP$Bandeira <- "OUTRAS"

ft341BP <- bind_rows(ft341BP, ft341OBP)

ft341 <- ft341BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft341BP, 
        main="Boxplot de preços de G.A por bandeira - Centro Oeste (Nov/21)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft342BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA ADITIVADA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft342OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA ADITIVADA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft342OBP$Bandeira <- "OUTRAS"

ft342BP <- bind_rows(ft342BP, ft342OBP)

ft342 <- ft342BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft342BP, 
        main="Boxplot de preços de G.A por bandeira - Centro Oeste (Mar/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft343BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft343OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'CO' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft343OBP$Bandeira <- "OUTRAS"

ft343BP <- bind_rows(ft343BP, ft343OBP)

ft343 <- ft343BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft343BP, 
        main="Boxplot de preços de G.A por bandeira - Centro Oeste (Jun/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftCO4 <- ft341 %>% 
  left_join(ft342, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft343, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftCO4 <- delete_part(ftCO4, part = "header")
ftCO4 <- add_header(x=ftCO4, Bandeira = "Bandeira",
                    preco_med.x="Preço", desv_pad.x="DP",
                    preco_med.y="Preço", desv_pad.y="DP",
                    preco_med="Preço", desv_pad="DP",
                    top = FALSE) 

ftCO4 <- add_header(x=ftCO4,
                    preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                    preco_med.y="Março/2022", desv_pad.y="Março/2022",
                    preco_med="Junho/2022", desv_pad="Junho/2022",
                    top = TRUE) 
ftCO4 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios da GASOLINA ADITIVADA por BANDEIRA no Centro Oeste")

Preços médios da GASOLINA ADITIVADA por BANDEIRA no Centro Oeste
	Novembro/2021	Março/2022	Junho/2022
BRANCA	7.0460	0.3087	7.0998	0.4160	7.2884	0.3802
IPIRANGA	7.0963	0.3163	7.1797	0.4069	7.4495	0.3304
OUTRAS	6.9317	0.2440	7.1186	0.3914	7.3534	0.3093
RAIZEN	7.1206	0.3135	7.1773	0.4365	7.4386	0.3333
VIBRA ENERGIA	7.0180	0.2755	7.1903	0.4356	7.4343	0.3690

#-------
# Tabelas com preços médios e desvio padrão 
# por bandeira da região sudeste para os meses de 
# nov/21, mar/22 e jun/22, extratificadas pelos 
# produtos D S10, D S500, G comum e G aditivada 
#-------
ft411BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft411OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft411OBP$Bandeira <- "OUTRAS"

ft411BP <- bind_rows(ft411BP, ft411OBP)

ft411 <- ft411BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft411BP, 
        main="Boxplot de preços de D.S10 por bandeira - Sudeste (Nov/21)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft412BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL S10' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft412OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL S10' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft412OBP$Bandeira <- "OUTRAS"

ft412BP <- bind_rows(ft412BP, ft412OBP)

ft412 <- ft412BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft412BP, 
        main="Boxplot de preços de D.S10 por bandeira - Sudeste (Mar/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft413BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft413OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft413OBP$Bandeira <- "OUTRAS"

ft413BP <- bind_rows(ft413BP, ft413OBP)

ft413 <- ft413BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft413BP, 
        main="Boxplot de preços de D.S10 por bandeira - Sudeste (Jun/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftSE1 <- ft411 %>% 
  left_join(ft412, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft413, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftSE1 <- delete_part(ftSE1, part = "header")
ftSE1 <- add_header(x=ftSE1, Bandeira = "Bandeira",
                    preco_med.x="Preço", desv_pad.x="DP",
                    preco_med.y="Preço", desv_pad.y="DP",
                    preco_med="Preço", desv_pad="DP",
                    top = FALSE) 

ftSE1 <- add_header(x=ftSE1,
                    preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                    preco_med.y="Março/2022", desv_pad.y="Março/2022",
                    preco_med="Junho/2022", desv_pad="Junho/2022",
                    top = TRUE) 
ftSE1 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios do DIESEL S10 por BANDEIRA no Sudeste")

Preços médios do DIESEL S10 por BANDEIRA no Sudeste
	Novembro/2021	Março/2022	Junho/2022
BRANCA	5.3529	0.1747	6.2334	0.5269	7.1427	0.3961
IPIRANGA	5.4285	0.1888	6.3246	0.4818	7.3066	0.4437
OUTRAS	5.4182	0.1985	6.3174	0.5480	7.2545	0.4001
RAIZEN	5.3878	0.1763	6.2967	0.4940	7.2533	0.4184
VIBRA ENERGIA	5.4497	0.1926	6.3371	0.4985	7.3234	0.4129

ft421BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft421OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft421OBP$Bandeira <- "OUTRAS"

ft421BP <- bind_rows(ft421BP, ft421OBP)

ft421 <- ft421BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft421BP, 
        main="Boxplot de preços de D.S500 por bandeira - Sudeste (Nov/21)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft422BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft422OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft422OBP$Bandeira <- "OUTRAS"

ft422BP <- bind_rows(ft422BP, ft422OBP)

ft422 <- ft422BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft422BP, 
        main="Boxplot de preços de D.S500 por bandeira - Sudeste (Mar/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft423BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft423OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft423OBP$Bandeira <- "OUTRAS"

ft423BP <- bind_rows(ft423BP, ft423OBP)

ft423 <- ft423BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft423BP, 
        main="Boxplot de preços de D.S500 por bandeira - Sudeste (Jun/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftSE2 <- ft421 %>% 
  left_join(ft422, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft423, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftSE2 <- delete_part(ftSE2, part = "header")
ftSE2 <- add_header(x=ftSE2, Bandeira = "Bandeira",
                    preco_med.x="Preço", desv_pad.x="DP",
                    preco_med.y="Preço", desv_pad.y="DP",
                    preco_med="Preço", desv_pad="DP",
                    top = FALSE) 

ftSE2 <- add_header(x=ftSE2,
                    preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                    preco_med.y="Março/2022", desv_pad.y="Março/2022",
                    preco_med="Junho/2022", desv_pad="Junho/2022",
                    top = TRUE) 
ftSE2 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios do DIESEL S500 por BANDEIRA no Sudeste")

Preços médios do DIESEL S500 por BANDEIRA no Sudeste
	Novembro/2021	Março/2022	Junho/2022
BRANCA	5.2529	0.1673	6.1485	0.5069	7.0401	0.4003
IPIRANGA	5.3472	0.1781	6.2186	0.4652	7.2082	0.4423
OUTRAS	5.3815	0.2024	6.2582	0.5301	7.1572	0.4045
RAIZEN	5.3101	0.1763	6.1802	0.4813	7.1251	0.4257
VIBRA ENERGIA	5.3786	0.1728	6.2316	0.4808	7.1951	0.4239

ft431BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft431OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft431OBP$Bandeira <- "OUTRAS"

ft431BP <- bind_rows(ft431BP, ft431OBP)

ft431 <- ft431BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft431BP, 
        main="Boxplot de preços de G.C por bandeira - Sudeste (Nov/21)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft432BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft432OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft432OBP$Bandeira <- "OUTRAS"

ft432BP <- bind_rows(ft432BP, ft432OBP)

ft432 <- ft432BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft432BP, 
        main="Boxplot de preços de G.C por bandeira - Sudeste (Mar/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft433BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft433OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft433OBP$Bandeira <- "OUTRAS"

ft433BP <- bind_rows(ft433BP, ft433OBP)

ft433 <- ft433BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft433BP, 
        main="Boxplot de preços de G.C por bandeira - Sudeste (Jun/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftSE3 <- ft431 %>% 
  left_join(ft432, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft433, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftSE3 <- delete_part(ftSE3, part = "header")
ftSE3 <- add_header(x=ftSE3, Bandeira = "Bandeira",
                    preco_med.x="Preço", desv_pad.x="DP",
                    preco_med.y="Preço", desv_pad.y="DP",
                    preco_med="Preço", desv_pad="DP",
                    top = FALSE) 

ftSE3 <- add_header(x=ftSE3,
                    preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                    preco_med.y="Março/2022", desv_pad.y="Março/2022",
                    preco_med="Junho/2022", desv_pad="Junho/2022",
                    top = TRUE) 
ftSE3 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios da GASOLINA COMUM por BANDEIRA no Sudeste")

Preços médios da GASOLINA COMUM por BANDEIRA no Sudeste
	Novembro/2021	Março/2022	Junho/2022
BRANCA	6.5786	0.4136	6.8177	0.5213	7.0277	0.4901
IPIRANGA	6.6737	0.3737	6.9531	0.4768	7.1627	0.4341
OUTRAS	6.8882	0.4002	7.1631	0.4804	7.4280	0.4090
RAIZEN	6.6873	0.4082	6.9767	0.5070	7.1833	0.4519
VIBRA ENERGIA	6.8331	0.4122	7.1143	0.5135	7.3348	0.4808

ft441BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft441OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft441OBP$Bandeira <- "OUTRAS"

ft441BP <- bind_rows(ft441BP, ft441OBP)

ft441 <- ft441BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft441BP, 
        main="Boxplot de preços de G.A por bandeira - Sudeste (Nov/21)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft442BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA ADITIVADA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft442OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA ADITIVADA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft442OBP$Bandeira <- "OUTRAS"

ft442BP <- bind_rows(ft442BP, ft442OBP)

ft442 <- ft442BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft442BP, 
        main="Boxplot de preços de G.A por bandeira - Sudeste (Mar/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft443BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft443OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'SE' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft443OBP$Bandeira <- "OUTRAS"

ft443BP <- bind_rows(ft443BP, ft443OBP)

ft443 <- ft443BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft443BP, 
        main="Boxplot de preços de G.A por bandeira - Sudeste (Jun/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftSE4 <- ft441 %>% 
  left_join(ft442, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft443, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftSE4 <- delete_part(ftSE4, part = "header")
ftSE4 <- add_header(x=ftSE4, Bandeira = "Bandeira",
                    preco_med.x="Preço", desv_pad.x="DP",
                    preco_med.y="Preço", desv_pad.y="DP",
                    preco_med="Preço", desv_pad="DP",
                    top = FALSE) 

ftSE4 <- add_header(x=ftSE4,
                    preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                    preco_med.y="Março/2022", desv_pad.y="Março/2022",
                    preco_med="Junho/2022", desv_pad="Junho/2022",
                    top = TRUE) 
ftSE4 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios da GASOLINA ADITIVADA por BANDEIRA no Sudeste")

Preços médios da GASOLINA ADITIVADA por BANDEIRA no Sudeste
	Novembro/2021	Março/2022	Junho/2022
BRANCA	6.6797	0.4155	6.9317	0.5252	7.1727	0.4807
IPIRANGA	6.8641	0.3654	7.1498	0.4730	7.3651	0.4284
OUTRAS	6.9696	0.3939	7.2933	0.4913	7.5474	0.4054
RAIZEN	6.8914	0.3903	7.1814	0.5010	7.4000	0.4469
VIBRA ENERGIA	6.9915	0.4451	7.2617	0.5442	7.4887	0.4958

#-------
# Tabelas com preços médios e desvio padrão 
# por bandeira da região sul para os meses de 
# nov/21, mar/22 e jun/22, extratificadas pelos 
# produtos D S10, D S500, G comum e G aditivada 
#-------
ft511BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft511OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL S10' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft511OBP$Bandeira <- "OUTRAS"

ft511BP <- bind_rows(ft511BP, ft511OBP)

ft511 <- ft511BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft511BP, 
        main="Boxplot de preços de D.S10 por bandeira - Sul (Nov/21)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft512BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL S10' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft512OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL S10' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft512OBP$Bandeira <- "OUTRAS"

ft512BP <- bind_rows(ft512BP, ft512OBP)

ft512 <- ft512BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft512BP, 
        main="Boxplot de preços de D.S10 por bandeira - Sul (Mar/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft513BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft513OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL S10' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft513OBP$Bandeira <- "OUTRAS"

ft513BP <- bind_rows(ft513BP, ft513OBP)

ft513 <- ft513BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft513BP, 
        main="Boxplot de preços de D.S10 por bandeira - Sul (Jun/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftS1 <- ft511 %>% 
  left_join(ft512, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft513, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftS1 <- delete_part(ftS1, part = "header")
ftS1 <- add_header(x=ftS1, Bandeira = "Bandeira",
                    preco_med.x="Preço", desv_pad.x="DP",
                    preco_med.y="Preço", desv_pad.y="DP",
                    preco_med="Preço", desv_pad="DP",
                    top = FALSE) 

ftS1 <- add_header(x=ftS1,
                    preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                    preco_med.y="Março/2022", desv_pad.y="Março/2022",
                    preco_med="Junho/2022", desv_pad="Junho/2022",
                    top = TRUE) 
ftS1 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios do DIESEL S10 por BANDEIRA no Sul")

Preços médios do DIESEL S10 por BANDEIRA no Sul
	Novembro/2021	Março/2022	Junho/2022
BRANCA	5.2672	0.1767	6.2188	0.5351	7.0827	0.4162
IPIRANGA	5.2885	0.2248	6.2428	0.5559	7.2206	0.4453
OUTRAS	5.2454	0.1866	6.1417	0.5122	7.1462	0.4242
RAIZEN	5.2973	0.1781	6.2475	0.5209	7.1814	0.4330
VIBRA ENERGIA	5.3592	0.2014	6.2761	0.5125	7.2080	0.4256

ft521BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft521OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft521OBP$Bandeira <- "OUTRAS"

ft521BP <- bind_rows(ft521BP, ft521OBP)

ft521 <- ft521BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft521BP, 
        main="Boxplot de preços de D.S500 por bandeira - Sul (Nov/21)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft522BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft522OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft522OBP$Bandeira <- "OUTRAS"

ft522BP <- bind_rows(ft522BP, ft522OBP)

ft522 <- ft522BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft522BP, 
        main="Boxplot de preços de D.S500 por bandeira - Sul (Mar/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft523BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft523OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'DIESEL' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft523OBP$Bandeira <- "OUTRAS"

ft523BP <- bind_rows(ft523BP, ft523OBP)

ft523 <- ft523BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft523BP, 
        main="Boxplot de preços de D.S500 por bandeira - Sul (Jun/22)",
        ylim = c(4,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftS2 <- ft521 %>% 
  left_join(ft522, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft523, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftS2 <- delete_part(ftS2, part = "header")
ftS2 <- add_header(x=ftS2, Bandeira = "Bandeira",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftS2 <- add_header(x=ftS2,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftS2 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios do DIESEL S500 por BANDEIRA no Sul")

Preços médios do DIESEL S500 por BANDEIRA no Sul
	Novembro/2021	Março/2022	Junho/2022
BRANCA	5.1683	0.1717	6.1333	0.5008	6.9350	0.4157
IPIRANGA	5.2464	0.2283	6.1599	0.5270	7.0985	0.4328
OUTRAS	5.2041	0.1814	6.0752	0.4797	7.0657	0.4166
RAIZEN	5.2536	0.1905	6.1651	0.4936	7.0440	0.4205
VIBRA ENERGIA	5.3006	0.2107	6.1587	0.4789	7.0937	0.4309

ft531BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft531OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft531OBP$Bandeira <- "OUTRAS"

ft531BP <- bind_rows(ft531BP, ft531OBP)

ft531 <- ft531BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft531BP, 
        main="Boxplot de preços de G.C por bandeira - Sul (Nov/21)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft532BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft532OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft532OBP$Bandeira <- "OUTRAS"

ft532BP <- bind_rows(ft532BP, ft532OBP)

ft532 <- ft532BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft532BP, 
        main="Boxplot de preços de G.C por bandeira - Sul (Mar/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft533BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft533OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft533OBP$Bandeira <- "OUTRAS"

ft533BP <- bind_rows(ft533BP, ft533OBP)

ft533 <- ft533BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft533BP, 
        main="Boxplot de preços de G.C por bandeira - Sul (Jun/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftS3 <- ft531 %>% 
  left_join(ft532, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft533, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftS3 <- delete_part(ftS3, part = "header")
ftS3 <- add_header(x=ftS3, Bandeira = "Bandeira",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftS3 <- add_header(x=ftS3,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftS3 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios da GASOLINA COMUM por BANDEIRA no Sul")

Preços médios da GASOLINA COMUM por BANDEIRA no Sul
	Novembro/2021	Março/2022	Junho/2022
BRANCA	6.6994	0.3044	6.8084	0.3804	6.9930	0.3230
IPIRANGA	6.8060	0.3508	6.8745	0.4192	7.0985	0.3374
OUTRAS	6.7010	0.2955	6.8565	0.3567	7.0808	0.2783
RAIZEN	6.8405	0.3309	6.8550	0.4060	7.0835	0.3125
VIBRA ENERGIA	6.8319	0.3419	6.8823	0.4055	7.0954	0.3328

ft541BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft541OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` <= "2022-01-01" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft541OBP$Bandeira <- "OUTRAS"

ft541BP <- bind_rows(ft541BP, ft541OBP)

ft541 <- ft541BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft541BP, 
        main="Boxplot de preços de G.A por bandeira - Sul (Nov/21)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft542BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA ADITIVADA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft542OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA ADITIVADA' 
         & (`Data da Coleta` > "2022-02-28" &
              `Data da Coleta` < "2022-04-01") &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft542OBP$Bandeira <- "OUTRAS"

ft542BP <- bind_rows(ft542BP, ft542OBP)

ft542 <- ft542BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft542BP, 
        main="Boxplot de preços de G.A por bandeira - Sul (Mar/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ft543BP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira == 'BRANCA' |
              Bandeira == 'IPIRANGA' | Bandeira == 'RAIZEN' |
              Bandeira == 'VIBRA ENERGIA') ) %>%
  select(Bandeira,`Valor de Venda`) 

ft543OBP <- DB_Comb %>% 
  filter(`Regiao - Sigla` == 'S' & Produto == 'GASOLINA ADITIVADA' 
         & `Data da Coleta` > "2022-05-30" &
           (Bandeira != 'BRANCA' &
              Bandeira != 'IPIRANGA' & Bandeira != 'RAIZEN' &
              Bandeira != 'VIBRA ENERGIA')) %>%
  select(Bandeira,`Valor de Venda`) 

ft543OBP$Bandeira <- "OUTRAS"

ft543BP <- bind_rows(ft543BP, ft543OBP)

ft543 <- ft543BP %>% 
  group_by(Bandeira) %>%
  summarise(preco_med=round(mean(`Valor de Venda`, na.rm = TRUE),4),
            desv_pad=round(sd(`Valor de Venda`, na.rm = TRUE),4)) %>%
  data.frame() 

boxplot(`Valor de Venda`~Bandeira,data=ft543BP, 
        main="Boxplot de preços de G.A por bandeira - Sul (Jun/22)",
        ylim = c(5,9), ylab = "Preço", col=cor_dark,
        cex.axis = 0.7)

ftS4 <- ft541 %>% 
  left_join(ft542, by = c("Bandeira" = "Bandeira")) %>%
  left_join(ft543, by = c("Bandeira" = "Bandeira")) %>%
  flextable()

ftS4 <- delete_part(ftS4, part = "header")
ftS4 <- add_header(x=ftS4, Bandeira = "Bandeira",
                   preco_med.x="Preço", desv_pad.x="DP",
                   preco_med.y="Preço", desv_pad.y="DP",
                   preco_med="Preço", desv_pad="DP",
                   top = FALSE) 

ftS4 <- add_header(x=ftS4,
                   preco_med.x="Novembro/2021", desv_pad.x="Novembro/2021",
                   preco_med.y="Março/2022", desv_pad.y="Março/2022",
                   preco_med="Junho/2022", desv_pad="Junho/2022",
                   top = TRUE) 
ftS4 %>% 
  autofit() %>%
  theme_booktabs(bold_header = TRUE) %>%
  merge_h(part = "header") %>%
  align(align = "center", part = "all") %>% 
  merge_v(j = 1) %>% 
  valign(j = 1, valign = "top") %>% 
  set_caption(caption = "Preços médios da GASOLINA ADITIVADA por BANDEIRA no Sul")

	Novembro/2021		Março/2022		Junho/2022
Bandeira	Preço	DP	Preço	DP	Preço	DP
BRANCA	6.8005	0.3080	6.8546	0.4072	7.0339	0.3498
IPIRANGA	6.9676	0.3453	7.0355	0.4215	7.2571	0.3354
OUTRAS	6.7990	0.3175	6.9599	0.3621	7.1692	0.2888
RAIZEN	7.0293	0.3125	7.0195	0.4219	7.2494	0.3198
VIBRA ENERGIA	6.9847	0.3426	7.0259	0.4101	7.2416	0.3343

Relatório Final

26/01/2023

1. INTRODUÇÃO

2. OBJETIVO

2.1. Objetivos específicos

3. MERCADO BRASILEIRO DE COMBUSTÍVEL

3.1. Cenário contemporâneo

3.2. Reposicionamento da Petrobras

3.4. Influência do conflito Rússia x Ucrânia

4. ABORDAGEM ESTATÍSTICA

5. METODOLOGIA

5.1. Descrição das Bases de Dados

5.2. Descrição das etapas de análise

6. RESULTADOS

6.1. Análise dos preços por região

6.2. Análise dos preços no Brasil por bandeiras

6.3. Análise dos preços por estado

6.4. Análise de correlação

7. DISCUSSÃO

8. CONCLUSÃO

9. REFERÊNCIAS

ANEXO

Preços nas regiões brasileiras por bandeiras

Relatório Final

26/01/2023

1. INTRODUÇÃO

2. OBJETIVO

2.1. Objetivos específicos

3. MERCADO BRASILEIRO DE COMBUSTÍVEL

3.1. Cenário contemporâneo

3.2. Reposicionamento da Petrobras

3.3. Função social da Petrobras

3.4. Influência do conflito Rússia x Ucrânia

4. ABORDAGEM ESTATÍSTICA

5. METODOLOGIA

5.1. Descrição das Bases de Dados

5.2. Descrição das etapas de análise

6. RESULTADOS

6.1. Análise dos preços por região

6.2. Análise dos preços no Brasil por bandeiras

6.3. Análise dos preços por estado

6.4. Análise de correlação

7. DISCUSSÃO

8. CONCLUSÃO

9. REFERÊNCIAS

ANEXO

Preços nas regiões brasileiras por bandeiras