Evolução do preço do aço por Kg no Brasil no ano de 2015

knitr::opts_chunk$set(echo = TRUE)
options(digits=4)

1. Introdução

O Brasil é um país que se destaca pelo grande volume de obras, que inclui variados projetos e modelos construtivos, com diferentes características. A maioria das construções seguem como padrão projetos de estrutura de concreto armado, com a utilização do aço nas mesmas. Por questões climáticas e culturais, o Brasil ainda não investe muito em edificações de madeira, steel frame ou placas cimentícias, como ocorre nos Estados Unidos, na maioria dos países europeus e em alguns países asiáticos. No Brasil, a grande maioria das obras faz uso do aço em larga escala para compor as estruturas de concreto armado, o que torna esse material essencial para edificações dessa natureza e,muitas vezes, oneroso para a maioria da população.

Considerando que,o ano de 2015 pode ser encarado, por muitos órgão públicos, como o início da crise financeira recente que vem se acentuando sobre o país nos últimos anos, o presente trabalho busca analisar dentro de parâmetros estatísticos como se deu a variação do preço do aço do tipo CA-50, de 10 mm de diâmetro, nos estados durante esse período.

A Câmara Brasileira da Indústria da Construção (CBIC) é uma entidade que tem como objetivo analisar as mais diversas questões que envolvem o mercado da construção civil, como: variação do preço dos insumos, variação de consumo dos principais materiais utilizados nas obras, estudo do grau de aceitação de novos materiais, entre outros, além de, frequentemente, divulgar boletins de dados estatísticos e financeiros inerentes aos parâmetros desse setor tão importante para a sociedade, que é a construção civil.

Utilizou-se,também, neste trabalho, dados do Instituto Brasileiro de Geografia e Estatística (IBGE), do ano de 2015, sendo esse, atualmente, o principal órgão responsável por coletar, manipular e divulgar informações relevantes de cunho social para a população, como: renda capita da população, dados sobre educação, saúde, índice de desenvolvimento humano (IDH) dos estados, entre outros.

De acordo com o Atlas do Desenvolvimento Humano no Brasil (2020), as faixas do IDH são as seguintes:

MUITO ALTO: 0,800 - 1,000
ALTO: 0,700 - 0,799
MÉDIO: 0,600 - 0,699
BAIXO: 0,500 - 0,599
MUITO BAIXO: 0,000 - 0,499

2. Objetivos Gerais

O presente trabalho tem como objetivo principal apresentar a evolução e analisar estatisticamente a variação do preço do aço, do tipo CA-50 - 10 mm de diâmetro, por Kg ,mensalmente, em todos o estados do país, ao longo do ano de 2015, relacionando variáveis importantes, como: renda média da população e IDH de cada estado.
Relacionando essas variáveis com o preço do aço em cada estado é possível avaliar os impactos que esses dados podem causar na indústria da contrução civil em todo o país.

2.1 Objetivos Específicos

Verificar através de testes estatísticos,de gráficos e de mapas como as variáveis qualitativas e quantitativas podem se relacionar entre si e qual é o resultado dessa análise no que concerne à evolução e a variação do preço do aço tipo CA-50 por Kg no Brasil ao longo do ano de 2015 em cada estado da federação. Informar através de gráficos e mapas as possíveis variações no preço desse insumo ao longo do ano de 2015 e como as alterações de preço desse produto tão importante pode sofrer influência direta de outros parâmetros sociais importantes, como IDH e renda média per capita dos cidadãos.

3. Metodologia

O banco de dados desse trabalho se refere à evolução do preço do aço tipo CA-50, de 10 mm de diâmetro, no Brasil, durante todo o ano de 2015.

O presente trabalho se divide nas seguintes etapas:

Etapa 1 - Importação da base de dados referente à evolução do preço do aço CA-50 nos estados no ano de 2015, de acordo com o site da CBIC;

Etapa 2 - Manipulação e análise estatística das principais variáveis do banco de dados;

Etapa 3 - Teste de Hipóteses Estatísticas e suas interpretações no que tange à variação do preço desse insumo;

Etapa 4 - Avaliação dos Resultados através de Gráficos do tipo Boxplot, juntamente com suas interpretações;

Etapa 5 - Matriz de Correlação para as principais variáveis e suas interpretações;

Etapa 6 - Mapas nacionais da evolução do preço do aço no referido ano juntamente com outros mapas de outras variáveis importantes nesse trabalho, como IDH e Renda Média da população, incluindo suas interpretações.

No decorrer das etapas citadas acima, optou-se, nesse trabalho, pela construção de alguns gráficos do tipo Boxplot, matrizes de correlação de variáveis, testes de hipóteses e mapas inerentes à evolução do preço do aço no Brasil no ano de 2015.

Foram realizados diversos testes de hipóteses para as variáveis quantitativas e qualitativas presentes no banco de dados desse trabalho.Através desses testes foi possível avaliar critérios, como a normalidade, a correlação e a dependência entre variáveis.

Foram construídos cinco gráficos do tipo Boxplot para as seguintes variáveis do banco de dados:

REGIÃO e RENDA MÉDIA;
REGIÃO e PREÇO MÉDIO;
JAN e REGIÃO;
JUL e REGIÃO;
DEZ e REGIÃO;

Em seguida, visando analisar o comportamento do preço do aço em três períodos distintos do ano de 2015 atrelado aos fatores de cunho social dos estados brasileiros, como a renda média da população, foram construídos três matrizes de correlação, para as seguintes variáveis do banco de dados:

PREÇO MÉDIO,RENDA MÉDIA e JAN;
PREÇO MÉDIO, RENDA MÉDIA e JUL;
PREÇO MÉDIO,RENDA MÉDIA e DEZ;

Em seguida, visando detalhar a análise das variações do preço do aço nas diferentes regiões do Brasil, foram construídos seis mapas da seguinte forma:

Mapa do Brasil por regiões;
Mapa do Brasil por IDH;
Mapa do Brasil por Renda Média dos estados;
Mapa do Brasil inerente ao preço do aço em janeiro de 2015;
Mapa do Brasil inerente ao preço do aço em julho de 2015;
Mapa do Brasil inerente ao preço do aço em dezembro de 2015.

A tabela abaixo apresenta a base de dados do CBIC utilizada nessa pesquisa.

# Biblioteca para incluir o banco de dados na forma de tabela: 

library(kableExtra) 

# Base de dados utilizada no trabalho:

library(readxl)
dados <- read_excel("relatorio final/dados.xlsx")

# Apresentando os números sem notação científica:

options(scipen = 999)

# Realizando a manipulação da tabela da base de dados: 

 kable(dados, row.names = FALSE)%>%
  kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
                 position = "center", fixed_thead = T) %>%
  scroll_box(width = "900px", height = "600px")

LOCALIDADE	ESTADO	CODIGO	REGIAO	COD REGIAO	JAN	FEV	MAR	ABR	MAI	JUN	JUL	AGO	SET	OUT	NOV	DEZ	PRECO MEDIO	RENDA MEDIA	IDH
ALAGOAS	AL	27	Nordeste	NE	1.00	0.96	0.85	0.78	0.74	0.80	0.79	0.90	0.91	0.87	0.90	0.95	0.87	714	0.683
BAHIA	BA	29	Nordeste	NE	1.05	0.98	0.87	0.80	0.75	0.73	0.73	0.71	0.85	0.84	0.96	1.07	0.86	841	0.714
CEARA	CE	23	Nordeste	NE	0.84	0.82	0.73	0.67	0.63	0.69	0.68	0.82	0.84	0.86	0.96	1.01	0.79	855	0.735
MARANHAO	MA	21	Nordeste	NE	0.92	0.88	0.75	0.72	0.68	0.75	0.75	0.72	0.77	0.74	0.77	0.85	0.77	605	0.687
PARAIBA	PB	25	Nordeste	NE	0.79	0.76	0.67	0.62	0.58	0.63	0.62	0.60	0.61	0.79	1.07	1.12	0.74	898	0.722
PERNAMBUCO	PE	26	Nordeste	NE	0.98	0.93	0.86	0.79	0.75	0.80	0.87	0.97	1.00	1.06	1.16	1.40	0.96	871	0.727
SERGIPE	SE	28	Nordeste	NE	1.03	0.99	0.84	0.81	0.76	0.82	0.81	0.79	0.82	0.82	0.86	0.90	0.85	906	0.702
RIO GRANDE DO NORTE	RN	24	Nordeste	NE	1.08	1.02	0.91	0.88	0.87	0.83	0.77	0.82	0.98	1.02	0.88	0.96	0.92	956	0.731
PIAUI	PI	22	Nordeste	NE	1.02	0.98	0.97	0.93	0.98	0.84	0.79	0.83	0.88	0.92	0.91	0.93	0.91	817	0.697
ESPIRTO SANTO	ES	32	Sudeste	SE	0.91	0.87	0.79	0.72	0.68	0.85	0.71	0.71	0.74	0.73	0.77	0.91	0.78	1295	0.772
MINAS GERAIS	MG	31	Sudeste	SE	0.92	0.88	0.78	0.71	0.67	0.86	0.70	0.78	0.84	0.89	0.95	1.09	0.84	1322	0.787
RIO DE JANEIRO	RJ	33	Sudeste	SE	1.06	1.01	0.90	0.82	0.78	0.87	0.83	0.81	0.86	0.87	0.99	1.14	0.91	1689	0.796
SAO PAULO	SP	35	Sudeste	SE	1.04	0.97	0.88	0.81	0.75	0.88	0.81	0.81	0.87	0.88	0.97	1.04	0.89	1898	0.826
AMAZONAS	AM	13	Norte	N	1.13	1.08	0.85	0.80	0.75	0.89	0.79	0.83	1.02	0.96	1.39	1.52	1.00	791	0.733
RONDONIA	RO	11	Norte	N	1.29	1.23	1.10	1.00	0.93	0.90	1.04	1.22	1.34	1.38	1.58	1.84	1.24	1113	0.725
PARA	PA	15	Norte	N	1.11	1.07	0.96	0.89	0.83	0.91	0.90	0.88	0.89	1.06	1.31	1.49	1.02	863	0.698
ACRE	AC	12	Norte	N	1.07	1.07	1.08	1.09	0.84	0.92	0.72	0.74	0.91	0.81	0.86	0.92	0.92	909	0.719
RORAIMA	RR	14	Norte	N	1.06	1.08	1.09	1.10	0.86	0.93	0.78	0.75	0.78	0.88	0.94	1.17	0.95	1204	0.752
AMAPA	AP	16	Norte	N	1.09	1.07	1.15	1.12	0.67	0.94	0.82	1.14	1.19	1.24	0.99	1.16	1.05	857	0.741
TOCANTINS	TO	17	Norte	N	1.12	1.14	1.13	1.14	0.81	0.95	0.80	1.12	1.32	1.36	1.43	1.41	1.14	1045	0.743
DISTRITO FEDERAL	DF	53	Centro-Oeste	MW	0.85	0.82	0.74	0.66	0.62	0.96	0.67	0.68	0.79	0.88	0.86	0.89	0.78	2460	0.851
GOIAS	GO	52	Centro-Oeste	MW	0.89	0.86	0.77	0.70	0.65	0.97	0.69	0.69	0.70	0.68	0.73	0.77	0.76	1323	0.769
MATO GROSSO DO SUL	MS	50	Centro-Oeste	MW	0.99	0.99	0.88	0.83	0.78	0.98	0.85	0.85	0.90	0.89	0.96	1.02	0.99	1439	0.766
MATO GROSSO	MT	51	Centro-Oeste	MW	1.02	0.94	0.83	0.77	0.73	0.99	0.78	0.77	0.83	1.16	1.26	1.33	0.95	1386	0.774
PARANA	PR	41	Sul	S	0.91	0.87	0.78	0.73	0.70	1.00	0.74	0.76	0.86	0.93	1.05	1.24	0.88	1607	0.792
RIO GRANDE DO SUL	RS	43	Sul	S	1.11	1.11	1.00	0.94	0.85	1.01	0.91	0.97	1.07	1.27	1.37	1.51	1.09	1705	0.787
SANTA CATARINA	SC	42	Sul	S	1.19	1.13	1.01	0.92	0.87	1.02	0.93	0.91	0.95	0.93	0.99	1.05	1.01	1660	0.808

3.1 Dicionário de dados

A tabela abaixo constitui o dicionário de dados, em que constam as variáveis e uma breve explicação sobre as mesmas.

Abaixo está apresentado o dicionário de dados, local onde estão todas as variáveis do banco de dados.

# Base de dados em que está o dicionário de dados:

library(readxl)
dicio <- read_excel("C:/Users/User/Desktop/relatorio final/dados.xlsx")

# Execução e manipulação da tabela:

library(DT)

DT::datatable(dicio, rownames = FALSE, colnames = FALSE)

Nesse artigo foram utilizadas as seguintes variáveis:

LOCALIDADE: São os estados que compõem a República Federativa do Brasil;
ESTADO: São as siglas de cada estado do país;
CÓDIGO: É o código numérico que representa cada estado do país;
REGIÃO: Trata-se das subdivisões das regiões do país;
COD REGIÃO: Trata-se de um código de uma ou duas letras para cada região do país;
IDH: Trata-se do Índice de Desenvolvimento Humano dos estados no ano de 2015;
RENDA MÉDIA: Trata-se da renda média dos habitantes em cada estado no ano de 2015;
JAN: Trata-se do preço do aço por Kg praticado em cada estado no mês de janeiro, ao longo do ano de 2015;
FEV: Trata-se do preço do aço por Kg praticado em cada estado no mês de fevereiro, ao longo do ano de 2015;
MAR: Trata-se do preço do aço por Kg praticado em cada estado no mês de março, ao longo do ano de 2015;
ABR: Trata-se do preço do aço por Kg praticado em cada estado no mês de abril, ao longo do ano de 2015;
MAI: Trata-se do preço do aço por Kg praticado em cada estado no mês de maio, ao longo do ano de 2015;
JUN: Trata-se do preço do aço por Kg praticado em cada estado no mês de junho, ao longo do ano de 2015;
JUL: Trata-se do preço do aço por Kg praticado em cada estado no mês de julho, ao longo do ano de 2015;
AGO: Trata-se do preço do aço por Kg praticado em cada estado no mês de agosto, ao longo do ano de 2015;
SET: Trata-se do preço do aço por Kg praticado em cada estado no mês de setembro, ao longo do ano de 2015;
OUT: Trata-se do preço do aço por Kg praticado em cada estado no mês de outubro, ao longo do ano de 2015;
NOV: Trata-se do preço do aço por Kg praticado em cada estado no mês de novembro, ao longo do ano de 2015;
DEZ: Trata-se do preço do aço por Kg praticado em cada estado no mês de dezembro, ao longo do ano de 2015;
PREÇO MÉDIO: Trata-se do preço médio do aço por Kg em cada estado, ao longo do ano de 2015.

Vale ressaltar que, em estatística, algumas variáveis são classificadas como qualitativas ou categóricas e outras como quantitativas.

As variáveis qualitativas nesse trabalho são: LOCALIDADE;ESTADO;REGIÃO e COD REGIÃO. As variáveis quantitativas desse trabalho são: IDH;RENDA MÉDIA;JAN;FEV; MAR;ABR;MAI;JUN;JUL;AGO;SET;OUT;NOV;DEZ e PREÇO MÉDIO.

Através dessas variáveis foi possível gerar gráficos diversos,executar testes de hipóteses, construir mapas, além de ser possível analisar dados estatísticos relevantes para a melhor compreensão dos principais impactos que a variação no preço do aço do tipo CA-50 - 10 mm de diâmetro pode provocar na economia dos estados e no desenvolvimento das obras de concreto armado em todo o Brasil.

4.Testes de Hipóteses

4.1 Testes de Hipóteses para a verificação da normalidade de uma variável

Teste de Shapiro-Wilk.

4.2 Testes de Hipóteses realizados para as variáveis que não apresentam distribuição normal

Teste da Correlação de Spearman;
Teste de Kruskal-Wallis;
Teste de Comparações Múltiplas de Wilcoxon.

4.3 Testes de Hipóteses para a variável que apresentam distribuição normal

Teste de Bartlett;
Teste Anova;

5. Execução dos Testes de Hipóteses

5.1 Teste de Shapiro-Wilk

O objetivo deste teste é fornecer uma estatística para avaliar se uma amostra tem distribuição normal. O teste pode ser utilizado para amostras de qualquer tamanho. A avaliação do pressuposto de normalidade é exigida pela maioria dos procedimentos estatísticos

5.1.1 Teste de Shapiro-wilk para as variáveis meses do ano

O Teste de Shapiro, utilizado,para variáveis quantitativas, será executado para as seguintes variáveis do banco de dados desse trabalho:

JAN;MAR;ABR;JUN;JUL;SET;OUT;DEZ

Nesse trabalhou, optou-se por realizar o referido teste para avaliar os resultados de forma que se considere os meses iniciais e finais de cada trimestre:

Primeiro Trimestre: JAN e MAR
Segundo Trimestre: ABR e JUN
Terceiro Trimetre: JUL e SET
Quarto Trimestre: OUT e DEZ

## Teste de normalidade (Shapiro Wilk)

# H0: os dados apresentam distribuição normal
# H1: os dados não apresentam distribuição normal
# alpha = 0.05

## Manipulação de variáveis

dados$JAN<-as.numeric(sub(",", ".", dados$JAN))
dados$MAR<-as.numeric(sub(",", ".", dados$MAR))
dados$ABR<-as.numeric(sub(",", ".", dados$ABR)) 
dados$JUN<-as.numeric(sub(",", ".", dados$JUN))
dados$JUL<-as.numeric(sub(",", ".", dados$JUL))
dados$SET<-as.numeric(sub(",", ".", dados$SET))
dados$OUT<-as.numeric(sub(",", ".", dados$OUT))
dados$DEZ<-as.numeric(sub(",", ".", dados$DEZ))
dados$`RENDA MEDIA`<-as.numeric(sub(",", ".", dados$`RENDA MEDIA`))
dados$`PRECO MEDIO`<-as.numeric(sub(",", ".", dados$`PRECO MEDIO`))

## Aplicando o Teste de Shapiro

# Meses iniciais e finais do primeiro trimestre

shapiro.test(dados$JAN)


    Shapiro-Wilk normality test

data:  dados$JAN
W = 0.98, p-value = 0.8

shapiro.test(dados$MAR)


    Shapiro-Wilk normality test

data:  dados$MAR
W = 0.95, p-value = 0.2

# Meses iniciais e finais do segundo trimestre 

shapiro.test(dados$ABR)


    Shapiro-Wilk normality test

data:  dados$ABR
W = 0.93, p-value = 0.06

shapiro.test(dados$JUN)


    Shapiro-Wilk normality test

data:  dados$JUN
W = 0.96, p-value = 0.3

# Meses iniciais e finais do terceiro trimestre

shapiro.test(dados$JUL)


    Shapiro-Wilk normality test

data:  dados$JUL
W = 0.97, p-value = 0.6

shapiro.test(dados$SET)


    Shapiro-Wilk normality test

data:  dados$SET
W = 0.9, p-value = 0.01

# Meses iniciais e finais do quarto trimestre 

shapiro.test(dados$OUT)


    Shapiro-Wilk normality test

data:  dados$OUT
W = 0.89, p-value = 0.009

shapiro.test(dados$DEZ)


    Shapiro-Wilk normality test

data:  dados$DEZ
W = 0.92, p-value = 0.04

## Conclusão

# Os meses de *JAN*,*MAR*,*ABR*,*JUN* E *JUL* apresentam pvalor > 0.05, logo não rejeita-se H0,podendo-se concluir que os dados seguem uma distribuição normal.  

# Os meses de *SET*,*OUT* E *DEZ* apresentam pvalor < 0.05, logo rejeita-se H0, podendo-se concluir que os dados não seguem uma distribuição normal.

5.1.2 Realização do Teste de Shapiro para outras variáveis

Realizou-se também, o Teste de Shapiro, para outras variáveis quantitativas do banco de dados, visando verificar a normalidade das variáveis.

Foram realizados testes de normalidade para as seguintes variáveis:

RENDA MÉDIA e PREÇO MÉDIO.

## Teste de normalidade (Shapiro Wilk)

#H0: os dados seguem uma distribuição normal
#H1: os dados NÃO seguem uma distribuição normal
#alpha = 0.05

## Manipulação de variáveis

dados$`RENDA MEDIA`<-as.numeric(sub(",", ".", dados$`RENDA MEDIA`))
dados$`PRECO MEDIO`<-as.numeric(sub(",", ".", dados$`PRECO MEDIO`))

## Aplicando o Teste de Shapiro para outras variáveis quantitativas:

shapiro.test(dados$`RENDA MEDIA`)


    Shapiro-Wilk normality test

data:  dados$`RENDA MEDIA`
W = 0.9, p-value = 0.01

shapiro.test(dados$`PRECO MEDIO`)


    Shapiro-Wilk normality test

data:  dados$`PRECO MEDIO`
W = 0.96, p-value = 0.4

# Conclusão

## A variável *Renda Média* apresentou pvalor < 0.05, logo rejeita-se H0,podendo-se concluir que os dados não seguem uma distribuição normal. 

## A variável *Preço Médio* apresentou pvalor > 0.05, logo não se rejeita HO, podendo-se concluir que os dados seguem uma distribuição normal.

Conclusão

As variáveis que não apresentaram distribuição normal foram SET,OUT,DEZ e Renda Média. Já as variáveis JAN,MAR,ABR,JUN,JUL e Preço Médio apresentaram distribuição normal.

5.2 Testes de Hipóteses para as variáveis que não apresentaram distribuição normal

5.2.1 Teste de Spearman

Esse teste deve ser realizado para as variáveis que não apresentam distribuição normal.Ao realizar esse teste é possível verificar a existência de correlação entre as variáveis. Foi executado o Teste de Spearman para as variáveis que não apresentam distribuição normal, tanto para aquelas que correspondem aos meses do ano, como aquelas que estão relacionadas com a evolução do preço do aço,como a renda média.

5.2.1.1 Teste de Spearman para as variáveis meses do ano

Executando o referido teste para as variáveis correspondentes aos meses do ano que não apresentaram distribuição normal, como:

SET,OUT E DEZ

## Teste da correlação de Spearman

#H0(Hipótese nula): se o valor de rho = 0: não há correlação entre as variáveis. 
#H1(Hipótese alternativa): se o valor de rho for diferente de zero: há correlação entre as variáveis.
#alpha = 0,05

#Se Pvalor ≤ alpha: rejeita-se H0
#Se Pvalor > alpha: não se rejeita H0

# Aplicando Spearman para Outubro e Dezembro

cor.test(dados$OUT,dados$DEZ,method = "spearman")

## Warning in cor.test.default(dados$OUT, dados$DEZ, method = "spearman"): Cannot
## compute exact p-value with ties

## 
##  Spearman's rank correlation rho
## 
## data:  dados$OUT and dados$DEZ
## S = 747, p-value = 0.000002
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##   rho 
## 0.772

# Aplicando Spearman para Setembro e Outubro

cor.test(dados$SET,dados$OUT,method = "spearman")

## Warning in cor.test.default(dados$SET, dados$OUT, method = "spearman"): Cannot
## compute exact p-value with ties

## 
##  Spearman's rank correlation rho
## 
## data:  dados$SET and dados$OUT
## S = 732, p-value = 0.000002
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##    rho 
## 0.7766

# Conclusão:

## Não foi possível chegar a nenhuma conclusão ao testar as variáveis acima, uma vez que, dentro do banco de dados, essas variáveis podem ter valores iguais ou empatados.

Conclusão

Portanto, não foi possível chegar a nenhuma conclusão ao realizar esse teste, pois existem valores iguais ou empatados no banco de dados para as variáveis supracitadas.

5.2.1.2 Teste de Spearman para outras variáveis

Executando o teste para a variável Renda Média, uma vez que essa variável não apresentou distribuição normal.

## Teste da correlação de Spearman

#H0(Hipótese nula): se o valor de rho = 0: não há correlação entre as variáveis. 
#H1(Hipótese alternativa): se o valor de rho for diferente de zero: há correlação entre as variáveis.
#alpha = 0,05

#Se Pvalor ≤ alpha: rejeita-se H0
#Se Pvalor > alpha: não se rejeita H0

# Aplicando Spearman para as variáveis *RENDA MÉDIA* e *DEZ*

cor.test(dados$DEZ,dados$`RENDA MEDIA`,method = "spearman")

## 
##  Spearman's rank correlation rho
## 
## data:  dados$DEZ and dados$`RENDA MEDIA`
## S = 3092, p-value = 0.8
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##     rho 
## 0.05617

# Aplicando Spearman para as variáveis *RENDA MÉDIA* e *SET*

cor.test(dados$SET,dados$`RENDA MEDIA`,method = "spearman")

## Warning in cor.test.default(dados$SET, dados$`RENDA MEDIA`, method =
## "spearman"): Cannot compute exact p-value with ties

## 
##  Spearman's rank correlation rho
## 
## data:  dados$SET and dados$`RENDA MEDIA`
## S = 3556, p-value = 0.7
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##      rho 
## -0.08551

# Aplicando Spearman para as variáveis *RENDA MÉDIA* e *OUT*

cor.test(dados$OUT,dados$`RENDA MEDIA`,method = "spearman")

## Warning in cor.test.default(dados$OUT, dados$`RENDA MEDIA`, method =
## "spearman"): Cannot compute exact p-value with ties

## 
##  Spearman's rank correlation rho
## 
## data:  dados$OUT and dados$`RENDA MEDIA`
## S = 2856, p-value = 0.5
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##    rho 
## 0.1281

# Conclusão

## Para as variáveis *RENDA MÉDIA* e *SET* e *RENDA MÉDIA* e *OUT* não foi possível chegar a nenhuma conclusão ao testar as variáveis acima, uma vez que, dentro do banco de dados, essas variáveis podem ter valores iguais ou empatados.  
## Já para as variáveis *RENDA MÉDIA* e *DEZ*,Pvalor > alpha, logo não se rejeita H0, podendo-se concluir que há correlação entre as variáveis.

Conclusão

Portanto, não foi possível chegar a nenhuma conclusão ao realizar esse teste, pois existem valores iguais ou empatados no banco de dados para as variáveis RENDA MÉDIA e SET e RENDA MÉDIA e OUT.

Já para as variáveis RENDA MÉDIA e DEZ,Pvalor > alpha, logo não se rejeita H0, podendo-se concluir que há correlação entre as variáveis.Entende-se, portanto, que a renda média dos estados tem correlação com a variação do preço do aço em dezembro, ou seja, o preço varia conforme a renda dos estados.

5.2.2 Teste de Kruskal-Wallis

Esse teste é realizado para variáveis que não apresentam distribuição normal.

Após a verificação do pressuposto de normalidade, executou-se o teste para os dados que não seguem uma distribuição normal.

Com a realização desse teste pode-se verificar se a variável REGIÃO interfere na evolução do preço do aço ao longo do ano de 2015.

5.2.2.1 Teste de Kruskal-Wallis para as variáveis meses do ano

Realização do Teste de Kruskal-Wallis para as variáveis meses do ano que não apresentam distribuição normal:

SET,OUT E DEZ

# Teste de Kruskal-Wallis

# Hipoteses do Teste 

#H0: os grupos analisados possuem distribuições idênticas.
#H1: os grupos analisados possuem diferentes distribuições.
#alpha = 0,05
# Se Pvalor <= alpha: rej h0
# Se Pvalor > alpha: não rej h0

# Bibliotecas necessárias para o Teste

library(dplyr)

## 
## Attaching package: 'dplyr'

## The following object is masked from 'package:kableExtra':
## 
##     group_rows

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(rstatix)

## 
## Attaching package: 'rstatix'

## The following object is masked from 'package:stats':
## 
##     filter

# Realização do Teste de Kruskal-Wallis

## Testando se a variável *REGIÃO* interfere na evolução do preço do aço ao longo do ano de 2015 para o mês de setembro

kruskal.test(dados$SET~dados$REGIAO)

## 
##  Kruskal-Wallis rank sum test
## 
## data:  dados$SET by dados$REGIAO
## Kruskal-Wallis chi-squared = 9, df = 4, p-value = 0.06

## Testando se a variável *REGIÃO* interfere na evolução do preço do aço ao longo do ano de 2015 para o mês de outubro

kruskal.test(dados$OUT~dados$REGIAO)

## 
##  Kruskal-Wallis rank sum test
## 
## data:  dados$OUT by dados$REGIAO
## Kruskal-Wallis chi-squared = 7.9, df = 4, p-value = 0.1

## Testando se a variável *REGIÃO* interfere na evolução do preço do aço ao longo do ano de 2015 para o mês de dezembro

kruskal.test(dados$DEZ~dados$REGIAO)

## 
##  Kruskal-Wallis rank sum test
## 
## data:  dados$DEZ by dados$REGIAO
## Kruskal-Wallis chi-squared = 9.8, df = 4, p-value = 0.04

## Conclusão

# O mês de *DEZ* apresentou Pvalor ≤ alpha, logo rejeita-se H0, podendo-se concluir que os grupos analisados possuem distribuições distintas.  

# Os meses de *SET* e *OUT* apresentaram Pvalor ≥ alpha, logo não se rejeita H0, podendo-se concluir que os grupos analisados possuem distribuições idênticas, ou seja, pode ter havido repetição de valores do preço do aço nesses meses.

Conclusão

Portanto, fica comprovado que, de fato, a variável REGIÃO é relevante, ou seja, interfere diretamente na variação do preço do aço em diferentes estados ao longo do ano, uma vez que em alguns meses, como setembro e outubro, pode haver preços idênticos do insumo em regiões distintas. Pode-se reparar, também, que no mês de dezembro, os grupos analisados possuem distribuições distintas, ou seja, os preços do aço foram diferentes durante esse mês em diferente regiões.

5.2.2.2 Teste de Kruskal-Wallis para outras variáveis

Executando o teste para a variável Renda Média, uma vez que essa variável não apresentou distribuição normal.

# Teste de Kruskal-Wallis

# Hipoteses do Teste 

#H0: os grupos analisados possuem distribuições idênticas.
#H1: os grupos analisados possuem diferentes distribuições.
#alpha = 0,05
# Se Pvalor <= alpha: rej h0
# Se Pvalor > alpha: não rej h0

# Bibliotecas necessárias para o Teste

library(dplyr)
library(rstatix)

# Realização do Teste de Kruskal-Wallis

## Testando se a variável *REGIÃO* interfere na variável *RENDA MÉDIA*:

kruskal.test(dados$`RENDA MEDIA`~dados$REGIAO)

## 
##  Kruskal-Wallis rank sum test
## 
## data:  dados$`RENDA MEDIA` by dados$REGIAO
## Kruskal-Wallis chi-squared = 20, df = 4, p-value = 0.0005

## Conclusão

# A variável *RENDA MÉDIA* apresentou Pvalor ≤ alpha, logo rejeita-se H0, podendo-se concluir que os grupos analisados possuem distribuições distintas.

Conclusão

Portanto, conclui-se que, de fato, a variável REGIÃO interfere na variável RENDA MÉDIA, uma vez que existem diferentes valores de renda média para regiões distintas, de acordo com o banco de dados desse trabalho.

5.2.3 Teste de Comparações Múltiplas de Wilcoxon

Esse Teste deve ser utilizado para os dados que não apresentam distribuição normal e tem como objetivo comparar grupos que são dependentes, ou seja, grupos relacionados.

Para verificar possíveis grupos dependentes, vamos analisar se a variável qualitativa REGIÃO interfere nas variáveis quantitativas SET, OUT, DEZ e RENDA MÉDIA, uma vez que essas não apresentam distribuição normal.

# Teste de Wilcoxon

# Como pvalor < 0.05, rejeito H0
# Os grupos são amostrados de populações com diferentes distribuições.

# Hipótese nula: os dois grupos são amostrados de populações com distribuições idênticas.
# Hipótese alternativa: os dois grupos são amostrados de populações com distribuições diferentes.

# Bibliotecas necessárias para o teste

library(dplyr)
library(rstatix)

# Manipulação de variáveis

dados$REGIAO<-as.factor(dados$REGIAO)
dados$REGIAO<-as.double(dados$REGIAO)

# Realização do Teste de Wilcoxon

## Executando o teste para verificar se a variável *REGIÃO* interfere nas variáveis *SET*, *OUT*, *DEZ* e *RENDA MÉDIA*

wilcox.test(dados$SET,dados$REGIAO,paired = TRUE)

## 
##  Wilcoxon signed rank exact test
## 
## data:  dados$SET and dados$REGIAO
## V = 0, p-value = 0.00000001
## alternative hypothesis: true location shift is not equal to 0

wilcox.test(dados$OUT,dados$REGIAO,paired = TRUE)

## Warning in wilcox.test.default(dados$OUT, dados$REGIAO, paired = TRUE): cannot
## compute exact p-value with ties

## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  dados$OUT and dados$REGIAO
## V = 3, p-value = 0.000008
## alternative hypothesis: true location shift is not equal to 0

wilcox.test(dados$DEZ,dados$REGIAO,paired = TRUE)

## 
##  Wilcoxon signed rank exact test
## 
## data:  dados$DEZ and dados$REGIAO
## V = 5, p-value = 0.0000001
## alternative hypothesis: true location shift is not equal to 0

wilcox.test(dados$`RENDA MEDIA`,dados$REGIAO,paired = TRUE)

## 
##  Wilcoxon signed rank exact test
## 
## data:  dados$`RENDA MEDIA` and dados$REGIAO
## V = 378, p-value = 0.00000001
## alternative hypothesis: true location shift is not equal to 0

## Conclusão

# Para *RENDA MÉDIA* e *REGIÃO*,pvalor ≤ alpha, logo rejeita-se H0, podendo-se concluir que os grupos relacionados apresentam distribuições distintas. 
# Para *SET* e *REGIÃO*,pvalor ≤ alpha, logo rejeita-se H0, podendo-se concluir que os grupos relacionados apresentam distribuições distintas.
# Para *DEZ* e *REGIÃO*,pvalor ≤ alpha, logo rejeita-se H0, podendo-se concluir que os grupos relacionados apresentam distribuições distintas.
# Para *OUT* e *REGIÃO*,não foi possível chegar a um valor para p-valor, uma vez que, dentro do banco de dados, essas variáveis podem ter valores iguais ou empatados

Conclusão

Conclui-se que, para os conjuntos de variáveis em que p-valor é menor do que alpha, então a hipótese nula é rejeitada. Logo, os grupos analisados são amostrados de distribuições diferentes. Isso quer dizer que o preço do aço dos meses testados ao longo de 2015 não é a mesma em todas regiões do país. Entende-se, portanto, que a região exerce forte influência sobre a evolução do preço do aço nos estados.

5.3 Testes de Hipóteses para as variáveis que apresentaram distribuição normal

5.3.1 Teste de Bartlett

Esse teste, também chamado de Teste da Homogeneidade das Variâncias, é utilizado para variáveis que apresentam distribuição normal.

Será realizado o Teste de Bartlett com o objetivo de verificar se a Região interfere no preço do aço nos estados.

As variáveis JAN,MAR,ABR,JUN,JUL e Preço Médio apresentam distribuição de dados normal.

Optou-se por verificar se a Região interfere no Preço Médio do aço, por exemplo

# Testando se a Região interfere no Preço do Aço

# Manipulação de variáveis

dados$`PRECO MEDIO`<-as.numeric(sub(",", ".", dados$`PRECO MEDIO`))

# Gerando um modelo estatístico:

modelo <- aov(`PRECO MEDIO`~REGIAO, data=dados)
residuos <- residuals(modelo)

summary(residuos)

##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -0.17960 -0.09790 -0.00904  0.00000  0.07653  0.31096

#H0: os dados seguem uma distribuição normal
#H1: os dados não seguem uma distribuição normal
#alpha = 0.05

shapiro.test(residuos)

## 
##  Shapiro-Wilk normality test
## 
## data:  residuos
## W = 0.96, p-value = 0.3

# Conclusão 
  
#pvalor>0.05, não rejeita-se H0 (os dados seguem distribuição normal)
  
# Teste de Bartlett

## Hipóteses: 

#H0: todas as variÃncias são iguais
#H1: pelo menos uma das variâncias é diferente
#alpha = 0.05

bartlett.test(residuos~dados$REGIAO)

## 
##  Bartlett test of homogeneity of variances
## 
## data:  residuos by dados$REGIAO
## Bartlett's K-squared = 2.4, df = 4, p-value = 0.7

# p-value = 0.6684

# Conclusão 
  
#pvalor>0.05, não rejeito H0, logo conclui-se que todas as variâncias são iguais.

Conclusão

Como pvalor>0.05 no teste de homogeneidade das variâncias, a hipótese H0 não é rejeitada. Logo, todas as variâncias para a variável Preço Médio são iguais.

5.3.2 Teste Anova

Em seguida, já tendo concluído que as variâncias são todas iguais, executou-se o Teste Anova para um modelo estatístico formado pelas variáveis Preço Médio e REGIÃO.O Teste Anova deve ser realizado quando as variâncias são todas iguais.

# Teste de Anova para *Preço Médio* e *Região*

modelo2 <- aov(`PRECO MEDIO`~ REGIAO, data= dados)
summary(modelo2)

##             Df Sum Sq Mean Sq F value Pr(>F)
## REGIAO       1  0.037  0.0366    2.62   0.12
## Residuals   25  0.349  0.0140

# Hipóteses do Teste de Anova

#pvalor>0.05, não rej H0
#coeficientes das retas de regressão são iguais

# P-valor representado por  Pr(>F)=  0.00286

Conclusão:

Ao realizar o Teste de Anova para as variáveis Preço Médio e REGIÃO, encontrou-se pvalor<0.05,representado por PR(>F) na matriz, ou seja, a hipótese nula deve ser rejeitada. Portanto, conclui-se, que existe ao menos uma média entre os grupos que difere das demais.

6. Resultados e Discussões

Nessa etapa serão construídos gráficos do tipo Boxplot entre variáveis quantitativas e qualitativas relevantes, que compõem o banco de dados.

Variáveis quantitativas relevantes:

JAN, FEV, MAR, ABR, MAI, JUN, JUL, AGO, SET, OUT, NOV E DEZ.

Outras variáveis quantitativas relevantes:

RENDA MÉDIA, PREÇO MÉDIO E IDH

Variáveis qualitativas relevantes:

REGIÃO

6.1 Construção de Gráfico Boxplot

Considerando que os fatores de cunho social são extremamente importantes para esse trabalho, uma vez que impactaram diretamente na evolução do preço do aço por Kg no Brasil ao longo do ano de 2015, serão apresentados gráficos do tipo Boxplot relacionando as variáveis PREÇO MÉDIO e RENDA MÉDIA com a variável REGIÃO.

6.1.1 Boxplot entre REGIÃO e PREÇO MÉDIO

A seguir será construído o gráfico do tipo boxplot para as variáveis REGIÃO e PREÇO MÉDIO

## Manipulação de variáveis necessária nessa etapa

dados$REGIAO<-as.factor(dados$REGIAO)
library(readxl)
dados <- read_excel("relatorio final/dados.xlsx")

## Boxplot entre *REGIÃO* e *PREÇO MÉDIO*

# Manipulação de variáveis

dados$`PRECO MEDIO`<-as.double(dados$`PRECO MEDIO`)

# Construção do Boxplot

boxplot(`PRECO MEDIO`~REGIAO, 
        data=dados,
        col=c("red","#faa005","#1bc704","#0f8efc","yellow"),
        main="Boxplot 1 \n Preço Médio do Aço por região do Brasil no ano de 2015")

Comentário

Observa-se nesse gráfico que os maiores preços médios do aço ao longo do ano de 2015, foram para as regiões Norte e Sul. Isso pode ser explicado pela baixa demanda de obras nessas localidades quando comparadas aos outros locais do país. Já a reigão Sudeste, Centro - Oeste e Nordeste apresentam os menores preços médios desse insumo, pois como se trata de grandes centros, contam com maior quantidade de obras, havendo maior consumo de aço, e, consequentemente, queda no preço do produto.

6.1.2 Boxplot entre REGIÃO e RENDA MÉDIA

A seguir será construído o gráfico do tipo boxplot para as variáveis REGIÃO e RENDA MÉDIA.

## Boxplot entre *REGIÃO* e *RENDA MÉDIA*

# Manipulação de variáveis

dados$`RENDA MEDIA`<-as.double(dados$`RENDA MEDIA`)

# Construção do Boxplot

boxplot(`RENDA MEDIA`~REGIAO, 
        data=dados,
        col=c("red","#faa005","#1bc704","#0f8efc","yellow"),
        main="Boxplot 2 \n Renda Média per capita por região do Brasil no ano de 2015")

Comentário

Observa-se nesse gráfico que as regiões Sul e Sudeste apresentaram os maiores valores de renda média. Logo, o maior poder aquisitivo da população nessas localidades favorece a construção de muitas edificações e obras de infrestrutura, o que contribui para recuzir o preço médio do aço nessas regiões. Em contrapartida, as regiões Norte e Nordeste apresentam os menores valores de renda média per capita do Brasil, o que impacta diretamente na baixa atração de investimentos que essas regiões recebem, tanto por parte do governo, como da iniciativa privada, o que favorece uma contração do mercado e construção civil e, consequentemente, a elevação do preço médio do aço.

6.1.3 Boxplot entre variáveis meses do ano e REGIÃO

Para observar melhor a variação do preço do aço ao longo de 2015 em todo o Brasil, optou-se por fazer os gráficos para os meses de Janeiro, Julho e Dezembro, o que contribui para visualizar essa variação dos preços em intervalos ao longo do ano.

A seguir será construído o gráfico do tipo boxplot para as variáveis JAN e REGIÃO

Dessa forma será possivel observar como o preço do aço variou durante o mês de janeiro em cada região do pais.

## Boxplot entre *JAN* e *REGIÃO*

# Manipulação de variáveis

dados$JAN<-as.double(dados$JAN)

# Construção do Boxplot

boxplot(JAN~REGIAO, 
        data=dados,
        col=c("red","#faa005","#1bc704","#0f8efc","yellow"),
        main="Boxplot 3 \n Preço do aço por Kg por região do Brasil em Janeiro de 2015")

Comentário

Pode-se notar que as regiões Sul e Norte apresentaram os maiores valores no preço do aço por Kg no mês de janeiro. A região Sudeste apresentou preços bem menores do que as regiões Sul e Norte, o que pode ser explicado pelo grande volume de obras que geralmente ocorre nessa localidade. Como geralmente as regiões Norte e Nordeste apresentam menos investimento por parte do governo e da iniciativa privada, então pode ocorrer de o preço do aço sofrer aumento nesses locais, principalmente, em comparação com os estados mais ricos do Brasil.

A seguir será construído o gráfico do tipo boxplot para as variáveis JUL e REGIÃO

Dessa forma será possivel observar como o preço do aço variou durante o mês de julho em cada região do pais.

## Boxplot entre *JUL* e *REGIÃO*

# Manipulação de variáveis

dados$JUL<-as.double(dados$JUL)

# Construção do Boxplot

boxplot(JUL~REGIAO, 
        data=dados,
        col=c("red","#faa005","#1bc704","#0f8efc","yellow"),
        main="Boxplot 4\n Preço do aço por Kg por região do Brasil em Julho de 2015")

Comentário

Pode-se notar que as regiões Sul e Norte apresentaram os maiores valores no preço do aço por Kg também no mês de julho. A região Sudeste apresentou preços bem menores do que as regiões Sul e Norte, o que se explica pelo grande volume de obras e pelo elevado por aquisivo dessa região, o que contribui para reduzir, de forma geral, o preço do insumo.

A seguir será construído o gráfico do tipo boxplot para as variáveis DEZ e REGIÃO

Dessa forma será possivel observar como o preço do aço variou durante o mês de dezembro em cada região do pais.

## Boxplot entre *DEZ* e *REGIÃO*

# Manipulação de variáveis

dados$DEZ<-as.double(dados$DEZ)

# Construção do Boxplot

boxplot(DEZ~REGIAO, 
        data=dados,
        col=c("red","#faa005","#1bc704","#0f8efc","yellow"),
        main="Boxplot 5 \n Preço do aço por Kg por região do Brasil em Dezembro de 2015")

Comentário

Observa-se nesse gráfico a mesma tendência dos dois anteriores, de forma que as regiões Centro-Oeste, Nordeste e Sudeste apresentaram os menores valores referentes ao preço do aço em dezembro, o que se explica pelos grandes polos de obras de infraestrutura e pelo grande poder econômico dessas regiões do país. Geralmente, o preço desse insumo está ligado ao potencial econômico de uma determinada região, fazendo com que as altas demandas da construção civil pelo produto colaborem para manter o seu preço mais baixo nesses locais.

7. Matriz de Correlação

A correlação entre variáveis é interpretada através da matriz de correlação.São apresentados números entre -1 e +1, que servem como parâmetro de classificação para uma correlação forte ou fraca entre variáveis.

Nessa etapa, serão geradas algumas matrizes de correlação para as variáveis quantitativas referentes aos meses do ano e para outras variáveis quantitativas relevantes do banco de dados.

Serão construídos três matrizes de correlação entre as seguintes variáveis:

PREÇO MÉDIO,RENDA MÉDIA e JAN
PREÇO MÉDIO, RENDA MÉDIA e JUL
PREÇO MÉDIO,RENDA MÉDIA e DEZ

Assim, será possível avaliar a correlação entre o preço médio do aço por Kg no ano de 2015 e os preços desse insumo nos meses de janeiro, julho e dezembro do referido ano.

A seguir será construída a Matriz de Correlação entre as variáveis PREÇO MÉDIO,RENDA MÉDIA e JAN.

# Matriz de Correlação entre *PREÇO MÉDIO*,*RENDA MÉDIA* e *JAN*

# Biblioteca necessária para essa etapa

library(corrplot)

## corrplot 0.90 loaded

# Matriz de Correlação:

variaveis_quant<-c("PRECO MEDIO","RENDA MEDIA","JAN")

dados[,variaveis_quant]

## # A tibble: 27 x 3
##    `PRECO MEDIO` `RENDA MEDIA`   JAN
##            <dbl>         <dbl> <dbl>
##  1          0.87           714  1   
##  2          0.86           841  1.05
##  3          0.79           855  0.84
##  4          0.77           605  0.92
##  5          0.74           898  0.79
##  6          0.96           871  0.98
##  7          0.85           906  1.03
##  8          0.92           956  1.08
##  9          0.91           817  1.02
## 10          0.78          1295  0.91
## # ... with 17 more rows

cor(dados[,variaveis_quant])

##             PRECO MEDIO RENDA MEDIA      JAN
## PRECO MEDIO     1.00000    -0.02799  0.87251
## RENDA MEDIA    -0.02799     1.00000 -0.09032
## JAN             0.87251    -0.09032  1.00000

library(corrplot)

correlacao_dados<-cor(dados[,variaveis_quant])

corrplot(cor(dados[,variaveis_quant]))

Comentário

Conforme o gráfico gerado e a matriz de correlação da tabela, pode-se observar que existe uma correlação fraca entre algumas variáveis.Pode-se notar a existência de correlação fraca entre as variáveis RENDA MÉDIA e PREÇO MÉDIO & entre as variáveis RENDA MÉDIA e JAN, o que indica que,mesmo estados com baixa renda média per capita, podem apresentar preços médios mais elevados desse insumo no referido mês, assim como também pode acontecer de existirem estados com elevada renda média per capita apresentando preços mais baixos desse material.

A seguir será construída a Matriz de Correlação entre as variáveis PREÇO MÉDIO, RENDA MÉDIA e JUL.

# Matriz de Correlação entre *PREÇO MÉDIO*,*RENDA MÉDIA* e *JUL*:

# Biblioteca necessária para essa etapa:

library(corrplot)

# Matriz de Correlação:

variaveis_quant<-c("PRECO MEDIO","RENDA MEDIA","JUL")

dados[,variaveis_quant]

## # A tibble: 27 x 3
##    `PRECO MEDIO` `RENDA MEDIA`   JUL
##            <dbl>         <dbl> <dbl>
##  1          0.87           714  0.79
##  2          0.86           841  0.73
##  3          0.79           855  0.68
##  4          0.77           605  0.75
##  5          0.74           898  0.62
##  6          0.96           871  0.87
##  7          0.85           906  0.81
##  8          0.92           956  0.77
##  9          0.91           817  0.79
## 10          0.78          1295  0.71
## # ... with 17 more rows

cor(dados[,variaveis_quant])

##             PRECO MEDIO RENDA MEDIA     JUL
## PRECO MEDIO     1.00000    -0.02799 0.84084
## RENDA MEDIA    -0.02799     1.00000 0.02418
## JUL             0.84084     0.02418 1.00000

library(corrplot)

correlacao_dados<-cor(dados[,variaveis_quant])

corrplot(cor(dados[,variaveis_quant]))

Comentário

Assim como no caso acima, pode-se notar a existência de uma correlação fraca entre algumas variáveis. Ocorre correlação fraca entre as variáveis RENDA MÉDIA e PREÇO MÉDIO & entre as variáveis RENDA MÉDIA e JUL, o que, também, indica que, em alguns casos, o preço médio do aço pode variar de forma independente da renda média per capita das regiões.

A seguir será construída a Matriz de Correlação entre as variáveis PREÇO MÉDIO, RENDA MÉDIA e DEZ.

variaveis_quant<-c("PRECO MEDIO","RENDA MEDIA","DEZ")

dados[,variaveis_quant]

## # A tibble: 27 x 3
##    `PRECO MEDIO` `RENDA MEDIA`   DEZ
##            <dbl>         <dbl> <dbl>
##  1          0.87           714  0.95
##  2          0.86           841  1.07
##  3          0.79           855  1.01
##  4          0.77           605  0.85
##  5          0.74           898  1.12
##  6          0.96           871  1.4 
##  7          0.85           906  0.9 
##  8          0.92           956  0.96
##  9          0.91           817  0.93
## 10          0.78          1295  0.91
## # ... with 17 more rows

cor(dados[,variaveis_quant])

##             PRECO MEDIO RENDA MEDIA      DEZ
## PRECO MEDIO     1.00000    -0.02799  0.79260
## RENDA MEDIA    -0.02799     1.00000 -0.04687
## DEZ             0.79260    -0.04687  1.00000

library(corrplot)

correlacao_dados<-cor(dados[,variaveis_quant])

corrplot(cor(dados[,variaveis_quant]))

Comentário

Para o mês de dezembro, pode-se notar, também a existência de correlação fraca entre as variáveis RENDA MÉDIA e PREÇO MÉDIO & entre as variáveis RENDA MÉDIA e DEZ, o que, também, indica que, a evolução do preço médio do aço para o referido mês não está diretamente ligado à renda média per capita da população, em alguns casos. Como mencionado acima, pode ocorrer de existirem estados com elevada renda média e preço do Kg do aço mais baixo, assim como pode occorer também de existirem regiões com baixa renda média praticando preços um pouco mais elevados.

8. Mapas inerentes à evolução do preço do aço no Brasil

Visando detalhar a evolução do preço do aço do tipo, CA-50 com 10 mm de diâmetro, por Kg, nas diferentes regiões do Brasil no ano de 2015, além do mapa do país por regiões, serão apresentados, também, outros mapas de interesse para esse trabalho.

Como trata-se de um insumo de alta relevância em todo o país, visto que esse material construtivo está diretamente relacionado com as obras de infraestrutura e com o desenvolvimento econômico em todo o Brasil, serão, também, apresentados outros mapas referentes a indicadores sociais de grande importância para esse trabalho, como: Mapa do Indíce de Desenvolvimento Humano (IDH) e o Mapa da Renda Média per capita dos estados.

Por fim, optou-se, nesse trabalho, por criar três mapas referentes para a evolução do preço do aço em três meses diferentes do ano de 2015, sendo considerado, portanto, os seguintes meses: Janeiro, Julho e Dezembro.

Com isso, será possível avaliar a variação do preço desse insumo em diferentes regiões da nação, bem como, nos seus diferentes estados, demonstrando como fatores de cunho social e econômico podem contribuir diretamente para impactar no preço desse produto.

A seguir será apresentado o Mapa do Brasil por regiões.

8.1 Mapa do Brasil por regiões

8.1.1 Dados necessários para a construção do mapa

# Carregando as bibliotecas

library(geobr)

## Loading required namespace: sf

library(dplyr)
library(readxl)
library(ggspatial)
library(ggimage)

## Carregando pacotes exigidos: ggplot2

# Banco de dados

library(readxl)
dados <- read_excel("relatorio final/dados.xlsx")

# Manipulação de variáveis

dados$`RENDA MEDIA`<-as.double(dados$`RENDA MEDIA`)
dados$`PRECO MEDIO`<-as.double(dados$`PRECO MEDIO`)
dados$IDH<-as.numeric(sub(",", ".", dados$IDH)) 

# Excluindo a possibilidade de notação científica

options(scipen = 999)

# Objetos criados para montar o mapa

estados <- read_state(code_state="all", year=2010)

## Using year 2010

## Loading data for the whole country

## 
  |                                                                            
  |                                                                      |   0%
  |                                                                            
  |===                                                                   |   4%
  |                                                                            
  |=====                                                                 |   7%
  |                                                                            
  |========                                                              |  11%
  |                                                                            
  |==========                                                            |  15%
  |                                                                            
  |=============                                                         |  19%
  |                                                                            
  |================                                                      |  22%
  |                                                                            
  |==================                                                    |  26%
  |                                                                            
  |=====================                                                 |  30%
  |                                                                            
  |=======================                                               |  33%
  |                                                                            
  |==========================                                            |  37%
  |                                                                            
  |=============================                                         |  41%
  |                                                                            
  |===============================                                       |  44%
  |                                                                            
  |==================================                                    |  48%
  |                                                                            
  |====================================                                  |  52%
  |                                                                            
  |=======================================                               |  56%
  |                                                                            
  |=========================================                             |  59%
  |                                                                            
  |============================================                          |  63%
  |                                                                            
  |===============================================                       |  67%
  |                                                                            
  |=================================================                     |  70%
  |                                                                            
  |====================================================                  |  74%
  |                                                                            
  |======================================================                |  78%
  |                                                                            
  |=========================================================             |  81%
  |                                                                            
  |============================================================          |  85%
  |                                                                            
  |==============================================================        |  89%
  |                                                                            
  |=================================================================     |  93%
  |                                                                            
  |===================================================================   |  96%
  |                                                                            
  |======================================================================| 100%

dados <- read_excel("relatorio final/dados.xlsx") %>% rename(abbrev_state=ESTADO)
juntos <- full_join(estados,dados,by="abbrev_state")  

# Transformação de variável

summary(dados)

##   LOCALIDADE        abbrev_state           CODIGO        REGIAO         
##  Length:27          Length:27          Min.   :11.0   Length:27         
##  Class :character   Class :character   1st Qu.:19.0   Class :character  
##  Mode  :character   Mode  :character   Median :27.0   Mode  :character  
##                                        Mean   :29.1                     
##                                        3rd Qu.:38.0                     
##                                        Max.   :53.0                     
##   COD REGIAO            JAN                FEV                MAR           
##  Length:27          Length:27          Length:27          Length:27         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##      ABR                MAI                JUN                JUL           
##  Length:27          Length:27          Length:27          Length:27         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##      AGO                SET                OUT                NOV           
##  Length:27          Length:27          Length:27          Length:27         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##      DEZ            PRECO MEDIO         RENDA MEDIA       IDH           
##  Length:27          Length:27          Min.   : 605   Length:27         
##  Class :character   Class :character   1st Qu.: 860   Class :character  
##  Mode  :character   Mode  :character   Median :1045   Mode  :character  
##                                        Mean   :1186                     
##                                        3rd Qu.:1412                     
##                                        Max.   :2460

dados$abbrev_state<-as.factor(dados$abbrev_state)  
summary(dados)

##   LOCALIDADE         abbrev_state     CODIGO        REGIAO         
##  Length:27          AC     : 1    Min.   :11.0   Length:27         
##  Class :character   AL     : 1    1st Qu.:19.0   Class :character  
##  Mode  :character   AM     : 1    Median :27.0   Mode  :character  
##                     AP     : 1    Mean   :29.1                     
##                     BA     : 1    3rd Qu.:38.0                     
##                     CE     : 1    Max.   :53.0                     
##                     (Other):21                                     
##   COD REGIAO            JAN                FEV                MAR           
##  Length:27          Length:27          Length:27          Length:27         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##      ABR                MAI                JUN                JUL           
##  Length:27          Length:27          Length:27          Length:27         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##      AGO                SET                OUT                NOV           
##  Length:27          Length:27          Length:27          Length:27         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##      DEZ            PRECO MEDIO         RENDA MEDIA       IDH           
##  Length:27          Length:27          Min.   : 605   Length:27         
##  Class :character   Class :character   1st Qu.: 860   Class :character  
##  Mode  :character   Mode  :character   Median :1045   Mode  :character  
##                                        Mean   :1186                     
##                                        3rd Qu.:1412                     
##                                        Max.   :2460                     
##

8.1.2 Construção do Mapa do Brasil por regiões

ggplot(juntos)+
  geom_sf(aes(fill=REGIAO))+
  scale_fill_manual(values = c("orange","red","yellow","green","blue","purple"))+
  annotation_scale(location="br",height = unit(0.2,"cm"))+
  annotation_north_arrow(location="tr",
                         style = north_arrow_nautical,
                         height = unit(1.5,"cm"),
                         width = unit(1.5,"cm"))+
  labs(title = "Mapa 1 - Mapa do Brasil",
       subtitle = "Subdivisão do Brasil em regiões",
       fill="Regiões",
       x=NULL,
       y=NULL)+
  geom_sf_text(data=estados,aes(label = abbrev_state), size=2, color= "black")+
  theme_bw()+
  theme(legend.position = c(0.18,0.2),
        legend.key.size = unit(3.7,"mm"))

## Warning in st_point_on_surface.sfc(sf::st_zm(x)): st_point_on_surface may not
## give correct results for longitude/latitude data

## Scale on map varies by more than 10%, scale bar may be inaccurate

8.2 Mapa do Brasil por IDH

A seguir será apresentado o Mapa do Brasil por IDH.

8.2.1 Dados necessários para a construção do mapa

# Manipulação de variáveis

dados$IDH<-as.numeric(sub(",", ".", dados$IDH)) 

dados$IDH<-as.double(dados$IDH)

juntos$IDH<-as.numeric(sub(",", ".", juntos$IDH))

glimpse(dados)

## Rows: 27
## Columns: 20
## $ LOCALIDADE    <chr> "ALAGOAS", "BAHIA", "CEARA", "MARANHAO", "PARAIBA", "PER~
## $ abbrev_state  <fct> AL, BA, CE, MA, PB, PE, SE, RN, PI, ES, MG, RJ, SP, AM, ~
## $ CODIGO        <dbl> 27, 29, 23, 21, 25, 26, 28, 24, 22, 32, 31, 33, 35, 13, ~
## $ REGIAO        <chr> "Nordeste", "Nordeste", "Nordeste", "Nordeste", "Nordest~
## $ `COD REGIAO`  <chr> "NE", "NE", "NE", "NE", "NE", "NE", "NE", "NE", "NE", "S~
## $ JAN           <chr> "1.00", "1.05", "0.84", "0.92", "0.79", "0.98", "1.03", ~
## $ FEV           <chr> "0.96", "0.98", "0.82", "0.88", "0.76", "0.93", "0.99", ~
## $ MAR           <chr> "0.85", "0.87", "0.73", "0.75", "0.67", "0.86", "0.84", ~
## $ ABR           <chr> "0.78", "0.80", "0.67", "0.72", "0.62", "0.79", "0.81", ~
## $ MAI           <chr> "0.74", "0.75", "0.63", "0.68", "0.58", "0.75", "0.76", ~
## $ JUN           <chr> "0.80", "0.73", "0.69", "0.75", "0.63", "0.80", "0.82", ~
## $ JUL           <chr> "0.79", "0.73", "0.68", "0.75", "0.62", "0.87", "0.81", ~
## $ AGO           <chr> "0.90", "0.71", "0.82", "0.72", "0.60", "0.97", "0.79", ~
## $ SET           <chr> "0.91", "0.85", "0.84", "0.77", "0.61", "1.00", "0.82", ~
## $ OUT           <chr> "0.87", "0.84", "0.86", "0.74", "0.79", "1.06", "0.82", ~
## $ NOV           <chr> "0.90", "0.96", "0.96", "0.77", "1.07", "1.16", "0.86", ~
## $ DEZ           <chr> "0.95", "1.07", "1.01", "0.85", "1.12", "1.40", "0.90", ~
## $ `PRECO MEDIO` <chr> "0.87", "0.86", "0.79", "0.77", "0.74", "0.96", "0.85", ~
## $ `RENDA MEDIA` <dbl> 714, 841, 855, 605, 898, 871, 906, 956, 817, 1295, 1322,~
## $ IDH           <dbl> 0.683, 0.714, 0.735, 0.687, 0.722, 0.727, 0.702, 0.731, ~

glimpse(juntos)

## Rows: 27
## Columns: 25
## $ code_state    <dbl> 11, 12, 13, 14, 15, 16, 17, 21, 22, 23, 24, 25, 26, 27, ~
## $ abbrev_state  <chr> "RO", "AC", "AM", "RR", "PA", "AP", "TO", "MA", "PI", "C~
## $ name_state    <chr> "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amap~
## $ code_region   <dbl> 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3,~
## $ name_region   <chr> "Norte", "Norte", "Norte", "Norte", "Norte", "Norte", "N~
## $ LOCALIDADE    <chr> "RONDONIA", "ACRE", "AMAZONAS", "RORAIMA", "PARA", "AMAP~
## $ CODIGO        <dbl> 11, 12, 13, 14, 15, 16, 17, 21, 22, 23, 24, 25, 26, 27, ~
## $ REGIAO        <chr> "Norte", "Norte", "Norte", "Norte", "Norte", "Norte", "N~
## $ `COD REGIAO`  <chr> "N", "N", "N", "N", "N", "N", "N", "NE", "NE", "NE", "NE~
## $ JAN           <chr> "1.29", "1.07", "1.13", "1.06", "1.11", "1.09", "1.12", ~
## $ FEV           <chr> "1.23", "1.07", "1.08", "1.08", "1.07", "1.07", "1.14", ~
## $ MAR           <chr> "1.10", "1.08", "0.85", "1.09", "0.96", "1.15", "1.13", ~
## $ ABR           <chr> "1.00", "1.09", "0.80", "1.10", "0.89", "1.12", "1.14", ~
## $ MAI           <chr> "0.93", "0.84", "0.75", "0.86", "0.83", "0.67", "0.81", ~
## $ JUN           <chr> "0.90", "0.92", "0.89", "0.93", "0.91", "0.94", "0.95", ~
## $ JUL           <chr> "1.04", "0.72", "0.79", "0.78", "0.90", "0.82", "0.80", ~
## $ AGO           <chr> "1.22", "0.74", "0.83", "0.75", "0.88", "1.14", "1.12", ~
## $ SET           <chr> "1.34", "0.91", "1.02", "0.78", "0.89", "1.19", "1.32", ~
## $ OUT           <chr> "1.38", "0.81", "0.96", "0.88", "1.06", "1.24", "1.36", ~
## $ NOV           <chr> "1.58", "0.86", "1.39", "0.94", "1.31", "0.99", "1.43", ~
## $ DEZ           <chr> "1.84", "0.92", "1.52", "1.17", "1.49", "1.16", "1.41", ~
## $ `PRECO MEDIO` <chr> "1.24", "0.92", "1.00", "0.95", "1.02", "1.05", "1.14", ~
## $ `RENDA MEDIA` <dbl> 1113, 909, 791, 1204, 863, 857, 1045, 605, 817, 855, 956~
## $ IDH           <dbl> 0.725, 0.719, 0.733, 0.752, 0.698, 0.741, 0.743, 0.687, ~
## $ geom          <MULTIPOLYGON [°]> MULTIPOLYGON (((-63.33 -7.9..., MULTIPOLYGO~

juntos$CATEGORIA10 <- cut(juntos$IDH,breaks =c(0.680,0.720,0.750,0.800,Inf),
                          labels = c("0.681 a 0.720","0.721 a 0.750","0.751 a 0.800","Mais de 0.800"))

8.2.2 Construção do Mapa do Brasil por IDH

ggplot(juntos)+
  geom_sf(aes(fill=CATEGORIA10))+
  scale_fill_manual(values = c("orange","red","yellow","green","blue","purple"))+
  annotation_scale(location="br",height = unit(0.2,"cm"))+
  annotation_north_arrow(location="tr",
                         style = north_arrow_nautical,
                         height = unit(1.5,"cm"),
                         width = unit(1.5,"cm"))+
  labs(title = "Mapa 2 - Mapa do Brasil por IDH",
       subtitle = "IDH por estados",
       fill="Valores das faixas do IDH",
       x=NULL,
       y=NULL)+
  geom_sf_text(data=estados,aes(label = abbrev_state), size=2, color= "black")+
  theme_bw()+
  theme(legend.position = c(0.18,0.2),
        legend.key.size = unit(3.7,"mm"))

## Warning in st_point_on_surface.sfc(sf::st_zm(x)): st_point_on_surface may not
## give correct results for longitude/latitude data

## Scale on map varies by more than 10%, scale bar may be inaccurate

8.3 Mapa do Brasil por Renda Média per capita

A seguir será apresentado o mapa do Brasil por renda média per capita da população nos estados. Esse mapa tem grande importância para esse trabalho, visto que, a renda da população está diretamente ligada à capacidade econômica dos estados e, consequentemente, à infraestrutura das diferentes regiões do país, o que vai impactar no consumo e no preço do aço.

8.3.1 Dados necessários para a construção do mapa

juntos$CATEGORIA6 <- cut(juntos$RENDA,breaks =c(500,1000,1500,2000,Inf),
                           labels = c("501 a 1000","1001 a 1500","1501 a 2000","Mais de 2000"))

8.3.2 Construção do Mapa do Brasil por renda média dos estados

ggplot(juntos)+
  geom_sf(aes(fill=CATEGORIA6))+
  scale_fill_manual(values = c("orange","red","yellow","green","blue","purple"))+
  annotation_scale(location="br",height = unit(0.2,"cm"))+
  annotation_north_arrow(location="tr",
                         style = north_arrow_nautical,
                         height = unit(1.5,"cm"),
                         width = unit(1.5,"cm"))+
  labs(title = "Mapa 3 - Mapa da renda média per capita no Brasil por estados",
       subtitle = "Renda Média per capita",
       fill="Renda mensal média \nEm reais",
       x=NULL,
       y=NULL)+
  geom_sf_text(data=estados,aes(label = abbrev_state), size=2, color= "black")+
  theme_bw()+
  theme(legend.position = c(0.18,0.2),
        legend.key.size = unit(3.7,"mm"))

## Warning in st_point_on_surface.sfc(sf::st_zm(x)): st_point_on_surface may not
## give correct results for longitude/latitude data

## Scale on map varies by more than 10%, scale bar may be inaccurate

8.4 Mapas referentes à evolução do preço do aço no ano de 2015

A seguir, serão apresentados os mapas referentes à evolução do preço do aço por Kg no ano de 2015 nos estados do Brasil.

Com a finalidade de avaliar melhor como a variação do preço desse insumo pode ocorrer ao longo do ano, optou-se por analisar o comportamento do preço do aço nos meses de Janeiro, Julho e Dezembro, o que permite visualizar tais variações no início e final dos semestres do ano.

8.4.1 Mapa da evolução do preço do aço em Janeiro de 2015 no Brasil

A seguir será apresentado o mapa do preço do aço CA-50 por Kg no Brasil em Janeiro de 2015.

8.4.1.1 Dados necessários para a construção do mapa

dados$JAN<-as.double(dados$JAN)
juntos$JAN<-as.numeric(sub(",", ".", juntos$JAN))

juntos$CATEGORIA1 <- cut(juntos$JAN,breaks =c(0.70,0.90,1.00,1.10,Inf),
                         labels = c("0.71 a 0.90","0.91 a 1.00","1.01 a 1.10","Mais de 1.10"))

8.4.1.2 Construção do Mapa do preço do aço no Brasil em Janeiro de 2015

ggplot(juntos)+
  geom_sf(aes(fill=CATEGORIA1))+
  scale_fill_manual(values = c("orange","red","yellow","green","blue","purple"))+
  annotation_scale(location="br",height = unit(0.2,"cm"))+
  annotation_north_arrow(location="tr",
                         style = north_arrow_nautical,
                         height = unit(1.5,"cm"),
                         width = unit(1.5,"cm"))+
  labs(title = "Mapa 4 - Variação do preço do Aço no Brasil em Janeiro de 2015",
       subtitle = "Janeiro - 2015",
       fill="Preço do aço \nPor Kg",
       x=NULL,
       y=NULL)+
  geom_sf_text(data=estados,aes(label = abbrev_state), size=2, color= "black")+
  theme_bw()+
  theme(legend.position = c(0.18,0.2),
        legend.key.size = unit(4.2,"mm"))

## Warning in st_point_on_surface.sfc(sf::st_zm(x)): st_point_on_surface may not
## give correct results for longitude/latitude data

## Scale on map varies by more than 10%, scale bar may be inaccurate

Comentário

Pode-se observar, no mapa acima, que o preço do aço por Kg no mês de Janeiro de 2015 foi mais elevado em alguns estados da região Norte e Sul. No caso da região Norte isso pode ser explicado pelo baixo volume de obras de infraestrutura nessa localidade e pela baixa demanda desse insumo, o que contribui para encarecer o produto. É importante ressaltar que as regiões Sudeste, Nordeste e Centro-Oeste apresentam, em alguns estados, preços semelhantes, o que se deduz pelo alto volume de obras e construções nessas localidades, contribuindo para que não ocorra tanta alteração do preço do aço no referido mês.

8.4.2 Mapa da evolução do preço do aço em Julho de 2015 no Brasil

A seguir será apresentado o mapa do preço do aço CA-50 por Kg no Brasil em Julho de 2015.

8.4.2.1 Dados necessários para a construção do mapa

dados$JUL<-as.double(dados$JUL)
juntos$JUL<-as.numeric(sub(",", ".", juntos$JUL))

juntos$CATEGORIA2 <- cut(juntos$JUL,breaks =c(0.60,0.75,0.90,1.00,Inf),
                         labels = c("0.61 a 0.75","0.76 a 0.90","0.91 a 1.00","Mais de 1.00"))

8.4.2.2 Construção do Mapa do preço do aço no Brasil em Julho de 2015

ggplot(juntos)+
  geom_sf(aes(fill=CATEGORIA2))+
  scale_fill_manual(values = c("orange","red","yellow","green","blue","purple"))+
  annotation_scale(location="br",height = unit(0.2,"cm"))+
  annotation_north_arrow(location="tr",
                         style = north_arrow_nautical,
                         height = unit(1.5,"cm"),
                         width = unit(1.5,"cm"))+
  labs(title = "Mapa 5 - Variação do preço do Aço no Brasil em Julho de 2015 ",
       subtitle = "Julho - 2015",
       fill="Preço do aço \nPor Kg",
       x=NULL,
       y=NULL)+
  geom_sf_text(data=estados,aes(label = abbrev_state), size=2, color= "black")+
  theme_bw()+
  theme(legend.position = c(0.18,0.2),
        legend.key.size = unit(4.2,"mm"))

## Warning in st_point_on_surface.sfc(sf::st_zm(x)): st_point_on_surface may not
## give correct results for longitude/latitude data

## Scale on map varies by more than 10%, scale bar may be inaccurate

Comentário

Pode-se observar no mapa acima que vários estados do Sudeste e Nordeste apresentaram recuo no preço do aço por Kg em relação ao mês de Janeiro do mesmo ano.Esses estados apresentaram os menores preços do insumo por Kg no mês de Julho. Observa-se, também, que grande parte dos estados do Norte e Centro-Oeste apresentaram preços variando entre 0,76 e 0,90 por Kg. O baixo preço para essas regiões nesse mês pode ser explicado por um provável aumento no volume de obras e na demanda por aço, o que contribui para o recuo do preço do produto. Destaque para o estado de Rondônia, que, nesse mês, apresentou o preço mais elevado do Brasil.

8.4.3 Mapa da evolução do preço do aço em Dezembro de 2015 no Brasil

A seguir será apresentado o mapa do preço do aço CA-50 por Kg no Brasil em Dezembro de 2015.

8.4.3.1 Dados necessários para a construção do mapa

dados$DEZ<-as.double(dados$DEZ)
juntos$DEZ<-as.numeric(sub(",", ".", juntos$DEZ))

juntos$CATEGORIA3 <- cut(juntos$DEZ,breaks =c(0.70,0.75,0.90,1.00,1.15,1.30,Inf),
                         labels = c("0.71 a 0.75","0.76 a 0.90","0.91 a 1.00","1.01 a 1.15","1.16 a 1.30","Mais de 1.30"))

8.4.3.2 Construção do Mapa do preço do aço no Brasil em Dezembro de 2015

ggplot(juntos)+
  geom_sf(aes(fill=CATEGORIA3))+
  scale_fill_manual(values = c("orange","red","yellow","green","blue","purple"))+
  annotation_scale(location="br",height = unit(0.2,"cm"))+
  annotation_north_arrow(location="tr",
                         style = north_arrow_nautical,
                         height = unit(1.5,"cm"),
                         width = unit(1.5,"cm"))+
  labs(title = "Mapa 6 - Variação do preço do Aço no Brasil em Dezembro de 2015",
       subtitle = "Dezembro - 2015",
       fill="Preço do aço \nPor Kg",
       x=NULL,
       y=NULL)+
  geom_sf_text(data=estados,aes(label = abbrev_state), size=2, color= "black")+
  theme_bw()+
  theme(legend.position = c(0.18,0.2),
        legend.key.size = unit(4.2,"mm"))

## Warning in st_point_on_surface.sfc(sf::st_zm(x)): st_point_on_surface may not
## give correct results for longitude/latitude data

## Scale on map varies by more than 10%, scale bar may be inaccurate

Comentário

Pode-se observar no mapa acima um aumento abrupto do preço do aço por Kg em alguns estados do Norte e Centro-Oeste do Brasil em relação aos períodos anteriores do mesmo ano. Tal elevação pode ser explicada por um provável crescimento da quantidade de obras nessas localidades no referido mês, o que contribuiu diretamente para a alteração do preço do produto nessas regiões. Percebe-se, também, que vários estados do Sudeste e Nordeste apresentaram a mesma faixa de preço, variando entre 1,16 a 1,30, nesse período, o que indica que o preço desse insumo é passível de variações significativas ao longo do ano em regiões bastante distintas economicamente.

9. Conclusão

Foi possível concluir, nesse trabalho, que a evolução do preço do aço do tipo CA-50, de 10 mm de diâmetro, por Kg, no Brasil ao longo do ano de 2015, pode ter relação, em alguns casos, com questões econômicas e sociais, a exemplo do IDH e da Renda Média per capita dos estados. Geralmente, em localidades mais carentes socialmente e com baixo volume de obras e pouca infraestrutura, o preço do insumo se torna mais oneroso em comparação a regiões mais ricas que detém grande movimento do setor da construção civil e com elevada capacidade de infraestrutura, que, devido a alta demanda pelo insumo apresentam preços menores. Notou-se, ainda, que ao longo dos doze meses de 2015, o preço desse produto apresentou variações significativas nos diferentes estados da federação ao se analisar o início e término de cada semestre. Isso ocorre porque a construção civil é uma área altamente dinâmica, o que contribui para que o volume de obras se altere bastante ao longo do ano em todo o país e, apesar de a região Sudeste ser a maior consumidora de materiais de construção, incluindo,o aço, essa localidade nem sempre apresentou os menores preços desse produto ao longo do ano de 2015. Foi possível notar, também, que mesmo em regiões com maior poder aquisitivo e maior renda média per capita o preço do aço apresentou-se, em alguns períodos, mais baixo, enquanto em localidades mais carentes e com menor renda per capita, o preço do insumo se apresentou com valores mais elevados. Conforme já mencionado, essas variações podem ser explicadas não só por fatores de cunho social e econômico, mas, principalmente, pelo dinamismo a que o mercado da construção civil está constantemente exposto, o que contribui diretamente para tantas variações nos preços desse produto tão importante no decorrer do ano. Portanto, o preço do aço apresentou-se de forma bastante desigual em alguns períodos do ano de 2015, além de estar, também, ligado a fatores relevantes de cunho econômico e social nas diferentes regiões do Brasil.

10. Bibliografia

Atlas do Desenvolvimento Humano no Brasil.Disponível em: http://www.atlasbrasil.org.br/ranking.Acesso em: 06 ago. 2021.

BRASIL.Instituto Brasileiro de Geografia e Estatística. O IBGE.Disponível em: https://www.ibge.gov.br/institucional/o-ibge.html.Acesso em: 08 ago. 2021.

CBIC.Câmara Brasileira da Indústria da Construção.Disponível em: http://www.cbicdados.com.br/menu/materiais-de-construcao/aco-10mm-e-produtos-de-aco-longo.Acesso em: 04 ago. 2021.

CBIC.Câmara Brasileira da Indústria da Construção.Disponível em: https://cbic.org.br/institucional/.Acesso em: 10 ago. 2021.

INSTITUTODEENGENHARIA.A utilização do aço na construção.Disponível em: https://www.institutodeengenharia.org.br/site/2015/10/06/a-utilizacao-do-aco-na-construcao-civil/.Acesso em: 07 ago. 2021.

PNUD (Programa das Nações Unidas para o Desenvolvimento).IDH.Disponível em: https://www.br.undp.org/content/brazil/pt/home/idh0.html.Acesso em: 01 ago. 2021.

Evolução do preço do aço por Kg no Brasil no ano de 2015

Welington da Silva

13/08/2021

1. Introdução

2. Objetivos Gerais

2.1 Objetivos Específicos

3. Metodologia

3.1 Dicionário de dados

4.Testes de Hipóteses

4.1 Testes de Hipóteses para a verificação da normalidade de uma variável

4.2 Testes de Hipóteses realizados para as variáveis que não apresentam distribuição normal

4.3 Testes de Hipóteses para a variável que apresentam distribuição normal

5. Execução dos Testes de Hipóteses

5.1 Teste de Shapiro-Wilk

5.1.1 Teste de Shapiro-wilk para as variáveis meses do ano

5.1.2 Realização do Teste de Shapiro para outras variáveis

5.2 Testes de Hipóteses para as variáveis que não apresentaram distribuição normal

5.2.1 Teste de Spearman

5.2.1.1 Teste de Spearman para as variáveis meses do ano

5.2.1.2 Teste de Spearman para outras variáveis

5.2.2 Teste de Kruskal-Wallis

5.2.2.1 Teste de Kruskal-Wallis para as variáveis meses do ano

5.2.2.2 Teste de Kruskal-Wallis para outras variáveis

5.2.3 Teste de Comparações Múltiplas de Wilcoxon

5.3 Testes de Hipóteses para as variáveis que apresentaram distribuição normal

5.3.1 Teste de Bartlett

5.3.2 Teste Anova

6. Resultados e Discussões

6.1 Construção de Gráfico Boxplot

6.1.1 Boxplot entre REGIÃO e PREÇO MÉDIO

6.1.2 Boxplot entre REGIÃO e RENDA MÉDIA

6.1.3 Boxplot entre variáveis meses do ano e REGIÃO

7. Matriz de Correlação

8. Mapas inerentes à evolução do preço do aço no Brasil

8.1 Mapa do Brasil por regiões

8.1.1 Dados necessários para a construção do mapa

8.1.2 Construção do Mapa do Brasil por regiões

8.2 Mapa do Brasil por IDH

8.2.1 Dados necessários para a construção do mapa

8.2.2 Construção do Mapa do Brasil por IDH

8.3 Mapa do Brasil por Renda Média per capita

8.3.1 Dados necessários para a construção do mapa

8.3.2 Construção do Mapa do Brasil por renda média dos estados

8.4 Mapas referentes à evolução do preço do aço no ano de 2015

8.4.1 Mapa da evolução do preço do aço em Janeiro de 2015 no Brasil

8.4.1.1 Dados necessários para a construção do mapa

8.4.1.2 Construção do Mapa do preço do aço no Brasil em Janeiro de 2015

8.4.2 Mapa da evolução do preço do aço em Julho de 2015 no Brasil

8.4.2.1 Dados necessários para a construção do mapa

8.4.2.2 Construção do Mapa do preço do aço no Brasil em Julho de 2015

8.4.3 Mapa da evolução do preço do aço em Dezembro de 2015 no Brasil

8.4.3.1 Dados necessários para a construção do mapa

8.4.3.2 Construção do Mapa do preço do aço no Brasil em Dezembro de 2015

9. Conclusão

10. Bibliografia