Trabalho Final de Estatística

1 - Introdução

Na construção civil o orçamento financeiro se constitui como uma das etapas mais importantes dos empreendimentos. Com isso, quando o orçamento é malfeito, fatalmente ocorrem imperfeições e possíveis frustrações de custo e prazo. Enquanto a norma NBR ISO 31.000 (2009:2) diz que risco é o efeito da incerteza nos objetivos, o guia PMBOK (2017) afirma que “risco é um evento ou uma condição incerta que, se ocorrer, tem um efeito em pelo menos um objetivo do projeto.” É tratado como risco o aumento do custo real de determinada atividade, ou insumo, em comparação ao orçamento inicial. Os autores Harzer, Souza e Silva (2014), consideram por risco sempre que seja possível atribuir um valor para mensurar uma perda potencial no orçamento de uma construção.

Mais recentemente, pesquisas foram realizadas para acompanhar os custos relativos à construção civil, no que apresenta um aumento nos últimos anos em relação aos materiais. Este fator influencia diretamente no aumento de insumos do orçamento, no que causa um risco devido aos orçamentos projetados com um cronograma mais extenso por conta do valor calculado inicialmente e o seu valor atual, quando não são considerados.

O Sistema Nacional de Pesquisa de Custos e Índices da Construção Civil - SINAPI tem por objetivo a produção de séries mensais de custos e índices para o setor habitacional, e de séries mensais de salários medianos de mão de obra e preços medianos de materiais, máquinas e equipamentos e serviços da construção para os setores de saneamento básico, infraestrutura e habitação. O Sistema é uma produção conjunta do IBGE e da Caixa Econômica Federal - Caixa, realizada por meio de acordo de cooperação técnica, cabendo ao Instituto a responsabilidade da coleta, apuração e cálculo, enquanto à CAIXA, a definição e manutenção dos aspectos de engenharia, tais como projetos, composições de serviços etc. As estatísticas do SINAPI são fundamentais na programação de investimentos, sobretudo para o setor público. Os preços e custos auxiliam na elaboração, análise e avaliação de orçamentos, enquanto os índices possibilitam a atualização dos valores das despesas nos contratos e orçamentos.

2 - Objetivo

O objetivo do estudo desenvolvido foi demonstrar a variância do Índice Nacional da Construção Civil - INCC através dos resultados da SINAPI no ano de 2018 com o ano de 2022 para assim identificar e analisar a variação desses insumos e como isso influencia no orçamento. E apresentar o impacto desses resultados através dos gráficos e testes de hipóteses.

3 - Metodologia

O objetivo principal deste trabalho foi “Analisar a variação da tabela do INCC da SINAPI.” Para o estudo utilizamos a coleta de dados do mês de maio do ano de 2018 até maio de 2022, extraída do banco de dados SIDRA, atraves do link (https://sidra.ibge.gov.br/tabela/2296). Com enfoque nos materiais da construção civil que serviram de base para elaboração dos gráficos. A tabela a seguir apresenta a base de dados que foi utilizada:

Tabela 2296 (tab) - Custo médio m² em moeda corrente e variações percentuais no ano

Variável - Custo médio m² - componente material - número-índice (Número-índice)

Variável Qualitativa: Região (Estados da Região Geográfica)

Variável Quantitativa: Índice no ano de 2018 Deflacionado e Índice do ano de 2022 (Indice_maio_2018_deflacionado) e (Indice_maio_2022)

O trabalho foi elaborado no programa de estátistica RStudio em script em seguida foi lançado no RMarkdown para edição e em seguida a publicação em HTML

library(readxl)
tab <- read_excel("tabela2296.modificada.2.xlsx")
View(tab)
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

tab <- tab %>% filter(is.na(Estados)==FALSE) 
names(tab)

## [1] "Estados"              "Unidade_da_Federacao" "Região"              
## [4] "Indice_maio_2018"     "Indice_maio_2022"

4 - Resultados e Discussões

O INCC apresenta uma grande variação do ano de 2018 para o ano vigente(2022), conforme apresenta a tabela a seguir:

4.1 - Deflação dos Estados

Foi realizado o cálculo de deflação para cada estado do país e a sua taxa de crescimento, conforme veremos a seguir:

summary(tab)

##     Estados     Unidade_da_Federacao    Região          Indice_maio_2018
##  Min.   : 1.0   Length:27            Length:27          Min.   :375.3   
##  1st Qu.: 7.5   Class :character     Class :character   1st Qu.:401.8   
##  Median :14.0   Mode  :character     Mode  :character   Median :418.7   
##  Mean   :14.0                                           Mean   :430.0   
##  3rd Qu.:20.5                                           3rd Qu.:466.5   
##  Max.   :27.0                                           Max.   :535.1   
##  Indice_maio_2022
##  Min.   :627.6   
##  1st Qu.:674.3   
##  Median :725.3   
##  Mean   :728.3   
##  3rd Qu.:769.1   
##  Max.   :887.7

Deflação dos Estados e a Taxa de Crescimento

tab$Indice_maio_2018_deflacionado <- deflateBR::deflate(nominal_values = tab$Indice_maio_2018,
                                                        nominal_dates = as.Date("2018-05-01"),
                                                        real_date = "05/2022")

## 
## Downloading necessary data from IPEA's API
## ...

tab$Tx_Cresc = (tab$Indice_maio_2022 - tab$Indice_maio_2018_deflacionado)/tab$Indice_maio_2018_deflacionado


View(tab)

library(flextable)

Qualitativa: Região

Quantitativa: Indice de 2018

tab %>% select(Indice_maio_2018_deflacionado, Região) %>%
  group_by(Região) %>%
  summarise(Média=round(mean(Indice_maio_2018_deflacionado),1),
            'Desvio Padrão' = round(sd(Indice_maio_2018_deflacionado),1))%>%
  flextable() %>%
  theme_vader()

Região	Média	Desvio Padrão
Centro-Oeste	581.7	54.7
Nordeste	554.0	63.9
Norte	563.1	51.4
Sudeste	532.4	25.8
Sul	540.4	64.5

Qualitativa: Região

Quantitativa: Indice de 2022

tab %>% select(Indice_maio_2022, Região) %>%
  group_by(Região) %>%
  summarise(Média=round(mean(Indice_maio_2022),1),
            'Desvio Padrão' = round(sd(Indice_maio_2022),1))%>%
  flextable() %>%
  theme_vader()

Região	Média	Desvio Padrão
Centro-Oeste	755.3	93.3
Nordeste	707.6	67.4
Norte	734.2	74.6
Sudeste	740.5	57.8
Sul	724.6	91.6

4.2 - Boxplot

Foram analisadas duas variáveis, uma qualitativa(Região) e outra quantitativa(Indices), conforme apresentado o gráfico abaixo, um boxplot para visualização da relação entre as variáveis no ano de 2018(deflacionado) e o ano de 2022.

Qualitativa: Região

Quantitativa: Índice de 2018 Deflacionado

boxplot(tab$Indice_maio_2018_deflacionado ~ tab$Região,
        col=c("pink","yellow"),
        main = "Boxplot das Regiões Geográficas com Indices de 2018",
        ylab = "Indice de 2018",
        xlab = "Regiões dos Estados")

Qualitativa: Região

Quantitativa: Índice de 2022

boxplot(tab$Indice_maio_2022 ~ tab$Região,
        col=c("pink","yellow"),
        main = "Boxplot das Regiões Geográficas com Indices de 2022",
        ylab = "Indice de 2022",
        xlab = "Regiões dos Estados")

4.3 - Diagrama de Dispersão

Índice de 2018 Deflacionado

plot(tab$Estados, tab$Indice_maio_2018_deflacionado,
     main = "Correlação dos Estados com Índice de 2018",
     pch=19, col="red",
     ylab = "Indices",
     xlab = "Estados")
abline(lsfit(tab$Estados, tab$Indice_maio_2018_deflacionado),col="blue")

cor(tab$Estados,tab$Indice_maio_2018_deflacionado)

## [1] -0.08129923

Índice de 2022

plot(tab$Estados, tab$Indice_maio_2022,
     main = "Correlação dos Estados com Índice de 2022",
     pch=19, col="red",
     ylab = "Índices de 2022",
     xlab = "Estados")
abline(lsfit(tab$Estados, tab$Indice_maio_2022),col="blue")

cor(tab$Estados,tab$Indice_maio_2022)

## [1] 0.06277114

4.4 - Matriz de Correlação

varquantitativas <- c("Estados", "Indice_maio_2018_deflacionado",
                      "Indice_maio_2022")
varquantitativas

## [1] "Estados"                       "Indice_maio_2018_deflacionado"
## [3] "Indice_maio_2022"

cor(tab[varquantitativas])

##                                   Estados Indice_maio_2018_deflacionado
## Estados                        1.00000000                   -0.08129923
## Indice_maio_2018_deflacionado -0.08129923                    1.00000000
## Indice_maio_2022               0.06277114                    0.85460267
##                               Indice_maio_2022
## Estados                             0.06277114
## Indice_maio_2018_deflacionado       0.85460267
## Indice_maio_2022                    1.00000000

library(dplyr)

tab %>% select(varquantitativas) %>% cor()

## Note: Using an external vector in selections is ambiguous.
## i Use `all_of(varquantitativas)` instead of `varquantitativas` to silence this message.
## i See <https://tidyselect.r-lib.org/reference/faq-external-vector.html>.
## This message is displayed once per session.

##                                   Estados Indice_maio_2018_deflacionado
## Estados                        1.00000000                   -0.08129923
## Indice_maio_2018_deflacionado -0.08129923                    1.00000000
## Indice_maio_2022               0.06277114                    0.85460267
##                               Indice_maio_2022
## Estados                             0.06277114
## Indice_maio_2018_deflacionado       0.85460267
## Indice_maio_2022                    1.00000000

tab %>% select(varquantitativas) %>% cor() %>%
  corrplot::corrplot(addCoef.col = TRUE,
                     number.cex = 0.7)

4.5 - Teste de hipóteses

a) Teste de Shapiro Wilk

Teste de normalidade (Shapiro Wilk)

H0: os dados seguem uma distribuição normal

H1: os dados NÃO seguem uma distribuição normal

alpha = 0.05

Ano de 2018

shapiro.test(tab$Indice_maio_2018_deflacionado)

## 
##  Shapiro-Wilk normality test
## 
## data:  tab$Indice_maio_2018_deflacionado
## W = 0.91948, p-value = 0.03836

W = 0.91948, p-value = 0.03836

Resultou-se que para a variável quantitativa do Indice de 2018, o P-valor foi menor do que 0,05, logo rejeita-se H0. Concluindo que os dados não seguem uma distribuição normal no Ano de 2018.

Ano de 2022

shapiro.test(tab$Indice_maio_2022)

## 
##  Shapiro-Wilk normality test
## 
## data:  tab$Indice_maio_2022
## W = 0.95526, p-value = 0.2867

W = 0.95526, p-value = 0.2867

Resultou-se que para a variável quantitativa do Indice de 2022, o P-valor foi maior do que 0,05, logo não rejeita o H0. Concluindo que os dados seguem uma distribuição normal no Ano de 2022.

Segue abaixo os gráficos de histograma e QQ-plot. Esses gráficos ajudam a decidir se a distribuição é normal

Ano de 2018 Deflacionado

modelo <- aov(Estados ~ Indice_maio_2018_deflacionado, data = tab)
residuos <- residuals(modelo)
hist(residuos)

shapiro.test(residuos)

## 
##  Shapiro-Wilk normality test
## 
## data:  residuos
## W = 0.95261, p-value = 0.2479

W = 0.95261, p-value = 0.2479

p-valor > alpha. Os residuos seguem uma distribuição normal. Pressuposto de normalidade garantido

Ano de 2022

modelo2 <- aov(Estados ~ Indice_maio_2022, data = tab)
residuos2 <- residuals(modelo2)
hist(residuos2)

shapiro.test(residuos2)

## 
##  Shapiro-Wilk normality test
## 
## data:  residuos2
## W = 0.96022, p-value = 0.3739

W = 0.96022, p-value = 0.3739

p-valor > alpha. Os residuos seguem uma distribuição normal. Pressuposto de normalidade garantido

b) Teste de Kruskal

Teste de 2018

kruskal.test(tab$Estados ~ tab$Indice_maio_2018_deflacionado)

## 
##  Kruskal-Wallis rank sum test
## 
## data:  tab$Estados by tab$Indice_maio_2018_deflacionado
## Kruskal-Wallis chi-squared = 26, df = 26, p-value = 0.4631

#data:  tab$Estados by tab$Indice_maio_2018
#Kruskal-Wallis chi-squared = 26, df = 26, p-value = 0.4631

Teste de 2022

kruskal.test(tab$Estados ~ tab$Indice_maio_2022)

## 
##  Kruskal-Wallis rank sum test
## 
## data:  tab$Estados by tab$Indice_maio_2022
## Kruskal-Wallis chi-squared = 26, df = 26, p-value = 0.4631

#data:  tab$Indice_maio_2018 by tab$Indice_maio_2022
#Kruskal-Wallis chi-squared = 26, df = 26, p-value = 0.4631

Conforme observado nos dois testes (2018 e 2022) o p-valor é maior do que 0,05, logo não rejeita-se H0, ou seja, apresentam distribuições normais.

5 - Conclusão

Os resultados evidenciam que ocorreram grandes variações na tabela do INCC nos últimos anos. Contudo, deflacionamos os valores do ano de 2018 para podermos fazer o comparativo com o atual ano de 2022, resultando assim em uma taxa de crescimento que varia de 19% à 44% de aumento do índice, sendo a região que mais teve aumento foi a região Sudeste e a que teve a menor taxa de crescimento foi a região Nordeste. Conforme foi apresentado anteriormente nos gráficos, os Estados dentro de cada região e seus respectivos aumentos. Este aumento influencia diretamente no orçamento da construção civil, podendo assim enfatizar a importância da atualização dos valores da taxa de crescimento da tabela do INCC para a melhor elaboração e resultado de um orçamento.

6 - Referências Bibliográficas

ABNT, ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS 12721: Avaliação de custos de construção para incorporação imobiliária e outras disposições para condomínios edilícios, Rio de Janeiro, 2006.

ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR ISO 31000:2018 Gestão de riscos ― Diretrizes. Rio de Janeiro, 2018

CÂMARA BRASILEIRA DA INDÚSTRIA DA CONSTRUÇÃO - CBIC. Informativo Econômico. CBIC. 2021. 7 p. Disponível em: https://cbic.org.br/wpcontent/uploads/2021/05/informativo-economico-incc-e-sinapi-abril-2021-final-1.pdf

HARZER J. H.; SOUZA A.; SILVA W. V. Abordagem probabilística do indicador TMA/TIR para avaliação do risco financeiro em projetos de investimentos. XXI Congresso Brasileiro de Custos – Natal, RN, Brasil, 2014.

Trabalho Final de Estatística

Análise do INCC do ano de 2018 para o ano de 2022

Késia Ribeiro

2022-07-07

1 - Introdução

2 - Objetivo

3 - Metodologia

Tabela 2296 (tab) - Custo médio m² em moeda corrente e variações percentuais no ano

Variável - Custo médio m² - componente material - número-índice (Número-índice)

Variável Qualitativa: Região (Estados da Região Geográfica)

Variável Quantitativa: Índice no ano de 2018 Deflacionado e Índice do ano de 2022 (Indice_maio_2018_deflacionado) e (Indice_maio_2022)

O trabalho foi elaborado no programa de estátistica RStudio em script em seguida foi lançado no RMarkdown para edição e em seguida a publicação em HTML

4 - Resultados e Discussões

O INCC apresenta uma grande variação do ano de 2018 para o ano vigente(2022), conforme apresenta a tabela a seguir:

4.1 - Deflação dos Estados

Foi realizado o cálculo de deflação para cada estado do país e a sua taxa de crescimento, conforme veremos a seguir:

Deflação dos Estados e a Taxa de Crescimento

Qualitativa: Região

Quantitativa: Indice de 2018

Qualitativa: Região

Quantitativa: Indice de 2022

4.2 - Boxplot

Foram analisadas duas variáveis, uma qualitativa(Região) e outra quantitativa(Indices), conforme apresentado o gráfico abaixo, um boxplot para visualização da relação entre as variáveis no ano de 2018(deflacionado) e o ano de 2022.

Qualitativa: Região

Quantitativa: Índice de 2018 Deflacionado

Qualitativa: Região

Quantitativa: Índice de 2022

4.3 - Diagrama de Dispersão

Índice de 2018 Deflacionado

Índice de 2022

4.4 - Matriz de Correlação

4.5 - Teste de hipóteses

a) Teste de Shapiro Wilk

Teste de normalidade (Shapiro Wilk)

H0: os dados seguem uma distribuição normal

H1: os dados NÃO seguem uma distribuição normal

alpha = 0.05

Ano de 2018

W = 0.91948, p-value = 0.03836

Resultou-se que para a variável quantitativa do Indice de 2018, o P-valor foi menor do que 0,05, logo rejeita-se H0. Concluindo que os dados não seguem uma distribuição normal no Ano de 2018.

Ano de 2022

W = 0.95526, p-value = 0.2867

Resultou-se que para a variável quantitativa do Indice de 2022, o P-valor foi maior do que 0,05, logo não rejeita o H0. Concluindo que os dados seguem uma distribuição normal no Ano de 2022.

Segue abaixo os gráficos de histograma e QQ-plot. Esses gráficos ajudam a decidir se a distribuição é normal

Ano de 2018 Deflacionado

W = 0.95261, p-value = 0.2479

p-valor > alpha. Os residuos seguem uma distribuição normal. Pressuposto de normalidade garantido

Ano de 2022

W = 0.96022, p-value = 0.3739

p-valor > alpha. Os residuos seguem uma distribuição normal. Pressuposto de normalidade garantido

b) Teste de Kruskal

Teste de 2018

Teste de 2022

Conforme observado nos dois testes (2018 e 2022) o p-valor é maior do que 0,05, logo não rejeita-se H0, ou seja, apresentam distribuições normais.

5 - Conclusão

6 - Referências Bibliográficas

ABNT, ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS 12721: Avaliação de custos de construção para incorporação imobiliária e outras disposições para condomínios edilícios, Rio de Janeiro, 2006.

ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR ISO 31000:2018 Gestão de riscos ― Diretrizes. Rio de Janeiro, 2018

CÂMARA BRASILEIRA DA INDÚSTRIA DA CONSTRUÇÃO - CBIC. Informativo Econômico. CBIC. 2021. 7 p. Disponível em: https://cbic.org.br/wpcontent/uploads/2021/05/informativo-economico-incc-e-sinapi-abril-2021-final-1.pdf

HARZER J. H.; SOUZA A.; SILVA W. V. Abordagem probabilística do indicador TMA/TIR para avaliação do risco financeiro em projetos de investimentos. XXI Congresso Brasileiro de Custos – Natal, RN, Brasil, 2014.

PROJECT MANAGEMENT INSTITUTE - PMI. “Um Guia do Conhecimento em Gerenciamento de Projeto (Guia PMBOK) - 6ª edição”, 2017.

https://sidra.ibge.gov.br/tabela/2296

https://livro.metodosquantitativos.com/docs/