library(readxl)
tab <- read_excel("tabela2296.modificada.2.xlsx")
View(tab)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
tab <- tab %>% filter(is.na(Estados)==FALSE)
names(tab)
## [1] "Estados" "Unidade_da_Federacao" "Região"
## [4] "Indice_maio_2018" "Indice_maio_2022"
summary(tab)
## Estados Unidade_da_Federacao Região Indice_maio_2018
## Min. : 1.0 Length:27 Length:27 Min. :375.3
## 1st Qu.: 7.5 Class :character Class :character 1st Qu.:401.8
## Median :14.0 Mode :character Mode :character Median :418.7
## Mean :14.0 Mean :430.0
## 3rd Qu.:20.5 3rd Qu.:466.5
## Max. :27.0 Max. :535.1
## Indice_maio_2022
## Min. :627.6
## 1st Qu.:674.3
## Median :725.3
## Mean :728.3
## 3rd Qu.:769.1
## Max. :887.7
tab$Indice_maio_2018_deflacionado <- deflateBR::deflate(nominal_values = tab$Indice_maio_2018,
nominal_dates = as.Date("2018-05-01"),
real_date = "05/2022")
##
## Downloading necessary data from IPEA's API
## ...
tab$Tx_Cresc = (tab$Indice_maio_2022 - tab$Indice_maio_2018_deflacionado)/tab$Indice_maio_2018_deflacionado
View(tab)
library(flextable)
tab %>% select(Indice_maio_2018_deflacionado, Região) %>%
group_by(Região) %>%
summarise(Média=round(mean(Indice_maio_2018_deflacionado),1),
'Desvio Padrão' = round(sd(Indice_maio_2018_deflacionado),1))%>%
flextable() %>%
theme_vader()
Região | Média | Desvio Padrão |
Centro-Oeste | 581.7 | 54.7 |
Nordeste | 554.0 | 63.9 |
Norte | 563.1 | 51.4 |
Sudeste | 532.4 | 25.8 |
Sul | 540.4 | 64.5 |
tab %>% select(Indice_maio_2022, Região) %>%
group_by(Região) %>%
summarise(Média=round(mean(Indice_maio_2022),1),
'Desvio Padrão' = round(sd(Indice_maio_2022),1))%>%
flextable() %>%
theme_vader()
Região | Média | Desvio Padrão |
Centro-Oeste | 755.3 | 93.3 |
Nordeste | 707.6 | 67.4 |
Norte | 734.2 | 74.6 |
Sudeste | 740.5 | 57.8 |
Sul | 724.6 | 91.6 |
boxplot(tab$Indice_maio_2018_deflacionado ~ tab$Região,
col=c("pink","yellow"),
main = "Boxplot das Regiões Geográficas com Indices de 2018",
ylab = "Indice de 2018",
xlab = "Regiões dos Estados")
boxplot(tab$Indice_maio_2022 ~ tab$Região,
col=c("pink","yellow"),
main = "Boxplot das Regiões Geográficas com Indices de 2022",
ylab = "Indice de 2022",
xlab = "Regiões dos Estados")
plot(tab$Estados, tab$Indice_maio_2018_deflacionado,
main = "Correlação dos Estados com Índice de 2018",
pch=19, col="red",
ylab = "Indices",
xlab = "Estados")
abline(lsfit(tab$Estados, tab$Indice_maio_2018_deflacionado),col="blue")
cor(tab$Estados,tab$Indice_maio_2018_deflacionado)
## [1] -0.08129923
plot(tab$Estados, tab$Indice_maio_2022,
main = "Correlação dos Estados com Índice de 2022",
pch=19, col="red",
ylab = "Índices de 2022",
xlab = "Estados")
abline(lsfit(tab$Estados, tab$Indice_maio_2022),col="blue")
cor(tab$Estados,tab$Indice_maio_2022)
## [1] 0.06277114
varquantitativas <- c("Estados", "Indice_maio_2018_deflacionado",
"Indice_maio_2022")
varquantitativas
## [1] "Estados" "Indice_maio_2018_deflacionado"
## [3] "Indice_maio_2022"
cor(tab[varquantitativas])
## Estados Indice_maio_2018_deflacionado
## Estados 1.00000000 -0.08129923
## Indice_maio_2018_deflacionado -0.08129923 1.00000000
## Indice_maio_2022 0.06277114 0.85460267
## Indice_maio_2022
## Estados 0.06277114
## Indice_maio_2018_deflacionado 0.85460267
## Indice_maio_2022 1.00000000
library(dplyr)
tab %>% select(varquantitativas) %>% cor()
## Note: Using an external vector in selections is ambiguous.
## i Use `all_of(varquantitativas)` instead of `varquantitativas` to silence this message.
## i See <https://tidyselect.r-lib.org/reference/faq-external-vector.html>.
## This message is displayed once per session.
## Estados Indice_maio_2018_deflacionado
## Estados 1.00000000 -0.08129923
## Indice_maio_2018_deflacionado -0.08129923 1.00000000
## Indice_maio_2022 0.06277114 0.85460267
## Indice_maio_2022
## Estados 0.06277114
## Indice_maio_2018_deflacionado 0.85460267
## Indice_maio_2022 1.00000000
tab %>% select(varquantitativas) %>% cor() %>%
corrplot::corrplot(addCoef.col = TRUE,
number.cex = 0.7)
shapiro.test(tab$Indice_maio_2018_deflacionado)
##
## Shapiro-Wilk normality test
##
## data: tab$Indice_maio_2018_deflacionado
## W = 0.91948, p-value = 0.03836
shapiro.test(tab$Indice_maio_2022)
##
## Shapiro-Wilk normality test
##
## data: tab$Indice_maio_2022
## W = 0.95526, p-value = 0.2867
modelo <- aov(Estados ~ Indice_maio_2018_deflacionado, data = tab)
residuos <- residuals(modelo)
hist(residuos)
shapiro.test(residuos)
##
## Shapiro-Wilk normality test
##
## data: residuos
## W = 0.95261, p-value = 0.2479
modelo2 <- aov(Estados ~ Indice_maio_2022, data = tab)
residuos2 <- residuals(modelo2)
hist(residuos2)
shapiro.test(residuos2)
##
## Shapiro-Wilk normality test
##
## data: residuos2
## W = 0.96022, p-value = 0.3739
kruskal.test(tab$Estados ~ tab$Indice_maio_2018_deflacionado)
##
## Kruskal-Wallis rank sum test
##
## data: tab$Estados by tab$Indice_maio_2018_deflacionado
## Kruskal-Wallis chi-squared = 26, df = 26, p-value = 0.4631
#data: tab$Estados by tab$Indice_maio_2018
#Kruskal-Wallis chi-squared = 26, df = 26, p-value = 0.4631
kruskal.test(tab$Estados ~ tab$Indice_maio_2022)
##
## Kruskal-Wallis rank sum test
##
## data: tab$Estados by tab$Indice_maio_2022
## Kruskal-Wallis chi-squared = 26, df = 26, p-value = 0.4631
#data: tab$Indice_maio_2018 by tab$Indice_maio_2022
#Kruskal-Wallis chi-squared = 26, df = 26, p-value = 0.4631