library(readxl)
BasesEstados <- read_excel("C:/Users/Renato/Desktop/Estatistica/Base_de_dados-master/BasesEstados.xlsx")
head(BasesEstados)
## # A tibble: 6 x 35
## S Sigla Codigo Estado Região CodigoReg PIB Gini Agua Banheiro
## <chr> <chr> <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl>
## 1 AC AC 12 Acre Norte N 9.63e6 0.63 86.5 47.4
## 2 AL AL 27 Alago~ Norde~ NE 2.95e7 0.63 77.6 75.6
## 3 AM AM 13 Amazo~ Norte N 6.41e7 0.65 77.3 62.2
## 4 AP AP 16 Amapa Norte N 1.04e7 0.6 91.4 66.4
## 5 BA BA 29 Bahia Norde~ NE 1.68e8 0.62 85.7 77.6
## 6 CE CE 23 Ceara Norde~ NE 9.01e7 0.61 86.1 76.3
## # ... with 25 more variables: Lixo <dbl>, Energia <dbl>, Densidade <dbl>,
## # Esperancadevida <dbl>, Populacao <dbl>, Mortalidade_infantil <dbl>,
## # Prob_sobrevivencia <dbl>, IDH <dbl>, IDH_Renda <dbl>,
## # IDH_Longevidade <dbl>, IDH_Educacao <dbl>, Probab_sobrev60 <dbl>,
## # TFT <dbl>, Taxa_envelhecimento <dbl>, Taxa_analfabetismo <dbl>,
## # frequencia_liquida_EM <dbl>, Expectativa_anos_de_estudo <dbl>,
## # frequencia_liquida_Superior <dbl>, perc_com_2_anos_de_de_atraso <dbl>,
## # Renda_per_capita <dbl>, Renda_per_capita_nula <dbl>,
## # Perc_pobres <dbl>, Perc_extremamente_pobres <dbl>,
## # Despesa_Corrente <dbl>, Despesa_Corrente_per_capita <dbl>
rho <- cor(BasesEstados$Agua, BasesEstados$Banheiro)
rho
## [1] 0.7429359
par(mfrow=c(1,1))
plot(BasesEstados$Agua,BasesEstados$Banheiro, col = "darkblue", pch=20, xlab = "Água", ylab = "Banheiros", main = "Diagrama de dispersão de Água por Banheiro")
Percebe-se pelo gráfico que existe uma concentração maior de Banheiros nos locais onde há mais Água. Apesar de haver alguma dispersão, pode-se observar uma forte correlação entre essas variáveis.
library(ggplot2)
ggplot(BasesEstados, aes(x=Agua, y=Banheiro) ) +
geom_hex(bins = 10) +
scale_fill_continuous(type = "viridis") +
theme_bw()
O gráfico de Densidade 2D corrobora a análise anterior, constatando que onde há mais água, há maior concentração de banheiros.