O Instituto Brasileiro de Geografia e Estatística (IBGE) é o principal provedor de dados e informações do País e, no desempenho de suas funções, produz e analisa informações estatísticas que contribuem para a formulação, validação e avaliação de políticas orientadas para o desenvolvimento socioeconômico e melhoria das condições de vida da população no País (IBGE, 2020).
O IBGE realiza censos demográficos e a Pesquisa Nacional por Amostra de Domicílios. Alguns dados coletados nessas ações são: IDH, percentual da população em domicílios com água encanada, percentual da população em domicílios com banheiro e água encanada, percentual da população em domicílios com energia elétrica e Índice de Desenvolvimento Humano (IDH), os quais serão estudados neste relatório.
“O Índice de Desenvolvimento Humano (IDH) é uma medida resumida do progresso a longo prazo em três dimensões básicas do desenvolvimento humano: renda, educação e saúde. O objetivo da criação do IDH foi o de oferecer um contraponto a outro indicador muito utilizado, o Produto Interno Bruto (PIB) per capita, que considera apenas a dimensão econômica do desenvolvimento.” (PNUD, 2020).
De acordo com o Atlas do Desenvolvimento Humano no Brasil (2020), as faixas de desenvolvimento humano são:
MUITO ALTO: 0,800 - 1,000
ALTO: 0,700 - 0,799
MÉDIO: 0,600 - 0,699
BAIXO: 0,500 - 0,599
MUITO BAIXO: 0,000 - 0,499
O objetivo do estudo desenvolvido é avaliar o impacto do IDH no acesso à saneamento básico e à energia elétrica, por meio da obtenção da correlação do IDH (Índice de Desenvolvimento Humano) com a taxa da população em domicílios com banheiro, água encanada e energia elétrica de cada unidade da federação; da avaliação visual de mapas temáticos e da análise de gráficos boxplot construídos a partir de uma base de dados.
As etapas que constituem a Metodologia da pesquisa desenvolvida neste trabalho serão expostas neste tópico.
Inicialmente, foi necessário selecionar e carregar a base de dados para o ambiente do RStudio. A fonte selecionada é uma base de dados do IBGE que contém informações sobre população, indicadores sociais e econômicos dos estados brasileiros e Distrito Federal, relativas ao ano de 2010.
Na tabela a seguir, está a base de dados utilizada.
#Carregar biblioteca para incluir tabela
library(kableExtra)
#Carregar base de dados objeto da pesquisa
library(readxl)
dados <- read_excel("BasesEstados2.xlsx",
sheet = "dados")
#Execução e manipulação da tabela
kable(dados, row.names = FALSE)%>%
kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"),
position = "center", fixed_thead = T) %>%
scroll_box(width = "900px", height = "600px")
| S | Sigla | Codigo | Estado | Regiao | CodigoReg | PIB | Gini | Agua | Banheiro | Lixo | Energia | Densidade | Esperancadevida | Populacao | Mortalidade_infantil | Prob_sobrevivencia | IDH | IDH_Renda | IDH_Longevidade | IDH_Educacao | Probab_sobrev60 | TFT | Taxa_envelhecimento | Taxa_analfabetismo | frequencia_liquida_EM | Expectativa_anos_de_estudo | frequencia_liquida_Superior | perc_com_2_anos_de_de_atraso | Renda_per_capita | Renda_per_capita_nula | Perc_pobres | Perc_extremamente_pobres | Despesa_Corrente | Despesa_Corrente_per_capita |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| AC | AC | 12 | Acre | Norte | N | 9629239 | 0.63 | 86.51 | 47.42 | 93.63 | 91.14 | 46.05 | 71.63 | 733559 | 23.01 | 94.62 | 0.663 | 0.671 | 0.777 | 0.559 | 84.53 | 2.95 | 4.32 | 21.29 | 48.45 | 8.69 | 10.50 | 22.57 | 522.15 | 550.76 | 29.46 | 22.69 | 2739927889 | 3735.116 |
| AL | AL | 27 | Alagoas | Nordeste | NE | 29544708 | 0.63 | 77.56 | 75.64 | 96.16 | 98.98 | 35.04 | 70.32 | 3120494 | 28.40 | 93.36 | 0.631 | 0.641 | 0.755 | 0.520 | 82.31 | 2.22 | 6.01 | 30.57 | 36.86 | 9.07 | 9.18 | 27.34 | 432.56 | 439.17 | 34.29 | 24.77 | 4408229588 | 1412.670 |
| AM | AM | 13 | Amazonas | Norte | N | 64119836 | 0.65 | 77.32 | 62.16 | 92.98 | 92.18 | 57.95 | 73.30 | 3483985 | 17.01 | 96.03 | 0.674 | 0.677 | 0.805 | 0.561 | 87.24 | 2.59 | 4.03 | 12.30 | 39.09 | 8.54 | 10.06 | 26.68 | 539.80 | 565.89 | 30.78 | 23.38 | 7778802887 | 2232.731 |
| AP | AP | 16 | Amapa | Norte | N | 10419539 | 0.60 | 91.44 | 66.38 | 96.38 | 98.27 | 53.98 | 73.80 | 669526 | 15.14 | 96.47 | 0.708 | 0.694 | 0.813 | 0.629 | 88.14 | 2.48 | 3.44 | 11.20 | 50.97 | 9.44 | 12.95 | 22.08 | 598.98 | 609.44 | 24.07 | 14.45 | 2317897869 | 3461.998 |
| BA | BA | 29 | Bahia | Nordeste | NE | 167727375 | 0.62 | 85.66 | 77.60 | 95.35 | 96.45 | 27.91 | 71.97 | 14016906 | 21.73 | 94.92 | 0.660 | 0.663 | 0.783 | 0.555 | 85.09 | 2.05 | 7.23 | 20.92 | 40.53 | 8.63 | 7.86 | 29.80 | 496.73 | 503.15 | 28.72 | 21.24 | 21502299427 | 1534.026 |
| CE | CE | 23 | Ceara | Nordeste | NE | 90131724 | 0.61 | 86.08 | 76.28 | 93.56 | 99.08 | 34.13 | 72.60 | 8452381 | 19.29 | 95.50 | 0.682 | 0.651 | 0.793 | 0.615 | 86.20 | 1.99 | 7.54 | 23.95 | 52.18 | 9.82 | 9.68 | 18.54 | 460.63 | 465.38 | 30.32 | 22.38 | 12325234404 | 1458.197 |
| DF | DF | 53 | Distrito Federal | Centro-Oeste | MW | 171235534 | 0.63 | 98.13 | 96.01 | 98.87 | 99.91 | 23.48 | 77.35 | 2570160 | 14.01 | 94.57 | 0.824 | 0.863 | 0.873 | 0.742 | 86.19 | 1.75 | 4.97 | 4.31 | 63.19 | 9.87 | 24.55 | 16.29 | 1715.11 | 1716.52 | 4.93 | 2.24 | 10981410590 | 4272.656 |
| ES | ES | 32 | Espirito Santo | Sudeste | SE | 107328771 | 0.56 | 96.45 | 96.89 | 97.93 | 99.83 | 20.59 | 75.10 | 3514952 | 14.15 | 92.57 | 0.740 | 0.743 | 0.835 | 0.653 | 82.28 | 1.80 | 7.08 | 10.15 | 56.33 | 9.36 | 14.86 | 17.05 | 815.43 | 818.90 | 9.53 | 4.72 | 9689078646 | 2756.532 |
| GO | GO | 52 | Goias | Centro-Oeste | MW | 123926301 | 0.55 | 96.76 | 93.66 | 98.65 | 99.39 | 19.26 | 74.60 | 6003788 | 13.96 | 93.33 | 0.735 | 0.742 | 0.827 | 0.646 | 82.69 | 1.87 | 6.25 | 10.06 | 58.28 | 9.72 | 16.32 | 15.98 | 810.97 | 814.76 | 7.59 | 3.75 | 12818102561 | 2135.003 |
| MA | MA | 21 | Maranhao | Nordeste | NE | 58819683 | 0.62 | 82.12 | 51.79 | 79.08 | 96.10 | 42.70 | 70.40 | 6574789 | 28.03 | 93.45 | 0.639 | 0.612 | 0.757 | 0.562 | 82.45 | 2.56 | 6.02 | 27.15 | 44.49 | 9.26 | 6.97 | 25.18 | 360.34 | 373.40 | 39.53 | 31.42 | 7376867858 | 1121.993 |
| MG | MG | 31 | Minas Gerais | Sudeste | SE | 403551318 | 0.56 | 94.44 | 94.91 | 97.85 | 99.35 | 18.91 | 75.30 | 19597330 | 15.08 | 93.77 | 0.731 | 0.730 | 0.838 | 0.638 | 82.95 | 1.79 | 8.12 | 10.36 | 56.78 | 9.38 | 14.97 | 17.51 | 749.69 | 753.07 | 10.97 | 6.35 | 39703443889 | 2025.962 |
| MS | MS | 50 | Mato Grosso do Sul | Centro-Oeste | MW | 54471447 | 0.56 | 96.22 | 93.76 | 98.64 | 98.63 | 24.97 | 74.96 | 2449024 | 18.14 | 93.21 | 0.729 | 0.740 | 0.833 | 0.629 | 83.02 | 2.04 | 6.62 | 9.72 | 50.43 | 10.08 | 15.93 | 17.80 | 799.34 | 804.67 | 9.92 | 6.34 | 6830726301 | 2789.163 |
| MT | MT | 51 | Mato Grosso | Centro-Oeste | MW | 80830108 | 0.55 | 95.17 | 90.37 | 97.11 | 98.01 | 26.58 | 74.25 | 3035122 | 16.80 | 92.82 | 0.725 | 0.732 | 0.821 | 0.635 | 82.21 | 2.08 | 5.12 | 10.82 | 57.09 | 9.29 | 15.39 | 17.35 | 762.52 | 774.44 | 10.52 | 6.84 | 8649397120 | 2849.769 |
| PA | PA | 15 | Para | Norte | N | 91009014 | 0.62 | 84.70 | 57.50 | 91.92 | 91.89 | 49.40 | 72.36 | 7581051 | 20.29 | 95.26 | 0.646 | 0.646 | 0.789 | 0.528 | 85.74 | 2.50 | 4.75 | 14.98 | 36.84 | 8.49 | 6.84 | 31.25 | 446.76 | 463.80 | 32.33 | 22.76 | 10158797999 | 1340.025 |
| PB | PB | 25 | Paraiba | Nordeste | NE | 38731149 | 0.61 | 81.96 | 78.91 | 96.50 | 99.43 | 28.94 | 72.00 | 3766528 | 21.67 | 94.94 | 0.658 | 0.656 | 0.783 | 0.555 | 85.12 | 1.95 | 8.53 | 27.42 | 41.93 | 9.24 | 12.12 | 25.96 | 474.94 | 479.78 | 28.93 | 21.09 | 5501088472 | 1460.520 |
| PE | PE | 26 | Pernambuco | Nordeste | NE | 117340092 | 0.62 | 83.69 | 78.22 | 94.74 | 99.47 | 29.89 | 72.32 | 8796448 | 20.43 | 95.23 | 0.673 | 0.673 | 0.789 | 0.574 | 85.68 | 1.92 | 7.37 | 22.23 | 44.08 | 9.13 | 9.62 | 23.75 | 525.64 | 531.61 | 27.17 | 19.75 | 16318603007 | 1855.136 |
| PI | PI | 22 | Piaui | Nordeste | NE | 25720626 | 0.61 | 81.60 | 67.12 | 87.61 | 93.01 | 31.44 | 71.62 | 3118360 | 23.05 | 94.61 | 0.646 | 0.635 | 0.777 | 0.547 | 84.51 | 1.99 | 7.44 | 29.16 | 42.93 | 9.23 | 12.29 | 27.93 | 416.93 | 424.02 | 34.11 | 27.60 | 4225356568 | 1354.993 |
| PR | PR | 41 | Parana | Sul | S | 255926608 | 0.53 | 96.71 | 96.69 | 99.18 | 99.60 | 16.85 | 74.80 | 10444526 | 13.08 | 93.64 | 0.749 | 0.757 | 0.830 | 0.668 | 83.48 | 1.86 | 7.53 | 7.86 | 60.70 | 10.43 | 18.53 | 14.64 | 890.89 | 893.61 | 6.46 | 3.51 | 19876326503 | 1903.038 |
| RJ | RJ | 33 | Rio de Janeiro | Sudeste | SE | 504221370 | 0.59 | 95.84 | 94.73 | 97.59 | 99.92 | 30.33 | 75.10 | 15989929 | 14.15 | 92.57 | 0.761 | 0.782 | 0.835 | 0.675 | 82.28 | 1.68 | 8.91 | 5.07 | 52.52 | 9.17 | 15.38 | 21.18 | 1039.30 | 1040.90 | 7.23 | 4.02 | 44483694633 | 2781.982 |
| RN | RN | 24 | Rio Grande do Norte | Nordeste | NE | 39543679 | 0.60 | 89.15 | 85.06 | 97.51 | 99.36 | 29.67 | 72.52 | 3168027 | 19.70 | 95.40 | 0.684 | 0.678 | 0.792 | 0.597 | 86.02 | 1.98 | 7.54 | 23.16 | 45.96 | 9.54 | 12.50 | 23.11 | 545.42 | 549.56 | 23.79 | 16.44 | 6189187740 | 1953.641 |
| RO | RO | 11 | Rondonia | Norte | N | 29361936 | 0.56 | 95.13 | 79.62 | 94.64 | 97.26 | 27.15 | 72.97 | 1562409 | 18.02 | 95.80 | 0.690 | 0.712 | 0.800 | 0.577 | 86.77 | 2.16 | 4.69 | 11.46 | 47.34 | 9.20 | 11.63 | 20.79 | 670.82 | 685.13 | 14.80 | 9.16 | 4065844380 | 2602.292 |
| RR | RR | 14 | Roraima | Norte | N | 7313836 | 0.63 | 93.35 | 74.04 | 96.68 | 90.73 | 51.22 | 73.51 | 450479 | 16.11 | 96.24 | 0.707 | 0.695 | 0.809 | 0.628 | 87.67 | 2.41 | 3.45 | 13.07 | 51.40 | 8.69 | 13.58 | 21.59 | 605.59 | 641.28 | 26.65 | 22.26 | 1748167767 | 3880.686 |
| RS | RS | 43 | Rio Grande do Sul | Sul | S | 277657666 | 0.54 | 96.17 | 96.46 | 99.24 | 99.71 | 16.25 | 75.38 | 10693929 | 12.38 | 94.43 | 0.746 | 0.769 | 0.840 | 0.642 | 84.16 | 1.76 | 9.26 | 5.44 | 55.56 | 10.00 | 18.50 | 16.70 | 959.24 | 961.50 | 6.37 | 4.01 | 30151892932 | 2819.534 |
| SC | SC | 42 | Santa Catarina | Sul | S | 177275691 | 0.49 | 94.13 | 97.00 | 99.31 | 99.81 | 13.15 | 76.61 | 6248436 | 11.54 | 94.98 | 0.774 | 0.773 | 0.860 | 0.697 | 85.72 | 1.71 | 6.89 | 5.11 | 61.85 | 10.24 | 19.17 | 12.66 | 983.90 | 985.70 | 3.65 | 1.93 | 11609996145 | 1858.064 |
| SE | SE | 28 | Sergipe | Nordeste | NE | 27823191 | 0.62 | 89.13 | 82.24 | 97.14 | 99.18 | 29.14 | 71.84 | 2068017 | 22.22 | 94.81 | 0.665 | 0.672 | 0.781 | 0.560 | 84.88 | 1.95 | 6.14 | 23.30 | 37.93 | 9.01 | 12.68 | 29.82 | 523.53 | 527.71 | 27.89 | 18.70 | 5288791762 | 2557.422 |
| SP | SP | 35 | Sao Paulo | Sudeste | SE | 1408903866 | 0.56 | 98.57 | 97.12 | 99.62 | 99.91 | 28.66 | 75.69 | 41262199 | 13.86 | 94.80 | 0.783 | 0.789 | 0.845 | 0.719 | 84.30 | 1.66 | 7.82 | 5.21 | 66.65 | 10.33 | 16.91 | 10.98 | 1084.46 | 1085.22 | 4.66 | 2.30 | 126050054074 | 3054.855 |
| TO | TO | 17 | Tocantins | Norte | N | 19529689 | 0.60 | 94.33 | 80.41 | 94.35 | 94.74 | 31.22 | 72.56 | 1383445 | 19.56 | 95.43 | 0.699 | 0.690 | 0.793 | 0.624 | 86.08 | 2.41 | 5.82 | 17.14 | 53.47 | 9.80 | 14.35 | 18.80 | 586.62 | 597.07 | 22.15 | 14.96 | 3732488875 | 2697.967 |
A tabela abaixo constitui o dicionário de dados, em que constam as variáveis e uma breve explicação do que cada uma delas significa.
#Carregar base de dados em que consta o dicionário de dados
library(readxl)
dicio <- read_excel("BasesEstados2.xlsx",
sheet = "dicionario")
#Execução e manipulação da tabela
library(DT)
DT::datatable(dicio, rownames = FALSE, colnames = FALSE)
As variáveis de interesse utilizadas no estudo desta base de dados são:
Agua (% da população em domicílios com água encanada);
Banheiro (% da população em domicílios com banheiro e água encanada);
Energia (% da população em domicílios com energia elétrica);
IDH (IDHM);
Regiao;
Estados.
Primeiramente, foram elaborados os gráficos do tipo Boxplot entre a variável qualitativa Região e as variáveis Energia, IDH, Agua e Banheiro. Em seguida, foi executada a matriz de correlação entre as variáveis Energia, Banheiro e IDH de cada unidade da federação. Ao fim dessas etapas, foram elaborados gráficos do tipo geobr, que permitem a elaboração de mapas do Brasil utilizando as variáveis Estados e as quantitativas de interesse do estudo, para facilitar a visualização dos dados apresentados.
Além da construção e análise de dados, o estudo abrangeu testes de hipóteses.
Foram executados testes de hipóteses para avaliar se a variável Região interfere nas variáveis Banheiro e IDH. Adotou-se alpha=0,05 para todos os testes realizados. Dessa forma, a regra de decisão foi definida como:
Se p-value ≤ alpha, rejeita H0.
Se p-value > alpha, não rejeita H0.
O primeiro teste de hipóteses realizado com as variáveis teve como objetivo a verificação do pressuposto de normalidade, por meio do teste de Shapiro Wilk, o qual parte do pressuposto de que as observações são independentes e apresenta as seguintes hipóteses:
H0:os dados seguem uma distribuição normal.
H1:os dados não seguem uma distribuição normal.
Após a verificação do pressuposto de normalidade, executou-se, para os dados que não seguem distribuição normal, o teste de Kruskal- Wallis com as hipóteses:
H0: os grupos são amostrados de populações com distribuições idênticas.
H1: os grupos são amostrados de populações com diferentes distribuições.
E em seguida, executou-se o teste de Comparações Múltiplas de Wilcoxon.
Para dados que seguem uma distribuição normal, procedeu-se com o teste de Bartlett, com as hipóteses:
H0: todas as variâncias são iguais.
H1: pelo menos uma das variâncias é diferente.
Após a verificação da igualdade de variância, deve ser executado o teste ANOVA quando a hipótese nula não foi rejeitada ou o teste de Welch caso a hipótese nula seja rejeitada. O método ANOVA permite “avaliar o efeito que os diferentes níveis do fator provoca na variável resposta” (PORTAL ACTION, 2020). O teste ANOVA determina se a variabilidade entre as médias de um grupo é maior que a variabilidade das observações da amostra (MINITAB, 2020). As hipóteses, tanto para ANOVA quanto para Welch são:
H0: todas as médias são iguais.
H1: existe pelo menos uma média diferente.
Depois, sucedeu-se o teste de Comparações Múltiplas de Tukey, para comparar as diferenças entre as médias e o p-valor.
Por fim, foi executado duas análises pelo método ANCOVA, que permite comparar as médias ajustadas de dois ou mais grupos independentes, entre as variáveis Regiao, Banheiro e IDH, com o intuito de verificar o impacto do IDH e da Região na taxa da população em domicílios com banheiro e água encanada. A primeira análise, verificou se não há interação significativa entre a covariável e a variável de agrupamento, com as hipóteses:
H0: coeficientes das retas de regressão são iguais.
H1: coeficientes das retas de regressão não são iguais.
Já na segunda análise, uma ANCOVA para testar os efeitos principais, as hipóteses foram:
H0: não há efeito.
H1: há efeito.
Foram analisadas duas variáveis, qualitativa e quantitativa, e elaborados gráficos boxplot para visualização da relação entre os dados.
A primeira análise foi com as variáveis Regiao e Banheiro.
#Manipulação de dados
dados$Regiao<-as.factor(dados$Regiao)
#Construção de gráfico tipo boxplot
boxplot(Banheiro ~Regiao, data=dados, col=c("red","#faa005","#1bc704","#0f8efc","yellow"), main="Bloxpot 1 \n % da população em domicílios com banheiro e água encanada por Região \n")
A partir dos gráficos, observa-se que apenas a região Nordeste possui outliers, ou seja, há três estados desta região que possuem taxa da população em domicílios com banheiro e água encanada muito superiores ou inferiores ao restante dos estados. Com exceção do Norte, as outras regiões possuem pequena amplitude interquartil. Nota-se ainda que as regiões centro-Oeste, Sudeste e Sul possuem altas taxas para essa variável,enquanto a região Norte é a mais deficiente no quesito avaliado e existem estados em que há menos de 50% da população com acesso à água encanada e que possui banheiros, enquanto que em todos os estados das regiões Centro-Oeste, Sudeste e Sul, mais de 90% da população em domicílios possui água encanada e banheiro.
A segunda análise foi com as variáveis Regiao e Agua.
#Construção de gráfico tipo boxplot
boxplot(Agua~Regiao, data=dados,col=c("red","#faa005","#1bc704","#0f8efc","yellow"),main="Bloxpot 2 \n % da população em domicílios com água encanada por Região \n")
É possível observar que nenhuma região possui outliers. Além disso, região Norte possui grande amplitude interquartil também para esta variável. As regiões centro-Oeste, Sudeste e Sul possuem altas taxas da população em domicílios com água encanada, enquanto a região Nordeste é a mais deficiente no quesito avaliado.A partir do gráfico, pode se concluir que em todos os estados do Brasil, mais de 75% da população em domicílios de cada um deles possui água encanada.
Os resultados dessa avaliação são semelhantes ao da primeira, uma vez que a variável Banheiro é constituída pela taxa da população que possui água encanada e banheiro. Entretanto, a mediana das porcentagens da população que possuem água encanada, sem se considerar a presença de banheiros no domicílio, nas regiões Nordeste e Norte são bem maiores que as porcentagens de habitantes em domicílios com ambos os recursos. Para as demais regiões, as medianas são bastante semelhantes.
A terceira análise foi elaborada com as variáveis Regiao e Energia.
#Construção de gráfico tipo boxplot
boxplot(Energia~Regiao, data=dados, col=c("red","#faa005","#1bc704","#0f8efc","yellow"),main="Bloxpot 3 \n % da população em domicílios com energia elétrica por Região \n")
Nenhuma região possui outliers para a variável Energia. A região Norte possui grande amplitude interquartil também para esta variável, apresenta a menor mediana e o estado com menor taxa da população em domicílio com energia elétrica do país está nessa região.
Mais que 90% da população em domicílio de todos os estados do país possuem energia elétrica. As regiões centro-Oeste, Sudeste e Sul têm menor amplitude interquartil e são as que todos os estados possuem maiores taxas da população em domicílios com energia elétrica (maiores que 98%). Entretanto a mediana das regiões Centro-Oeste e Nordeste possuem valores muito próximos.
A quarta análise foi elaborada a partir das variáveis Regiao e IDH.
#Construção de gráfico tipo boxplot
boxplot(IDH~Regiao, data=dados,col=c("red","#faa005","#1bc704","#0f8efc","yellow"),main="Bloxpot 4 \n IDH por Região \n")
A região Nordeste apresenta a menor mediana de valores de IDH dentre as cinco regiões do Brasil e contém o estado com menor IDH do país. O Sul e o Sudeste possuem as maiores medianas, com valores bem próximos entre si. Entretanto, o maior IDH dos estados do Brasil pertence à uma unidade da federação do Centro-Oeste. Todas as unidades da federação possuem IDH superior a 0,60.
Uma matriz de correlação analítica permite a visualização gráfica e do valor numérico do coeficiente de correlação entre variáveis.
#Carregar biblioteca para elaboração de matriz de correlação
library(corrplot)
#Elaboração da matriz de correlação
MC <-cor(dados[,c("Energia","Banheiro","Agua","IDH")])
corrplot.mixed(MC)
A partir da matriz de correlação é possível verificar que as variáveis Banheiro e Agua possuem bom grau de associação, o que era esperado tendo em vista que parte da primeira é composta pela segunda. Os pares IDH com Agua e IDH com Banheiro possuem forte grau de associação. Uma vez que o IDH considera saúde no seu cálculo, o acesso a banheiros e principalmente à água encanada pode favorecer hábitos de higiene que implicam em melhoria na saúde da população. Em resumo, à medida que se aumenta a porcentagem da população em domicílio com banheiro e água encanada ou apenas com água encada, maior tende a ser o IDH. O grau de correlação entre Energia e Agua e entre Energia e IDH é fraco, ou seja, não é possivel estimar o comportamento de um desses indicadores a partir do outro.
O pacote geobr permite a elaboração de mapas do Brasil. A ferramenta facilita a visualização e interpretação de dados.
No mapa abaixo estão representadas as regiões do Brasil, com as mesmas cores usadas para representar os dados de cada uma no gráfico do tipo Boxplot.
#Carregar biblioteca que permite execução de mapas do Brasil
library(geobr)
estado <- read_state(code_state="all", year=2010)
|
| | 0%
|
|=== | 4%
|
|===== | 7%
|
|======== | 11%
|
|========== | 15%
|
|============= | 19%
|
|================ | 22%
|
|================== | 26%
|
|===================== | 30%
|
|======================= | 33%
|
|========================== | 37%
|
|============================= | 41%
|
|=============================== | 44%
|
|================================== | 48%
|
|==================================== | 52%
|
|======================================= | 56%
|
|========================================= | 59%
|
|============================================ | 63%
|
|=============================================== | 67%
|
|================================================= | 70%
|
|==================================================== | 74%
|
|====================================================== | 78%
|
|========================================================= | 81%
|
|============================================================ | 85%
|
|============================================================== | 89%
|
|================================================================= | 93%
|
|=================================================================== | 96%
|
|======================================================================| 100%
regiao <- read_region(year=2010)
|
| | 0%
|
|======================================================================| 100%
Downloading: 770 B
Downloading: 770 B
Downloading: 1.6 kB
Downloading: 1.6 kB
Downloading: 1.8 kB
Downloading: 1.8 kB
Downloading: 1.8 kB
Downloading: 1.8 kB
Downloading: 1.9 kB
Downloading: 1.9 kB
Downloading: 2 kB
Downloading: 2 kB
Downloading: 2 kB
Downloading: 2 kB
Downloading: 2.1 kB
Downloading: 2.1 kB
Downloading: 2.1 kB
Downloading: 2.1 kB
Downloading: 2.1 kB
Downloading: 2.1 kB
Downloading: 3.8 kB
Downloading: 3.8 kB
Downloading: 5 kB
Downloading: 5 kB
Downloading: 5 kB
Downloading: 5 kB
Downloading: 7.3 kB
Downloading: 7.3 kB
Downloading: 7.3 kB
Downloading: 7.3 kB
Downloading: 7.3 kB
Downloading: 7.3 kB
Downloading: 15 kB
Downloading: 15 kB
Downloading: 15 kB
Downloading: 15 kB
Downloading: 15 kB
Downloading: 15 kB
Downloading: 23 kB
Downloading: 23 kB
Downloading: 23 kB
Downloading: 23 kB
Downloading: 23 kB
Downloading: 23 kB
Downloading: 32 kB
Downloading: 32 kB
Downloading: 32 kB
Downloading: 32 kB
Downloading: 32 kB
Downloading: 32 kB
Downloading: 40 kB
Downloading: 40 kB
Downloading: 40 kB
Downloading: 40 kB
Downloading: 40 kB
Downloading: 40 kB
Downloading: 40 kB
Downloading: 40 kB
Downloading: 40 kB
Downloading: 40 kB
Downloading: 40 kB
Downloading: 40 kB
Downloading: 48 kB
Downloading: 48 kB
Downloading: 48 kB
Downloading: 48 kB
Downloading: 48 kB
Downloading: 48 kB
Downloading: 48 kB
Downloading: 48 kB
Downloading: 56 kB
Downloading: 56 kB
Downloading: 56 kB
Downloading: 56 kB
Downloading: 56 kB
Downloading: 56 kB
Downloading: 64 kB
Downloading: 64 kB
Downloading: 64 kB
Downloading: 64 kB
Downloading: 64 kB
Downloading: 64 kB
Downloading: 64 kB
Downloading: 64 kB
Downloading: 72 kB
Downloading: 72 kB
Downloading: 72 kB
Downloading: 72 kB
Downloading: 72 kB
Downloading: 72 kB
Downloading: 72 kB
Downloading: 72 kB
Downloading: 80 kB
Downloading: 80 kB
Downloading: 80 kB
Downloading: 80 kB
Downloading: 80 kB
Downloading: 80 kB
Downloading: 80 kB
Downloading: 80 kB
Downloading: 80 kB
Downloading: 80 kB
Downloading: 88 kB
Downloading: 88 kB
Downloading: 88 kB
Downloading: 88 kB
Downloading: 88 kB
Downloading: 88 kB
Downloading: 96 kB
Downloading: 96 kB
Downloading: 96 kB
Downloading: 96 kB
Downloading: 96 kB
Downloading: 96 kB
Downloading: 100 kB
Downloading: 100 kB
Downloading: 100 kB
Downloading: 100 kB
Downloading: 100 kB
Downloading: 100 kB
Downloading: 110 kB
Downloading: 110 kB
Downloading: 110 kB
Downloading: 110 kB
Downloading: 110 kB
Downloading: 110 kB
Downloading: 120 kB
Downloading: 120 kB
Downloading: 120 kB
Downloading: 120 kB
Downloading: 120 kB
Downloading: 120 kB
Downloading: 130 kB
Downloading: 130 kB
Downloading: 130 kB
Downloading: 130 kB
Downloading: 130 kB
Downloading: 130 kB
Downloading: 140 kB
Downloading: 140 kB
Downloading: 140 kB
Downloading: 140 kB
Downloading: 140 kB
Downloading: 140 kB
Downloading: 140 kB
Downloading: 140 kB
Downloading: 140 kB
Downloading: 140 kB
Downloading: 140 kB
Downloading: 140 kB
Downloading: 150 kB
Downloading: 150 kB
Downloading: 150 kB
Downloading: 150 kB
Downloading: 150 kB
Downloading: 150 kB
Downloading: 150 kB
Downloading: 150 kB
Downloading: 150 kB
Downloading: 150 kB
Downloading: 150 kB
Downloading: 150 kB
Downloading: 160 kB
Downloading: 160 kB
Downloading: 160 kB
Downloading: 160 kB
Downloading: 160 kB
Downloading: 160 kB
Downloading: 170 kB
Downloading: 170 kB
Downloading: 170 kB
Downloading: 170 kB
Downloading: 170 kB
Downloading: 170 kB
Downloading: 180 kB
Downloading: 180 kB
Downloading: 180 kB
Downloading: 180 kB
Downloading: 180 kB
Downloading: 180 kB
Downloading: 190 kB
Downloading: 190 kB
Downloading: 190 kB
Downloading: 190 kB
Downloading: 190 kB
Downloading: 190 kB
Downloading: 190 kB
Downloading: 190 kB
Downloading: 190 kB
Downloading: 190 kB
Downloading: 190 kB
Downloading: 190 kB
Downloading: 200 kB
Downloading: 200 kB
Downloading: 200 kB
Downloading: 200 kB
Downloading: 200 kB
Downloading: 200 kB
Downloading: 200 kB
Downloading: 200 kB
Downloading: 200 kB
Downloading: 200 kB
Downloading: 210 kB
Downloading: 210 kB
Downloading: 210 kB
Downloading: 210 kB
Downloading: 210 kB
Downloading: 210 kB
Downloading: 220 kB
Downloading: 220 kB
Downloading: 220 kB
Downloading: 220 kB
Downloading: 220 kB
Downloading: 220 kB
Downloading: 230 kB
Downloading: 230 kB
Downloading: 230 kB
Downloading: 230 kB
Downloading: 230 kB
Downloading: 230 kB
Downloading: 230 kB
Downloading: 230 kB
Downloading: 230 kB
Downloading: 230 kB
Downloading: 230 kB
Downloading: 230 kB
Downloading: 240 kB
Downloading: 240 kB
Downloading: 240 kB
Downloading: 240 kB
Downloading: 240 kB
Downloading: 240 kB
Downloading: 250 kB
Downloading: 250 kB
Downloading: 250 kB
Downloading: 250 kB
Downloading: 250 kB
Downloading: 250 kB
Downloading: 260 kB
Downloading: 260 kB
Downloading: 260 kB
Downloading: 260 kB
Downloading: 260 kB
Downloading: 260 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 270 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 280 kB
Downloading: 290 kB
Downloading: 290 kB
Downloading: 290 kB
Downloading: 290 kB
Downloading: 290 kB
Downloading: 290 kB
Downloading: 300 kB
Downloading: 300 kB
Downloading: 300 kB
Downloading: 300 kB
Downloading: 300 kB
Downloading: 300 kB
Downloading: 310 kB
Downloading: 310 kB
Downloading: 310 kB
Downloading: 310 kB
Downloading: 310 kB
Downloading: 310 kB
Downloading: 310 kB
Downloading: 310 kB
Downloading: 310 kB
Downloading: 310 kB
Downloading: 310 kB
Downloading: 310 kB
Downloading: 320 kB
Downloading: 320 kB
Downloading: 320 kB
Downloading: 320 kB
Downloading: 320 kB
Downloading: 320 kB
Downloading: 330 kB
Downloading: 330 kB
Downloading: 330 kB
Downloading: 330 kB
Downloading: 330 kB
Downloading: 330 kB
Downloading: 330 kB
Downloading: 330 kB
Downloading: 330 kB
Downloading: 330 kB
Downloading: 340 kB
Downloading: 340 kB
Downloading: 340 kB
Downloading: 340 kB
Downloading: 340 kB
Downloading: 340 kB
Downloading: 350 kB
Downloading: 350 kB
Downloading: 350 kB
Downloading: 350 kB
Downloading: 350 kB
Downloading: 350 kB
Downloading: 360 kB
Downloading: 360 kB
Downloading: 360 kB
Downloading: 360 kB
Downloading: 360 kB
Downloading: 360 kB
Downloading: 360 kB
Downloading: 360 kB
Downloading: 360 kB
Downloading: 360 kB
Downloading: 360 kB
Downloading: 360 kB
Downloading: 370 kB
Downloading: 370 kB
Downloading: 370 kB
Downloading: 370 kB
Downloading: 370 kB
Downloading: 370 kB
Downloading: 370 kB
Downloading: 370 kB
Downloading: 370 kB
Downloading: 370 kB
Downloading: 380 kB
Downloading: 380 kB
Downloading: 380 kB
Downloading: 380 kB
Downloading: 380 kB
Downloading: 380 kB
Downloading: 390 kB
Downloading: 390 kB
Downloading: 390 kB
Downloading: 390 kB
Downloading: 390 kB
Downloading: 390 kB
Downloading: 400 kB
Downloading: 400 kB
Downloading: 400 kB
Downloading: 400 kB
Downloading: 400 kB
Downloading: 400 kB
Downloading: 400 kB
Downloading: 400 kB
Downloading: 400 kB
Downloading: 400 kB
Downloading: 400 kB
Downloading: 400 kB
Downloading: 410 kB
Downloading: 410 kB
Downloading: 410 kB
Downloading: 410 kB
Downloading: 410 kB
Downloading: 410 kB
Downloading: 410 kB
Downloading: 410 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 420 kB
Downloading: 430 kB
Downloading: 430 kB
Downloading: 430 kB
Downloading: 430 kB
Downloading: 430 kB
Downloading: 430 kB
Downloading: 440 kB
Downloading: 440 kB
Downloading: 440 kB
Downloading: 440 kB
Downloading: 440 kB
Downloading: 440 kB
Downloading: 440 kB
Downloading: 440 kB
Downloading: 440 kB
Downloading: 440 kB
Downloading: 440 kB
Downloading: 440 kB
Downloading: 450 kB
Downloading: 450 kB
Downloading: 450 kB
Downloading: 450 kB
Downloading: 450 kB
Downloading: 450 kB
Downloading: 460 kB
Downloading: 460 kB
Downloading: 460 kB
Downloading: 460 kB
Downloading: 460 kB
Downloading: 460 kB
Downloading: 470 kB
Downloading: 470 kB
Downloading: 470 kB
Downloading: 470 kB
Downloading: 470 kB
Downloading: 470 kB
Downloading: 470 kB
Downloading: 470 kB
Downloading: 470 kB
Downloading: 470 kB
Downloading: 480 kB
Downloading: 480 kB
Downloading: 480 kB
Downloading: 480 kB
Downloading: 480 kB
Downloading: 480 kB
Downloading: 480 kB
Downloading: 480 kB
Downloading: 480 kB
Downloading: 480 kB
Downloading: 480 kB
Downloading: 480 kB
Downloading: 490 kB
Downloading: 490 kB
Downloading: 490 kB
Downloading: 490 kB
Downloading: 490 kB
Downloading: 490 kB
Downloading: 500 kB
Downloading: 500 kB
Downloading: 500 kB
Downloading: 500 kB
Downloading: 500 kB
Downloading: 500 kB
Downloading: 510 kB
Downloading: 510 kB
Downloading: 510 kB
Downloading: 510 kB
Downloading: 510 kB
Downloading: 510 kB
Downloading: 510 kB
Downloading: 510 kB
Downloading: 520 kB
Downloading: 520 kB
Downloading: 520 kB
Downloading: 520 kB
Downloading: 520 kB
Downloading: 520 kB
Downloading: 530 kB
Downloading: 530 kB
Downloading: 530 kB
Downloading: 530 kB
Downloading: 530 kB
Downloading: 530 kB
Downloading: 530 kB
Downloading: 530 kB
Downloading: 530 kB
Downloading: 530 kB
Downloading: 530 kB
Downloading: 530 kB
Downloading: 540 kB
Downloading: 540 kB
Downloading: 540 kB
Downloading: 540 kB
Downloading: 540 kB
Downloading: 540 kB
Downloading: 550 kB
Downloading: 550 kB
Downloading: 550 kB
Downloading: 550 kB
Downloading: 550 kB
Downloading: 550 kB
Downloading: 550 kB
Downloading: 550 kB
Downloading: 550 kB
Downloading: 550 kB
Downloading: 550 kB
Downloading: 550 kB
Downloading: 560 kB
Downloading: 560 kB
Downloading: 560 kB
Downloading: 560 kB
Downloading: 560 kB
Downloading: 560 kB
Downloading: 560 kB
Downloading: 560 kB
Downloading: 560 kB
Downloading: 560 kB
Downloading: 560 kB
Downloading: 560 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 570 kB
Downloading: 580 kB
Downloading: 580 kB
Downloading: 580 kB
Downloading: 580 kB
Downloading: 580 kB
Downloading: 580 kB
Downloading: 590 kB
Downloading: 590 kB
Downloading: 590 kB
Downloading: 590 kB
Downloading: 590 kB
Downloading: 590 kB
Downloading: 600 kB
Downloading: 600 kB
Downloading: 600 kB
Downloading: 600 kB
Downloading: 600 kB
Downloading: 600 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 610 kB
Downloading: 620 kB
Downloading: 620 kB
Downloading: 620 kB
Downloading: 620 kB
Downloading: 620 kB
Downloading: 620 kB
Downloading: 630 kB
Downloading: 630 kB
Downloading: 630 kB
Downloading: 630 kB
Downloading: 630 kB
Downloading: 630 kB
Downloading: 640 kB
Downloading: 640 kB
Downloading: 640 kB
Downloading: 640 kB
Downloading: 640 kB
Downloading: 640 kB
Downloading: 650 kB
Downloading: 650 kB
Downloading: 650 kB
Downloading: 650 kB
Downloading: 650 kB
Downloading: 650 kB
Downloading: 650 kB
Downloading: 650 kB
Downloading: 650 kB
Downloading: 650 kB
Downloading: 650 kB
Downloading: 650 kB
Downloading: 660 kB
Downloading: 660 kB
Downloading: 660 kB
Downloading: 660 kB
Downloading: 660 kB
Downloading: 660 kB
Downloading: 670 kB
Downloading: 670 kB
Downloading: 670 kB
Downloading: 670 kB
Downloading: 670 kB
Downloading: 670 kB
Downloading: 680 kB
Downloading: 680 kB
Downloading: 680 kB
Downloading: 680 kB
Downloading: 680 kB
Downloading: 680 kB
Downloading: 690 kB
Downloading: 690 kB
Downloading: 690 kB
Downloading: 690 kB
Downloading: 690 kB
Downloading: 690 kB
Downloading: 690 kB
Downloading: 690 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 700 kB
Downloading: 710 kB
Downloading: 710 kB
Downloading: 710 kB
Downloading: 710 kB
Downloading: 710 kB
Downloading: 710 kB
Downloading: 710 kB
Downloading: 710 kB
Downloading: 720 kB
Downloading: 720 kB
Downloading: 720 kB
Downloading: 720 kB
Downloading: 720 kB
Downloading: 720 kB
Downloading: 730 kB
Downloading: 730 kB
Downloading: 730 kB
Downloading: 730 kB
Downloading: 730 kB
Downloading: 730 kB
Downloading: 740 kB
Downloading: 740 kB
Downloading: 740 kB
Downloading: 740 kB
Downloading: 740 kB
Downloading: 740 kB
Downloading: 740 kB
Downloading: 740 kB
Downloading: 740 kB
Downloading: 740 kB
Downloading: 740 kB
Downloading: 740 kB
Downloading: 750 kB
Downloading: 750 kB
Downloading: 750 kB
Downloading: 750 kB
Downloading: 750 kB
Downloading: 750 kB
Downloading: 760 kB
Downloading: 760 kB
Downloading: 760 kB
Downloading: 760 kB
Downloading: 760 kB
Downloading: 760 kB
Downloading: 770 kB
Downloading: 770 kB
Downloading: 770 kB
Downloading: 770 kB
Downloading: 770 kB
Downloading: 770 kB
Downloading: 770 kB
Downloading: 770 kB
Downloading: 780 kB
Downloading: 780 kB
Downloading: 780 kB
Downloading: 780 kB
Downloading: 780 kB
Downloading: 780 kB
Downloading: 780 kB
Downloading: 780 kB
Downloading: 780 kB
Downloading: 780 kB
#Gerar mapa geobr das regiões do Brasil
library(ggplot2)
ggplot() +
geom_sf(data=regiao, fill=c("#1bc704","#faa005","#0f8efc","yellow","red"), color= "BLACK", size=.15, show.legend = TRUE) +
geom_sf_text(data=regiao,aes(label = name_region), size = 4, color="black")+
labs(subtitle="Mapa 1 - Regiões do Brasil", size= 10) +
theme_minimal()
Os limites da escala de cor para a variável quantitativa de cada mapa foi definido a partir da interpretação dos gráficos do tipo Boxplot previamente elaborados e analisados. Os valores atribuídos às variáveis quantitativas da base de dados são de amplitude relativamente pequena, e caso fossem mantidas as escalas completas de 0 a 100 para Agua, Banheiro e Energia e de 0 a 1 para IDH, a escala de cores pouco facilitaria a visualização dos dados.
Dessa forma, adotou-se como escala, os intervalos observados por meio dos gráficos Boxplot em que estão contidos todos os valores da amostra, para a variável em análise.
O mapa seguinte apresenta a porcentagem da população em domicílios com água encanada em cada estado e Distrito Federal (DF).
#Modificar nome da coluna da base de dados para adequar à biblioteca geobr
colnames(dados)[3]<-"code_state"
#Manipular variável
dados$code_state<-as.numeric(dados$code_state)
#Unir base de dados da pesquisa com base dos estados do pacote geobr
library(dplyr)
BR<-estado %>% left_join(dados)
#Gerar mapas, por meio do pacote ggplot2
library(ggplot2)
ggplot() +
geom_sf(data=BR, aes(fill=Agua), color= "black", size=.15) +
labs(subtitle="Mapa 2 - % da população em domicílios com água encanada por estado e DF", size=10) +
geom_sf_text(data=BR,aes(label = abbrev_state), size=2, color= "black")+
scale_fill_distiller(palette = "Blues",direction = 1, name="% da população", limits = c(75,100)) +
theme_minimal()
O “Mapa 2 - % da população em domicílios com água encanada por estado e DF” permite visualizar que os estados com menores taxas da população em domicílios com água encanada se concentram nas regiões Norte e Nordeste do país e que São Paulo e distrito federal são as unidades da federação que possuem as maiores porcentagens, próximas a 100%. Essas constatações corroboram as interpretações do gráfico Boxplot para essas mesmas variáveis.
O terceiro mapa apresenta a porcentagem da população em domicílios com banheiro e água encanada em cada estado e Distrito Federal (DF).
#Gerar mapas, por meio do pacote ggplot2
library(ggplot2)
ggplot() +
geom_sf(data=BR, aes(fill=Banheiro), color= "black", size=.15) +
labs(subtitle="Mapa 3 - % da população em domicílios com banheiro e água encanada por estado e DF", size=10) +
geom_sf_text(data=BR,aes(label = abbrev_state), size=2, color= "black")+
scale_fill_distiller(palette = "Greens",direction = 1, name="% da população", limits = c(40,100)) +
theme_minimal()
A partir do mapa geobr “Mapa 3 - % da população em domicílios com banheiro e água encanada por estado e DF”, percebe-se que todos os estados do Sudeste e Sul possuem mais de 90% da população em domicílios com banheiros e água encanada.
O quarto mapa apresenta a porcentagem da população em domicílios com energia elétrica em cada estado e Distrito Federal (DF).
#Gerar mapas, por meio do pacote ggplot2
library(ggplot2)
ggplot() +
geom_sf(data=BR, aes(fill=Energia), color= "black", size=.15) +
labs(subtitle="Mapa 4 - % da população em domicílios com energia elétrica por estado e DF", size=10) +
geom_sf_text(data=BR,aes(label = abbrev_state), size=2, color= "black")+
scale_fill_distiller(palette = "Reds",direction = 1, name="% da população", limits = c(90,100)) +
theme_minimal()
De posse do “Mapa 4 - % da população em domicílios com energia elétrica por estado e DF”, é possível afirmar que os estados com menores porcentagens da população vivendo em domicílios com energia elétrica são da região Norte, enquanto que os das regiões Sul e sudeste apresentam as maiores porcentagens, acima de 97,5%.
Baseando-se unicamente na escala de cores, é perceptível semelhança entre os três gráficos, ou seja, a maioria dos estados que possuem cores fortes ou cores fracas em um dos gráficos, apresenta o mesmo padrão de intensidade de cor nos outros dois, com exceção de poucos estados do Nodeste para o mapa relativo ao acesso a energia elétrica.
O quinto mapa apresenta o IDH em cada estado e Distrito Federal (DF).
#Gerar mapas, por meio do pacote ggplot2
library(ggplot2)
ggplot() +
geom_sf(data=BR, aes(fill=IDH), color= "black", size=.15) +
labs(subtitle="Mapa 5 - IDH por estado e DF", size=10) +
geom_sf_text(data=BR,aes(label = abbrev_state), size=2, color= "black")+
scale_fill_distiller(palette = "Oranges",direction = 1, name="IDH", limits = c(0.6,1)) +
theme_minimal()
Há pouca variabilidade do valor de IDH no país,sendo que todos apresentam um valor para o indicador classificado ao menos como médio, de acordo com as faixas do Atlas do Desenvolvimento Humano no Brasil. O Distrito Federal apresenta o maior valor de IDH no Brasil.
Foi executado o teste de Shapiro Wilk para as variáveis quantitativas Banheiro e IDH.
#Teste de normalidade (Shapiro Wilk)
#H0: os dados seguem uma distribuição normal
#H1: os dados NÃO seguem uma distribuição normal
#alpha = 0.05
shapiro.test(dados$Banheiro)
Shapiro-Wilk normality test
data: dados$Banheiro
W = 0.89806, p-value = 0.01208
#Como pvalor < 0.05, rejeito H0
#os dados NÃO seguem uma distribuição normal
Para a variável Banheiro, o pvalor < 0.05, logo, rejeita-se a hipótese nula H0. Portanto, os dados não seguem uma distribuição normal e deve ser executado, em seguida, o teste de Kruskal-Wallis.
#Teste de normalidade (Shapiro Wilk)
#H0: os dados seguem uma distribuição normal
#H1: os dados NÃO seguem uma distribuição normal
#alpha = 0.05
shapiro.test(dados$IDH)
Shapiro-Wilk normality test
data: dados$IDH
W = 0.96157, p-value = 0.401
#Como pvalor > 0.05, não rejeito H0
#os dados seguem uma distribuição normal
Para IDH, pvalor > 0.05, logo, não se rejeita a hipótese nula H0. Portanto, os dados seguem uma distribuição normal e deve ser executado em seguida o teste de Bartlett.
Em seguida, foi investigado se a Região interfere em Banheiro, por meio do teste de Kruskal-Wallis e do teste de Comparações Múltiplas de Wilcoxon.
#-------------------------------------------------------
#Teste se a região interfere em Banheiro
#-------------------------------------------------------
#Para dados que NÃO seguem uma distribuição normal
# H0: os grupos são amostrados de populações com distribuições idênticas.
# H1: os grupos são amostrados de populações com diferentes distribuições.
kruskal.test(dados$Banheiro~dados$Regiao)
Kruskal-Wallis rank sum test
data: dados$Banheiro by dados$Regiao
Kruskal-Wallis chi-squared = 20.417, df = 4, p-value = 0.0004131
#Como pvalor < 0.05, rejeito H0
#os grupos são amostrados de populações com diferentes distribuições
PMW <- pairwise.wilcox.test(dados$Banheiro,
dados$Regiao,
p.adjust.method="fdr")
# Adjusts p-values for multiple comparisons;
PMW
Pairwise comparisons using Wilcoxon rank sum exact test
data: dados$Banheiro and dados$Regiao
Centro-Oeste Nordeste Norte Sudeste
Nordeste 0.014 - - -
Norte 0.015 0.234 - -
Sudeste 0.143 0.014 0.015 -
Sul 0.082 0.018 0.028 0.857
P value adjustment method: fdr
Como pvalor < 0.05, a hipótese nula H0 é rejeitada. Portanto, os grupos são amostrados de populações com diferentes distribuições, ou seja, a taxa da população em domicílios com banheiro e água encanada não possui distribuição semelhante entre todas as regiões. Portanto, a região exerce influência sobre a taxa da população em domicílios com banheiro e água encanada, o que é perceptível pelo “Mapa 3 - % da população em domicílios com banheiro e água encanada por estado e DF”, em que se observa que a variação de cores de uma região para outra não é uniforme.
A partir da matriz do Teste de Wilcoxon, que compara as regiões em relação à taxa da população em domicílios com banheiro e água encanada, é possível observar que as regiões que possuem distribuição em média diferentes entre si são: Nordeste e Cento-Oeste; Norte e Cento-Oeste; Nordeste e Sudeste; Nordeste e Sul; Norte e Sudeste; Norte e Sul , pois quando comparadas uma com a outra, pvalor<0.05. Dessa forma, os pares de regiões Cento-Oeste e Sudeste; Cento-Oeste e Sul;Norte e Nordeste; Sudeste e Sul, possuem distribuição da variável em média semelhantes, uma vez que quando comparadas uma com a outra, pvalor>0.05.
Depois, foi investigado se a Região interfere em IDH, por meio do teste de Bartlett, também denominado teste da homogeneidade das variâncias. Primeiramente, criou-se um modelo estatístico. Foi verificado que os resíduos do modelo seguem uma distribuição normal, para então ser executado o teste de Bartlett.
#-------------------------------------------------------
#Teste se a região interfere em IDH
#-------------------------------------------------------
#Para dados que seguem uma distribuição normal
#criar modelo estatístico
modelo <- aov(IDH~Regiao, data=dados)
residuos <- residuals(modelo)
residuos
1 2 3 4 5
-0.0208571429 -0.0287777778 -0.0098571429 0.0241428571 0.0002222222
6 7 8 9 10
0.0222222222 0.0707500000 -0.0137500000 -0.0182500000 -0.0207777778
11 12 13 14 15
-0.0227500000 -0.0242500000 -0.0282500000 -0.0378571429 -0.0017777778
16 17 18 19 20
0.0132222222 -0.0137777778 -0.0073333333 0.0072500000 0.0242222222
21 22 23 24 25
0.0061428571 0.0231428571 -0.0103333333 0.0176666667 0.0052222222
26 27
0.0292500000 0.0151428571
#H0: os dados seguem uma distribuição normal
#H1: os dados NÃO seguem uma distribuição normal
#alpha = 0.05
shapiro.test(residuos)
Shapiro-Wilk normality test
data: residuos
W = 0.93962, p-value = 0.1193
#pvalor>0.05
#NÃO rejeito H0 (os dados seguem distribuição normal)
#H0: todas as variâncias são iguais
#H1: pelo menos uma das variâncias é diferente
#alpha = 0.05
bartlett.test(residuos~dados$Regiao)
Bartlett test of homogeneity of variances
data: residuos by dados$Regiao
Bartlett's K-squared = 5.213, df = 4, p-value = 0.2661
#pvalor>0.05, NÃO rejeito H0
#todas as variâncias são iguais
Como pvalor>0.05 no teste de homogeneidade das variâncias para os resíduos, a hipótese H0 não é rejeitada. Logo, todas as variâncias são iguais. Depois, executou-se o teste ANOVA, para um novo modelo estatístico composto pelas variáveis avaliadas, IDH e Região.
modelo2 <- aov(IDH~Regiao, data= dados)
modelo2
Call:
aov(formula = IDH ~ Regiao, data = dados)
Terms:
Regiao Residuals
Sum of Squares 0.04825216 0.01489858
Deg. of Freedom 4 22
Residual standard error: 0.02602322
Estimated effects may be unbalanced
summary(modelo2)
Df Sum Sq Mean Sq F value Pr(>F)
Regiao 4 0.04825 0.012063 17.81 1.19e-06 ***
Residuals 22 0.01490 0.000677
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##pvalor<0.05, Rej H0
#Existe pelo menos uma média diferente
Como pvalor<0.05,representado por PR(>F) na matriz, a hipótese nula é rejeitada. Dessa forma, existe ao menos uma média entre os grupos que difere das demais. Para avaliar qual é a média diferente, executou-se o teste de Comparações Múltiplas de Tukey.
#Qual a média que é diferente das demais?
TukeyHSD(modelo2)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = IDH ~ Regiao, data = dados)
$Regiao
diff lwr upr p adj
Nordeste-Centro-Oeste -0.093472222 -0.13986988 -0.04707457 0.0000465
Norte-Centro-Oeste -0.069392857 -0.11778701 -0.02099870 0.0027013
Sudeste-Centro-Oeste 0.000500000 -0.05409597 0.05509597 0.9999999
Sul-Centro-Oeste 0.003083333 -0.05588705 0.06205372 0.9998587
Norte-Nordeste 0.024079365 -0.01483100 0.06298973 0.3792906
Sudeste-Nordeste 0.093972222 0.04757457 0.14036988 0.0000432
Sul-Nordeste 0.096555556 0.04508198 0.14802913 0.0001210
Sudeste-Norte 0.069892857 0.02149870 0.11828701 0.0025124
Sul-Norte 0.072476190 0.01919598 0.12575640 0.0045197
Sul-Sudeste 0.002583333 -0.05638705 0.06155372 0.9999301
Na matriz do teste de comparações múltiplas, o valor de p adj é o valor de pvalor ajustado. A partir do resultado do Teste de Tukey, é possível observar que os grupos Nordeste e Centro-Oeste, Norte e Centro-Oeste, Sudeste e Nordeste, Sul e Nordeste, Sudeste e Norte, Sul e Norte, os quais possuem pvalor<0.05, possuem distribuição em média do IDH diferentes entre si. Já os demais grupos, em pvalor>0.05, apresentam distribuição em média do IDH semelhantes dentro do mesmo grupo.
Abaixo estão os resultados do método ANCOVA executado para verificar qual o impacto do IDH na taxa da população em domicílios com banheiro e água encanada, usando a Região como covariável.
#H0: coeficientes das retas de regressão são iguais
#H1: coeficientes das retas de regressão não são iguais
#alpha = 0.05
ANCOVA <- aov(Banheiro ~ Regiao * IDH, data = dados)
summary(ANCOVA)
Df Sum Sq Mean Sq F value Pr(>F)
Regiao 4 4014 1003.6 18.664 4.78e-06 ***
IDH 1 407 407.4 7.576 0.0136 *
Regiao:IDH 4 374 93.5 1.738 0.1881
Residuals 17 914 53.8
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#pvalor>0.05, não rej H0
#coeficientes das retas de regressão são iguais
O resultado mostra que os coeficientes das retas de regressão são iguais, ou seja, o comportamento das variáveis taxa da população em domicílios com banheiro e água encanada e IDH são semelhantes para uma mesma Região . Ao retirar o termo de interação, para testar os efeitos principais, o resultado foi o seguinte:
#H0: não há efeito
#H1: há efeito
#alpha = 0.05
ANCOVA2 <- aov(Banheiro ~ Regiao + IDH, data = dados)
summary(ANCOVA2)
Df Sum Sq Mean Sq F value Pr(>F)
Regiao 4 4014 1003.6 16.363 3.15e-06 ***
IDH 1 407 407.4 6.642 0.0176 *
Residuals 21 1288 61.3
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#pvalor<0.05, rej H0
#existe efeito
Assim, é possível verificar que a remoção da interação não afeta o ajuste do modelo de forma significativa, visto que não há grandes alterações nos valores de pvalor entre os dois modelos. Além disso, verifica-se que existe efeito conjunto do IDH e da Região sobre a taxa da população em domicílios com banheiro e água encanada.
A partir dos resultados obtidos, é possível concluir que há disparidades no desenvolvimento humano e no acesso da população à serviços de saneamento básico entre as unidades da federação e, por conseguinte, entre as cinco regiões do Brasil, pois os testes de hipóteses apontaram que a variável qualitativa Região interfere nas variáveis quantitativas Banheiro e IDH.
Como aspectos relacionados à saúde são avaliados para o cálculo do IDH, é esperado que este índice tenha correlação com o percentual da população em domicílios com água encanada, uma vez que saneamento básico é imprescindível para a saúde. O fato é corroborado pela matriz de correlação que apontou forte grau de correlação entre as variáveis Agua e IDH, indicando que quanto maior o acesso à água encanada, maior tende a ser o IDH do estado avaliado.
Os gráficos do tipo Boxplot, os mapas temáticos e a matriz de correlação entre as variáveis de interesse são complementares para o entendimento dos dados, pois apenas uma dessas formas de visualização de dados fornece um tipo de informação, mas quando utilizados em conjunto, permitem uma melhor compreensão.
Atlas do Desenvolvimento Humano no Brasil. Ranking. Disponível em: http://www.atlasbrasil.org.br/ranking . Acesso em: 17 out. 2020.
BRASIL. Instituto Brasileiro de Geografia e Estatística. O IBGE. Disponível em: https://www.ibge.gov.br/institucional/o-ibge.html. Acesso em: 17 out. 2020.
Minitab. Entendendo Análise de Variância (ANOVA) e o teste F. Disponível em: https://blog.minitab.com/pt/entendendo-analise-de-variancia-anova-e-o-teste-f. Acesso em: 05 nov. 2020.
PNUD (Programa das Nações Unidas para o Desenvolvimento) . IDH. Disponível em: https://www.br.undp.org/content/brazil/pt/home/idh0.html. Acesso em: 12 out. 2020.
Portal Action. ANOVA um fator. Disponível em: http://www.portalaction.com.br/anova/anova-um-fator. Acesso em: 05 nov. 2020.