1. Introdução

O Instituto Brasileiro de Geografia e Estatística (IBGE) é o principal provedor de dados e informações do País e, no desempenho de suas funções, produz e analisa informações estatísticas que contribuem para a formulação, validação e avaliação de políticas orientadas para o desenvolvimento socioeconômico e melhoria das condições de vida da população no País (IBGE, 2020).

O IBGE realiza censos demográficos e a Pesquisa Nacional por Amostra de Domicílios. Alguns dados coletados nessas ações são: IDH, percentual da população em domicílios com água encanada, percentual da população em domicílios com banheiro e água encanada, percentual da população em domicílios com energia elétrica e Índice de Desenvolvimento Humano (IDH), os quais serão estudados neste relatório.

“O Índice de Desenvolvimento Humano (IDH) é uma medida resumida do progresso a longo prazo em três dimensões básicas do desenvolvimento humano: renda, educação e saúde. O objetivo da criação do IDH foi o de oferecer um contraponto a outro indicador muito utilizado, o Produto Interno Bruto (PIB) per capita, que considera apenas a dimensão econômica do desenvolvimento.” (PNUD, 2020).

De acordo com o Atlas do Desenvolvimento Humano no Brasil (2020), as faixas de desenvolvimento humano são:

  • MUITO ALTO: 0,800 - 1,000

  • ALTO: 0,700 - 0,799

  • MÉDIO: 0,600 - 0,699

  • BAIXO: 0,500 - 0,599

  • MUITO BAIXO: 0,000 - 0,499

2. Objetivo

O objetivo do estudo desenvolvido é avaliar o impacto do IDH no acesso à saneamento básico e à energia elétrica, por meio da obtenção da correlação do IDH (Índice de Desenvolvimento Humano) com a taxa da população em domicílios com banheiro, água encanada e energia elétrica de cada unidade da federação; da avaliação visual de mapas temáticos e da análise de gráficos boxplot construídos a partir de uma base de dados.

3. Metodologia

As etapas que constituem a Metodologia da pesquisa desenvolvida neste trabalho serão expostas neste tópico.

Inicialmente, foi necessário selecionar e carregar a base de dados para o ambiente do RStudio. A fonte selecionada é uma base de dados do IBGE que contém informações sobre população, indicadores sociais e econômicos dos estados brasileiros e Distrito Federal, relativas ao ano de 2010.

Na tabela a seguir, está a base de dados utilizada.

#Carregar biblioteca para incluir tabela
library(kableExtra)

#Carregar base de dados objeto da pesquisa
library(readxl)
dados <- read_excel("BasesEstados2.xlsx", 
                    sheet = "dados")

#Execução e manipulação da tabela
kable(dados, row.names = FALSE)%>%
kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
               position = "center", fixed_thead = T) %>%
  scroll_box(width = "900px", height = "600px")
S Sigla Codigo Estado Regiao CodigoReg PIB Gini Agua Banheiro Lixo Energia Densidade Esperancadevida Populacao Mortalidade_infantil Prob_sobrevivencia IDH IDH_Renda IDH_Longevidade IDH_Educacao Probab_sobrev60 TFT Taxa_envelhecimento Taxa_analfabetismo frequencia_liquida_EM Expectativa_anos_de_estudo frequencia_liquida_Superior perc_com_2_anos_de_de_atraso Renda_per_capita Renda_per_capita_nula Perc_pobres Perc_extremamente_pobres Despesa_Corrente Despesa_Corrente_per_capita
AC AC 12 Acre Norte N 9629239 0.63 86.51 47.42 93.63 91.14 46.05 71.63 733559 23.01 94.62 0.663 0.671 0.777 0.559 84.53 2.95 4.32 21.29 48.45 8.69 10.50 22.57 522.15 550.76 29.46 22.69 2739927889 3735.116
AL AL 27 Alagoas Nordeste NE 29544708 0.63 77.56 75.64 96.16 98.98 35.04 70.32 3120494 28.40 93.36 0.631 0.641 0.755 0.520 82.31 2.22 6.01 30.57 36.86 9.07 9.18 27.34 432.56 439.17 34.29 24.77 4408229588 1412.670
AM AM 13 Amazonas Norte N 64119836 0.65 77.32 62.16 92.98 92.18 57.95 73.30 3483985 17.01 96.03 0.674 0.677 0.805 0.561 87.24 2.59 4.03 12.30 39.09 8.54 10.06 26.68 539.80 565.89 30.78 23.38 7778802887 2232.731
AP AP 16 Amapa Norte N 10419539 0.60 91.44 66.38 96.38 98.27 53.98 73.80 669526 15.14 96.47 0.708 0.694 0.813 0.629 88.14 2.48 3.44 11.20 50.97 9.44 12.95 22.08 598.98 609.44 24.07 14.45 2317897869 3461.998
BA BA 29 Bahia Nordeste NE 167727375 0.62 85.66 77.60 95.35 96.45 27.91 71.97 14016906 21.73 94.92 0.660 0.663 0.783 0.555 85.09 2.05 7.23 20.92 40.53 8.63 7.86 29.80 496.73 503.15 28.72 21.24 21502299427 1534.026
CE CE 23 Ceara Nordeste NE 90131724 0.61 86.08 76.28 93.56 99.08 34.13 72.60 8452381 19.29 95.50 0.682 0.651 0.793 0.615 86.20 1.99 7.54 23.95 52.18 9.82 9.68 18.54 460.63 465.38 30.32 22.38 12325234404 1458.197
DF DF 53 Distrito Federal Centro-Oeste MW 171235534 0.63 98.13 96.01 98.87 99.91 23.48 77.35 2570160 14.01 94.57 0.824 0.863 0.873 0.742 86.19 1.75 4.97 4.31 63.19 9.87 24.55 16.29 1715.11 1716.52 4.93 2.24 10981410590 4272.656
ES ES 32 Espirito Santo Sudeste SE 107328771 0.56 96.45 96.89 97.93 99.83 20.59 75.10 3514952 14.15 92.57 0.740 0.743 0.835 0.653 82.28 1.80 7.08 10.15 56.33 9.36 14.86 17.05 815.43 818.90 9.53 4.72 9689078646 2756.532
GO GO 52 Goias Centro-Oeste MW 123926301 0.55 96.76 93.66 98.65 99.39 19.26 74.60 6003788 13.96 93.33 0.735 0.742 0.827 0.646 82.69 1.87 6.25 10.06 58.28 9.72 16.32 15.98 810.97 814.76 7.59 3.75 12818102561 2135.003
MA MA 21 Maranhao Nordeste NE 58819683 0.62 82.12 51.79 79.08 96.10 42.70 70.40 6574789 28.03 93.45 0.639 0.612 0.757 0.562 82.45 2.56 6.02 27.15 44.49 9.26 6.97 25.18 360.34 373.40 39.53 31.42 7376867858 1121.993
MG MG 31 Minas Gerais Sudeste SE 403551318 0.56 94.44 94.91 97.85 99.35 18.91 75.30 19597330 15.08 93.77 0.731 0.730 0.838 0.638 82.95 1.79 8.12 10.36 56.78 9.38 14.97 17.51 749.69 753.07 10.97 6.35 39703443889 2025.962
MS MS 50 Mato Grosso do Sul Centro-Oeste MW 54471447 0.56 96.22 93.76 98.64 98.63 24.97 74.96 2449024 18.14 93.21 0.729 0.740 0.833 0.629 83.02 2.04 6.62 9.72 50.43 10.08 15.93 17.80 799.34 804.67 9.92 6.34 6830726301 2789.163
MT MT 51 Mato Grosso Centro-Oeste MW 80830108 0.55 95.17 90.37 97.11 98.01 26.58 74.25 3035122 16.80 92.82 0.725 0.732 0.821 0.635 82.21 2.08 5.12 10.82 57.09 9.29 15.39 17.35 762.52 774.44 10.52 6.84 8649397120 2849.769
PA PA 15 Para Norte N 91009014 0.62 84.70 57.50 91.92 91.89 49.40 72.36 7581051 20.29 95.26 0.646 0.646 0.789 0.528 85.74 2.50 4.75 14.98 36.84 8.49 6.84 31.25 446.76 463.80 32.33 22.76 10158797999 1340.025
PB PB 25 Paraiba Nordeste NE 38731149 0.61 81.96 78.91 96.50 99.43 28.94 72.00 3766528 21.67 94.94 0.658 0.656 0.783 0.555 85.12 1.95 8.53 27.42 41.93 9.24 12.12 25.96 474.94 479.78 28.93 21.09 5501088472 1460.520
PE PE 26 Pernambuco Nordeste NE 117340092 0.62 83.69 78.22 94.74 99.47 29.89 72.32 8796448 20.43 95.23 0.673 0.673 0.789 0.574 85.68 1.92 7.37 22.23 44.08 9.13 9.62 23.75 525.64 531.61 27.17 19.75 16318603007 1855.136
PI PI 22 Piaui Nordeste NE 25720626 0.61 81.60 67.12 87.61 93.01 31.44 71.62 3118360 23.05 94.61 0.646 0.635 0.777 0.547 84.51 1.99 7.44 29.16 42.93 9.23 12.29 27.93 416.93 424.02 34.11 27.60 4225356568 1354.993
PR PR 41 Parana Sul S 255926608 0.53 96.71 96.69 99.18 99.60 16.85 74.80 10444526 13.08 93.64 0.749 0.757 0.830 0.668 83.48 1.86 7.53 7.86 60.70 10.43 18.53 14.64 890.89 893.61 6.46 3.51 19876326503 1903.038
RJ RJ 33 Rio de Janeiro Sudeste SE 504221370 0.59 95.84 94.73 97.59 99.92 30.33 75.10 15989929 14.15 92.57 0.761 0.782 0.835 0.675 82.28 1.68 8.91 5.07 52.52 9.17 15.38 21.18 1039.30 1040.90 7.23 4.02 44483694633 2781.982
RN RN 24 Rio Grande do Norte Nordeste NE 39543679 0.60 89.15 85.06 97.51 99.36 29.67 72.52 3168027 19.70 95.40 0.684 0.678 0.792 0.597 86.02 1.98 7.54 23.16 45.96 9.54 12.50 23.11 545.42 549.56 23.79 16.44 6189187740 1953.641
RO RO 11 Rondonia Norte N 29361936 0.56 95.13 79.62 94.64 97.26 27.15 72.97 1562409 18.02 95.80 0.690 0.712 0.800 0.577 86.77 2.16 4.69 11.46 47.34 9.20 11.63 20.79 670.82 685.13 14.80 9.16 4065844380 2602.292
RR RR 14 Roraima Norte N 7313836 0.63 93.35 74.04 96.68 90.73 51.22 73.51 450479 16.11 96.24 0.707 0.695 0.809 0.628 87.67 2.41 3.45 13.07 51.40 8.69 13.58 21.59 605.59 641.28 26.65 22.26 1748167767 3880.686
RS RS 43 Rio Grande do Sul Sul S 277657666 0.54 96.17 96.46 99.24 99.71 16.25 75.38 10693929 12.38 94.43 0.746 0.769 0.840 0.642 84.16 1.76 9.26 5.44 55.56 10.00 18.50 16.70 959.24 961.50 6.37 4.01 30151892932 2819.534
SC SC 42 Santa Catarina Sul S 177275691 0.49 94.13 97.00 99.31 99.81 13.15 76.61 6248436 11.54 94.98 0.774 0.773 0.860 0.697 85.72 1.71 6.89 5.11 61.85 10.24 19.17 12.66 983.90 985.70 3.65 1.93 11609996145 1858.064
SE SE 28 Sergipe Nordeste NE 27823191 0.62 89.13 82.24 97.14 99.18 29.14 71.84 2068017 22.22 94.81 0.665 0.672 0.781 0.560 84.88 1.95 6.14 23.30 37.93 9.01 12.68 29.82 523.53 527.71 27.89 18.70 5288791762 2557.422
SP SP 35 Sao Paulo Sudeste SE 1408903866 0.56 98.57 97.12 99.62 99.91 28.66 75.69 41262199 13.86 94.80 0.783 0.789 0.845 0.719 84.30 1.66 7.82 5.21 66.65 10.33 16.91 10.98 1084.46 1085.22 4.66 2.30 126050054074 3054.855
TO TO 17 Tocantins Norte N 19529689 0.60 94.33 80.41 94.35 94.74 31.22 72.56 1383445 19.56 95.43 0.699 0.690 0.793 0.624 86.08 2.41 5.82 17.14 53.47 9.80 14.35 18.80 586.62 597.07 22.15 14.96 3732488875 2697.967

A tabela abaixo constitui o dicionário de dados, em que constam as variáveis e uma breve explicação do que cada uma delas significa.

#Carregar base de dados em que consta o dicionário de dados
library(readxl)
dicio <- read_excel("BasesEstados2.xlsx", 
                    sheet = "dicionario")

#Execução e manipulação da tabela
library(DT)
DT::datatable(dicio, rownames = FALSE, colnames = FALSE)

As variáveis de interesse utilizadas no estudo desta base de dados são:

  • Agua (% da população em domicílios com água encanada);

  • Banheiro (% da população em domicílios com banheiro e água encanada);

  • Energia (% da população em domicílios com energia elétrica);

  • IDH (IDHM);

  • Regiao;

  • Estados.

Primeiramente, foram elaborados os gráficos do tipo Boxplot entre a variável qualitativa Região e as variáveis Energia, IDH, Agua e Banheiro. Em seguida, foi executada a matriz de correlação entre as variáveis Energia, Banheiro e IDH de cada unidade da federação. Ao fim dessas etapas, foram elaborados gráficos do tipo geobr, que permitem a elaboração de mapas do Brasil utilizando as variáveis Estados e as quantitativas de interesse do estudo, para facilitar a visualização dos dados apresentados.

Além da construção e análise de dados, o estudo abrangeu testes de hipóteses.

Testes de Hipóteses

Foram executados testes de hipóteses para avaliar se a variável Região interfere nas variáveis Banheiro e IDH. Adotou-se alpha=0,05 para todos os testes realizados. Dessa forma, a regra de decisão foi definida como:

Se p-value ≤ alpha, rejeita H0.
Se p-value > alpha, não rejeita H0.

O primeiro teste de hipóteses realizado com as variáveis teve como objetivo a verificação do pressuposto de normalidade, por meio do teste de Shapiro Wilk, o qual parte do pressuposto de que as observações são independentes e apresenta as seguintes hipóteses:

H0:os dados seguem uma distribuição normal.
H1:os dados não seguem uma distribuição normal.

Após a verificação do pressuposto de normalidade, executou-se, para os dados que não seguem distribuição normal, o teste de Kruskal- Wallis com as hipóteses:

H0: os grupos são amostrados de populações com distribuições idênticas.
H1: os grupos são amostrados de populações com diferentes distribuições.

E em seguida, executou-se o teste de Comparações Múltiplas de Wilcoxon.

Para dados que seguem uma distribuição normal, procedeu-se com o teste de Bartlett, com as hipóteses:

H0: todas as variâncias são iguais.
H1: pelo menos uma das variâncias é diferente.

Após a verificação da igualdade de variância, deve ser executado o teste ANOVA quando a hipótese nula não foi rejeitada ou o teste de Welch caso a hipótese nula seja rejeitada. O método ANOVA permite “avaliar o efeito que os diferentes níveis do fator provoca na variável resposta” (PORTAL ACTION, 2020). O teste ANOVA determina se a variabilidade entre as médias de um grupo é maior que a variabilidade das observações da amostra (MINITAB, 2020). As hipóteses, tanto para ANOVA quanto para Welch são:

H0: todas as médias são iguais.
H1: existe pelo menos uma média diferente.

Depois, sucedeu-se o teste de Comparações Múltiplas de Tukey, para comparar as diferenças entre as médias e o p-valor.

Por fim, foi executado duas análises pelo método ANCOVA, que permite comparar as médias ajustadas de dois ou mais grupos independentes, entre as variáveis Regiao, Banheiro e IDH, com o intuito de verificar o impacto do IDH e da Região na taxa da população em domicílios com banheiro e água encanada. A primeira análise, verificou se não há interação significativa entre a covariável e a variável de agrupamento, com as hipóteses:

H0: coeficientes das retas de regressão são iguais.
H1: coeficientes das retas de regressão não são iguais.

Já na segunda análise, uma ANCOVA para testar os efeitos principais, as hipóteses foram:

H0: não há efeito.
H1: há efeito.

4. Resultados e Discussões

Boxplot

Foram analisadas duas variáveis, qualitativa e quantitativa, e elaborados gráficos boxplot para visualização da relação entre os dados.

A primeira análise foi com as variáveis Regiao e Banheiro.

#Manipulação de dados
dados$Regiao<-as.factor(dados$Regiao)

#Construção de gráfico tipo boxplot
boxplot(Banheiro ~Regiao, data=dados, col=c("red","#faa005","#1bc704","#0f8efc","yellow"), main="Bloxpot 1 \n % da população em domicílios com banheiro e água encanada por Região \n")

A partir dos gráficos, observa-se que apenas a região Nordeste possui outliers, ou seja, há três estados desta região que possuem taxa da população em domicílios com banheiro e água encanada muito superiores ou inferiores ao restante dos estados. Com exceção do Norte, as outras regiões possuem pequena amplitude interquartil. Nota-se ainda que as regiões centro-Oeste, Sudeste e Sul possuem altas taxas para essa variável,enquanto a região Norte é a mais deficiente no quesito avaliado e existem estados em que há menos de 50% da população com acesso à água encanada e que possui banheiros, enquanto que em todos os estados das regiões Centro-Oeste, Sudeste e Sul, mais de 90% da população em domicílios possui água encanada e banheiro.

A segunda análise foi com as variáveis Regiao e Agua.

#Construção de gráfico tipo boxplot
boxplot(Agua~Regiao, data=dados,col=c("red","#faa005","#1bc704","#0f8efc","yellow"),main="Bloxpot 2 \n % da população em domicílios com água encanada por Região \n")

É possível observar que nenhuma região possui outliers. Além disso, região Norte possui grande amplitude interquartil também para esta variável. As regiões centro-Oeste, Sudeste e Sul possuem altas taxas da população em domicílios com água encanada, enquanto a região Nordeste é a mais deficiente no quesito avaliado.A partir do gráfico, pode se concluir que em todos os estados do Brasil, mais de 75% da população em domicílios de cada um deles possui água encanada.

Os resultados dessa avaliação são semelhantes ao da primeira, uma vez que a variável Banheiro é constituída pela taxa da população que possui água encanada e banheiro. Entretanto, a mediana das porcentagens da população que possuem água encanada, sem se considerar a presença de banheiros no domicílio, nas regiões Nordeste e Norte são bem maiores que as porcentagens de habitantes em domicílios com ambos os recursos. Para as demais regiões, as medianas são bastante semelhantes.

A terceira análise foi elaborada com as variáveis Regiao e Energia.

#Construção de gráfico tipo boxplot
boxplot(Energia~Regiao, data=dados, col=c("red","#faa005","#1bc704","#0f8efc","yellow"),main="Bloxpot 3 \n % da população em domicílios com energia elétrica por Região \n")

Nenhuma região possui outliers para a variável Energia. A região Norte possui grande amplitude interquartil também para esta variável, apresenta a menor mediana e o estado com menor taxa da população em domicílio com energia elétrica do país está nessa região.

Mais que 90% da população em domicílio de todos os estados do país possuem energia elétrica. As regiões centro-Oeste, Sudeste e Sul têm menor amplitude interquartil e são as que todos os estados possuem maiores taxas da população em domicílios com energia elétrica (maiores que 98%). Entretanto a mediana das regiões Centro-Oeste e Nordeste possuem valores muito próximos.

A quarta análise foi elaborada a partir das variáveis Regiao e IDH.

#Construção de gráfico tipo boxplot
boxplot(IDH~Regiao, data=dados,col=c("red","#faa005","#1bc704","#0f8efc","yellow"),main="Bloxpot 4 \n IDH por Região \n")

A região Nordeste apresenta a menor mediana de valores de IDH dentre as cinco regiões do Brasil e contém o estado com menor IDH do país. O Sul e o Sudeste possuem as maiores medianas, com valores bem próximos entre si. Entretanto, o maior IDH dos estados do Brasil pertence à uma unidade da federação do Centro-Oeste. Todas as unidades da federação possuem IDH superior a 0,60.

Matriz de correlação

Uma matriz de correlação analítica permite a visualização gráfica e do valor numérico do coeficiente de correlação entre variáveis.

#Carregar biblioteca para elaboração de matriz de correlação
library(corrplot)

#Elaboração da matriz de correlação
MC <-cor(dados[,c("Energia","Banheiro","Agua","IDH")])
corrplot.mixed(MC)

A partir da matriz de correlação é possível verificar que as variáveis Banheiro e Agua possuem bom grau de associação, o que era esperado tendo em vista que parte da primeira é composta pela segunda. Os pares IDH com Agua e IDH com Banheiro possuem forte grau de associação. Uma vez que o IDH considera saúde no seu cálculo, o acesso a banheiros e principalmente à água encanada pode favorecer hábitos de higiene que implicam em melhoria na saúde da população. Em resumo, à medida que se aumenta a porcentagem da população em domicílio com banheiro e água encanada ou apenas com água encada, maior tende a ser o IDH. O grau de correlação entre Energia e Agua e entre Energia e IDH é fraco, ou seja, não é possivel estimar o comportamento de um desses indicadores a partir do outro.

Mapas temáticos geobr

O pacote geobr permite a elaboração de mapas do Brasil. A ferramenta facilita a visualização e interpretação de dados.
No mapa abaixo estão representadas as regiões do Brasil, com as mesmas cores usadas para representar os dados de cada uma no gráfico do tipo Boxplot.

#Carregar biblioteca que permite execução de mapas do Brasil
library(geobr)
estado <- read_state(code_state="all", year=2010)

  |                                                                            
  |                                                                      |   0%
  |                                                                            
  |===                                                                   |   4%
  |                                                                            
  |=====                                                                 |   7%
  |                                                                            
  |========                                                              |  11%
  |                                                                            
  |==========                                                            |  15%
  |                                                                            
  |=============                                                         |  19%
  |                                                                            
  |================                                                      |  22%
  |                                                                            
  |==================                                                    |  26%
  |                                                                            
  |=====================                                                 |  30%
  |                                                                            
  |=======================                                               |  33%
  |                                                                            
  |==========================                                            |  37%
  |                                                                            
  |=============================                                         |  41%
  |                                                                            
  |===============================                                       |  44%
  |                                                                            
  |==================================                                    |  48%
  |                                                                            
  |====================================                                  |  52%
  |                                                                            
  |=======================================                               |  56%
  |                                                                            
  |=========================================                             |  59%
  |                                                                            
  |============================================                          |  63%
  |                                                                            
  |===============================================                       |  67%
  |                                                                            
  |=================================================                     |  70%
  |                                                                            
  |====================================================                  |  74%
  |                                                                            
  |======================================================                |  78%
  |                                                                            
  |=========================================================             |  81%
  |                                                                            
  |============================================================          |  85%
  |                                                                            
  |==============================================================        |  89%
  |                                                                            
  |=================================================================     |  93%
  |                                                                            
  |===================================================================   |  96%
  |                                                                            
  |======================================================================| 100%
regiao <- read_region(year=2010)

  |                                                                            
  |                                                                      |   0%
  |                                                                            
  |======================================================================| 100%

Downloading: 770 B     
Downloading: 770 B     
Downloading: 1.6 kB     
Downloading: 1.6 kB     
Downloading: 1.8 kB     
Downloading: 1.8 kB     
Downloading: 1.8 kB     
Downloading: 1.8 kB     
Downloading: 1.9 kB     
Downloading: 1.9 kB     
Downloading: 2 kB     
Downloading: 2 kB     
Downloading: 2 kB     
Downloading: 2 kB     
Downloading: 2.1 kB     
Downloading: 2.1 kB     
Downloading: 2.1 kB     
Downloading: 2.1 kB     
Downloading: 2.1 kB     
Downloading: 2.1 kB     
Downloading: 3.8 kB     
Downloading: 3.8 kB     
Downloading: 5 kB     
Downloading: 5 kB     
Downloading: 5 kB     
Downloading: 5 kB     
Downloading: 7.3 kB     
Downloading: 7.3 kB     
Downloading: 7.3 kB     
Downloading: 7.3 kB     
Downloading: 7.3 kB     
Downloading: 7.3 kB     
Downloading: 15 kB     
Downloading: 15 kB     
Downloading: 15 kB     
Downloading: 15 kB     
Downloading: 15 kB     
Downloading: 15 kB     
Downloading: 23 kB     
Downloading: 23 kB     
Downloading: 23 kB     
Downloading: 23 kB     
Downloading: 23 kB     
Downloading: 23 kB     
Downloading: 32 kB     
Downloading: 32 kB     
Downloading: 32 kB     
Downloading: 32 kB     
Downloading: 32 kB     
Downloading: 32 kB     
Downloading: 40 kB     
Downloading: 40 kB     
Downloading: 40 kB     
Downloading: 40 kB     
Downloading: 40 kB     
Downloading: 40 kB     
Downloading: 40 kB     
Downloading: 40 kB     
Downloading: 40 kB     
Downloading: 40 kB     
Downloading: 40 kB     
Downloading: 40 kB     
Downloading: 48 kB     
Downloading: 48 kB     
Downloading: 48 kB     
Downloading: 48 kB     
Downloading: 48 kB     
Downloading: 48 kB     
Downloading: 48 kB     
Downloading: 48 kB     
Downloading: 56 kB     
Downloading: 56 kB     
Downloading: 56 kB     
Downloading: 56 kB     
Downloading: 56 kB     
Downloading: 56 kB     
Downloading: 64 kB     
Downloading: 64 kB     
Downloading: 64 kB     
Downloading: 64 kB     
Downloading: 64 kB     
Downloading: 64 kB     
Downloading: 64 kB     
Downloading: 64 kB     
Downloading: 72 kB     
Downloading: 72 kB     
Downloading: 72 kB     
Downloading: 72 kB     
Downloading: 72 kB     
Downloading: 72 kB     
Downloading: 72 kB     
Downloading: 72 kB     
Downloading: 80 kB     
Downloading: 80 kB     
Downloading: 80 kB     
Downloading: 80 kB     
Downloading: 80 kB     
Downloading: 80 kB     
Downloading: 80 kB     
Downloading: 80 kB     
Downloading: 80 kB     
Downloading: 80 kB     
Downloading: 88 kB     
Downloading: 88 kB     
Downloading: 88 kB     
Downloading: 88 kB     
Downloading: 88 kB     
Downloading: 88 kB     
Downloading: 96 kB     
Downloading: 96 kB     
Downloading: 96 kB     
Downloading: 96 kB     
Downloading: 96 kB     
Downloading: 96 kB     
Downloading: 100 kB     
Downloading: 100 kB     
Downloading: 100 kB     
Downloading: 100 kB     
Downloading: 100 kB     
Downloading: 100 kB     
Downloading: 110 kB     
Downloading: 110 kB     
Downloading: 110 kB     
Downloading: 110 kB     
Downloading: 110 kB     
Downloading: 110 kB     
Downloading: 120 kB     
Downloading: 120 kB     
Downloading: 120 kB     
Downloading: 120 kB     
Downloading: 120 kB     
Downloading: 120 kB     
Downloading: 130 kB     
Downloading: 130 kB     
Downloading: 130 kB     
Downloading: 130 kB     
Downloading: 130 kB     
Downloading: 130 kB     
Downloading: 140 kB     
Downloading: 140 kB     
Downloading: 140 kB     
Downloading: 140 kB     
Downloading: 140 kB     
Downloading: 140 kB     
Downloading: 140 kB     
Downloading: 140 kB     
Downloading: 140 kB     
Downloading: 140 kB     
Downloading: 140 kB     
Downloading: 140 kB     
Downloading: 150 kB     
Downloading: 150 kB     
Downloading: 150 kB     
Downloading: 150 kB     
Downloading: 150 kB     
Downloading: 150 kB     
Downloading: 150 kB     
Downloading: 150 kB     
Downloading: 150 kB     
Downloading: 150 kB     
Downloading: 150 kB     
Downloading: 150 kB     
Downloading: 160 kB     
Downloading: 160 kB     
Downloading: 160 kB     
Downloading: 160 kB     
Downloading: 160 kB     
Downloading: 160 kB     
Downloading: 170 kB     
Downloading: 170 kB     
Downloading: 170 kB     
Downloading: 170 kB     
Downloading: 170 kB     
Downloading: 170 kB     
Downloading: 180 kB     
Downloading: 180 kB     
Downloading: 180 kB     
Downloading: 180 kB     
Downloading: 180 kB     
Downloading: 180 kB     
Downloading: 190 kB     
Downloading: 190 kB     
Downloading: 190 kB     
Downloading: 190 kB     
Downloading: 190 kB     
Downloading: 190 kB     
Downloading: 190 kB     
Downloading: 190 kB     
Downloading: 190 kB     
Downloading: 190 kB     
Downloading: 190 kB     
Downloading: 190 kB     
Downloading: 200 kB     
Downloading: 200 kB     
Downloading: 200 kB     
Downloading: 200 kB     
Downloading: 200 kB     
Downloading: 200 kB     
Downloading: 200 kB     
Downloading: 200 kB     
Downloading: 200 kB     
Downloading: 200 kB     
Downloading: 210 kB     
Downloading: 210 kB     
Downloading: 210 kB     
Downloading: 210 kB     
Downloading: 210 kB     
Downloading: 210 kB     
Downloading: 220 kB     
Downloading: 220 kB     
Downloading: 220 kB     
Downloading: 220 kB     
Downloading: 220 kB     
Downloading: 220 kB     
Downloading: 230 kB     
Downloading: 230 kB     
Downloading: 230 kB     
Downloading: 230 kB     
Downloading: 230 kB     
Downloading: 230 kB     
Downloading: 230 kB     
Downloading: 230 kB     
Downloading: 230 kB     
Downloading: 230 kB     
Downloading: 230 kB     
Downloading: 230 kB     
Downloading: 240 kB     
Downloading: 240 kB     
Downloading: 240 kB     
Downloading: 240 kB     
Downloading: 240 kB     
Downloading: 240 kB     
Downloading: 250 kB     
Downloading: 250 kB     
Downloading: 250 kB     
Downloading: 250 kB     
Downloading: 250 kB     
Downloading: 250 kB     
Downloading: 260 kB     
Downloading: 260 kB     
Downloading: 260 kB     
Downloading: 260 kB     
Downloading: 260 kB     
Downloading: 260 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 270 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 280 kB     
Downloading: 290 kB     
Downloading: 290 kB     
Downloading: 290 kB     
Downloading: 290 kB     
Downloading: 290 kB     
Downloading: 290 kB     
Downloading: 300 kB     
Downloading: 300 kB     
Downloading: 300 kB     
Downloading: 300 kB     
Downloading: 300 kB     
Downloading: 300 kB     
Downloading: 310 kB     
Downloading: 310 kB     
Downloading: 310 kB     
Downloading: 310 kB     
Downloading: 310 kB     
Downloading: 310 kB     
Downloading: 310 kB     
Downloading: 310 kB     
Downloading: 310 kB     
Downloading: 310 kB     
Downloading: 310 kB     
Downloading: 310 kB     
Downloading: 320 kB     
Downloading: 320 kB     
Downloading: 320 kB     
Downloading: 320 kB     
Downloading: 320 kB     
Downloading: 320 kB     
Downloading: 330 kB     
Downloading: 330 kB     
Downloading: 330 kB     
Downloading: 330 kB     
Downloading: 330 kB     
Downloading: 330 kB     
Downloading: 330 kB     
Downloading: 330 kB     
Downloading: 330 kB     
Downloading: 330 kB     
Downloading: 340 kB     
Downloading: 340 kB     
Downloading: 340 kB     
Downloading: 340 kB     
Downloading: 340 kB     
Downloading: 340 kB     
Downloading: 350 kB     
Downloading: 350 kB     
Downloading: 350 kB     
Downloading: 350 kB     
Downloading: 350 kB     
Downloading: 350 kB     
Downloading: 360 kB     
Downloading: 360 kB     
Downloading: 360 kB     
Downloading: 360 kB     
Downloading: 360 kB     
Downloading: 360 kB     
Downloading: 360 kB     
Downloading: 360 kB     
Downloading: 360 kB     
Downloading: 360 kB     
Downloading: 360 kB     
Downloading: 360 kB     
Downloading: 370 kB     
Downloading: 370 kB     
Downloading: 370 kB     
Downloading: 370 kB     
Downloading: 370 kB     
Downloading: 370 kB     
Downloading: 370 kB     
Downloading: 370 kB     
Downloading: 370 kB     
Downloading: 370 kB     
Downloading: 380 kB     
Downloading: 380 kB     
Downloading: 380 kB     
Downloading: 380 kB     
Downloading: 380 kB     
Downloading: 380 kB     
Downloading: 390 kB     
Downloading: 390 kB     
Downloading: 390 kB     
Downloading: 390 kB     
Downloading: 390 kB     
Downloading: 390 kB     
Downloading: 400 kB     
Downloading: 400 kB     
Downloading: 400 kB     
Downloading: 400 kB     
Downloading: 400 kB     
Downloading: 400 kB     
Downloading: 400 kB     
Downloading: 400 kB     
Downloading: 400 kB     
Downloading: 400 kB     
Downloading: 400 kB     
Downloading: 400 kB     
Downloading: 410 kB     
Downloading: 410 kB     
Downloading: 410 kB     
Downloading: 410 kB     
Downloading: 410 kB     
Downloading: 410 kB     
Downloading: 410 kB     
Downloading: 410 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 420 kB     
Downloading: 430 kB     
Downloading: 430 kB     
Downloading: 430 kB     
Downloading: 430 kB     
Downloading: 430 kB     
Downloading: 430 kB     
Downloading: 440 kB     
Downloading: 440 kB     
Downloading: 440 kB     
Downloading: 440 kB     
Downloading: 440 kB     
Downloading: 440 kB     
Downloading: 440 kB     
Downloading: 440 kB     
Downloading: 440 kB     
Downloading: 440 kB     
Downloading: 440 kB     
Downloading: 440 kB     
Downloading: 450 kB     
Downloading: 450 kB     
Downloading: 450 kB     
Downloading: 450 kB     
Downloading: 450 kB     
Downloading: 450 kB     
Downloading: 460 kB     
Downloading: 460 kB     
Downloading: 460 kB     
Downloading: 460 kB     
Downloading: 460 kB     
Downloading: 460 kB     
Downloading: 470 kB     
Downloading: 470 kB     
Downloading: 470 kB     
Downloading: 470 kB     
Downloading: 470 kB     
Downloading: 470 kB     
Downloading: 470 kB     
Downloading: 470 kB     
Downloading: 470 kB     
Downloading: 470 kB     
Downloading: 480 kB     
Downloading: 480 kB     
Downloading: 480 kB     
Downloading: 480 kB     
Downloading: 480 kB     
Downloading: 480 kB     
Downloading: 480 kB     
Downloading: 480 kB     
Downloading: 480 kB     
Downloading: 480 kB     
Downloading: 480 kB     
Downloading: 480 kB     
Downloading: 490 kB     
Downloading: 490 kB     
Downloading: 490 kB     
Downloading: 490 kB     
Downloading: 490 kB     
Downloading: 490 kB     
Downloading: 500 kB     
Downloading: 500 kB     
Downloading: 500 kB     
Downloading: 500 kB     
Downloading: 500 kB     
Downloading: 500 kB     
Downloading: 510 kB     
Downloading: 510 kB     
Downloading: 510 kB     
Downloading: 510 kB     
Downloading: 510 kB     
Downloading: 510 kB     
Downloading: 510 kB     
Downloading: 510 kB     
Downloading: 520 kB     
Downloading: 520 kB     
Downloading: 520 kB     
Downloading: 520 kB     
Downloading: 520 kB     
Downloading: 520 kB     
Downloading: 530 kB     
Downloading: 530 kB     
Downloading: 530 kB     
Downloading: 530 kB     
Downloading: 530 kB     
Downloading: 530 kB     
Downloading: 530 kB     
Downloading: 530 kB     
Downloading: 530 kB     
Downloading: 530 kB     
Downloading: 530 kB     
Downloading: 530 kB     
Downloading: 540 kB     
Downloading: 540 kB     
Downloading: 540 kB     
Downloading: 540 kB     
Downloading: 540 kB     
Downloading: 540 kB     
Downloading: 550 kB     
Downloading: 550 kB     
Downloading: 550 kB     
Downloading: 550 kB     
Downloading: 550 kB     
Downloading: 550 kB     
Downloading: 550 kB     
Downloading: 550 kB     
Downloading: 550 kB     
Downloading: 550 kB     
Downloading: 550 kB     
Downloading: 550 kB     
Downloading: 560 kB     
Downloading: 560 kB     
Downloading: 560 kB     
Downloading: 560 kB     
Downloading: 560 kB     
Downloading: 560 kB     
Downloading: 560 kB     
Downloading: 560 kB     
Downloading: 560 kB     
Downloading: 560 kB     
Downloading: 560 kB     
Downloading: 560 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 570 kB     
Downloading: 580 kB     
Downloading: 580 kB     
Downloading: 580 kB     
Downloading: 580 kB     
Downloading: 580 kB     
Downloading: 580 kB     
Downloading: 590 kB     
Downloading: 590 kB     
Downloading: 590 kB     
Downloading: 590 kB     
Downloading: 590 kB     
Downloading: 590 kB     
Downloading: 600 kB     
Downloading: 600 kB     
Downloading: 600 kB     
Downloading: 600 kB     
Downloading: 600 kB     
Downloading: 600 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 610 kB     
Downloading: 620 kB     
Downloading: 620 kB     
Downloading: 620 kB     
Downloading: 620 kB     
Downloading: 620 kB     
Downloading: 620 kB     
Downloading: 630 kB     
Downloading: 630 kB     
Downloading: 630 kB     
Downloading: 630 kB     
Downloading: 630 kB     
Downloading: 630 kB     
Downloading: 640 kB     
Downloading: 640 kB     
Downloading: 640 kB     
Downloading: 640 kB     
Downloading: 640 kB     
Downloading: 640 kB     
Downloading: 650 kB     
Downloading: 650 kB     
Downloading: 650 kB     
Downloading: 650 kB     
Downloading: 650 kB     
Downloading: 650 kB     
Downloading: 650 kB     
Downloading: 650 kB     
Downloading: 650 kB     
Downloading: 650 kB     
Downloading: 650 kB     
Downloading: 650 kB     
Downloading: 660 kB     
Downloading: 660 kB     
Downloading: 660 kB     
Downloading: 660 kB     
Downloading: 660 kB     
Downloading: 660 kB     
Downloading: 670 kB     
Downloading: 670 kB     
Downloading: 670 kB     
Downloading: 670 kB     
Downloading: 670 kB     
Downloading: 670 kB     
Downloading: 680 kB     
Downloading: 680 kB     
Downloading: 680 kB     
Downloading: 680 kB     
Downloading: 680 kB     
Downloading: 680 kB     
Downloading: 690 kB     
Downloading: 690 kB     
Downloading: 690 kB     
Downloading: 690 kB     
Downloading: 690 kB     
Downloading: 690 kB     
Downloading: 690 kB     
Downloading: 690 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 700 kB     
Downloading: 710 kB     
Downloading: 710 kB     
Downloading: 710 kB     
Downloading: 710 kB     
Downloading: 710 kB     
Downloading: 710 kB     
Downloading: 710 kB     
Downloading: 710 kB     
Downloading: 720 kB     
Downloading: 720 kB     
Downloading: 720 kB     
Downloading: 720 kB     
Downloading: 720 kB     
Downloading: 720 kB     
Downloading: 730 kB     
Downloading: 730 kB     
Downloading: 730 kB     
Downloading: 730 kB     
Downloading: 730 kB     
Downloading: 730 kB     
Downloading: 740 kB     
Downloading: 740 kB     
Downloading: 740 kB     
Downloading: 740 kB     
Downloading: 740 kB     
Downloading: 740 kB     
Downloading: 740 kB     
Downloading: 740 kB     
Downloading: 740 kB     
Downloading: 740 kB     
Downloading: 740 kB     
Downloading: 740 kB     
Downloading: 750 kB     
Downloading: 750 kB     
Downloading: 750 kB     
Downloading: 750 kB     
Downloading: 750 kB     
Downloading: 750 kB     
Downloading: 760 kB     
Downloading: 760 kB     
Downloading: 760 kB     
Downloading: 760 kB     
Downloading: 760 kB     
Downloading: 760 kB     
Downloading: 770 kB     
Downloading: 770 kB     
Downloading: 770 kB     
Downloading: 770 kB     
Downloading: 770 kB     
Downloading: 770 kB     
Downloading: 770 kB     
Downloading: 770 kB     
Downloading: 780 kB     
Downloading: 780 kB     
Downloading: 780 kB     
Downloading: 780 kB     
Downloading: 780 kB     
Downloading: 780 kB     
Downloading: 780 kB     
Downloading: 780 kB     
Downloading: 780 kB     
Downloading: 780 kB     
#Gerar mapa geobr das regiões do Brasil
library(ggplot2)
ggplot() +
  geom_sf(data=regiao, fill=c("#1bc704","#faa005","#0f8efc","yellow","red"), color= "BLACK", size=.15, show.legend = TRUE) +
  geom_sf_text(data=regiao,aes(label = name_region), size = 4, color="black")+
                  labs(subtitle="Mapa 1 - Regiões do Brasil", size= 10) +
                  theme_minimal()

Os limites da escala de cor para a variável quantitativa de cada mapa foi definido a partir da interpretação dos gráficos do tipo Boxplot previamente elaborados e analisados. Os valores atribuídos às variáveis quantitativas da base de dados são de amplitude relativamente pequena, e caso fossem mantidas as escalas completas de 0 a 100 para Agua, Banheiro e Energia e de 0 a 1 para IDH, a escala de cores pouco facilitaria a visualização dos dados.

Dessa forma, adotou-se como escala, os intervalos observados por meio dos gráficos Boxplot em que estão contidos todos os valores da amostra, para a variável em análise.

O mapa seguinte apresenta a porcentagem da população em domicílios com água encanada em cada estado e Distrito Federal (DF).

#Modificar nome da coluna da base de dados para adequar à biblioteca geobr
colnames(dados)[3]<-"code_state"

#Manipular variável
dados$code_state<-as.numeric(dados$code_state)

#Unir base de dados da pesquisa com base dos estados do pacote geobr
library(dplyr)
BR<-estado %>% left_join(dados)

#Gerar mapas, por meio do pacote ggplot2
library(ggplot2)
ggplot() +
  geom_sf(data=BR, aes(fill=Agua), color= "black", size=.15) +
  labs(subtitle="Mapa 2 - % da população em domicílios com água encanada por estado e DF", size=10) +
  geom_sf_text(data=BR,aes(label = abbrev_state), size=2, color= "black")+
  scale_fill_distiller(palette = "Blues",direction = 1, name="% da população", limits = c(75,100)) +
  theme_minimal() 

O “Mapa 2 - % da população em domicílios com água encanada por estado e DF” permite visualizar que os estados com menores taxas da população em domicílios com água encanada se concentram nas regiões Norte e Nordeste do país e que São Paulo e distrito federal são as unidades da federação que possuem as maiores porcentagens, próximas a 100%. Essas constatações corroboram as interpretações do gráfico Boxplot para essas mesmas variáveis.

O terceiro mapa apresenta a porcentagem da população em domicílios com banheiro e água encanada em cada estado e Distrito Federal (DF).

#Gerar mapas, por meio do pacote ggplot2
library(ggplot2)
ggplot() +
  geom_sf(data=BR, aes(fill=Banheiro), color= "black", size=.15) +
  labs(subtitle="Mapa 3 - % da população em domicílios com banheiro e água encanada por estado e DF", size=10) +
  geom_sf_text(data=BR,aes(label = abbrev_state), size=2, color= "black")+
  scale_fill_distiller(palette = "Greens",direction = 1, name="% da população", limits = c(40,100)) +
  theme_minimal()

A partir do mapa geobr “Mapa 3 - % da população em domicílios com banheiro e água encanada por estado e DF”, percebe-se que todos os estados do Sudeste e Sul possuem mais de 90% da população em domicílios com banheiros e água encanada.

O quarto mapa apresenta a porcentagem da população em domicílios com energia elétrica em cada estado e Distrito Federal (DF).

#Gerar mapas, por meio do pacote ggplot2
library(ggplot2)
ggplot() +
  geom_sf(data=BR, aes(fill=Energia), color= "black", size=.15) +
  labs(subtitle="Mapa 4 - % da população em domicílios com energia elétrica por estado e DF", size=10) +
  geom_sf_text(data=BR,aes(label = abbrev_state), size=2, color= "black")+
  scale_fill_distiller(palette = "Reds",direction = 1, name="% da população", limits = c(90,100)) +
  theme_minimal()

De posse do “Mapa 4 - % da população em domicílios com energia elétrica por estado e DF”, é possível afirmar que os estados com menores porcentagens da população vivendo em domicílios com energia elétrica são da região Norte, enquanto que os das regiões Sul e sudeste apresentam as maiores porcentagens, acima de 97,5%.

Baseando-se unicamente na escala de cores, é perceptível semelhança entre os três gráficos, ou seja, a maioria dos estados que possuem cores fortes ou cores fracas em um dos gráficos, apresenta o mesmo padrão de intensidade de cor nos outros dois, com exceção de poucos estados do Nodeste para o mapa relativo ao acesso a energia elétrica.

O quinto mapa apresenta o IDH em cada estado e Distrito Federal (DF).

#Gerar mapas, por meio do pacote ggplot2
library(ggplot2)
ggplot() +
  geom_sf(data=BR, aes(fill=IDH), color= "black", size=.15) +
  labs(subtitle="Mapa 5 - IDH por estado e DF", size=10) +
  geom_sf_text(data=BR,aes(label = abbrev_state), size=2, color= "black")+
  scale_fill_distiller(palette = "Oranges",direction = 1, name="IDH", limits = c(0.6,1)) +
  theme_minimal()

Há pouca variabilidade do valor de IDH no país,sendo que todos apresentam um valor para o indicador classificado ao menos como médio, de acordo com as faixas do Atlas do Desenvolvimento Humano no Brasil. O Distrito Federal apresenta o maior valor de IDH no Brasil.

Testes de Hipóteses

Foi executado o teste de Shapiro Wilk para as variáveis quantitativas Banheiro e IDH.

#Teste de normalidade (Shapiro Wilk)

#H0: os dados seguem uma distribuição normal
#H1: os dados NÃO seguem uma distribuição normal
#alpha = 0.05

shapiro.test(dados$Banheiro)

    Shapiro-Wilk normality test

data:  dados$Banheiro
W = 0.89806, p-value = 0.01208
#Como pvalor < 0.05, rejeito H0
#os dados NÃO seguem uma distribuição normal

Para a variável Banheiro, o pvalor < 0.05, logo, rejeita-se a hipótese nula H0. Portanto, os dados não seguem uma distribuição normal e deve ser executado, em seguida, o teste de Kruskal-Wallis.

#Teste de normalidade (Shapiro Wilk)

#H0: os dados seguem uma distribuição normal
#H1: os dados NÃO seguem uma distribuição normal
#alpha = 0.05

shapiro.test(dados$IDH)

    Shapiro-Wilk normality test

data:  dados$IDH
W = 0.96157, p-value = 0.401
#Como pvalor > 0.05, não rejeito H0
#os dados seguem uma distribuição normal

Para IDH, pvalor > 0.05, logo, não se rejeita a hipótese nula H0. Portanto, os dados seguem uma distribuição normal e deve ser executado em seguida o teste de Bartlett.

Em seguida, foi investigado se a Região interfere em Banheiro, por meio do teste de Kruskal-Wallis e do teste de Comparações Múltiplas de Wilcoxon.

#-------------------------------------------------------
#Teste se a região interfere em Banheiro
#-------------------------------------------------------
#Para dados que NÃO seguem uma distribuição normal

# H0: os grupos são amostrados de populações com distribuições idênticas. 
# H1: os grupos são amostrados de populações com diferentes distribuições.

kruskal.test(dados$Banheiro~dados$Regiao)

    Kruskal-Wallis rank sum test

data:  dados$Banheiro by dados$Regiao
Kruskal-Wallis chi-squared = 20.417, df = 4, p-value = 0.0004131
#Como pvalor < 0.05, rejeito H0
#os grupos são amostrados de populações com diferentes distribuições
PMW <- pairwise.wilcox.test(dados$Banheiro,
                          dados$Regiao,
                          p.adjust.method="fdr")
# Adjusts p-values for multiple comparisons;
PMW

    Pairwise comparisons using Wilcoxon rank sum exact test 

data:  dados$Banheiro and dados$Regiao 

         Centro-Oeste Nordeste Norte Sudeste
Nordeste 0.014        -        -     -      
Norte    0.015        0.234    -     -      
Sudeste  0.143        0.014    0.015 -      
Sul      0.082        0.018    0.028 0.857  

P value adjustment method: fdr 

Como pvalor < 0.05, a hipótese nula H0 é rejeitada. Portanto, os grupos são amostrados de populações com diferentes distribuições, ou seja, a taxa da população em domicílios com banheiro e água encanada não possui distribuição semelhante entre todas as regiões. Portanto, a região exerce influência sobre a taxa da população em domicílios com banheiro e água encanada, o que é perceptível pelo “Mapa 3 - % da população em domicílios com banheiro e água encanada por estado e DF”, em que se observa que a variação de cores de uma região para outra não é uniforme.

A partir da matriz do Teste de Wilcoxon, que compara as regiões em relação à taxa da população em domicílios com banheiro e água encanada, é possível observar que as regiões que possuem distribuição em média diferentes entre si são: Nordeste e Cento-Oeste; Norte e Cento-Oeste; Nordeste e Sudeste; Nordeste e Sul; Norte e Sudeste; Norte e Sul , pois quando comparadas uma com a outra, pvalor<0.05. Dessa forma, os pares de regiões Cento-Oeste e Sudeste; Cento-Oeste e Sul;Norte e Nordeste; Sudeste e Sul, possuem distribuição da variável em média semelhantes, uma vez que quando comparadas uma com a outra, pvalor>0.05.

Depois, foi investigado se a Região interfere em IDH, por meio do teste de Bartlett, também denominado teste da homogeneidade das variâncias. Primeiramente, criou-se um modelo estatístico. Foi verificado que os resíduos do modelo seguem uma distribuição normal, para então ser executado o teste de Bartlett.

#-------------------------------------------------------
#Teste se a região interfere em IDH
#-------------------------------------------------------
#Para dados que seguem uma distribuição normal

#criar modelo estatístico
modelo <- aov(IDH~Regiao, data=dados)
residuos <- residuals(modelo)
residuos
            1             2             3             4             5 
-0.0208571429 -0.0287777778 -0.0098571429  0.0241428571  0.0002222222 
            6             7             8             9            10 
 0.0222222222  0.0707500000 -0.0137500000 -0.0182500000 -0.0207777778 
           11            12            13            14            15 
-0.0227500000 -0.0242500000 -0.0282500000 -0.0378571429 -0.0017777778 
           16            17            18            19            20 
 0.0132222222 -0.0137777778 -0.0073333333  0.0072500000  0.0242222222 
           21            22            23            24            25 
 0.0061428571  0.0231428571 -0.0103333333  0.0176666667  0.0052222222 
           26            27 
 0.0292500000  0.0151428571 
#H0: os dados seguem uma distribuição normal
#H1: os dados NÃO seguem uma distribuição normal
#alpha = 0.05

shapiro.test(residuos)

    Shapiro-Wilk normality test

data:  residuos
W = 0.93962, p-value = 0.1193
#pvalor>0.05
#NÃO rejeito H0 (os dados seguem distribuição normal)

#H0: todas as variâncias são iguais
#H1: pelo menos uma das variâncias é diferente
#alpha = 0.05

bartlett.test(residuos~dados$Regiao)

    Bartlett test of homogeneity of variances

data:  residuos by dados$Regiao
Bartlett's K-squared = 5.213, df = 4, p-value = 0.2661
#pvalor>0.05, NÃO rejeito H0
#todas as variâncias são iguais

Como pvalor>0.05 no teste de homogeneidade das variâncias para os resíduos, a hipótese H0 não é rejeitada. Logo, todas as variâncias são iguais. Depois, executou-se o teste ANOVA, para um novo modelo estatístico composto pelas variáveis avaliadas, IDH e Região.

modelo2 <- aov(IDH~Regiao, data= dados)
modelo2
Call:
   aov(formula = IDH ~ Regiao, data = dados)

Terms:
                    Regiao  Residuals
Sum of Squares  0.04825216 0.01489858
Deg. of Freedom          4         22

Residual standard error: 0.02602322
Estimated effects may be unbalanced
summary(modelo2)
            Df  Sum Sq  Mean Sq F value   Pr(>F)    
Regiao       4 0.04825 0.012063   17.81 1.19e-06 ***
Residuals   22 0.01490 0.000677                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##pvalor<0.05, Rej H0
#Existe pelo menos uma média diferente

Como pvalor<0.05,representado por PR(>F) na matriz, a hipótese nula é rejeitada. Dessa forma, existe ao menos uma média entre os grupos que difere das demais. Para avaliar qual é a média diferente, executou-se o teste de Comparações Múltiplas de Tukey.

#Qual a média que é diferente das demais?
TukeyHSD(modelo2)
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = IDH ~ Regiao, data = dados)

$Regiao
                              diff         lwr         upr     p adj
Nordeste-Centro-Oeste -0.093472222 -0.13986988 -0.04707457 0.0000465
Norte-Centro-Oeste    -0.069392857 -0.11778701 -0.02099870 0.0027013
Sudeste-Centro-Oeste   0.000500000 -0.05409597  0.05509597 0.9999999
Sul-Centro-Oeste       0.003083333 -0.05588705  0.06205372 0.9998587
Norte-Nordeste         0.024079365 -0.01483100  0.06298973 0.3792906
Sudeste-Nordeste       0.093972222  0.04757457  0.14036988 0.0000432
Sul-Nordeste           0.096555556  0.04508198  0.14802913 0.0001210
Sudeste-Norte          0.069892857  0.02149870  0.11828701 0.0025124
Sul-Norte              0.072476190  0.01919598  0.12575640 0.0045197
Sul-Sudeste            0.002583333 -0.05638705  0.06155372 0.9999301

Na matriz do teste de comparações múltiplas, o valor de p adj é o valor de pvalor ajustado. A partir do resultado do Teste de Tukey, é possível observar que os grupos Nordeste e Centro-Oeste, Norte e Centro-Oeste, Sudeste e Nordeste, Sul e Nordeste, Sudeste e Norte, Sul e Norte, os quais possuem pvalor<0.05, possuem distribuição em média do IDH diferentes entre si. Já os demais grupos, em pvalor>0.05, apresentam distribuição em média do IDH semelhantes dentro do mesmo grupo.

Abaixo estão os resultados do método ANCOVA executado para verificar qual o impacto do IDH na taxa da população em domicílios com banheiro e água encanada, usando a Região como covariável.

#H0: coeficientes das retas de regressão são iguais 
#H1: coeficientes das retas de regressão não são iguais
#alpha = 0.05

ANCOVA <- aov(Banheiro ~ Regiao * IDH, data = dados)
summary(ANCOVA)
            Df Sum Sq Mean Sq F value   Pr(>F)    
Regiao       4   4014  1003.6  18.664 4.78e-06 ***
IDH          1    407   407.4   7.576   0.0136 *  
Regiao:IDH   4    374    93.5   1.738   0.1881    
Residuals   17    914    53.8                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#pvalor>0.05, não rej H0
#coeficientes das retas de regressão são iguais

O resultado mostra que os coeficientes das retas de regressão são iguais, ou seja, o comportamento das variáveis taxa da população em domicílios com banheiro e água encanada e IDH são semelhantes para uma mesma Região . Ao retirar o termo de interação, para testar os efeitos principais, o resultado foi o seguinte:

#H0: não há efeito
#H1: há efeito
#alpha = 0.05

ANCOVA2 <- aov(Banheiro ~ Regiao + IDH, data = dados)
summary(ANCOVA2)
            Df Sum Sq Mean Sq F value   Pr(>F)    
Regiao       4   4014  1003.6  16.363 3.15e-06 ***
IDH          1    407   407.4   6.642   0.0176 *  
Residuals   21   1288    61.3                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#pvalor<0.05, rej H0
#existe efeito

Assim, é possível verificar que a remoção da interação não afeta o ajuste do modelo de forma significativa, visto que não há grandes alterações nos valores de pvalor entre os dois modelos. Além disso, verifica-se que existe efeito conjunto do IDH e da Região sobre a taxa da população em domicílios com banheiro e água encanada.

5. Conclusão

A partir dos resultados obtidos, é possível concluir que há disparidades no desenvolvimento humano e no acesso da população à serviços de saneamento básico entre as unidades da federação e, por conseguinte, entre as cinco regiões do Brasil, pois os testes de hipóteses apontaram que a variável qualitativa Região interfere nas variáveis quantitativas Banheiro e IDH.

Como aspectos relacionados à saúde são avaliados para o cálculo do IDH, é esperado que este índice tenha correlação com o percentual da população em domicílios com água encanada, uma vez que saneamento básico é imprescindível para a saúde. O fato é corroborado pela matriz de correlação que apontou forte grau de correlação entre as variáveis Agua e IDH, indicando que quanto maior o acesso à água encanada, maior tende a ser o IDH do estado avaliado.

Os gráficos do tipo Boxplot, os mapas temáticos e a matriz de correlação entre as variáveis de interesse são complementares para o entendimento dos dados, pois apenas uma dessas formas de visualização de dados fornece um tipo de informação, mas quando utilizados em conjunto, permitem uma melhor compreensão.

Referências Bibliográficas

Atlas do Desenvolvimento Humano no Brasil. Ranking. Disponível em: http://www.atlasbrasil.org.br/ranking . Acesso em: 17 out. 2020.

BRASIL. Instituto Brasileiro de Geografia e Estatística. O IBGE. Disponível em: https://www.ibge.gov.br/institucional/o-ibge.html. Acesso em: 17 out. 2020.

Minitab. Entendendo Análise de Variância (ANOVA) e o teste F. Disponível em: https://blog.minitab.com/pt/entendendo-analise-de-variancia-anova-e-o-teste-f. Acesso em: 05 nov. 2020.

PNUD (Programa das Nações Unidas para o Desenvolvimento) . IDH. Disponível em: https://www.br.undp.org/content/brazil/pt/home/idh0.html. Acesso em: 12 out. 2020.

Portal Action. ANOVA um fator. Disponível em: http://www.portalaction.com.br/anova/anova-um-fator. Acesso em: 05 nov. 2020.