1.Introdução

O Índice de Progresso Social (IPS) é uma abordagem de mensuração direta do desenvolvimento humano a partir de indicadores selecionados em três dimensões e 12 componentes definidos globalmente. A seleção das dimensões e componentes foi realizada pelo Social Progress Imperative com apoio de acadêmicos nas universidades de Harvard e do Massachusetts Institute of Technology (MIT) com o objetivo de cobrir um gama abrangente de temas, sempre tentando responder em que medida cada território é capaz de prover condições mínimas para seus habitantes. Por mensuração direta entende-se a medição que não inclui proxies econômicas nem tampouco indicadores de insumos (inputs), como o nível de investimento e a capacidade instalada de atendimento dos serviços públicos. Mede-se o desenvolvimento com indicadores de resultados (outcomes), como a cobertura de serviços efetivamente disponível, a variação da incidência de doenças ou a exposição à violência..

O IPS combina variáveis sociais comumente usadas em avaliações do desenvolvimento humano e bem-estar — indicadores de saúde, nível de acesso e qualidade dos serviços básicos e da educação básica e superior — com variáveis ambientais, acesso à comunicação, direitos humanos, liberdade de escolha, tolerância e inclusão. A justificativa desse modelo é que o crescimento econômico é condição necessária, mas não suficiente, do desenvolvimento humano ou “Progresso Social”.

A estrutura básica do IPS tem sido utilizada em diversas aplicações. O IPS Global foi criado com 52 indicadores levantados para 133 países. A mesma estrutura foi adaptada e aplicada para as Regiões administrativas no IPS RIO e, em outros contextos, para regiões e cidades na Colômbia, Costa Rica, Estados Unidos, Paraguai, Peru e União Europeia.

Em cada aplicação, a definição de indicadores é realizada localmente por meio de processo participativo, envolvendo os atores locais, como governo, universidades, institutos de pesquisa, empresas, fundações e organizações da sociedade civil.

2. Objetivo

O objetivo do estudo desenvolvido é verificar se o IPS tem impacto no acesso das pessoas à educação e oportunidades, correlacionando o IPS (Índice de Progresso Social) com acesso a educação básica, ao acesso ao ensino superior, evasão do ensino médio, oportunidades e nível de alfabetização de cada de cada zona do Municipio do Rio de Janeiro. Para tanto, serão utilizados para melhor visualização dos dados de gráficos boxplot construídos a partir de uma base de dados.

3. Metodologia

As etapas que constituem a Metodologia da pesquisa desenvolvida neste trabalho serão expostas neste tópico.

Inicialmente, foi preciso selecionar e carregar uma base de dados para o ambiente do RStudio. Foi escolhida uma base de dados do IPS Rio, que contém informações sobre população, indicadores sociais e econômicos dos bairros cariocas, relativas ao ano de 2015. Para esse relatório em específico, foi adicionada a variável Zona no banco de dados

Na tabela a seguir, estão os dados utilizados.

library(readxl)
trabalho_estatistica <- read_excel("~/Base_de_dados-master/Base_de_dados-master/trabalho estatistica.xlsx")
View(trabalho_estatistica)

library(kableExtra)
library(shinythemes)

library(readxl)
dados <- read_excel("Base_de_dados-master/trabalho estatistica.xlsx", 
                    sheet = "índices")

#Execução e manipulação da tabela
kable(dados, row.names = FALSE)%>%
  kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
                 position = "center", fixed_thead = T) %>%
  scroll_box(width = "900px", height = "600px")
RA ID Região Administrativa Zona IPS Necessidades humanas básicas Fundamentos do bem-estar Oportunidades Nutrição e Cuidados Médicos Básicos Água e Saneamento Moradia Segurança Pessoal Acesso educação básica Acesso à informação e comunicação Saúde e bem-estar Sustentabilidade dos ecossistemas Direitos individuais Liberdade individual e de escolha Tolerância e inclusão Acesso à Educação Superior Mortalidade infantil Baixo peso ao nascer Mortalidade materna Internações infantis por crise respiratória aguda Acesso a esgotamento sanitário Acesso a água canalizada Acesso a banheiro Acesso à energia elétrica População vivendo em favelas não urbanizadas Adensamento habitacional Excessivo Taxa de homicídios Roubos de rua Evasão do Ensino Médio Nota IDEB nos anos iniciais Nota IDEB nos anos finais Alfabetização Acesso a internet Acesso a telefone celular ou fixo Incidência de dengue Mortes por doenças crônicas não-transmissíveis Mortalidade por tuberculose e HIV Degradação de áreas verdes Taxa de coleta seletiva de lixo Mobilidade urbana Tempo médio de deslocamento Homicídios por intervenção policial Participação nas eleições Trabalho infantil Gravidez na adolescência Acesso à cultura Vulnerabilidade familiar Violência contra a mulher Homicídios de jovens negros Pessoas com ensino superior Negros e indígenas com ensino superior Frequência ao ensino superior
1 I PORTUARIA Centro 45.24827 58.86548 41.78264 35.09667 87.62969 80.79779 67.03446 0.00000 41.339060 21.16810 64.73768 39.88573 39.34683 61.944282 33.67123 5.4243315 0.9140768 0.0740343 75.81495 9.659614 0.9397460 0.9973192 0.9426182 0.9112125 0.1318428 0.1019578 44.006341 31.1745573 14.533333 4.783333 4.960000 0.5489342 0.3235331 0.9304391 130.88249 194.39900 19.247426 -0.0230543 0.0000000 0.5186187 42.94118 10.8883718 0.7523077 9.514205 0.2017167 67.263654 0.0453723 601.8866 6.1271666 0.0388446 0.0210459 0.0980684
2 II CENTRO Centro 65.05133 72.86013 52.55585 69.73801 59.38067 74.17556 91.49402 66.39028 55.602223 56.59037 41.03828 56.99254 50.72477 87.268371 92.70392 48.2549776 3.9164491 0.1052632 0.00000 9.770603 0.9222811 0.9965855 0.9233513 0.9691001 0.0026251 0.0376714 10.421951 14.9541572 1.666667 5.000000 4.750000 0.5270000 0.5075594 0.9746848 183.72265 250.53089 33.404118 0.0000004 0.0280910 0.6868051 31.03846 2.0929899 0.7016657 0.000000 0.1315789 100.000000 0.0134899 201.4403 0.8371959 0.2402451 0.1802790 0.3936988
3 III RIO COMPRIDO Centro 53.51634 59.71209 49.76196 51.07496 61.22442 84.36338 64.32577 28.93479 34.001319 52.36891 47.83610 64.84151 66.88753 50.450552 64.48828 22.4734764 3.7054938 0.1028708 27.92508 7.876547 0.9302709 0.9945506 0.9644639 0.9077172 0.3544033 0.0813468 43.022384 10.6941354 9.440000 4.833333 4.500000 0.6098969 0.5091193 0.9655559 257.98647 201.20476 32.094011 0.0096534 0.0420638 0.5636553 23.24590 4.9375401 0.7570008 3.687633 0.1698565 7.182558 0.0227540 417.2221 4.9375401 0.1516174 0.0663111 0.2179684
4 IV BOTAFOGO Sul 86.90105 91.76146 82.03457 86.90712 85.14870 98.48767 99.56529 83.84418 78.469514 90.14123 81.46079 78.06677 68.18301 85.740906 94.31272 99.3918513 1.0475775 0.0916162 14.80166 4.153411 0.9907000 0.9987327 0.9933126 0.9865785 0.0166939 0.0077175 4.164897 8.1631973 11.780000 5.875000 5.560000 0.4254633 0.7829505 1.0000000 233.70229 129.55688 8.331632 -0.0007887 0.0969055 0.7327649 25.65049 0.4165816 0.7403952 8.329793 0.0432152 68.389389 0.0059334 217.0390 2.4994897 0.5703153 0.3516722 0.6869137
5 IX VILA ISABEL Norte 74.36221 85.23414 67.36365 70.48884 72.44784 94.20576 86.82062 87.46235 63.061940 75.32193 74.40541 56.66532 58.53597 61.445909 88.77652 73.1969588 1.4236564 0.0881834 39.75353 17.900857 0.9853779 0.9870965 0.9948873 0.9285536 0.1292430 0.0211752 5.241502 4.4238279 6.840000 5.550000 4.871429 0.4733415 0.6820549 0.9854134 355.24258 142.20198 8.920419 0.0021725 0.0244915 0.2935148 30.08416 0.0000000 0.7690390 7.338103 0.1287478 29.038720 0.0118641 227.2083 3.1483833 0.4071881 0.2580671 0.5424197
6 V COPACABANA Sul 82.48733 93.22172 78.18060 76.05967 86.03902 99.32263 96.59223 90.93302 80.933715 82.30121 72.38526 77.10223 64.63988 71.180350 84.89546 83.5229797 1.8168055 0.0848214 25.57551 2.731619 0.9936487 0.9991836 0.9949494 0.9719675 0.0404489 0.0106782 3.722154 3.3437347 13.750000 6.233333 5.250000 0.3444461 0.7196247 0.9939160 200.99754 147.02598 16.749795 -0.0068358 0.1008848 0.9351757 24.70588 1.2407256 0.7005785 2.481436 0.0758929 27.929930 0.0055214 362.2919 1.2407256 0.5049353 0.2833628 0.5868647
7 VI LAGOA Sul 85.18402 90.27187 85.14460 80.13560 79.23636 98.86122 96.55602 86.43388 62.489336 97.76380 84.58395 95.74131 54.75178 86.212695 98.00703 81.5708797 1.9167888 0.0937149 0.00000 6.112628 0.9943574 0.9960222 0.9974218 0.9863365 0.0271377 0.0197748 4.849660 5.5710475 9.571429 5.400000 4.900000 0.4255696 0.9091913 0.9952998 165.09035 128.20203 7.861445 -0.0020534 0.1553251 0.2082618 27.60432 0.0000000 0.7519843 1.818623 0.0555556 65.038596 0.0060140 210.4448 0.0000000 0.5812770 0.1881919 0.6647887
8 VII SAO CRISTOVAO Centro 52.08942 67.56584 46.72307 41.97935 70.05447 86.36102 67.34671 46.50117 44.501265 52.36725 31.45072 58.57302 64.14905 40.629695 46.31723 16.8214376 2.2573363 0.0827943 132.21654 11.053316 0.9317486 0.9941414 0.9725726 0.8882699 0.2630682 0.0708794 27.898465 12.5295198 9.885714 5.240000 4.560000 0.5456734 0.4086984 0.9820359 183.91314 217.15045 50.963882 -0.0091157 0.0438656 0.5447937 28.54839 7.7825239 0.7796993 16.455127 0.1863517 4.187575 0.0321642 462.2171 11.4848378 0.0879074 0.0583942 0.1924026
9 VIII TIJUCA Norte 77.62715 86.28713 67.21780 79.37652 82.47568 84.61617 95.08250 82.97418 56.824482 80.67243 77.74720 53.62709 71.17253 78.808094 88.71577 78.8096877 1.8220793 0.0813648 53.57133 7.079646 0.9602799 0.9666486 0.9950661 0.9731933 0.0379077 0.0184797 4.498109 8.4807512 9.240000 5.281250 5.014286 0.5140019 0.7106812 0.9919606 125.73851 155.38864 12.079682 -0.0001553 0.0174319 0.6145276 22.17647 3.0905125 0.7588630 9.331635 0.0845144 66.898375 0.0069462 266.6178 3.3245451 0.4633932 0.2462383 0.6173630
10 X RAMOS Norte 57.74748 71.45287 46.88990 54.89966 54.91210 94.91548 68.40516 67.57874 47.165641 53.04856 39.40422 47.94116 81.56155 48.675287 64.97212 24.3896733 2.7556062 0.1097752 34.60202 15.299656 0.9718439 0.9950370 0.9911487 0.9063996 0.3254601 0.0662630 17.729762 6.8949561 14.330000 5.152174 4.950000 0.5314440 0.4766018 0.9723220 317.68672 266.46784 26.581950 -0.0034255 0.0029473 0.7880410 23.07988 3.8338692 0.7885426 7.771115 0.1651856 6.012228 0.0199638 305.0825 12.7368379 0.1343309 0.0835553 0.2389247
11 XI PENHA Norte 61.83749 82.83738 49.41498 53.26011 71.56372 97.55575 81.15663 81.07342 47.440751 40.41210 58.21269 51.59439 69.06910 35.465092 85.31455 23.1916880 2.0584199 0.1004431 48.57505 4.747496 0.9740202 0.9982760 0.9962959 0.9752649 0.2046781 0.0592600 9.212873 5.2584246 15.610000 5.413636 4.877778 0.5328846 0.4671791 0.9473086 229.80132 189.62626 23.569366 -0.0010775 0.0119644 0.5192915 28.08333 3.5464877 0.7886427 35.858599 0.1729266 12.928990 0.0194652 189.0278 4.2557853 0.1339274 0.0864588 0.2092653
12 XII INHAUMA Norte 60.90411 72.95660 45.22265 64.53308 70.68070 92.05403 82.32656 46.76512 41.764934 45.51416 48.95756 44.65394 87.07919 59.097880 81.14774 30.8075059 2.8804609 0.0895735 31.80161 11.103007 0.9473157 0.9902148 0.9955522 0.9629141 0.1125501 0.0607839 31.615090 8.6831212 14.422222 5.145833 4.771429 0.5550045 0.4726428 0.9571356 302.71337 213.59338 26.515040 -0.0174039 0.0087389 0.8879178 20.05303 3.6826444 0.7862052 5.146643 0.1830763 42.806588 0.0197768 237.1623 4.4191733 0.1438712 0.1141846 0.2917743
13 XIII MEIER Norte 66.36749 78.32838 54.99070 65.78339 67.59127 91.26379 87.14133 67.31711 51.583954 62.29172 55.11805 50.96906 67.20936 73.978803 75.78237 46.1630148 2.7581298 0.0898635 43.83398 14.254879 0.9606643 0.9877213 0.9911243 0.9625807 0.1289344 0.0365033 14.412588 10.3472653 11.895238 5.575758 4.810526 0.5402646 0.5759932 0.9754352 209.05029 217.10036 22.640826 -0.0021879 0.0112512 0.5841556 28.04918 3.5771700 0.7733662 4.780271 0.1279983 64.125017 0.0130707 328.1074 6.5019221 0.2422520 0.1613442 0.3897607
14 XIV IRAJA Norte 61.76467 77.52630 44.86997 62.89774 68.34762 97.73011 87.74546 56.28200 60.431168 55.04873 37.20677 26.79321 67.89536 68.770541 76.78907 38.1359890 2.6982461 0.0920330 83.67191 8.067556 0.9778299 0.9979740 0.9960493 0.9768167 0.1431866 0.0387722 21.680751 11.3873217 14.538462 5.609091 5.062500 0.4555344 0.5420665 0.9657803 604.59433 233.06692 23.651612 -0.0724940 0.0157614 0.5486093 31.38889 3.4491934 0.7947999 7.883909 0.1363468 56.471058 0.0142300 266.0806 8.8693544 0.1817696 0.1286832 0.3655518
15 XIX SANTA CRUZ Oeste 47.94325 64.94270 40.33379 38.55325 64.71500 71.20823 65.08669 58.76089 46.185839 19.45995 59.27663 36.41275 67.76934 34.229527 45.90524 6.3088988 3.9832833 0.0898610 62.82535 8.660532 0.7614345 0.9810743 0.9925132 0.8813079 0.1255868 0.0969513 29.176561 2.1869736 7.793750 5.363636 4.608333 0.5849197 0.3042365 0.9300163 128.30527 206.41526 23.304949 -0.0341312 0.0017930 0.1770575 24.12821 4.6097702 0.8080316 23.087540 0.2109918 5.839882 0.0312617 385.1719 16.9024906 0.0463885 0.0340600 0.0798128
16 XV MADUREIRA Norte 53.85021 68.97426 48.15372 44.42267 66.97235 89.35819 81.70307 37.86341 51.434927 43.20843 48.43015 49.54139 59.04282 56.359063 37.21544 25.0733474 2.6854649 0.1046229 32.96629 4.961021 0.9211137 0.9907008 0.9935251 0.9605092 0.1019738 0.0639079 32.076509 14.8279729 12.230435 5.361224 5.031579 0.5588424 0.4582941 0.9546445 356.47982 220.94743 23.441984 -0.0005952 0.0047855 0.5136214 33.82902 7.8139946 0.7855455 5.660560 0.1664554 27.438931 0.0172300 466.4146 25.8670166 0.1234595 0.0902263 0.2505212
17 XVI JACAREPAGUA Oeste 60.08916 73.63308 51.54689 55.08751 70.92327 68.77936 73.06587 81.76382 47.512609 37.79050 73.14807 47.73640 52.64238 56.707402 76.61597 34.3842862 2.3974486 0.0913228 60.06216 9.538310 0.8167316 0.9791612 0.9653540 0.9320976 0.2939174 0.0621977 12.376136 1.6394904 15.344444 5.456522 4.794118 0.5215799 0.4227731 0.9490874 184.45603 162.39973 13.560541 -0.0144449 0.0152013 0.0000000 32.28179 1.1244792 0.7912110 2.424509 0.1455914 13.863580 0.0196323 262.5659 6.4657557 0.2064229 0.1155722 0.2909629
18 XVII BANGU Oeste 54.72590 73.83950 40.43693 49.90127 72.19555 89.96009 74.33580 58.86657 44.216563 39.90687 32.28266 45.34162 71.36751 45.503134 68.01152 14.7229017 2.8885232 0.0894270 61.16493 6.411685 0.9228018 0.9930949 0.9918600 0.9276691 0.1980329 0.0676916 22.948221 8.2265893 11.855000 5.359375 4.700000 0.5752455 0.4042183 0.9565813 821.49438 213.26365 24.134298 -0.0137306 0.0066495 0.3337137 21.39053 7.8900590 0.8025425 12.749011 0.1801821 10.808991 0.0225453 347.8588 6.4976956 0.0795329 0.0567312 0.1632540
19 XVIII CAMPO GRANDE Oeste 57.18162 74.98295 47.63039 48.93153 67.07608 78.76136 75.93895 78.15543 54.855737 26.46593 61.25818 47.94170 59.54302 52.992578 63.92863 19.2618819 2.7851780 0.0960118 57.02119 8.623538 0.8220929 0.9853176 0.9947001 0.9193929 0.0886210 0.0716769 13.206178 3.4987569 11.262500 5.609231 4.880000 0.5291763 0.3445966 0.9381170 129.38491 211.26960 20.028075 -0.0182974 0.0203773 0.2377313 38.89286 0.1772396 0.8193758 5.634636 0.1663447 16.728553 0.0204249 437.7818 5.3171880 0.1046348 0.0795871 0.1777409
20 XX ILHA DO GOVERNADOR Norte 64.70186 84.78353 51.87230 57.44975 84.09155 89.27075 84.26212 81.50970 55.648444 58.27282 73.87983 19.68812 52.04417 54.319635 80.40603 43.0291899 2.3780301 0.0804155 0.00000 7.761469 0.9511311 0.9905914 0.9823955 0.9780833 0.2498706 0.0402424 11.733288 2.4592972 9.536364 5.421739 4.892308 0.5168276 0.5614388 0.9693771 126.29227 158.21745 15.962591 -0.0987725 0.0236684 0.0000000 28.18367 4.2253918 0.7795976 17.365267 0.1323586 24.290632 0.0153578 263.8522 5.6338557 0.2501671 0.1389845 0.3656920
22 XXII ANCHIETA Norte 56.94658 70.75781 47.33311 52.74882 71.92286 86.41734 76.20870 48.48235 55.825816 37.39589 48.87429 47.23642 71.25594 61.617542 61.11678 17.0050052 2.8154144 0.0909474 42.69253 7.806263 0.9383687 0.9763180 0.9962689 0.9577861 0.1583901 0.0795698 26.253610 12.6767431 12.975000 5.522222 5.033333 0.5168134 0.4201004 0.9486967 154.00025 256.66708 24.414674 -0.0028478 0.0000000 0.3900085 20.81356 10.0162764 0.7993018 5.000688 0.1608421 40.415300 0.0252214 396.8950 7.5122073 0.0799518 0.0647265 0.1914819
23 XXIII SANTA TERESA Centro 60.47134 68.69713 64.04788 48.66901 62.18156 84.63823 78.03303 49.93568 63.570338 60.40967 66.54838 65.66314 39.72695 43.479099 77.22338 34.2466104 2.0894275 0.0849257 209.20502 12.594458 0.9443320 0.9956275 0.9588853 0.9700897 0.3137126 0.0556018 27.747544 10.1320474 10.900000 5.800000 4.750000 0.4182218 0.5476358 0.9761341 399.09897 137.11376 17.139219 -0.0019986 0.0583656 0.3177538 36.25000 10.0957046 0.7448441 48.985990 0.1889597 66.555647 0.0234081 326.8862 0.2012433 0.2289777 0.1253345 0.2425038
24 XXIV BARRA DA TIJUCA Oeste 70.82741 74.09539 72.67814 65.70869 79.80573 50.74720 85.11539 80.71324 58.248034 80.45286 89.26041 62.75127 39.90895 75.297674 79.89944 67.7286966 1.9189366 0.0887685 30.52035 6.274769 0.7519625 0.9326944 0.9837343 0.9572316 0.1630361 0.0382785 10.114098 4.6401403 13.275000 5.556250 5.000000 0.4779956 0.7391147 0.9868318 143.43136 107.35880 7.443544 -0.0173598 0.0669869 0.0000000 47.10644 1.4867738 0.8050719 5.595658 0.0691477 42.848017 0.0108536 330.1274 4.3261698 0.4849684 0.1947432 0.4809607
25 XXIX COMPLEXO DO ALEMÃO Norte 43.34344 61.66855 37.92017 30.44160 57.01087 92.98374 19.33279 77.34679 0.000000 38.78116 74.97935 47.26465 45.85999 7.355855 68.02881 0.5217542 5.9149723 0.0942408 49.18837 4.609857 0.9453292 0.9969099 0.9903019 0.6564087 0.8745932 0.0887970 16.904980 0.4648869 19.600000 4.165351 4.110000 0.7067500 0.4447834 0.9475567 494.90250 74.94238 15.554079 -0.0027702 0.0000000 0.1549736 25.67925 22.6241145 0.7789675 61.984926 0.2591623 5.377570 0.0409441 253.1073 2.8280143 0.0163520 0.0144865 0.0388869
26 XXV PAVUNA Norte 41.43086 59.16670 28.86611 36.25977 58.82986 87.31495 59.78412 30.73786 32.007031 26.91636 56.54104 0.00000 58.20809 35.403213 40.45589 10.9718728 3.5170781 0.0917782 77.04152 15.838874 0.9086261 0.9914931 0.9886876 0.8899796 0.3620895 0.0921292 42.509658 9.8613064 18.800000 4.917857 4.760000 0.5814482 0.3715507 0.9346393 273.30474 188.45370 23.908305 -0.1326969 0.0000000 0.5401217 28.40506 22.5019338 0.7980960 11.678477 0.2341996 1.783195 0.0324836 242.8334 29.0649978 0.0576232 0.0450016 0.1374072
27 XXVI GUARATIBA Oeste 45.18094 53.40221 44.87266 37.26795 68.28202 17.53796 58.34299 69.44586 53.925361 22.73253 57.35225 45.48050 65.16788 45.385650 32.83974 5.6785160 3.4792163 0.0867834 14.15428 14.425468 0.5343215 0.8880034 0.9940495 0.8424813 0.2459347 0.0915625 21.065461 2.2344435 10.980000 5.361111 5.033333 0.5445006 0.3006897 0.9374770 330.77081 184.77542 21.290995 -0.0078014 0.0001484 0.0000000 28.61765 0.0000000 0.8239105 18.808447 0.2030255 30.542113 0.0316861 653.1773 10.6454973 0.0544685 0.0319733 0.0626652
28 XXVII ROCINHA Sul 44.59605 56.54076 46.76473 30.48266 30.75856 78.10878 38.44791 78.84777 29.074326 24.29764 68.85244 47.14411 43.37499 35.203506 41.54622 1.8059423 3.5093583 0.0979557 140.64698 39.611360 0.8419591 0.9868798 0.9825634 0.9104918 0.9999279 0.1095967 15.961267 0.2793222 14.660000 4.250000 4.510000 0.5107000 0.4034525 0.9238986 200.41428 102.22473 29.591370 -0.0031015 0.0000000 0.0000000 30.71429 1.3450623 0.7461759 21.281690 0.2197615 10.000000 0.0428802 489.6027 8.0703737 0.0191862 0.0215882 0.0463743
29 XXVIII JACAREZINHO Norte 43.52758 55.57102 31.32269 43.68903 46.45737 85.73297 21.10583 68.98789 7.994783 0.00000 85.97328 40.98440 84.27054 30.019225 58.12684 2.3395045 0.7507508 0.1102941 244.49848 16.734694 0.9463389 0.9859900 0.9765618 0.8181012 0.8848278 0.1588670 16.710761 6.8514119 17.270000 4.210000 4.180000 0.6600000 0.2910802 0.8912738 86.00917 70.37114 20.850709 -0.0200341 0.0000000 0.8846846 20.85849 3.8652747 0.7789675 5.200614 0.2977941 3.308689 0.0350432 327.2599 9.0189743 0.0113451 0.0143839 0.0810067
30 XXX MARE Norte 52.33820 68.91317 53.53114 34.57029 70.13507 82.17713 52.41686 70.92363 24.349284 53.03006 88.47278 48.27244 53.79141 29.910266 52.32542 2.2540732 2.4136496 0.0959596 52.06971 7.571143 0.9255230 0.9986341 0.9514510 0.9308377 0.5949680 0.1130056 16.975040 5.1570171 13.700000 4.450000 4.420000 0.5950135 0.5500928 0.9602199 19.86930 86.10032 17.661604 0.0000001 0.0000000 0.0066993 27.78571 2.3944490 0.7789675 25.563492 0.2478632 12.945415 0.0403791 267.8362 14.3666939 0.0183934 0.0121840 0.0761404
31 XXXI VIGARIO GERAL Norte 53.03173 74.16790 42.02456 42.90272 68.70318 88.64298 70.65516 68.67028 38.599926 36.89799 47.36542 45.23490 67.90386 26.638965 64.13683 12.9312335 3.3366700 0.0945248 18.46722 8.266309 0.9051357 0.9918909 0.9947350 0.9207143 0.1483723 0.0879069 16.220359 7.5685441 9.100000 4.766667 4.550000 0.5566965 0.4171562 0.9481334 273.25807 199.99853 32.234196 -0.0083498 0.0000000 0.5892034 27.37313 8.8299053 0.7881349 31.488913 0.2252632 1.863591 0.0274581 333.3830 7.8645232 0.0663955 0.0473825 0.1618101
33 XXXIII REALENGO Oeste 54.31652 72.11933 47.50148 43.32874 63.65372 87.39799 79.94651 57.47907 55.353872 43.10736 52.15439 39.39031 63.03273 37.977025 51.32030 20.9848972 2.7878097 0.0848708 198.96530 7.655378 0.8937171 0.9925314 0.9929463 0.9600294 0.1132565 0.0700531 24.516514 7.7145297 9.972727 5.297143 4.920000 0.5017576 0.4621558 0.9537982 436.01857 209.82882 17.997014 -0.0362369 0.0138527 0.3027719 33.44595 2.4541383 0.8089417 3.677477 0.3023064 28.015780 0.0227402 410.2501 15.5428758 0.1061718 0.0792839 0.2111319
34 XXXIV CIDADE DE DEUS Oeste 48.30921 65.79054 45.09776 34.03934 32.50650 93.42541 64.34860 72.88166 36.104922 60.52757 42.77413 40.98440 54.55964 23.244314 53.85503 4.4983815 5.4644809 0.1153403 78.80221 18.244576 0.9605725 0.9954338 0.9886723 0.8976223 0.1183408 0.1093366 18.282045 2.4218574 10.500000 4.687500 4.933333 0.6526514 0.5833788 0.9705149 172.50974 214.24597 38.953812 -0.0200341 0.0000000 0.0000000 30.00000 1.6388946 0.7905772 44.639121 0.2202999 10.000000 0.0341777 382.6819 9.4236440 0.0327995 0.0237495 0.0805308

As variáveis de estudo utilizadas nesse relatório são:

  • Acesso a educação básica;
  • Acesso ao ensino superior;
  • Evasão do ensino médio;
  • Oportunidades;
  • Alfabetização;e
  • Zona.

Foram feitos gráficos do tipo Boxplot entre a variável qualitativa Zona e as variáveis Alfabetização, IPS, Taxa de abandono do ensino médio, Acesso ao conhecimento básico. Em seguida, foi executada a matriz de correlação entre as variáveis Alfabetização, Acesso educação básica, Evasão do Ensino Médio, IPS de cada Município do Rio de Janeiro.

Além da construçãoo e análise de dados, o estudo abrangeu testes de hipóteses.

4. Teste de Hipóteses

Foram executados testes de hipóteses para avaliar se a variavel Zona interfere nas variaveis Oportunidades e Acesso ao ensino superior. O alfa utilizado foi de 0,05 para todos os testes realizados. Dessa forma, a regra de decisão foi definida como:

Se p-value < alpha, rejeita H0.

Se p-value > alpha, não rejeita H0.

O primeiro teste de hipóteses realizado com as variáveis teve como objetivo a verificação do pressuposto de normalidade, por meio do teste de Shapiro Wilk, o qual parte do pressuposto de que as observações são independentes e apresenta as seguintes hipóteses:

H0:os dados seguem uma distribuição normal.

H1:os dados não seguem uma distribuição normal.

Após a verificação do pressuposto de normalidade, executou-se, para os dados que não seguem distribuição normal, o teste de Kruskal- Wallis com as hipóteses:

H0: os grupos são amostrados de populações com distribuições idênticas.

H1: os grupos são amostrados de populações com diferentes distribuições.

E em seguida, executou-se o teste de Comparações Múltiplas de Wilcoxon.

Para dados que seguem uma distribuição normal, procedeu-se com o teste de Bartlett, com as hipóteses:

H0: todas as variâncias são iguais.

H1: pelo menos uma das variâncias é diferente.

Após a verificação da igualdade de variância, deve se executar o teste ANOVA quando a hipótese nula não foi rejeitada ou o teste de Welch caso a hipótese nula seja rejeitada. O método ANOVA permite uma avaliação do efeito que os diferentes níveis do fator podem provocar na variável resposta. O teste ANOVA determina se a variabilidade entre as médias de um grupo é maior que a variabilidade das observações da amostra (MINITAB, 2020). As hipóteses, tanto para ANOVA quanto para Welch são:

H0: todas as médias são iguais.

H1: existe pelo menos uma média diferente.

Depois, sucedeu-se o teste de Comparações Múltiplas de Tukey, para comparar as diferenças entre as médias e o p-valor.

Por fim, foi executado duas análises pelo método ANCOVA, que permite comparar as médias ajustadas de dois ou mais grupos independentes, entre as variáveis Zona, Oportunidades e Acesso à educação superior, com o intuito de verificar o impacto das Oportunidaes e das Zonas na taxa da população com domicílios com Acesso à educação superior. A primeira análise, verificou se não há interação significativa entre a covariável e a variável de agrupamento, com as hipóteses:

H0: coeficientes das retas de regressão são iguais.

H1: coeficientes das retas de regressão não são iguais.

Já na segunda análise, uma ANCOVA para testar os efeitos principais, as hipóteses foram:

H0: não há efeito.

H1: há efeito.

5. Resultados e Discussões

Gráficos de Boxplot

Analisou-se, por gráfico, duas variáveis, qualitativa e quantitativa, e elaborados gráfico boxplot para visualização da relação d entre os dados.

A primeira análise foi com as variáveis Zona e IPS.

boxplot(IPS ~Zona, data=trabalho_estatistica, col=c("red","#faa005","#1bc704","#0f8efc","yellow"), main="Boxplot 1 \n IPS por Zonas \n")

Através do boxplot é possível verificar que a região da zona norte possui um dos IPS mais baixos de todas as regiõees e a zona sul um dos maiores, mas também é possível identidacar na zona sul uma grande variação negativa da assimetria do IPS. Na zona central, a visualização da mediana está próxima do primeiro quartil e na zona norte temos uma simetria.

A segunda análise foi com as variáveis Zona e Alfabetização.

boxplot(Alfabetização ~Zona, data=trabalho_estatistica, col=c("red","#faa005","#1bc704","#0f8efc","yellow"), main="Boxplot 2 \n Alfabetização por Zonas \n")

Na zona do centro existem outliers positivos e negativos, na zona norte temos alguns bairros que tem um índice de alfabetização mais elevados que os outros e estão representados através dos Outliers. A zona oeste possui um dos maiores níveis e a zona sul um dos menores, mas possui uma simetria melhor do que as outras zonas.

A terceira análise foi elaborada com as variáveis Zona e Acesso a educação básica.

boxplot(trabalho_estatistica$`Acesso educação básica` ~Zona, data=trabalho_estatistica, col=c("red","#faa005","#1bc704","#0f8efc","yellow"), main="Boxplot 3 \n Acesso educação básica por Zonas \n")

A Zona Sul é uma das Zonas com o maior índice de acesso a educação básica com cerca de 80%, mas por outro lado possui uma simetria negativa. Com isso, é possível visualisar que a maioria dos bairros das Zona Sul possui um acesso razoável do acesso a educação básica. O Centro possui uma simetria positiva e na Zona Norte temos um dos piores níveis de acesso à educação e com um bairro possui um índice muito mais baixo do que os outros, esse índice está representado pelo outlier.

A quarta analise foi elaborada a partir das variáveis Zona e Evasão do ensino médio.

boxplot(trabalho_estatistica$`Evasão do Ensino Médio`~Zona, data=trabalho_estatistica, col=c("red","#faa005","#1bc704","#0f8efc","yellow"), main="Boxplot 4 \n Evasão do Ensino Médio por Zonas \n")

No Centro do Rio de Janeiro tem um outlier mostrando que uma região se destaca com o mínimo de evasão, mas é possível ver que na Zona Norte a evasão é muita alta com uma evasão de quase 20%.

Matriz de correlação

Uma matriz de correlação analítica permite a visualização gráfica e do valor numérico do coeficiente de correlação entre variáveis.

#Carregar biblioteca para elaboração de matriz de correlação
library(corrplot)
## corrplot 0.92 loaded
#Elaboração da matriz de correlação
par(cex=0.6)
MC <-cor(dados[,c("Alfabetização","Acesso educação básica","Evasão do Ensino Médio","IPS")])
corrplot.mixed(MC)

Teste de Hipótese

Foi realizado os teste de Shapiro Wilk para as variáveis Oportunidades e Acesso à educação superior.

Teste de normalidade da variavel Oportunidades

#H0: Os dados possuem uma distribuição normal
#H1: Os dados Não possuem uma distribuição normal 
#Alpha: 0,05
shapiro.test(trabalho_estatistica$Oportunidades)
## 
##  Shapiro-Wilk normality test
## 
## data:  trabalho_estatistica$Oportunidades
## W = 0.95174, p-value = 0.1615

p-value = 0.1615 > 0.05, logo, nao rejeitamos H0

As Oportunidades seguem uma distribuição normal

Teste de normalidade da variavel Acesso à educaçao superior

#H0: Os dados possuem uma distribuição normal
#H1: Os dados Não possuem uma distribuição normal 
#Alpha: 0,05
shapiro.test(trabalho_estatistica$`Acesso à Educação Superior`)
## 
##  Shapiro-Wilk normality test
## 
## data:  trabalho_estatistica$`Acesso à Educação Superior`
## W = 0.87635, p-value = 0.001632

p-value = 0.001632 < 0.05, logo rejeitamos H0

O Acesso à Educação superior não segue uma distribuição normal

Para a variável Acesso à educação superior, o pvalor < 0.05, logo, rejeita-se a hipótese nula H0. Portanto, os dados não seguem uma distribuição normal e deve ser executado, em seguida, o teste de Kruskal-Wallis. Já para Oportunidades, pvalor > 0.05, logo, não se rejeita a hipótese nula H0. Portanto, os dados seguem uma distribuição normal e deve ser executado em seguida o teste de Bartlett.

Em seguida, foi investigado se a Zona interfere em Acesso à educação superior, por meio do teste de Kruskal-Wallis e do teste de Comparações Múltiplas de Wilcoxon.

#-------------------------------------------------------
#Teste se a Zona interfere em Acesso à educação superior
#-------------------------------------------------------
#Para dados que NÃO seguem uma distribuição normal

# H0: os grupos são amostrados de populações com distribuições idênticas. 
# H1: os grupos são amostrados de populações com diferentes distribuições.

kruskal.test(dados$`Acesso à Educação Superior`~dados$Zona)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  dados$`Acesso à Educação Superior` by dados$Zona
## Kruskal-Wallis chi-squared = 3.1611, df = 3, p-value = 0.3675

p-value = 0.3675 > 0.05, logo, aceitamos H0 Como pvalor > 0.05, aceitamos a hipótese H0. Portanto, os grupos são amostrados de populações com diferentes distribuições, ou seja, a taxa da população que possui Acesso à educaçao superior tem distribuição semelhante entre todas as Zonas. Portanto, a Zona não exerce influência sobre a taxa da população que possui Acesso à educaçao superior.

Depois, foi investigado se a Zona interfere em Oportunidades, por meio do teste de Bartlett, também denominado teste da homogeneidade das variâncias. Primeiramente, criou-se um modelo estatístico. Foi verificado que os resíduos do modelo seguem uma distribuição normal, para então ser executado o teste de Bartlett.

#-------------------------------------------------------
#Teste se a Zona interfere em Oportunidades
#-------------------------------------------------------
#Para dados que seguem uma distribuição normal

#criar modelo estatístico
modelo <- aov(Oportunidades~Zona, data=dados)
residuos <- residuals(modelo)
residuos
##           1           2           3           4           5           6 
## -14.2149310  20.4264093   1.7633578  18.5108599  17.5739061   7.6634054 
##           7           8           9          10          11          12 
##  11.7393333  -7.3322473  26.4615870   1.9847264   0.3451758  11.6181473 
##          13          14          15          16          17          18 
##  12.8684549   9.9828093  -8.0490319  -8.4922667   8.4852258   3.2989819 
##          19          20          21          22          23          24 
##   2.3292428   4.5348227  -0.1661161  -0.6425888  19.1064043 -22.4733284 
##          25          26          27          28          29          30 
## -16.6551640  -9.3343372 -37.9135986  -9.2259057 -18.3446392 -10.0122093 
##          31          32 
##  -3.2735448 -12.5629410
#H0: os dados seguem uma distribuição normal
#H1: os dados NÃO seguem uma distribuição normal
#alpha = 0.05

shapiro.test(residuos)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuos
## W = 0.98125, p-value = 0.835

p-value = 0.835 > 0.05, logo, os dados seguem distribuição normal

#Checagem de igualdade das variâncias

#H0: todas as variâncias são iguais
#H1: pelo menos uma das variâncias é diferente
#alpha = 0.05

bartlett.test(residuos~trabalho_estatistica$Zona)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  residuos by trabalho_estatistica$Zona
## Bartlett's K-squared = 3.8817, df = 3, p-value = 0.2745

pvalor = 0.2745 > 0.05, não rejeitamos H0, logo, todas as variâncias são iguais

Como pvalor > 0.05 no teste de homogeneidade das variâncias para os resíduos, a hipótese H0 não é rejeitada. Logo, todas as variâncias são iguais. Depois, executou-se o teste ANOVA, para um novo modelo estatístico composto pelas variáveis avaliadas, Oportunidades e Zona.

modelo2 <- aov(Oportunidades~Zona, data= dados)
modelo2
## Call:
##    aov(formula = Oportunidades ~ Zona, data = dados)
## 
## Terms:
##                     Zona Residuals
## Sum of Squares  1341.044  6237.436
## Deg. of Freedom        3        28
## 
## Residual standard error: 14.92533
## Estimated effects may be unbalanced
summary(modelo2)
##             Df Sum Sq Mean Sq F value Pr(>F)
## Zona         3   1341   447.0   2.007  0.136
## Residuals   28   6237   222.8

pvalor= 0.136 > 0.05, logo, não Rej H0, portanto, todas as medias são iguais. Para confirmar se as medias são iguais, utilizamos o teste de Tukey

TukeyHSD(modelo2)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Oportunidades ~ Zona, data = dados)
## 
## $Zona
##                   diff        lwr      upr     p adj
## Norte-Centro  3.603331 -17.440297 24.64696 0.9655520
## Oeste-Centro -2.709316 -25.940853 20.52222 0.9885849
## Sul-Centro   19.084663  -8.251812 46.42114 0.2484509
## Oeste-Norte  -6.312647 -24.153251 11.52796 0.7695379
## Sul-Norte    15.481331  -7.450431 38.41309 0.2751151
## Sul-Oeste    21.793979  -3.160695 46.74865 0.1034756

Após executar o teste, verificamos que todos os p adj, que é o pvalor ajustado, são maiores que 0.05, assim comprovando que as medias são iguais.

Abaixo estão os resultados do método ANCOVA executado para verificar qual o impacto das Oportunidades em relação a taxa da população com o acesso ao ensino superior, usando a Região como covariável.

#H0: coeficientes das retas de regressão são iguais 
#H1: coeficientes das retas de regressão não são iguais
#alpha = 0.05

ANCOVA <- aov(`Acesso à Educação Superior` ~ Zona * Oportunidades, data = dados)
summary(ANCOVA)
##                    Df Sum Sq Mean Sq F value   Pr(>F)    
## Zona                3   5995    1998  25.537 1.21e-07 ***
## Oportunidades       1  15954   15954 203.860 3.16e-13 ***
## Zona:Oportunidades  3    203      68   0.863    0.474    
## Residuals          24   1878      78                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

pvalor = 0.474 > 0.05, logo, nao rejeitamos H0

O resultado mostra que os coeficientes das retas de regressão são iguais, ou seja, o comportamento das variáveis taxa da população com acesso ao ensino superiore Oportunidades são semelhantes para uma mesma Região. Ao retirar o termo de interação, para testar os efeitos principais, o resultado foi o seguinte:

#H0: não há efeito
#H1: há efeito
#alpha = 0.05

ANCOVA2 <- aov(`Acesso à Educação Superior` ~ Zona + Oportunidades, data = dados)
summary(ANCOVA2)
##               Df Sum Sq Mean Sq F value   Pr(>F)    
## Zona           3   5995    1998   25.93 4.16e-08 ***
## Oportunidades  1  15954   15954  207.01 3.51e-14 ***
## Residuals     27   2081      77                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

pvalorPr < 0.05, logo, rejeitamos H0 Com o pvalor < 0.05, podemos perceber que a Zona influencia na no Acesso à Educação Superior e nas oportuniades dos moradores da região da zona norte, sul, centro e oeste do Rio de Janeiro.

6. Conclusão

Ao escolhermos variáveis ligadas à educação para serem analisadas nesse relatório, vemos como esse aspecto impacta e influencia na vida futura dos jovens cariocas. Os Gráficos boxplot demonstram bem isso, evidenciando a disparidade entre as Zonas cariocas.

Através de todos os resultados é possível identicar que realmente a Zona influencia nas Oportunidades e no Acesso à educação superior dos moradores do Rio de Janeiro. Não há uma distruibuição igualitária nas próprias zonas do RJ, pois em alguns bairros temos uma condição de oportunidade melhor do que em um outro bairro, como acontece na Zona Sul, onde um bairro tem um índice ótimo de IPS e de acesso a educação superior, mas com uma má distribuição entre essa Zona para um bom entendimento temos os gráficos do tipo Boxplot..