O Objetivo deste trabalho é determinar através de métodos estatísticos o grau de relação entre as variáveis que compõem o banco de dados da análise e identificar qual das referidas possui maior impacto na integridade de um país. As variáveis que serão trabalhas são: País, PIB, IDH, Integridade, Democracia e Região.
O banco de dados utilizado foi construído através da junção das variáveis anteriormente mencionadas disponíveis nos seguintes websites:
-PIB: http://statisticstimes.com/economy/gdp-indicators-2018.php;
-IDH: http://hdr.undp.org/en/2018-update;
-Democracia: https://freedomhouse.org/content/freedom-world-data-and-resources;
-Corrupção: https://www.transparency.org/cpi2018.
É importante mencionar que, a primeiro momento a variável “corrupção” encontrava-se em escala inversa, ou seja, quanto maior o valor da escala menos corrupção havia em um determinado país. Para fins de facilidade de entendimento, preferiu-se renomear esta variável no banco de dados criado para “integridade”, de modo que esta possuí-se uma relação diretamente proporcional com a escala.
Também vale ressaltar que foi inserido no banco de dados uma variável região, que diz respeito ao continente em que cada país listado se encontra. Ao total, 100 países foram selecionados para análise.
A tabela a seguir representa o banco de dados contruídos para este trabalho:
#CARREGAMENTO BIBLIOTECA "Knitr" PARA APRESENTAÇÃO DO BANCO DE DADOS#
library(knitr)
#CARREGAMENTO BIBLIOTECA "KableExtra" PARA MANIPULAÇÃO DO QUADRO COM BANCO DE DADOS#
library(kableExtra)
#CARREGAMENTO DA BASE DE DADOS E ALOJAMENTO DO MESMO EM UMA VARIÁVEL#
BD <- readXL("C:/Users/Esdras/Desktop/Nova pasta (4)/Estatística.xlsx", rownames=FALSE,
header=TRUE, na="", sheet="Dados", stringsAsFactors=TRUE)
#CONSTRUÇÃO, MANIPULAÇÃO E IMPRESSÃO DA TABELA#
kable(BD, row.names = FALSE) %>%
kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"),
position = "center", fixed_thead = T) %>%
scroll_box(width = "700px", height = "400px")
| Pais | PIB | IDH | Integridade | Democracia | Regiao |
|---|---|---|---|---|---|
| Argélia | 188342 | 0.754 | 35 | 35 | África |
| Angola | 114504 | 0.581 | 19 | 26 | África |
| Argentina | 475429 | 0.825 | 40 | 83 | América do Sul |
| Austrália | 1427770 | 0.939 | 77 | 98 | Oceania |
| Áustria | 459401 | 0.908 | 76 | 94 | Europa |
| Azerbaijão | 45592 | 0.757 | 25 | 12 | Ásia |
| Bahrein | 39300 | 0.846 | 36 | 12 | Ásia |
| Bangladesh | 286275 | 0.608 | 26 | 45 | Ásia |
| Bielorússia | 56934 | 0.808 | 44 | 21 | Europa |
| Bélgica | 536055 | 0.916 | 75 | 95 | Europa |
| Bolívia | 41833 | 0.693 | 29 | 67 | América do Sul |
| Brasil | 1909390 | 0.759 | 35 | 78 | América do Sul |
| Bulgaria | 63651 | 0.813 | 42 | 80 | Europa |
| Camarões | 38445 | 0.556 | 25 | 22 | África |
| Canadá | 1733710 | 0.926 | 81 | 99 | América do Norte |
| Chile | 299887 | 0.843 | 67 | 94 | América do Sul |
| China | 13457270 | 0.752 | 39 | 14 | Ásia |
| Colômbia | 336940 | 0.747 | 36 | 65 | América do Sul |
| Costa Rica | 60816 | 0.794 | 56 | 91 | América do Norte |
| Costa do Marfim | 45875 | 0.492 | 35 | 51 | África |
| Croácia | 59971 | 0.831 | 48 | 86 | Europa |
| República Tcheca | 244540 | 0.888 | 59 | 93 | Europa |
| Congo | 42692 | 0.457 | 20 | 21 | África |
| Dinamarca | 354683 | 0.929 | 88 | 97 | Europa |
| República Dominicana | 81103 | 0.736 | 30 | 67 | América do Norte |
| Equador | 107266 | 0.752 | 34 | 60 | América do Sul |
| Egito | 249471 | 0.696 | 35 | 26 | África |
| Estônia | 29527 | 0.871 | 73 | 94 | Europa |
| Etiópia | 83836 | 0.463 | 34 | 12 | África |
| Finlândia | 276553 | 0.920 | 85 | 100 | Europa |
| França | 2794700 | 0.901 | 72 | 90 | Europa |
| Alemanha | 4029140 | 0.936 | 80 | 94 | Europa |
| Gana | 51815 | 0.592 | 41 | 83 | África |
| Grécia | 218057 | 0.870 | 45 | 85 | Europa |
| Guatemala | 79109 | 0.650 | 27 | 56 | América do Norte |
| Hong Kong | 360315 | 0.933 | 76 | 59 | Ásia |
| Hungria | 156393 | 0.838 | 46 | 72 | Europa |
| Índia | 2689990 | 0.640 | 41 | 77 | Ásia |
| Indonésia | 1005270 | 0.694 | 38 | 64 | Ásia |
| Iraque | 230911 | 0.685 | 18 | 31 | Ásia |
| Irlanda | 366448 | 0.938 | 73 | 96 | Europa |
| Irã | 430082 | 0.798 | 28 | 18 | Ásia |
| Israel | 365599 | 0.903 | 61 | 79 | Ásia |
| Itália | 2086910 | 0.880 | 52 | 89 | Europa |
| Japão | 5070630 | 0.909 | 73 | 96 | Ásia |
| Jordânia | 41869 | 0.735 | 49 | 37 | Ásia |
| Cazaquistão | 184209 | 0.800 | 31 | 22 | Ásia |
| Quênia | 89591 | 0.590 | 27 | 48 | África |
| Coréia | 1655610 | 0.903 | 57 | 84 | Ásia |
| Kuwait | 144523 | 0.803 | 41 | 36 | Ásia |
| Letônia | 34286 | 0.847 | 58 | 87 | Europa |
| Líbano | 56709 | 0.757 | 28 | 43 | Ásia |
| Líbia | 43236 | 0.706 | 17 | 9 | África |
| Lituânia | 52468 | 0.858 | 59 | 91 | Europa |
| Luxemburgo | 68993 | 0.904 | 81 | 98 | Europa |
| Malásia | 347290 | 0.802 | 47 | 45 | Ásia |
| México | 1199260 | 0.774 | 28 | 62 | América do Norte |
| Marrocos | 118178 | 0.667 | 43 | 39 | África |
| Myanmar | 71543 | 0.578 | 29 | 31 | Ásia |
| Nepal | 28813 | 0.574 | 31 | 55 | Ásia |
| Holanda | 909887 | 0.931 | 82 | 99 | Europa |
| Nova Zelândia | 205997 | 0.917 | 87 | 98 | Oceania |
| Nigéria | 397472 | 0.532 | 27 | 50 | África |
| Noruega | 441439 | 0.953 | 84 | 100 | Europa |
| Omã | 81682 | 0.821 | 52 | 23 | Ásia |
| Paquistão | 306897 | 0.562 | 33 | 43 | Ásia |
| Panamá | 66031 | 0.789 | 37 | 83 | América do Norte |
| Paraguai | 41851 | 0.702 | 29 | 64 | América do Sul |
| Perú | 228944 | 0.750 | 35 | 73 | América do Sul |
| Filipinas | 331678 | 0.699 | 36 | 62 | Ásia |
| Polônia | 549478 | 0.865 | 60 | 85 | Europa |
| Portugal | 237962 | 0.847 | 64 | 97 | Europa |
| Catar | 188295 | 0.856 | 62 | 24 | Ásia |
| Romênia | 239440 | 0.811 | 47 | 84 | Europa |
| Rússia | 1576490 | 0.816 | 28 | 20 | Ásia |
| Arábia Saudita | 769878 | 0.853 | 49 | 7 | Ásia |
| Sérvia | 47654 | 0.787 | 39 | 73 | Europa |
| Singapura | 346621 | 0.932 | 85 | 52 | Ásia |
| Eslováquia | 106940 | 0.855 | 50 | 89 | Europa |
| Eslovênia | 54969 | 0.896 | 60 | 93 | Europa |
| África do Sul | 376679 | 0.699 | 43 | 78 | África |
| Espanha | 1437050 | 0.891 | 58 | 94 | Europa |
| Sri Lanka | 92504 | 0.770 | 38 | 55 | Ásia |
| Sudão | 33249 | 0.502 | 16 | 8 | África |
| Suécia | 554659 | 0.933 | 85 | 100 | Europa |
| Suíça | 709118 | 0.944 | 85 | 96 | Europa |
| Taiwan | 602678 | 0.885 | 63 | 93 | Ásia |
| Tanzânia | 55645 | 0.538 | 36 | 52 | África |
| Tailândia | 490120 | 0.755 | 36 | 31 | Ásia |
| Tunísia | 41662 | 0.735 | 43 | 70 | África |
| Turquia | 713513 | 0.791 | 41 | 32 | Ásia |
| Turquemenistão | 42764 | 0.706 | 20 | 4 | Ásia |
| Ucrânia | 126390 | 0.751 | 32 | 62 | Europa |
| Emirados Árabes | 432612 | 0.863 | 70 | 17 | Ásia |
| Reino Unido | 2808900 | 0.922 | 80 | 94 | Europa |
| Estados Unidos | 20513000 | 0.924 | 71 | 86 | América do Norte |
| Uruguái | 60933 | 0.804 | 70 | 98 | América do Sul |
| Uzbequistão | 43303 | 0.710 | 23 | 7 | Ásia |
| Venezuela | 96328 | 0.761 | 18 | 26 | América do Sul |
| Vietnã | 241434 | 0.694 | 33 | 20 | Ásia |
De posse da tabela do banco de dados deu-se início a pesquisa construindo-se primeiramente gráficos do tipo Boxplot, entre a Região e o IDH, Integridade e Democracia. O boxplot de região e PIB não foi inserido pois este apresentava muitos “outliers” que inviabilizavam a análise gráfica.
A utilização da ferramenta gráfica boxplot surgiu da necessidade de se obter uma visualização gráfica do comportamento da região, em termos de variação, dos dados analisados no estudo, sendo estes IDH, Integridade e Democracia.
BP1<-Boxplot(IDH~Regiao, data=BD, id=list(method="y"), main="Boxplot IDH x Região",xlab="Região",
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19)
BP2<-Boxplot(Integridade~Regiao, data=BD, id=list(method="y"), main="Boxplot Integridade x Região", xlab="Região",
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19)
BP3<-Boxplot(Democracia~Regiao, data=BD, id=list(method="y"), main="Boxplot Democracia x Região", xlab="Região",
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19)
#CARREGAMENTO BIBLIOTECA "corrplot" PARA CONSTRUÇÃO DA MATRIZ#
library(corrplot)
## corrplot 0.84 loaded
#CONSTRUÇÃO DA MATRIZ#
MC<-cor(BD[,c("PIB","IDH","Integridade","Democracia")], use="complete")
corrplot(MC,addCoef.col=TRUE,number.cex=.9, tl.cex=1.2)
#CARREGAMENTO BIBLIOTECA "rworldmap"#
library(rworldmap)
## Loading required package: sp
## ### Welcome to rworldmap ###
## For a short introduction type : vignette('rworldmap')
#CARREGAMENTO BASE DE DADOS#
BD1 <- readXL("C:/Users/Esdras/Desktop/Nova pasta (4)/Estatística.xlsx", rownames=FALSE,
header=TRUE, na="", sheet="Data", stringsAsFactors=TRUE)
#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$GDP_Tracks <- with(BD1, binVariable(GDP, bins=6, method='natural',
labels=c('Very Low','Low','Medium','High','Very High','EUA/China')))
#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#verbose=TRUE (Para Identificar Países não correspondentes)#
#CONSTRUÇÃO DO MAPA#
MAP1<-mapCountryData(matched, nameColumnToPlot="GDP_Tracks", mapTitle="Distribuição PIB - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = "heat", borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP1$legendText <- c('$28813-$188342','$205997-$490120','$536055-$1005270','$1199260-$2086910','$2689990-$5070630','$13457270-$20513000')
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP1,cex=0.5, pt.cex = 1.4, x='left',title="Faixas de PIB em Milhões de Dólares",horiz=FALSE))
#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$HDI_Tracks <- with(BD1, binVariable(HDI, bins=5, method='natural',
labels=c('Muito Baixo','Baixo','Médio','Alto','Muito Alto')))
#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#CONSTRUÇÃO DO MAPA#
MAP2<-mapCountryData(matched, nameColumnToPlot="HDI_Tracks", mapTitle="Distribuição IDH - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = "heat", borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP2$legendText <- c('Muito Baixo','Baixo','Médio','Alto','Muito Alto')
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP2,cex=0.6, pt.cex = 1.6, x='bottom',title="Níveis de IDH",horiz=TRUE))
#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$INT_Tracks <- with(BD1, binVariable(Integrity, bins=5, method='natural',
labels=c('Muito Baixa','Baixa','Mediana','Elevada','Muito Elevada')))
#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#CONSTRUÇÃO DO MAPA#
MAP3<-mapCountryData(matched, nameColumnToPlot="INT_Tracks", mapTitle="Distribuição Integridade - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = "heat", borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP3$legendText <- c('Muito Baixa','Baixa','Mediana','Elevada','Muito Elevada')
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP3,cex=0.6, pt.cex = 1.6, x='bottom',title="Níveis de Integridade",horiz=TRUE))
#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$DEM_Tracks <- with(BD1, binVariable(Democracy, bins=5, method='natural',
labels=c('Muito Baixa','Baixa','Mediana','Elevada','Muito Elevada')))
#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#CONSTRUÇÃO DO MAPA#
MAP4<-mapCountryData(matched, nameColumnToPlot="DEM_Tracks", mapTitle="Democracia - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = "heat", borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP4$legendText <- c('Muito Baixa','Baixa','Mediana','Elevada','Muito Elevada')
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP4,cex=0.6, pt.cex = 1.6, x='bottom',title="Níveis de Democracia",horiz=TRUE))