Revisão Proposta

O Objetivo deste trabalho é determinar através de métodos estatísticos o grau de relação entre as variáveis que compõem o banco de dados da análise e identificar qual das referidas possui maior impacto na integridade de um país. As variáveis que serão trabalhas são: País, PIB, IDH, Integridade, Democracia e Região.

Banco de Dados

O banco de dados utilizado foi construído através da junção das variáveis anteriormente mencionadas disponíveis nos seguintes websites:

-PIB: http://statisticstimes.com/economy/gdp-indicators-2018.php;

-IDH: http://hdr.undp.org/en/2018-update;

-Democracia: https://freedomhouse.org/content/freedom-world-data-and-resources;

-Corrupção: https://www.transparency.org/cpi2018.

É importante mencionar que, a primeiro momento a variável “corrupção” encontrava-se em escala inversa, ou seja, quanto maior o valor da escala menos corrupção havia em um determinado país. Para fins de facilidade de entendimento, preferiu-se renomear esta variável no banco de dados criado para “integridade”, de modo que esta possuí-se uma relação diretamente proporcional com a escala.

Também vale ressaltar que foi inserido no banco de dados uma variável região, que diz respeito ao continente em que cada país listado se encontra. Ao total, 100 países foram selecionados para análise.

A tabela a seguir representa o banco de dados contruídos para este trabalho:

#CARREGAMENTO BIBLIOTECA "Knitr" PARA APRESENTAÇÃO DO BANCO DE DADOS#
library(knitr)

#CARREGAMENTO BIBLIOTECA "KableExtra" PARA MANIPULAÇÃO DO QUADRO COM BANCO DE DADOS#
library(kableExtra)

#CARREGAMENTO DA BASE DE DADOS E ALOJAMENTO DO MESMO EM UMA VARIÁVEL#
BD <- readXL("C:/Users/Esdras/Desktop/Nova pasta (4)/Estatística.xlsx", rownames=FALSE, 
  header=TRUE, na="", sheet="Dados", stringsAsFactors=TRUE)

#CONSTRUÇÃO, MANIPULAÇÃO E IMPRESSÃO DA TABELA#
kable(BD, row.names = FALSE) %>%
kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
               position = "center", fixed_thead = T) %>%
  scroll_box(width = "700px", height = "400px")
Pais PIB IDH Integridade Democracia Regiao
Argélia 188342 0.754 35 35 África
Angola 114504 0.581 19 26 África
Argentina 475429 0.825 40 83 América do Sul
Austrália 1427770 0.939 77 98 Oceania
Áustria 459401 0.908 76 94 Europa
Azerbaijão 45592 0.757 25 12 Ásia
Bahrein 39300 0.846 36 12 Ásia
Bangladesh 286275 0.608 26 45 Ásia
Bielorússia 56934 0.808 44 21 Europa
Bélgica 536055 0.916 75 95 Europa
Bolívia 41833 0.693 29 67 América do Sul
Brasil 1909390 0.759 35 78 América do Sul
Bulgaria 63651 0.813 42 80 Europa
Camarões 38445 0.556 25 22 África
Canadá 1733710 0.926 81 99 América do Norte
Chile 299887 0.843 67 94 América do Sul
China 13457270 0.752 39 14 Ásia
Colômbia 336940 0.747 36 65 América do Sul
Costa Rica 60816 0.794 56 91 América do Norte
Costa do Marfim 45875 0.492 35 51 África
Croácia 59971 0.831 48 86 Europa
República Tcheca 244540 0.888 59 93 Europa
Congo 42692 0.457 20 21 África
Dinamarca 354683 0.929 88 97 Europa
República Dominicana 81103 0.736 30 67 América do Norte
Equador 107266 0.752 34 60 América do Sul
Egito 249471 0.696 35 26 África
Estônia 29527 0.871 73 94 Europa
Etiópia 83836 0.463 34 12 África
Finlândia 276553 0.920 85 100 Europa
França 2794700 0.901 72 90 Europa
Alemanha 4029140 0.936 80 94 Europa
Gana 51815 0.592 41 83 África
Grécia 218057 0.870 45 85 Europa
Guatemala 79109 0.650 27 56 América do Norte
Hong Kong 360315 0.933 76 59 Ásia
Hungria 156393 0.838 46 72 Europa
Índia 2689990 0.640 41 77 Ásia
Indonésia 1005270 0.694 38 64 Ásia
Iraque 230911 0.685 18 31 Ásia
Irlanda 366448 0.938 73 96 Europa
Irã 430082 0.798 28 18 Ásia
Israel 365599 0.903 61 79 Ásia
Itália 2086910 0.880 52 89 Europa
Japão 5070630 0.909 73 96 Ásia
Jordânia 41869 0.735 49 37 Ásia
Cazaquistão 184209 0.800 31 22 Ásia
Quênia 89591 0.590 27 48 África
Coréia 1655610 0.903 57 84 Ásia
Kuwait 144523 0.803 41 36 Ásia
Letônia 34286 0.847 58 87 Europa
Líbano 56709 0.757 28 43 Ásia
Líbia 43236 0.706 17 9 África
Lituânia 52468 0.858 59 91 Europa
Luxemburgo 68993 0.904 81 98 Europa
Malásia 347290 0.802 47 45 Ásia
México 1199260 0.774 28 62 América do Norte
Marrocos 118178 0.667 43 39 África
Myanmar 71543 0.578 29 31 Ásia
Nepal 28813 0.574 31 55 Ásia
Holanda 909887 0.931 82 99 Europa
Nova Zelândia 205997 0.917 87 98 Oceania
Nigéria 397472 0.532 27 50 África
Noruega 441439 0.953 84 100 Europa
Omã 81682 0.821 52 23 Ásia
Paquistão 306897 0.562 33 43 Ásia
Panamá 66031 0.789 37 83 América do Norte
Paraguai 41851 0.702 29 64 América do Sul
Perú 228944 0.750 35 73 América do Sul
Filipinas 331678 0.699 36 62 Ásia
Polônia 549478 0.865 60 85 Europa
Portugal 237962 0.847 64 97 Europa
Catar 188295 0.856 62 24 Ásia
Romênia 239440 0.811 47 84 Europa
Rússia 1576490 0.816 28 20 Ásia
Arábia Saudita 769878 0.853 49 7 Ásia
Sérvia 47654 0.787 39 73 Europa
Singapura 346621 0.932 85 52 Ásia
Eslováquia 106940 0.855 50 89 Europa
Eslovênia 54969 0.896 60 93 Europa
África do Sul 376679 0.699 43 78 África
Espanha 1437050 0.891 58 94 Europa
Sri Lanka 92504 0.770 38 55 Ásia
Sudão 33249 0.502 16 8 África
Suécia 554659 0.933 85 100 Europa
Suíça 709118 0.944 85 96 Europa
Taiwan 602678 0.885 63 93 Ásia
Tanzânia 55645 0.538 36 52 África
Tailândia 490120 0.755 36 31 Ásia
Tunísia 41662 0.735 43 70 África
Turquia 713513 0.791 41 32 Ásia
Turquemenistão 42764 0.706 20 4 Ásia
Ucrânia 126390 0.751 32 62 Europa
Emirados Árabes 432612 0.863 70 17 Ásia
Reino Unido 2808900 0.922 80 94 Europa
Estados Unidos 20513000 0.924 71 86 América do Norte
Uruguái 60933 0.804 70 98 América do Sul
Uzbequistão 43303 0.710 23 7 Ásia
Venezuela 96328 0.761 18 26 América do Sul
Vietnã 241434 0.694 33 20 Ásia

Boxplots

De posse da tabela do banco de dados deu-se início a pesquisa construindo-se primeiramente gráficos do tipo Boxplot, entre a Região e o IDH, Integridade e Democracia. O boxplot de região e PIB não foi inserido pois este apresentava muitos “outliers” que inviabilizavam a análise gráfica.

A utilização da ferramenta gráfica boxplot surgiu da necessidade de se obter uma visualização gráfica do comportamento da região, em termos de variação, dos dados analisados no estudo, sendo estes IDH, Integridade e Democracia.

BP1<-Boxplot(IDH~Regiao, data=BD, id=list(method="y"), main="Boxplot IDH x Região",xlab="Região", 
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19)

BP2<-Boxplot(Integridade~Regiao, data=BD, id=list(method="y"), main="Boxplot Integridade x Região", xlab="Região", 
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19)

BP3<-Boxplot(Democracia~Regiao, data=BD, id=list(method="y"), main="Boxplot Democracia x Região", xlab="Região",
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19)

Matriz de Correlação - Variáveis Quantitativas

#CARREGAMENTO BIBLIOTECA "corrplot" PARA CONSTRUÇÃO DA MATRIZ#
library(corrplot)
## corrplot 0.84 loaded
#CONSTRUÇÃO DA MATRIZ#
MC<-cor(BD[,c("PIB","IDH","Integridade","Democracia")], use="complete")
corrplot(MC,addCoef.col=TRUE,number.cex=.9, tl.cex=1.2)

WorldMaps

#CARREGAMENTO BIBLIOTECA "rworldmap"#
library(rworldmap)
## Loading required package: sp
## ### Welcome to rworldmap ###
## For a short introduction type :   vignette('rworldmap')
#CARREGAMENTO BASE DE DADOS#
BD1 <- readXL("C:/Users/Esdras/Desktop/Nova pasta (4)/Estatística.xlsx", rownames=FALSE, 
  header=TRUE, na="", sheet="Data", stringsAsFactors=TRUE)

#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$GDP_Tracks <- with(BD1, binVariable(GDP, bins=6, method='natural', 
labels=c('Very Low','Low','Medium','High','Very High','EUA/China')))

#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#verbose=TRUE (Para Identificar Países não correspondentes)#

#CONSTRUÇÃO DO MAPA#
MAP1<-mapCountryData(matched, nameColumnToPlot="GDP_Tracks", mapTitle="Distribuição PIB - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = "heat", borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP1$legendText <- c('$28813-$188342','$205997-$490120','$536055-$1005270','$1199260-$2086910','$2689990-$5070630','$13457270-$20513000')        

#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP1,cex=0.5, pt.cex = 1.4, x='left',title="Faixas de PIB em Milhões de Dólares",horiz=FALSE))

#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$HDI_Tracks <- with(BD1, binVariable(HDI, bins=5, method='natural', 
  labels=c('Muito Baixo','Baixo','Médio','Alto','Muito Alto')))

#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#CONSTRUÇÃO DO MAPA#
MAP2<-mapCountryData(matched, nameColumnToPlot="HDI_Tracks", mapTitle="Distribuição IDH - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = "heat", borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP2$legendText <- c('Muito Baixo','Baixo','Médio','Alto','Muito Alto')        
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP2,cex=0.6, pt.cex = 1.6, x='bottom',title="Níveis de IDH",horiz=TRUE))

#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$INT_Tracks <- with(BD1, binVariable(Integrity, bins=5, method='natural', 
  labels=c('Muito Baixa','Baixa','Mediana','Elevada','Muito Elevada')))

#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#CONSTRUÇÃO DO MAPA#
MAP3<-mapCountryData(matched, nameColumnToPlot="INT_Tracks", mapTitle="Distribuição Integridade - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = "heat", borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP3$legendText <- c('Muito Baixa','Baixa','Mediana','Elevada','Muito Elevada')        
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP3,cex=0.6, pt.cex = 1.6, x='bottom',title="Níveis de Integridade",horiz=TRUE))

#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$DEM_Tracks <- with(BD1, binVariable(Democracy, bins=5, method='natural', 
  labels=c('Muito Baixa','Baixa','Mediana','Elevada','Muito Elevada')))

#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#CONSTRUÇÃO DO MAPA#
MAP4<-mapCountryData(matched, nameColumnToPlot="DEM_Tracks", mapTitle="Democracia - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = "heat", borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP4$legendText <- c('Muito Baixa','Baixa','Mediana','Elevada','Muito Elevada')        
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP4,cex=0.6, pt.cex = 1.6, x='bottom',title="Níveis de Democracia",horiz=TRUE))