Na economia global do século 21, a ética e a integridade são aspectos fundamentais para que países tenham um destaque particular no que diz respeito à sua atuação no mercado global. A corrupção é extremamente nociva à governança e ao desenvolvimento econômico (OLIVEIRA, 2018) e, ainda que o país seja democrático, este não está livre da mesma (OSCE, 2004). Ainda segundo a OSCE (2004), a corrupção é um problema social que:
De posse desta informação, compreender os fatores influenciadores no nível de integridade de um país é primordial para orientar em que sentido, as governanças devem atuar de forma a combater a corrupção, não só na esfera política, mas também na esfera social como um todo.
Tomando como base o anterior exposto, esta pesquisa tem como objetivo principal analisar, através de ferramentas e modelos estatísticos, de que forma os indicadores de PIB Per Capita, IDH e Democracia influenciam no nível de integridade dos países e, identificar qual desses indicadores possui maior impacto na integridade de um país.
Dentre os objetivos específicos desta pesquisa estão:
A metodologia utilizada na pesquisa abordada consiste inicialmente na construção do banco de dados contendo as variáveis de relevância para nortear o estudo ao cumprimento de seus objetivos. Basicamente, o banco de dados foi constituído da junção das variáveis País, PIB Per Capita, IDH, Corrupção e Democracia. Estas são apresentadas a seguir:
PIB Per Capita: construída pelo Fundo Monetário Internacional (FMI), através da divisão do Produto Interno Bruto de cada país pelo sua respectiva quantidade de habitantes. Seus valores são expressos em dólares americanos. Fonte: http://statisticstimes.com/economy/gdp-indicators-2018.php;
País: variável de respota ao PIB Per Capita (variável independente) concebida pelo FMI;
IDH: construída pelo Programa das Nações Unidas para o Desenvolvimento (PNUD) a partir de dados de expectativa de vida ao nascer, educação e PIB Per Capita. Suas observações são expressas em escala de 0 à 1, em que zero representa o IDH nulo e 1 IDH máximo. Fonte: http://hdr.undp.org/en/2018-update;
Democracia: concebida pela Freedom House por meio de relatórios anuais de avaliação da condição dos direitos políticos e liberdades civis em torno do mundo. Seus valores são apresentados em escala de 0 a 100, em que, 0 representa a ausência de democracia e 100 a forte presença da mesma. Fonte: https://freedomhouse.org/content/freedom-world-data-and-resources;
Corrupção (Integridade): construída pela Transparency International por meio de relatórios anuais da investigação dos níveis perceptivos de corrupção do setor público de acordo com especialistas e empresários. Utiliza uma escala de 0 a 100, onde 0 representa alta presença de corrupção e 100 ausência da mesma. Fonte: https://www.transparency.org/cpi2018.
É importante mencionar que, as variáveis referem-se ao ano de 2018 e que, a variável “Corrupção”, esta foi renomeada para “Integridade”, de forma que a escala ficasse crescente conforme a integridade do país, isto é, 0 para países muito corruptos e 100 para países com integridade elevada.
Também vale ressaltar que foi inserido no banco de dados uma variável região que diz respeito ao continente em que cada país listado se encontra. Ao total, 100 países foram selecionados para análise, sendo o critério de seleção o maior PIB.
A tabela a seguir apresenta o banco de dados contruído para este trabalho:
#CARREGAMENTO BIBLIOTECA "Knitr" PARA APRESENTAÇÃO DO BANCO DE DADOS#
library(knitr)
#CARREGAMENTO BIBLIOTECA "KableExtra" PARA MANIPULAÇÃO DO QUADRO COM BANCO DE DADOS#
library(kableExtra)
#CARREGAMENTO DA BASE DE DADOS E ALOJAMENTO DO MESMO EM UMA VARIÁVEL#
BD <- readXL("E:/Nova pasta (5)/Estatística2.xlsx", rownames=FALSE,
header=TRUE, na="", sheet="Dados", stringsAsFactors=TRUE)
#CONSTRUÇÃO, MANIPULAÇÃO E IMPRESSÃO DA TABELA#
kable(BD, row.names = FALSE) %>%
kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"),
position = "center", fixed_thead = T) %>%
scroll_box(width = "700px", height = "400px")
| Pais | PIB.Per.Capita | IDH | Integridade | Democracia | Regiao |
|---|---|---|---|---|---|
| Luxemburgo | 113954 | 0.904 | 81 | 98 | Europa |
| Suíça | 83583 | 0.944 | 85 | 96 | Europa |
| Noruega | 82372 | 0.953 | 84 | 100 | Europa |
| Irlanda | 75192 | 0.938 | 73 | 96 | Europa |
| Catar | 67818 | 0.856 | 62 | 24 | Ásia |
| Estados Unidos | 62518 | 0.924 | 71 | 86 | América do Norte |
| Singapura | 61230 | 0.932 | 85 | 52 | Ásia |
| Dinamarca | 61227 | 0.929 | 88 | 97 | Europa |
| Austrália | 56698 | 0.939 | 77 | 98 | Oceania |
| Suécia | 53867 | 0.933 | 85 | 100 | Europa |
| Holanda | 52931 | 0.931 | 82 | 99 | Europa |
| Áustria | 51708 | 0.908 | 76 | 94 | Europa |
| Finlândia | 50068 | 0.920 | 85 | 100 | Europa |
| Alemanha | 48670 | 0.936 | 80 | 94 | Europa |
| Hong Kong | 48231 | 0.933 | 76 | 59 | Ásia |
| Bélgica | 46979 | 0.916 | 75 | 95 | Europa |
| Canadá | 46733 | 0.926 | 81 | 99 | América do Norte |
| França | 42931 | 0.901 | 72 | 90 | Europa |
| Reino Unido | 42261 | 0.922 | 80 | 94 | Europa |
| Nova Zelândia | 41616 | 0.917 | 87 | 98 | Oceania |
| Emirados Árabes | 41476 | 0.863 | 70 | 17 | Ásia |
| Israel | 41180 | 0.903 | 61 | 79 | Ásia |
| Japão | 40106 | 0.909 | 73 | 96 | Ásia |
| Itália | 34349 | 0.880 | 52 | 89 | Europa |
| Coréia | 32046 | 0.903 | 57 | 84 | Ásia |
| Kuwait | 31916 | 0.803 | 41 | 36 | Ásia |
| Espanha | 31060 | 0.891 | 58 | 94 | Europa |
| Eslovênia | 26586 | 0.896 | 60 | 93 | Europa |
| Bahrein | 26532 | 0.846 | 36 | 12 | Ásia |
| Taiwan | 25534 | 0.885 | 63 | 93 | Ásia |
| Arábia Saudita | 23187 | 0.853 | 49 | 7 | Ásia |
| Portugal | 23176 | 0.847 | 64 | 97 | Europa |
| República Tcheca | 23085 | 0.888 | 59 | 93 | Europa |
| Estônia | 22417 | 0.871 | 73 | 94 | Europa |
| Grécia | 20311 | 0.870 | 45 | 85 | Europa |
| Eslováquia | 19642 | 0.855 | 50 | 89 | Europa |
| Omã | 19170 | 0.821 | 52 | 23 | Ásia |
| Lituânia | 18857 | 0.858 | 59 | 91 | Europa |
| Letônia | 17634 | 0.847 | 58 | 87 | Europa |
| Uruguái | 17380 | 0.804 | 70 | 98 | América do Sul |
| Chile | 16143 | 0.843 | 67 | 94 | América do Sul |
| Hungria | 16016 | 0.838 | 46 | 72 | Europa |
| Panamá | 15877 | 0.789 | 37 | 83 | América do Norte |
| Croácia | 14637 | 0.831 | 48 | 86 | Europa |
| Polônia | 14469 | 0.865 | 60 | 85 | Europa |
| Líbano | 12454 | 0.757 | 28 | 43 | Ásia |
| Romênia | 12189 | 0.811 | 47 | 84 | Europa |
| Costa Rica | 12095 | 0.794 | 56 | 91 | América do Norte |
| Rússia | 10950 | 0.816 | 28 | 20 | Ásia |
| Malásia | 10704 | 0.802 | 47 | 45 | Ásia |
| Argentina | 10667 | 0.825 | 40 | 83 | América do Sul |
| Cazaquistão | 9977 | 0.800 | 31 | 22 | Ásia |
| China | 9633 | 0.752 | 39 | 14 | Ásia |
| México | 9614 | 0.774 | 28 | 62 | América do Norte |
| Brasil | 9127 | 0.759 | 35 | 78 | América do Sul |
| Bulgaria | 9080 | 0.813 | 42 | 80 | Europa |
| Turquia | 8716 | 0.791 | 41 | 32 | Ásia |
| República Dominicana | 7891 | 0.736 | 30 | 67 | América do Norte |
| Turquemenistão | 7412 | 0.706 | 20 | 4 | Ásia |
| Perú | 7118 | 0.750 | 35 | 73 | América do Sul |
| Tailândia | 7084 | 0.755 | 36 | 31 | Ásia |
| Sérvia | 6815 | 0.787 | 39 | 73 | Europa |
| Colômbia | 6761 | 0.747 | 36 | 65 | América do Sul |
| Líbia | 6639 | 0.706 | 17 | 9 | África |
| África do Sul | 6560 | 0.699 | 43 | 78 | África |
| Equador | 6301 | 0.752 | 34 | 60 | América do Sul |
| Bielorússia | 6020 | 0.808 | 44 | 21 | Europa |
| Paraguai | 5934 | 0.702 | 29 | 64 | América do Sul |
| Iraque | 5793 | 0.685 | 18 | 31 | Ásia |
| Irã | 5222 | 0.798 | 28 | 18 | Ásia |
| Azerbaijão | 4587 | 0.757 | 25 | 12 | Ásia |
| Guatemala | 4583 | 0.650 | 27 | 56 | América do Norte |
| Argélia | 4450 | 0.754 | 35 | 35 | África |
| Sri Lanka | 4265 | 0.770 | 38 | 55 | Ásia |
| Jordânia | 4228 | 0.735 | 49 | 37 | Ásia |
| Angola | 3924 | 0.581 | 19 | 26 | África |
| Indonésia | 3789 | 0.694 | 38 | 64 | Ásia |
| Bolívia | 3719 | 0.693 | 29 | 67 | América do Sul |
| Tunísia | 3573 | 0.735 | 43 | 70 | África |
| Marrocos | 3355 | 0.667 | 43 | 39 | África |
| Venezuela | 3300 | 0.761 | 18 | 26 | América do Sul |
| Filipinas | 3099 | 0.699 | 36 | 62 | Ásia |
| Ucrânia | 2964 | 0.751 | 32 | 62 | Europa |
| Egito | 2572 | 0.696 | 35 | 26 | África |
| Vietnã | 2553 | 0.694 | 33 | 20 | Ásia |
| Nigéria | 2050 | 0.532 | 27 | 50 | África |
| Índia | 2016 | 0.640 | 41 | 77 | Ásia |
| Quênia | 1865 | 0.590 | 27 | 48 | África |
| Costa do Marfim | 1791 | 0.492 | 35 | 51 | África |
| Gana | 1787 | 0.592 | 41 | 83 | África |
| Bangladesh | 1736 | 0.608 | 26 | 45 | Ásia |
| Camarões | 1545 | 0.556 | 25 | 22 | África |
| Paquistão | 1527 | 0.562 | 33 | 43 | Ásia |
| Myanmar | 1354 | 0.578 | 29 | 31 | Ásia |
| Uzbequistão | 1326 | 0.710 | 23 | 7 | Ásia |
| Tanzânia | 1090 | 0.538 | 36 | 52 | África |
| Nepal | 971 | 0.574 | 31 | 55 | Ásia |
| Etiópia | 891 | 0.463 | 34 | 12 | África |
| Sudão | 792 | 0.502 | 16 | 8 | África |
| Congo | 478 | 0.457 | 20 | 21 | África |
De posse do banco de dados, deu-se prosseguimento a pesquisa, utilizando o programa R e as suas interfaces R Commander e R Console, para continuar o estudo. Fazendo uso do mesmo, construiu-se, em primeiro lugar, gráficos do tipo Boxplot entre a variável Região e as variáveis PIB Per Capita, Integridade, IDH e Democracia. Em segundo lugar, foi gerada uma matriz de correlação entre as variáveis quantitativas e, por fim, foram elaborados gráficos do tipo “Worldmap” entre a variável região e as demais quantitativas, com o intuito de ilustrar a intensidade destas últimas.
Depois de contruir os gráficos necessários ao estudo, deu-se início ao processo de construção dos modelos de regressão linear. Para construção dos tais, primeiramente verificou-se três pressupostos para elaboração da regressão, sendo estes: normalidade, homocedasticidade e independência.
Sobre o pressuposto de normalidade, formulou-se as hipóteses do problema, sendo:
h0 (hipótese nula) = Os dados da amostra seguem uma distribuição normal;
h1 (hipótese alternativa)= os dados da amostra não seguem uma distribuição normal.
Formuladas as hipóteses do problema, estabeleceu-se a regra de decisão para o p-valor a ser encontrado no teste de normalidade. A regra então foi definida da seguinte forma:
p-valor </= 0,05 - Rejeita-se a hipótese nula (h0);
p-valor >/= 0,05 - Não rejeita-se a hipótese nula (h0).
Definida a regra de decisão, aplicou-se dois métodos para verificação da normalidade da variável de interesse (integridade), sendo estes: Testes de Normalidade de Shapiro Wilk e Gráfico de Comparação de Quantis. O Teste de Shapiro Wilk foi aplicado tanto para a variável Integridade propriamente dita (inicialmente), quanto para os resíduos oriundos do modelo de regressão linear entre a variável de interesse e o conjunto de variáveis quantitativas (PIB Per Capita, IDH e Democracia). Quanto ao gráfico de comparação de quantis, este foi elaborado também em relação aos resíduos mencionados.
É importante mencionar que, estes métodos foram utilizados, pois sabe-se que se os resíduos de uma variável se apresentam na forma de distribuição normal, logo, a distribuição da referida é também considerada normal.
Para verificação do pressuposto de homocedasticidade, utilizou-se o método de Breusch-Pagan onde as hipóteses que foram testadas são:
h0: (sigma.1)² = (sigma.2)² = . = (sigma.n)²;
h1: pelo menos um dos (sigma.i)² é diferente, em que i=1,.,n.
A regra de decisão definida segue conforme estabelecido no pressuposto de normalidade, onde:
p-valor </= 0,05 - Rejeita-se a hipótese nula (h0);
p-valor >/= 0,05 - Não rejeita-se a hipótese nula (h0).
Quanto ao pressuposto de independência entre as variáveis, este foi constatado em virtude das observações estarem no formato cross-section, ou seja, os dados dos países foram coletados em um dado ponto no tempo, logo assume-se que as observações são independentes. Em termos práticos, tem-se que o IDH de um país não influência no IDH de outro, assim como o PIB Percapita, a democracia e a integridade dos mesmos.
Finalmente, depois de verificar os pressupostos anteriormente expostos, construiu-se três modelos de regressão linear entre a variável de interesse (Integridade) e as variáveis alternativas (PIB Per Capita, IDH e Democracia), além de seus respectivos diagramas de dispersão, para então concluir a pesquisa com um parecer mediante aos resultados gerados.
Com respeito aos boxplots construídos, estes foram necessários para se representar gráficamente o comportamento de cada região, em termos de variação da distribuição dos dados observados, isto é, PIB Per Capita, IDH, Democracia e Integridade. Os boxplots gerados são apresentados a seguir:
#CONSTRUÇÃO DOS BOXPLOTS#
BP1<-Boxplot(PIB.Per.Capita~Regiao, data=BD, id=list(method="y"), main="Boxplot PIB Per Capita x Região", xlab="Região",
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19, ylab="PIB Per Capita")
Infere-se a partir do gráfico acima que as regiões com maior PIB Per Capita são as regiões da Europa e Oceania, visto que a mediana dos seus valores de PIB Per Capita (acima dos US$ 20.000) encontram-se significativamente superiores as demais. Além disso, o primeiro quartil dos referidos é superior a mediana de todas as outras regiões, confirmando a afirmação anterior.
Vale ressaltar também, a presença 3 outliers, 2 para a região da Ásia e 1 para a região da Europa. Em outras palavras, 2 países da Ásia apresentaram valores de PIB Per Capita superiores a US 60.000, enquanto que 1 país da Europa apresentou valor muito acima de todos os outros valores registrados (superior à US 100.000).
BP2<-Boxplot(IDH~Regiao, data=BD, id=list(method="y"), main="Boxplot IDH x Região",xlab="Região",
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19)
A partir do gráfico IDH x Região, constata-se novamente que as regiões com maior IDH são as regiões da Europa e Oceania, com valores do primeiro quartil da distribuição acima de 0,8, que é superior a mediana de todas as outras regiões. Nota-se também que as regiões da America do Norte e Ásia possuem pelo menos um país com valor de IDH superior ao valor de 0,9 (muito elevado). A África, por sua vez, é a região que apresentou menor IDH em virtude da sua mediana da distribuição de valores se encontrar significativamente abaixo de todas as demais. Nota-se também que pelo menos um país da África possui o menor IDH de todos os países com valor registrado abaixo de 0,5 (muito baixo).
BP3<-Boxplot(Integridade~Regiao, data=BD, id=list(method="y"), main="Boxplot Integridade x Região", xlab="Região",
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19)
No gráfico Integridade x Região, tem-se que as regiões da África, América do Norte, América do Sul e Ásia possuem medianas bem similares um dos outros, com valores em torno de 35 a 40 pontos de Integridade. A região da América do Sul possui dois países com valores de integridade muito acima de sua distribuição, com valores acima de 60 pontos. Nota-se também que a Europa e a Oceania possuem maior número de países íntegros visto que, seus valores de primeiro quartil são superiores as medianas das demais regiões.
BP4<-Boxplot(Democracia~Regiao, data=BD, id=list(method="y"), main="Boxplot Democracia x Região", xlab="Região",
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19)
Com respeito a Democracia, observa-se que as regiões da Ásia e África possuem maior número de países com registros de ausência democracia, uma vez que seus valores de terceiro quartil encontram-se significativamente abaixo dos demais. Percebe-se também a presença de três países considerados outliers em relação a sua região, com registros abaixo de suas respectivas distribuições. Vale ressaltar de igual forma que, as regiões da América do Norte, Europa e Oceania possuem maior número de páises democráticos, com mediana de valores acima dos 80 pontos.
No que diz respeito a matriz de correlação criada, a mesma foi necessária para identificar em que grau as variáveis analisadas se relacionam e a mesma é apresentada a seguir:
#CARREGAMENTO BIBLIOTECA "corrplot" PARA CONSTRUÇÃO DA MATRIZ#
library(corrplot)
#CONSTRUÇÃO DA MATRIZ#
MC<-cor(BD[,c("PIB.Per.Capita","IDH","Integridade","Democracia")], use="complete")
corrplot(MC,addCoef.col=TRUE,number.cex=.9, tl.cex=1.2)
De posse da matriz de correlação, nota-se que todas as variáveis se relacionam entre si de forma crescente. No que diz respeito a intensidade, constata-se que o grau de relação entre “Integridade” e “PIB Per Capita” é o maior quando comparado aos demais, ou seja, quanto maior o incremento do PIB Per Capita do país analisado, maior tende a ser o incremento da Integridade do respectivo.
Com respeito aos gráficos do estilo “worldmaps” criados, estes foram fundamentais para ilustrar graficamente, por meio de escala de cores, a intensidade das variáveis quantitativas entre os países analisados, ao redor do globo. Os referidos gráficos são apresentados abaixo:
#CARREGAMENTO BIBLIOTECA "rworldmap"#
library(rworldmap)
#CARREGAMENTO BASE DE DADOS#
BD1 <- readXL("E:/Nova pasta (5)/Estatística2.xlsx", rownames=FALSE,
header=TRUE, na="", sheet="Data", stringsAsFactors=TRUE)
#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$GDP_Tracks <- with(BD1, binVariable(GDP.Per.Capita, bins=5, method='natural',
labels=c('Very Low','Low','Medium','High','Very High')))
#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#verbose=TRUE (Para Identificar Países não correspondentes)#
#CONSTRUÇÃO DO MAPA#
MAP1<-mapCountryData(matched, nameColumnToPlot="GDP_Tracks", mapTitle="Distribuição PIB Per Capita - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = c('#FFFFFF','#FFFFCC', '#FFFF00', '#FFA500', 'red'), borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
#ADIÇÃO DA LEGENDA#
MAP1$legendText <- c('Muito Baixo ($478-$7891)','Baixo ($8716-$19642)','Médio ($20311-$34349)','Alto ($40106-$67818)','Muito Alto ($75192-$113954)')
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP1,cex=0.5, pt.cex = 1.4, x='bottomleft',title="Faixas de PIB Per Capita",horiz=FALSE))
A partir do worldmap da distribuição do PIB Per Capita pelo globo, percebe-se que a grande maioria dos países possui o PIB Per Capita baixo, numa faixa de valor de US 8.716 à US 19.642. Dos 100 países analisados, apenas três se destacaram com PIB Per Capita muito elevado, numa faixa de US 75.192 à US 113.954.
#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$HDI_Tracks <- with(BD1, binVariable(HDI, bins=5, method='natural',
labels=c('Muito Baixo','Baixo','Médio','Alto','Muito Alto')))
#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#CONSTRUÇÃO DO MAPA#
MAP2<-mapCountryData(matched, nameColumnToPlot="HDI_Tracks", mapTitle="Distribuição IDH - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = c('#FFFFFF','#FFFFCC', '#FFFF00', '#FFA500', 'red'), borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP2$legendText <- c('Muito Baixo (0,457-0,634)','Baixo (0,635-0,734)','Médio (0,735-0,794)','Alto (0,795-0,874)','Muito Alto (0,875-0,953)')
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP2,cex=0.6, pt.cex = 1.6, x='bottomleft',title="Níveis de IDH",horiz=FALSE))
De posse do gráfico distribuição IDH pelo globo, constata-se que praticamente toda a região Europa, América do Norte e Oceania possui IDH muito alto, com excessão de alguns países que tiveram registros inferiores ou que não foram analisados nesta pesquisa. Além disso, como já foi constatado no boxplot IDH x Região, tem-se que a Àfrica é a região com maior número de países com IDH muito baixo.
#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$INT_Tracks <- with(BD1, binVariable(Integrity, bins=5, method='natural',
labels=c('Muito Baixa','Baixa','Mediana','Elevada','Muito Elevada')))
#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#CONSTRUÇÃO DO MAPA#
MAP3<-mapCountryData(matched, nameColumnToPlot="INT_Tracks", mapTitle="Distribuição Integridade - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = c('#FFFFFF','#FFFFCC', '#FFFF00', '#FFA500', 'red'), borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP3$legendText <- c('Muito Baixa (0-26)','Baixa (27-37)','Mediana (38-50)','Elevada (51-69)','Muito Elevada (70-100)')
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP3,cex=0.6, pt.cex = 1.6, x='bottomleft',title="Níveis de Integridade",horiz=FALSE))
Quanto a distribuição da Integridade pelo globo, novamente constata-se que as regiões América do Norte, Europa e Oceania possuem praticamente todos os países com Integridade muito elevada, com excessão de alguns países que não foram analisados ou que apresentaram registro inferiores. Vale ressaltar que as regiões Ásia e África possuem maior número de países com integridade muito baixa, isto é, com presença acentuada de corrupção.
#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$DEM_Tracks <- with(BD1, binVariable(Democracy, bins=5, method='natural',
labels=c('Muito Baixa','Baixa','Mediana','Elevada','Muito Elevada')))
#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#CONSTRUÇÃO DO MAPA#
MAP4<-mapCountryData(matched, nameColumnToPlot="DEM_Tracks", mapTitle="Democracia - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = c('#FFFFFF','#FFFFCC', '#FFFF00', '#FFA500', 'red'), borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP4$legendText <- c('Muito Baixa (0-28)','Baixa (29-48)','Mediana (49-68)','Elevada (69-88)','Muito Elevada (89-100)')
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP4,cex=0.6, pt.cex = 1.6, x='bottomleft',title="Níveis de Democracia",horiz=FALSE))
Finalmente, com relação ao gráfico da distribuição da democracia pelo globo, constata-se que praticamente toda a Europa e Oceania possuem níveis muito elevados de democracia. Já na América do Sul, a maioria dos países apresentaram níveis elevados de democracia, enquanto que na Ásia, grande parte dos países analisados possuem níveis muito baixos de democracia, isto é, forte presença de politicas absolutistas ou ditatorial.
Conforme mencionado na metodologia, definida a regra de decisão para verificação do pressuposto de normalidade da variável Integridade, aplicou-se o teste de normalidade de Shapiro-Wilk na mesma cujo resultado é apresentado a seguir.
#TESTE DE NORMALIDADE VARIÁVEL INTEGRIDADE#
normalityTest(~log(Integridade), test="shapiro.test", data=BD)
##
## Shapiro-Wilk normality test
##
## data: log(Integridade)
## W = 0.9629, p-value = 0.006503
Com base no resultado apresentado, percebeu-se que o p-valor encontrado no teste foi de 0,006503, que é menor do que 0,05 (valor estabelecido na regra de decisão). Logo, a primeiro momento, rejeitou-se a hipótese nula, isto é, a variável Integridade a princípio não segue uma distribuição normal.
Em seguida, conforme exposto na metodologia, aplicou-se o teste de Shapiro Wilk nos resíduos (erros) oriundos do modelo de regressão linear entre a variável de interesse (Integridade) e as demais variáveis quantitativas (PIB Per Capita, IDH e Democracia). Os resultados do modelo de regressão linear realizado e o teste de Shapiro-Wilk são apresentados adiante.
#MODELO DE REGRESSÃO LINEAR#
RegModel.1 <- lm(Integridade~Democracia+IDH+PIB.Per.Capita, data=BD)
summary(RegModel.1)
##
## Call:
## lm(formula = Integridade ~ Democracia + IDH + PIB.Per.Capita,
## data = BD)
##
## Residuals:
## Min 1Q Median 3Q Max
## -21.180 -6.126 -0.587 5.969 18.582
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -4.706e+00 7.233e+00 -0.651 0.516783
## Democracia 2.051e-01 3.436e-02 5.969 4.01e-08 ***
## IDH 3.942e+01 1.081e+01 3.647 0.000431 ***
## PIB.Per.Capita 4.489e-04 5.605e-05 8.008 2.73e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8.493 on 96 degrees of freedom
## Multiple R-squared: 0.8323, Adjusted R-squared: 0.8271
## F-statistic: 158.8 on 3 and 96 DF, p-value: < 2.2e-16
#TESTE DE NORMALIDADE RESÍDUOS VARIÁVEL INTEGRIDADE#
normalityTest(~ RegModel.1[["residuals"]], test="shapiro.test", data=BD)
##
## Shapiro-Wilk normality test
##
## data: RegModel.1[["residuals"]]
## W = 0.98828, p-value = 0.5294
Como o p-valor do teste de normalidade dos resíduos é 0,5294, isto é, maior que 0,05 (valor estabelecido na regra de decisão), não foi possível rejeitar a hipótese nula. Em outras palavras, os resíduos da variável Integridade seguem uma distribuição normal, tornando a variável em si também normal em sua distribuição.
Quanto ao gráfico de QQ-Plot oriundo também dos resíduos do modelo de regressão linear gerado, este é apresentado a seguir:
#GRÁFICO DE COMPARAÇÃO DE QUANTIS#
qqPlot(RegModel.1, simulate=TRUE, id=list(method="y", n=2), main="Gráfico QQ-Plot", ylab="Resíduos da Regressão", xlab="Quantis")
## [1] 1 21
O gráfico apresenta pontos que representam os valores do banco de dados, uma linha central que representa uma distribuição normal teórica e, por fim, duas linhas pontilhadas que ilustram o intervalo com 95% de confiança. Vale ressaltar que, quanto mais próximo da linha central os pontos se encontram, maior a evidência da normalidade e, de igual forma, se os mesmos estão dentro do intervalo (linhas tracejadas), semelhantemente maior é a evidência de normalidade. Logo, a partir do gráfico conclui-se que a distribuição é normal.
A partir dos dois métodos utilizados percebe-se que o resultado da verificação da normalidade é robusto, ou seja, a distribuição é normal independente do método utilizado.
O resultado do teste de Breusch-Pagan é apresentado adiante.
#VERIFICAÇÃO DE HOMOCEDASTICIDADE - BREUSCH PAGAN#
library(zoo, pos=18)
library(lmtest, pos=18)
bptest(Integridade ~ Democracia + IDH + PIB.Per.Capita, varformula = ~
fitted.values(RegModel.1), studentize=FALSE, data=BD)
##
## Breusch-Pagan test
##
## data: Integridade ~ Democracia + IDH + PIB.Per.Capita
## BP = 2.2481, df = 1, p-value = 0.1338
Como o p-valor do teste de homocedasticidade é 0,1338, isto é, maior que 0,05 (ver regra de de decisão teste homocedasticidade), não foi possível rejeitar a hipótese nula, ou seja, a variância dos resíduos são iguais.
No que diz respeito a independência entre as variáveis, assim como foi mencionado na metodologia, como os dados dos países foram coletados em um determinado período logo, as observações são independentes entre si.
Sobre os modelos de regressão linear e seus respectivos diagramas de dispersão, estes encontram-se exibidos abaixo.
#CONSTRUÇÃO DO MODELO DE REGRESSÃO ENTRE INTEGRIDADE E PIB PER CAPITA#
RegModel.2 <- lm(Integridade~PIB.Per.Capita, data=BD)
summary(RegModel.2)
##
## Call:
## lm(formula = Integridade ~ PIB.Per.Capita, data = BD)
##
## Residuals:
## Min 1Q Median 3Q Max
## -36.697 -7.964 0.763 7.418 24.556
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.244e+01 1.508e+00 21.51 <2e-16 ***
## PIB.Per.Capita 7.482e-04 4.872e-05 15.36 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 11.12 on 98 degrees of freedom
## Multiple R-squared: 0.7064, Adjusted R-squared: 0.7034
## F-statistic: 235.8 on 1 and 98 DF, p-value: < 2.2e-16
#CONSTRUÇÃO DO DIAGRAMA DE DISPERSÃO ENTRE INTEGRIDADE E PIB PER CAPITA#
scatterplot(PIB.Per.Capita~Integridade, regLine=TRUE, smooth=FALSE,
boxplots=FALSE, data=BD, main="Diagrama de Dispersão Integridade x PIB Per Capita", pch=16)
#CONSTRUÇÃO DO MODELO DE REGRESSÃO ENTRE INTEGRIDADE E IDH#
RegModel.3 <- lm(Integridade~IDH, data=BD)
summary(RegModel.3)
##
## Call:
## lm(formula = Integridade ~ IDH, data = BD)
##
## Residuals:
## Min 1Q Median 3Q Max
## -27.5216 -8.9653 -0.5042 9.9748 27.0415
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -52.957 7.963 -6.65 1.67e-09 ***
## IDH 129.407 10.072 12.85 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 12.53 on 98 degrees of freedom
## Multiple R-squared: 0.6275, Adjusted R-squared: 0.6237
## F-statistic: 165.1 on 1 and 98 DF, p-value: < 2.2e-16
#CONSTRUÇÃO DO DIAGRAMA DE DISPERSÃO ENTRE INTEGRIDADE E IDH#
scatterplot(IDH~Integridade, regLine=TRUE, smooth=FALSE, boxplots=FALSE,
data=BD, main="Diagrama de Dispersão Integridade x IDH", pch=16)
#CONSTRUÇÃO DO MODELO DE REGRESSÃO ENTRE INTEGRIDADE E DEMOCRACIA#
RegModel.4 <- lm(Integridade~Democracia, data=BD)
summary(RegModel.4)
##
## Call:
## lm(formula = Integridade ~ Democracia, data = BD)
##
## Residuals:
## Min 1Q Median 3Q Max
## -21.628 -12.321 -1.355 10.733 42.790
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 19.24736 3.27575 5.876 5.80e-08 ***
## Democracia 0.46837 0.04766 9.827 2.87e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 14.57 on 98 degrees of freedom
## Multiple R-squared: 0.4963, Adjusted R-squared: 0.4912
## F-statistic: 96.57 on 1 and 98 DF, p-value: 2.87e-16
#CONSTRUÇÃO DO DIAGRAMA DE DISPERSÃO ENTRE INTEGRIDADE E DEMOCRACIA#
scatterplot(Democracia~Integridade, regLine=TRUE, smooth=FALSE,
boxplots=FALSE, data=BD, main="Diagrama de Dispersão Integridade x Democracia", pch=16)
Diante dos resultados apresentados para os modelos e gráficos gerados, constata-se que em todos os casos a correlação entre as variáveis é positiva e crescente, confirmando o que foi exposto na matriz de correlação entre as variáveis. Também vale ressaltar que dentre as regressões feitas, a que possui maior coeficiente de determinação R² (Multiple R-squared) foi a mesma realizada entre a variável Integridade e PIB Per Capita, com valor de 0,7034. Assim, tem-se que a qualidade do ajustamento da regressão entre as referidas variáveis é de 70,34%, isto é, 70,34% da variável independente (Integridade) explica a variável dependente (PIB Per Capita).
#MODELO DE REGRESSÃO LINEAR#
RegModel.1 <- lm(Integridade~Democracia+IDH+PIB.Per.Capita, data=BD)
summary(RegModel.1)
##
## Call:
## lm(formula = Integridade ~ Democracia + IDH + PIB.Per.Capita,
## data = BD)
##
## Residuals:
## Min 1Q Median 3Q Max
## -21.180 -6.126 -0.587 5.969 18.582
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -4.706e+00 7.233e+00 -0.651 0.516783
## Democracia 2.051e-01 3.436e-02 5.969 4.01e-08 ***
## IDH 3.942e+01 1.081e+01 3.647 0.000431 ***
## PIB.Per.Capita 4.489e-04 5.605e-05 8.008 2.73e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8.493 on 96 degrees of freedom
## Multiple R-squared: 0.8323, Adjusted R-squared: 0.8271
## F-statistic: 158.8 on 3 and 96 DF, p-value: < 2.2e-16
Através do modelo de regressão linear múltipla realizado inicialmente, confirma-se o que foi apresentado nos resultados individuais para cada modelo de regressão simples, onde a variável integridade é explicada de forma positiva e crescente pelas variáveis PIB Per Capita, IDH e Democracia.
Através dos resultados apresentados nesta pesquisa, conclui-se que a falta de integridade dos países esta significativamente atrelada ao PIB Per Capita do mesmo, ou seja, o valor dos bens produzidos por cada habitante num determinado período, se todos tem partes iguais. Em termos práticos, segundo Cotarelli et al (2019), quanto maior o PIB produzido por uma pessoa maior tende a ser a qualidade de vida e o acesso a serviços como transporte, saúde, alimentação, entre outros. Logo, ainda segundo a referida autora, para se contornar o problema da falta de integridade dos países é necessário que os governos atentem para as questões de:
Infraestrutura: o Brasil, apesar de produzir em grande quantidade, acaba tendo gastos elevados com o transporte de bens em virtude das ferrovias, rodovias, portos e aeroportos despreparados ou insuficientes, acarretando assim num aumento significativo no preço de venda dos mesmos;
Redução da carga tributária: impostos altos e complexos prejudicam o crescimento das empresas que produzem os bens;
Instabilidade: constantes mudanças na política e economia do país geram instabilidade e desconfiança nos investidores;
Burocracia: processos burocráticos para produzir, contratar e vender acarretam em dificuldades para o crescimento das empresas;
Inflação: a alta dos preços impacta negativamente no planejamento das empresas e do governo, além de reduzir o poder de compra;
Juros: juros elevados tornam o investimento elevado e, assim, reduz o potencial de produção do país;
Escolaridade: a falta de mão de obra qualificada, oriunda da má formação estudantil, acarreta na diminuição da produtividade do trabalho do país.
COTARELLI, Natália et al.. Entenda o PIB. Disponível em: https://g1.globo.com/economia/pib-o-que-e/platb/. Acesso em: 28 jun. 2019;
OLIVEIRA, A. A.. O Teste de Integridade dos Agentes Públicos como Ferramenta de Combate à Corrupção: Validade e Efetividade;
OSCE, Best Pratices in Combating Corruption. Organization for Security and Cooperation in Europe. Viena, 2004;