INTRODUÇÃO

Na economia global do século 21, a ética e a integridade são aspectos fundamentais para que países tenham um destaque particular no que diz respeito à sua atuação no mercado global. A corrupção é extremamente nociva à governança e ao desenvolvimento econômico (OLIVEIRA, 2018) e, ainda que o país seja democrático, este não está livre da mesma (OSCE, 2004). Ainda segundo a OSCE (2004), a corrupção é um problema social que:

De posse desta informação, compreender os fatores influenciadores no nível de integridade de um país é primordial para orientar em que sentido, as governanças devem atuar de forma a combater a corrupção, não só na esfera política, mas também na esfera social como um todo.

OBJETIVO PRINCIPAL

Tomando como base o anterior exposto, esta pesquisa tem como objetivo principal analisar, através de ferramentas e modelos estatísticos, de que forma os indicadores de PIB Per Capita, IDH e Democracia influenciam no nível de integridade dos países e, identificar qual desses indicadores possui maior impacto na integridade de um país.

OBJETIVOS ESPECÍFICOS

Dentre os objetivos específicos desta pesquisa estão:

METODOLOGIA

A metodologia utilizada na pesquisa abordada consiste inicialmente na construção do banco de dados contendo as variáveis de relevância para nortear o estudo ao cumprimento de seus objetivos. Basicamente, o banco de dados foi constituído da junção das variáveis País, PIB Per Capita, IDH, Corrupção e Democracia. Estas são apresentadas a seguir:

É importante mencionar que, as variáveis referem-se ao ano de 2018 e que, a variável “Corrupção”, esta foi renomeada para “Integridade”, de forma que a escala ficasse crescente conforme a integridade do país, isto é, 0 para países muito corruptos e 100 para países com integridade elevada.

Também vale ressaltar que foi inserido no banco de dados uma variável região que diz respeito ao continente em que cada país listado se encontra. Ao total, 100 países foram selecionados para análise, sendo o critério de seleção o maior PIB.

A tabela a seguir apresenta o banco de dados contruído para este trabalho:

#CARREGAMENTO BIBLIOTECA "Knitr" PARA APRESENTAÇÃO DO BANCO DE DADOS#
library(knitr)

#CARREGAMENTO BIBLIOTECA "KableExtra" PARA MANIPULAÇÃO DO QUADRO COM BANCO DE DADOS#
library(kableExtra)

#CARREGAMENTO DA BASE DE DADOS E ALOJAMENTO DO MESMO EM UMA VARIÁVEL#
BD <- readXL("E:/Nova pasta (5)/Estatística2.xlsx", rownames=FALSE, 
  header=TRUE, na="", sheet="Dados", stringsAsFactors=TRUE)

#CONSTRUÇÃO, MANIPULAÇÃO E IMPRESSÃO DA TABELA#
kable(BD, row.names = FALSE) %>%
kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
               position = "center", fixed_thead = T) %>%
  scroll_box(width = "700px", height = "400px")
Pais PIB.Per.Capita IDH Integridade Democracia Regiao
Luxemburgo 113954 0.904 81 98 Europa
Suíça 83583 0.944 85 96 Europa
Noruega 82372 0.953 84 100 Europa
Irlanda 75192 0.938 73 96 Europa
Catar 67818 0.856 62 24 Ásia
Estados Unidos 62518 0.924 71 86 América do Norte
Singapura 61230 0.932 85 52 Ásia
Dinamarca 61227 0.929 88 97 Europa
Austrália 56698 0.939 77 98 Oceania
Suécia 53867 0.933 85 100 Europa
Holanda 52931 0.931 82 99 Europa
Áustria 51708 0.908 76 94 Europa
Finlândia 50068 0.920 85 100 Europa
Alemanha 48670 0.936 80 94 Europa
Hong Kong 48231 0.933 76 59 Ásia
Bélgica 46979 0.916 75 95 Europa
Canadá 46733 0.926 81 99 América do Norte
França 42931 0.901 72 90 Europa
Reino Unido 42261 0.922 80 94 Europa
Nova Zelândia 41616 0.917 87 98 Oceania
Emirados Árabes 41476 0.863 70 17 Ásia
Israel 41180 0.903 61 79 Ásia
Japão 40106 0.909 73 96 Ásia
Itália 34349 0.880 52 89 Europa
Coréia 32046 0.903 57 84 Ásia
Kuwait 31916 0.803 41 36 Ásia
Espanha 31060 0.891 58 94 Europa
Eslovênia 26586 0.896 60 93 Europa
Bahrein 26532 0.846 36 12 Ásia
Taiwan 25534 0.885 63 93 Ásia
Arábia Saudita 23187 0.853 49 7 Ásia
Portugal 23176 0.847 64 97 Europa
República Tcheca 23085 0.888 59 93 Europa
Estônia 22417 0.871 73 94 Europa
Grécia 20311 0.870 45 85 Europa
Eslováquia 19642 0.855 50 89 Europa
Omã 19170 0.821 52 23 Ásia
Lituânia 18857 0.858 59 91 Europa
Letônia 17634 0.847 58 87 Europa
Uruguái 17380 0.804 70 98 América do Sul
Chile 16143 0.843 67 94 América do Sul
Hungria 16016 0.838 46 72 Europa
Panamá 15877 0.789 37 83 América do Norte
Croácia 14637 0.831 48 86 Europa
Polônia 14469 0.865 60 85 Europa
Líbano 12454 0.757 28 43 Ásia
Romênia 12189 0.811 47 84 Europa
Costa Rica 12095 0.794 56 91 América do Norte
Rússia 10950 0.816 28 20 Ásia
Malásia 10704 0.802 47 45 Ásia
Argentina 10667 0.825 40 83 América do Sul
Cazaquistão 9977 0.800 31 22 Ásia
China 9633 0.752 39 14 Ásia
México 9614 0.774 28 62 América do Norte
Brasil 9127 0.759 35 78 América do Sul
Bulgaria 9080 0.813 42 80 Europa
Turquia 8716 0.791 41 32 Ásia
República Dominicana 7891 0.736 30 67 América do Norte
Turquemenistão 7412 0.706 20 4 Ásia
Perú 7118 0.750 35 73 América do Sul
Tailândia 7084 0.755 36 31 Ásia
Sérvia 6815 0.787 39 73 Europa
Colômbia 6761 0.747 36 65 América do Sul
Líbia 6639 0.706 17 9 África
África do Sul 6560 0.699 43 78 África
Equador 6301 0.752 34 60 América do Sul
Bielorússia 6020 0.808 44 21 Europa
Paraguai 5934 0.702 29 64 América do Sul
Iraque 5793 0.685 18 31 Ásia
Irã 5222 0.798 28 18 Ásia
Azerbaijão 4587 0.757 25 12 Ásia
Guatemala 4583 0.650 27 56 América do Norte
Argélia 4450 0.754 35 35 África
Sri Lanka 4265 0.770 38 55 Ásia
Jordânia 4228 0.735 49 37 Ásia
Angola 3924 0.581 19 26 África
Indonésia 3789 0.694 38 64 Ásia
Bolívia 3719 0.693 29 67 América do Sul
Tunísia 3573 0.735 43 70 África
Marrocos 3355 0.667 43 39 África
Venezuela 3300 0.761 18 26 América do Sul
Filipinas 3099 0.699 36 62 Ásia
Ucrânia 2964 0.751 32 62 Europa
Egito 2572 0.696 35 26 África
Vietnã 2553 0.694 33 20 Ásia
Nigéria 2050 0.532 27 50 África
Índia 2016 0.640 41 77 Ásia
Quênia 1865 0.590 27 48 África
Costa do Marfim 1791 0.492 35 51 África
Gana 1787 0.592 41 83 África
Bangladesh 1736 0.608 26 45 Ásia
Camarões 1545 0.556 25 22 África
Paquistão 1527 0.562 33 43 Ásia
Myanmar 1354 0.578 29 31 Ásia
Uzbequistão 1326 0.710 23 7 Ásia
Tanzânia 1090 0.538 36 52 África
Nepal 971 0.574 31 55 Ásia
Etiópia 891 0.463 34 12 África
Sudão 792 0.502 16 8 África
Congo 478 0.457 20 21 África

De posse do banco de dados, deu-se prosseguimento a pesquisa, utilizando o programa R e as suas interfaces R Commander e R Console, para continuar o estudo. Fazendo uso do mesmo, construiu-se, em primeiro lugar, gráficos do tipo Boxplot entre a variável Região e as variáveis PIB Per Capita, Integridade, IDH e Democracia. Em segundo lugar, foi gerada uma matriz de correlação entre as variáveis quantitativas e, por fim, foram elaborados gráficos do tipo “Worldmap” entre a variável região e as demais quantitativas, com o intuito de ilustrar a intensidade destas últimas.

Depois de contruir os gráficos necessários ao estudo, deu-se início ao processo de construção dos modelos de regressão linear. Para construção dos tais, primeiramente verificou-se três pressupostos para elaboração da regressão, sendo estes: normalidade, homocedasticidade e independência.

Verificação do Pressuposto de Normalidade

Sobre o pressuposto de normalidade, formulou-se as hipóteses do problema, sendo:

h0 (hipótese nula) = Os dados da amostra seguem uma distribuição normal;

h1 (hipótese alternativa)= os dados da amostra não seguem uma distribuição normal.

Formuladas as hipóteses do problema, estabeleceu-se a regra de decisão para o p-valor a ser encontrado no teste de normalidade. A regra então foi definida da seguinte forma:

p-valor </= 0,05 - Rejeita-se a hipótese nula (h0);

p-valor >/= 0,05 - Não rejeita-se a hipótese nula (h0).

Definida a regra de decisão, aplicou-se dois métodos para verificação da normalidade da variável de interesse (integridade), sendo estes: Testes de Normalidade de Shapiro Wilk e Gráfico de Comparação de Quantis. O Teste de Shapiro Wilk foi aplicado tanto para a variável Integridade propriamente dita (inicialmente), quanto para os resíduos oriundos do modelo de regressão linear entre a variável de interesse e o conjunto de variáveis quantitativas (PIB Per Capita, IDH e Democracia). Quanto ao gráfico de comparação de quantis, este foi elaborado também em relação aos resíduos mencionados.

É importante mencionar que, estes métodos foram utilizados, pois sabe-se que se os resíduos de uma variável se apresentam na forma de distribuição normal, logo, a distribuição da referida é também considerada normal.

Verificação do Pressuposto de Homocedasticidade

Para verificação do pressuposto de homocedasticidade, utilizou-se o método de Breusch-Pagan onde as hipóteses que foram testadas são:

h0: (sigma.1)² = (sigma.2)² = . = (sigma.n)²;

h1: pelo menos um dos (sigma.i)² é diferente, em que i=1,.,n.

A regra de decisão definida segue conforme estabelecido no pressuposto de normalidade, onde:

p-valor </= 0,05 - Rejeita-se a hipótese nula (h0);

p-valor >/= 0,05 - Não rejeita-se a hipótese nula (h0).

Verificação do Pressuposto de Independência entre as Variáveis

Quanto ao pressuposto de independência entre as variáveis, este foi constatado em virtude das observações estarem no formato cross-section, ou seja, os dados dos países foram coletados em um dado ponto no tempo, logo assume-se que as observações são independentes. Em termos práticos, tem-se que o IDH de um país não influência no IDH de outro, assim como o PIB Percapita, a democracia e a integridade dos mesmos.

Regressão Linear

Finalmente, depois de verificar os pressupostos anteriormente expostos, construiu-se três modelos de regressão linear entre a variável de interesse (Integridade) e as variáveis alternativas (PIB Per Capita, IDH e Democracia), além de seus respectivos diagramas de dispersão, para então concluir a pesquisa com um parecer mediante aos resultados gerados.

ANÁLISE DE DADOS

Boxplots

Com respeito aos boxplots construídos, estes foram necessários para se representar gráficamente o comportamento de cada região, em termos de variação da distribuição dos dados observados, isto é, PIB Per Capita, IDH, Democracia e Integridade. Os boxplots gerados são apresentados a seguir:

#CONSTRUÇÃO DOS BOXPLOTS#
BP1<-Boxplot(PIB.Per.Capita~Regiao, data=BD, id=list(method="y"), main="Boxplot PIB Per Capita x Região", xlab="Região", 
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19, ylab="PIB Per Capita")

Infere-se a partir do gráfico acima que as regiões com maior PIB Per Capita são as regiões da Europa e Oceania, visto que a mediana dos seus valores de PIB Per Capita (acima dos US$ 20.000) encontram-se significativamente superiores as demais. Além disso, o primeiro quartil dos referidos é superior a mediana de todas as outras regiões, confirmando a afirmação anterior.

Vale ressaltar também, a presença 3 outliers, 2 para a região da Ásia e 1 para a região da Europa. Em outras palavras, 2 países da Ásia apresentaram valores de PIB Per Capita superiores a US 60.000, enquanto que 1 país da Europa apresentou valor muito acima de todos os outros valores registrados (superior à US 100.000).

BP2<-Boxplot(IDH~Regiao, data=BD, id=list(method="y"), main="Boxplot IDH x Região",xlab="Região", 
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19)

A partir do gráfico IDH x Região, constata-se novamente que as regiões com maior IDH são as regiões da Europa e Oceania, com valores do primeiro quartil da distribuição acima de 0,8, que é superior a mediana de todas as outras regiões. Nota-se também que as regiões da America do Norte e Ásia possuem pelo menos um país com valor de IDH superior ao valor de 0,9 (muito elevado). A África, por sua vez, é a região que apresentou menor IDH em virtude da sua mediana da distribuição de valores se encontrar significativamente abaixo de todas as demais. Nota-se também que pelo menos um país da África possui o menor IDH de todos os países com valor registrado abaixo de 0,5 (muito baixo).

BP3<-Boxplot(Integridade~Regiao, data=BD, id=list(method="y"), main="Boxplot Integridade x Região", xlab="Região", 
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19)

No gráfico Integridade x Região, tem-se que as regiões da África, América do Norte, América do Sul e Ásia possuem medianas bem similares um dos outros, com valores em torno de 35 a 40 pontos de Integridade. A região da América do Sul possui dois países com valores de integridade muito acima de sua distribuição, com valores acima de 60 pontos. Nota-se também que a Europa e a Oceania possuem maior número de países íntegros visto que, seus valores de primeiro quartil são superiores as medianas das demais regiões.

BP4<-Boxplot(Democracia~Regiao, data=BD, id=list(method="y"), main="Boxplot Democracia x Região", xlab="Região",
col=c("#9932cc","#FFD700","#228B22","#FF0000","#1E90FF","#FF8C00"), pch=19)

Com respeito a Democracia, observa-se que as regiões da Ásia e África possuem maior número de países com registros de ausência democracia, uma vez que seus valores de terceiro quartil encontram-se significativamente abaixo dos demais. Percebe-se também a presença de três países considerados outliers em relação a sua região, com registros abaixo de suas respectivas distribuições. Vale ressaltar de igual forma que, as regiões da América do Norte, Europa e Oceania possuem maior número de páises democráticos, com mediana de valores acima dos 80 pontos.

Matriz de Correlação - Variáveis Quantitativas

No que diz respeito a matriz de correlação criada, a mesma foi necessária para identificar em que grau as variáveis analisadas se relacionam e a mesma é apresentada a seguir:

#CARREGAMENTO BIBLIOTECA "corrplot" PARA CONSTRUÇÃO DA MATRIZ#
library(corrplot)

#CONSTRUÇÃO DA MATRIZ#
MC<-cor(BD[,c("PIB.Per.Capita","IDH","Integridade","Democracia")], use="complete")
corrplot(MC,addCoef.col=TRUE,number.cex=.9, tl.cex=1.2)

De posse da matriz de correlação, nota-se que todas as variáveis se relacionam entre si de forma crescente. No que diz respeito a intensidade, constata-se que o grau de relação entre “Integridade” e “PIB Per Capita” é o maior quando comparado aos demais, ou seja, quanto maior o incremento do PIB Per Capita do país analisado, maior tende a ser o incremento da Integridade do respectivo.

WorldMaps

Com respeito aos gráficos do estilo “worldmaps” criados, estes foram fundamentais para ilustrar graficamente, por meio de escala de cores, a intensidade das variáveis quantitativas entre os países analisados, ao redor do globo. Os referidos gráficos são apresentados abaixo:

#CARREGAMENTO BIBLIOTECA "rworldmap"#
library(rworldmap)

#CARREGAMENTO BASE DE DADOS#
BD1 <- readXL("E:/Nova pasta (5)/Estatística2.xlsx", rownames=FALSE, 
  header=TRUE, na="", sheet="Data", stringsAsFactors=TRUE)

#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$GDP_Tracks <- with(BD1, binVariable(GDP.Per.Capita, bins=5, method='natural', 
labels=c('Very Low','Low','Medium','High','Very High')))

#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#verbose=TRUE (Para Identificar Países não correspondentes)#

#CONSTRUÇÃO DO MAPA#
MAP1<-mapCountryData(matched, nameColumnToPlot="GDP_Tracks", mapTitle="Distribuição PIB Per Capita - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = c('#FFFFFF','#FFFFCC', '#FFFF00', '#FFA500', 'red'), borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")

#ADIÇÃO DA LEGENDA#
MAP1$legendText <- c('Muito Baixo ($478-$7891)','Baixo ($8716-$19642)','Médio ($20311-$34349)','Alto ($40106-$67818)','Muito Alto ($75192-$113954)')       

#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP1,cex=0.5, pt.cex = 1.4, x='bottomleft',title="Faixas de PIB Per Capita",horiz=FALSE))

A partir do worldmap da distribuição do PIB Per Capita pelo globo, percebe-se que a grande maioria dos países possui o PIB Per Capita baixo, numa faixa de valor de US 8.716 à US 19.642. Dos 100 países analisados, apenas três se destacaram com PIB Per Capita muito elevado, numa faixa de US 75.192 à US 113.954.

#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$HDI_Tracks <- with(BD1, binVariable(HDI, bins=5, method='natural', 
  labels=c('Muito Baixo','Baixo','Médio','Alto','Muito Alto')))

#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#CONSTRUÇÃO DO MAPA#
MAP2<-mapCountryData(matched, nameColumnToPlot="HDI_Tracks", mapTitle="Distribuição IDH - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = c('#FFFFFF','#FFFFCC', '#FFFF00', '#FFA500', 'red'), borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP2$legendText <- c('Muito Baixo (0,457-0,634)','Baixo (0,635-0,734)','Médio (0,735-0,794)','Alto (0,795-0,874)','Muito Alto (0,875-0,953)')        
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP2,cex=0.6, pt.cex = 1.6, x='bottomleft',title="Níveis de IDH",horiz=FALSE))

De posse do gráfico distribuição IDH pelo globo, constata-se que praticamente toda a região Europa, América do Norte e Oceania possui IDH muito alto, com excessão de alguns países que tiveram registros inferiores ou que não foram analisados nesta pesquisa. Além disso, como já foi constatado no boxplot IDH x Região, tem-se que a Àfrica é a região com maior número de países com IDH muito baixo.

#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$INT_Tracks <- with(BD1, binVariable(Integrity, bins=5, method='natural', 
  labels=c('Muito Baixa','Baixa','Mediana','Elevada','Muito Elevada')))

#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#CONSTRUÇÃO DO MAPA#
MAP3<-mapCountryData(matched, nameColumnToPlot="INT_Tracks", mapTitle="Distribuição Integridade - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = c('#FFFFFF','#FFFFCC', '#FFFF00', '#FFA500', 'red'), borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP3$legendText <- c('Muito Baixa (0-26)','Baixa (27-37)','Mediana (38-50)','Elevada (51-69)','Muito Elevada (70-100)')        
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP3,cex=0.6, pt.cex = 1.6, x='bottomleft',title="Níveis de Integridade",horiz=FALSE))

Quanto a distribuição da Integridade pelo globo, novamente constata-se que as regiões América do Norte, Europa e Oceania possuem praticamente todos os países com Integridade muito elevada, com excessão de alguns países que não foram analisados ou que apresentaram registro inferiores. Vale ressaltar que as regiões Ásia e África possuem maior número de países com integridade muito baixa, isto é, com presença acentuada de corrupção.

#AGRUPAMENTO DE VARIÁVEIS EM CATEGORIAS#
BD1$DEM_Tracks <- with(BD1, binVariable(Democracy, bins=5, method='natural', 
  labels=c('Muito Baixa','Baixa','Mediana','Elevada','Muito Elevada')))

#CORRELAÇÃO ENTRE PAÍSES DA BASE DE DADOS E PAÍSES DO BANCO "rworldmap"#
matched <- joinCountryData2Map(BD1, joinCode="NAME", nameJoinColumn="Country")
## 100 codes from your data successfully matched countries in the map
## 0 codes from your data failed to match with a country code in the map
## 143 codes from the map weren't represented in your data
#CONSTRUÇÃO DO MAPA#
MAP4<-mapCountryData(matched, nameColumnToPlot="DEM_Tracks", mapTitle="Democracia - Globo", catMethod = "pretty", cut(include.lowest=TRUE), addLegend = FALSE, colourPalette = c('#FFFFFF','#FFFFCC', '#FFFF00', '#FFA500', 'red'), borderCol = "black", oceanCol = "#bee7ff", missingCountryCol = "#DCDCDC")
## using catMethod='categorical' for non numeric data in mapCountryData
#ADIÇÃO DA LEGENDA#
MAP4$legendText <- c('Muito Baixa (0-28)','Baixa (29-48)','Mediana (49-68)','Elevada (69-88)','Muito Elevada (89-100)')        
#CHAMADA DA LEGENDA#
do.call( addMapLegendBoxes, c(MAP4,cex=0.6, pt.cex = 1.6, x='bottomleft',title="Níveis de Democracia",horiz=FALSE))

Finalmente, com relação ao gráfico da distribuição da democracia pelo globo, constata-se que praticamente toda a Europa e Oceania possuem níveis muito elevados de democracia. Já na América do Sul, a maioria dos países apresentaram níveis elevados de democracia, enquanto que na Ásia, grande parte dos países analisados possuem níveis muito baixos de democracia, isto é, forte presença de politicas absolutistas ou ditatorial.

Regressão Linear - Verificação de Pressupostos

Pressuposto de Normalidade

Conforme mencionado na metodologia, definida a regra de decisão para verificação do pressuposto de normalidade da variável Integridade, aplicou-se o teste de normalidade de Shapiro-Wilk na mesma cujo resultado é apresentado a seguir.

#TESTE DE NORMALIDADE VARIÁVEL INTEGRIDADE#
normalityTest(~log(Integridade), test="shapiro.test", data=BD)
## 
##  Shapiro-Wilk normality test
## 
## data:  log(Integridade)
## W = 0.9629, p-value = 0.006503

Com base no resultado apresentado, percebeu-se que o p-valor encontrado no teste foi de 0,006503, que é menor do que 0,05 (valor estabelecido na regra de decisão). Logo, a primeiro momento, rejeitou-se a hipótese nula, isto é, a variável Integridade a princípio não segue uma distribuição normal.

Teste Shapiro-Wilk para os Resíduos

Em seguida, conforme exposto na metodologia, aplicou-se o teste de Shapiro Wilk nos resíduos (erros) oriundos do modelo de regressão linear entre a variável de interesse (Integridade) e as demais variáveis quantitativas (PIB Per Capita, IDH e Democracia). Os resultados do modelo de regressão linear realizado e o teste de Shapiro-Wilk são apresentados adiante.

#MODELO DE REGRESSÃO LINEAR#
RegModel.1 <- lm(Integridade~Democracia+IDH+PIB.Per.Capita, data=BD)
summary(RegModel.1)
## 
## Call:
## lm(formula = Integridade ~ Democracia + IDH + PIB.Per.Capita, 
##     data = BD)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -21.180  -6.126  -0.587   5.969  18.582 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    -4.706e+00  7.233e+00  -0.651 0.516783    
## Democracia      2.051e-01  3.436e-02   5.969 4.01e-08 ***
## IDH             3.942e+01  1.081e+01   3.647 0.000431 ***
## PIB.Per.Capita  4.489e-04  5.605e-05   8.008 2.73e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.493 on 96 degrees of freedom
## Multiple R-squared:  0.8323, Adjusted R-squared:  0.8271 
## F-statistic: 158.8 on 3 and 96 DF,  p-value: < 2.2e-16
#TESTE DE NORMALIDADE RESÍDUOS VARIÁVEL INTEGRIDADE#
normalityTest(~ RegModel.1[["residuals"]], test="shapiro.test", data=BD)
## 
##  Shapiro-Wilk normality test
## 
## data:  RegModel.1[["residuals"]]
## W = 0.98828, p-value = 0.5294

Como o p-valor do teste de normalidade dos resíduos é 0,5294, isto é, maior que 0,05 (valor estabelecido na regra de decisão), não foi possível rejeitar a hipótese nula. Em outras palavras, os resíduos da variável Integridade seguem uma distribuição normal, tornando a variável em si também normal em sua distribuição.

Gráfico de Comparação de Quantis (QQ-Plot)

Quanto ao gráfico de QQ-Plot oriundo também dos resíduos do modelo de regressão linear gerado, este é apresentado a seguir:

#GRÁFICO DE COMPARAÇÃO DE QUANTIS#
qqPlot(RegModel.1, simulate=TRUE, id=list(method="y", n=2), main="Gráfico QQ-Plot", ylab="Resíduos da Regressão", xlab="Quantis")

## [1]  1 21

O gráfico apresenta pontos que representam os valores do banco de dados, uma linha central que representa uma distribuição normal teórica e, por fim, duas linhas pontilhadas que ilustram o intervalo com 95% de confiança. Vale ressaltar que, quanto mais próximo da linha central os pontos se encontram, maior a evidência da normalidade e, de igual forma, se os mesmos estão dentro do intervalo (linhas tracejadas), semelhantemente maior é a evidência de normalidade. Logo, a partir do gráfico conclui-se que a distribuição é normal.

A partir dos dois métodos utilizados percebe-se que o resultado da verificação da normalidade é robusto, ou seja, a distribuição é normal independente do método utilizado.

Pressuposto de Homocedasticidade

O resultado do teste de Breusch-Pagan é apresentado adiante.

#VERIFICAÇÃO DE HOMOCEDASTICIDADE - BREUSCH PAGAN#
library(zoo, pos=18)
library(lmtest, pos=18)
bptest(Integridade ~ Democracia + IDH + PIB.Per.Capita, varformula = ~ 
  fitted.values(RegModel.1), studentize=FALSE, data=BD)
## 
##  Breusch-Pagan test
## 
## data:  Integridade ~ Democracia + IDH + PIB.Per.Capita
## BP = 2.2481, df = 1, p-value = 0.1338

Como o p-valor do teste de homocedasticidade é 0,1338, isto é, maior que 0,05 (ver regra de de decisão teste homocedasticidade), não foi possível rejeitar a hipótese nula, ou seja, a variância dos resíduos são iguais.

Pressuposto de Independência entre as Variáveis

No que diz respeito a independência entre as variáveis, assim como foi mencionado na metodologia, como os dados dos países foram coletados em um determinado período logo, as observações são independentes entre si.

Modelos de Regressão Linear e seus Diagramas de Dispersão

Sobre os modelos de regressão linear e seus respectivos diagramas de dispersão, estes encontram-se exibidos abaixo.

Integridade x PIB Per Capita

#CONSTRUÇÃO DO MODELO DE REGRESSÃO ENTRE INTEGRIDADE E PIB PER CAPITA#
RegModel.2 <- lm(Integridade~PIB.Per.Capita, data=BD)
summary(RegModel.2)
## 
## Call:
## lm(formula = Integridade ~ PIB.Per.Capita, data = BD)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -36.697  -7.964   0.763   7.418  24.556 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    3.244e+01  1.508e+00   21.51   <2e-16 ***
## PIB.Per.Capita 7.482e-04  4.872e-05   15.36   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11.12 on 98 degrees of freedom
## Multiple R-squared:  0.7064, Adjusted R-squared:  0.7034 
## F-statistic: 235.8 on 1 and 98 DF,  p-value: < 2.2e-16
#CONSTRUÇÃO DO DIAGRAMA DE DISPERSÃO ENTRE INTEGRIDADE E PIB PER CAPITA#
scatterplot(PIB.Per.Capita~Integridade, regLine=TRUE, smooth=FALSE, 
  boxplots=FALSE, data=BD, main="Diagrama de Dispersão Integridade x PIB Per Capita", pch=16)

Integridade x IDH

#CONSTRUÇÃO DO MODELO DE REGRESSÃO ENTRE INTEGRIDADE E IDH#
RegModel.3 <- lm(Integridade~IDH, data=BD)
summary(RegModel.3)
## 
## Call:
## lm(formula = Integridade ~ IDH, data = BD)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -27.5216  -8.9653  -0.5042   9.9748  27.0415 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -52.957      7.963   -6.65 1.67e-09 ***
## IDH          129.407     10.072   12.85  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 12.53 on 98 degrees of freedom
## Multiple R-squared:  0.6275, Adjusted R-squared:  0.6237 
## F-statistic: 165.1 on 1 and 98 DF,  p-value: < 2.2e-16
#CONSTRUÇÃO DO DIAGRAMA DE DISPERSÃO ENTRE INTEGRIDADE E IDH#
scatterplot(IDH~Integridade, regLine=TRUE, smooth=FALSE, boxplots=FALSE, 
  data=BD, main="Diagrama de Dispersão Integridade x IDH", pch=16)

Integridade x Democracia

#CONSTRUÇÃO DO MODELO DE REGRESSÃO ENTRE INTEGRIDADE E DEMOCRACIA#
RegModel.4 <- lm(Integridade~Democracia, data=BD)
summary(RegModel.4)
## 
## Call:
## lm(formula = Integridade ~ Democracia, data = BD)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -21.628 -12.321  -1.355  10.733  42.790 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 19.24736    3.27575   5.876 5.80e-08 ***
## Democracia   0.46837    0.04766   9.827 2.87e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14.57 on 98 degrees of freedom
## Multiple R-squared:  0.4963, Adjusted R-squared:  0.4912 
## F-statistic: 96.57 on 1 and 98 DF,  p-value: 2.87e-16
#CONSTRUÇÃO DO DIAGRAMA DE DISPERSÃO ENTRE INTEGRIDADE E DEMOCRACIA#
scatterplot(Democracia~Integridade, regLine=TRUE, smooth=FALSE, 
  boxplots=FALSE, data=BD, main="Diagrama de Dispersão Integridade x Democracia", pch=16)

Diante dos resultados apresentados para os modelos e gráficos gerados, constata-se que em todos os casos a correlação entre as variáveis é positiva e crescente, confirmando o que foi exposto na matriz de correlação entre as variáveis. Também vale ressaltar que dentre as regressões feitas, a que possui maior coeficiente de determinação R² (Multiple R-squared) foi a mesma realizada entre a variável Integridade e PIB Per Capita, com valor de 0,7034. Assim, tem-se que a qualidade do ajustamento da regressão entre as referidas variáveis é de 70,34%, isto é, 70,34% da variável independente (Integridade) explica a variável dependente (PIB Per Capita).

Integridade x PIB Per Capita + IDH + Democracia

#MODELO DE REGRESSÃO LINEAR#
RegModel.1 <- lm(Integridade~Democracia+IDH+PIB.Per.Capita, data=BD)
summary(RegModel.1)
## 
## Call:
## lm(formula = Integridade ~ Democracia + IDH + PIB.Per.Capita, 
##     data = BD)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -21.180  -6.126  -0.587   5.969  18.582 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    -4.706e+00  7.233e+00  -0.651 0.516783    
## Democracia      2.051e-01  3.436e-02   5.969 4.01e-08 ***
## IDH             3.942e+01  1.081e+01   3.647 0.000431 ***
## PIB.Per.Capita  4.489e-04  5.605e-05   8.008 2.73e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.493 on 96 degrees of freedom
## Multiple R-squared:  0.8323, Adjusted R-squared:  0.8271 
## F-statistic: 158.8 on 3 and 96 DF,  p-value: < 2.2e-16

Através do modelo de regressão linear múltipla realizado inicialmente, confirma-se o que foi apresentado nos resultados individuais para cada modelo de regressão simples, onde a variável integridade é explicada de forma positiva e crescente pelas variáveis PIB Per Capita, IDH e Democracia.

CONCLUSÃO

Através dos resultados apresentados nesta pesquisa, conclui-se que a falta de integridade dos países esta significativamente atrelada ao PIB Per Capita do mesmo, ou seja, o valor dos bens produzidos por cada habitante num determinado período, se todos tem partes iguais. Em termos práticos, segundo Cotarelli et al (2019), quanto maior o PIB produzido por uma pessoa maior tende a ser a qualidade de vida e o acesso a serviços como transporte, saúde, alimentação, entre outros. Logo, ainda segundo a referida autora, para se contornar o problema da falta de integridade dos países é necessário que os governos atentem para as questões de:

BIBLIOGRAFIA

COTARELLI, Natália et al.. Entenda o PIB. Disponível em: https://g1.globo.com/economia/pib-o-que-e/platb/. Acesso em: 28 jun. 2019;

OLIVEIRA, A. A.. O Teste de Integridade dos Agentes Públicos como Ferramenta de Combate à Corrupção: Validade e Efetividade;

OSCE, Best Pratices in Combating Corruption. Organization for Security and Cooperation in Europe. Viena, 2004;