Exploración de data

Column

Variables a utilizar

En la data se encuentran, aparte de las variables a analizar, las variables de año, país y región a la que pertenece cada uno.

Las variables a utilizar serán el consumo de gobierno, el crecimiento económico, la regulación económica, la libertad de expresión y el dinero sólido. El consumo de gobierno será utilizado como variable dependiente, se analizará si las otras variables la explican. El dinero sólido será la variable de control.

Una breve explicación de lo que significa cada variable, a mayor el concepto de la variable, mayor será el indice:

  • Consumo de gobierno: Mide el consumo del gobierno según al año analizado. Proporción del PBI utilizado del gobierno.

  • Crecimiento económico: Mide el crecimiento económico del país respecto al año anterior, toma al PBI como indice.

  • Regulación económica: Mide la regulacion economica interna en general de un país. A mayor la variable, más está limitado el mercado económico.

  • Libertad de expresión: Mide la libertad de expresión. O sea a mayor el indice, mayor será la libertad de movimientos para expresarse.

  • Dinero sólido: Signufica el valor real inmune al cambio del poder adquisitivo en un país como por ejemplo a las divisas. Mediante este indice se podría predecir la dirección respecto a un aumento o disminución.

Todas en escala del 0-10. A mayor el indíce, mayor será el concepto.

Los gráficos analizan las variables solo para el 2021 como explolatorio.

Grafico de proporción de paises por regiones

Column {data-width=500}

Consumo de gobierno por regiones

Crecimiento economico por regiones

Regulación economica por regiones

Libertad de expresión por regiones

Dinero sólido por regiones

Descripción de variables

Column

Variable dependiente e independiente

La variable de consumo de gobierno será objeto de este análisis para ver si las variables seleccionadas pueden afectarla. Por otro lado, ya es necesario la vinculación de la variable central con las independientes y la de control.

De por sí, la data en el último año actualizado, 2021, provee una variable confiable al tener solo 5 casos en el que es 0 (rango del 0-10). Su media es es 5.28, cerca a la mediana, 5.37. Esta tendencia puede significar que el consumo de gobierno de los países se está minimizando y esto puede aludir en la efectividad del manejo economico. Esto se puede decir ya que 10 años antes, su media se encontraba en 5.62 y la mediana 5.97.

Boxplot de consumo de gobierno por regiones en el 2021

Column

Summary de variables númericas

Str de todas las variables

Column {data-width=500}

Con crecimiento económico

Con regulación económica

Con Libertad de expresión

Con Dinero sólido

Modelos de regresión

Column

Gauss

En una ecuación seleccionando como objeto al consumo de gobierno, se ve que todas las variables son negativas y que la regulación económica es la única variable significativa. Sin embargo en primera estancia se da a cuenta que se deba estandarizar para ver su verdadero efecto. El R2 es muy bajo.

A continuación, la segunda regresión muestra un cambio significativo en el AIC. Además se ve que la regulación económica es la única que aún tiene gran efecto con -0.264 con significancia de 0.01.

El tercer modelo que no está estandarizado muestra que ninguna variable es significativa debido a la variable de control, dinero sólido. Sin embargo, este último es el único significativo con 0.05. El R2 se ve incrementado ligeramente.

Por último, están los dos modelos regresionados. Se puede ver que se todas las variables con excepción del dinero sólido es la única significante. El R2 es ligeramente mayor por la variable de control.

En esta variable también se toma la data filtrada del 2021. Existen 165 variables.

Column {data-width=400}

Regresión

Regresión solo con variables independientes
OLS
(Intercept) 10.278***
(1.280)
Crecimiento_eco -0.057
(0.111)
Regulacion_eco -0.586**
(0.201)
Libertad_exp -0.120
(0.092)
Num.Obs. 165
R2 0.123
R2 Adj. 0.106
AIC 756.5
BIC 772.1
Log.Lik. -373.268
F 7.507
RMSE 2.32
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Variable dependiente= Consumo de gobierno; Variables independientes= Crecimiento economico, Regulación económica y Libertad de expresión

Regresión estandarizada

Regresión solo con variables independientes estandarizadas
OLS
(Intercept) 0.000
(0.074)
scale(Crecimiento_eco) -0.039
(0.076)
scale(Regulacion_eco) -0.264**
(0.090)
scale(Libertad_exp) -0.115
(0.088)
Num.Obs. 165
R2 0.123
R2 Adj. 0.106
AIC 455.6
BIC 471.2
Log.Lik. -222.822
F 7.507
RMSE 0.93
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Variable dependiente= Consumo de gobierno; Variables independientes= Crecimiento economico, Regulación económica y Libertad de expresión

Regresión con variable de control

Regresión solo con variables independientes y control
Regresión Regresión con variable de control
(Intercept) 10.278*** 10.275***
(1.280) (1.267)
Crecimiento_eco -0.057 0.037
(0.111) (0.118)
Regulacion_eco -0.586** -0.265
(0.201) (0.249)
Libertad_exp -0.120 -0.124
(0.092) (0.091)
Dinero_sol -0.351*
(0.164)
Num.Obs. 165 165
R2 0.123 0.147
R2 Adj. 0.106 0.126
AIC 756.5 753.9
BIC 772.1 772.5
Log.Lik. -373.268 -370.952
F 7.507 6.894
RMSE 2.32 2.29
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Variable dependiente= Consumo de gobierno; Variables independientes= Crecimiento economico, Regulación económica y Libertad de expresión; Variable de control= Dinero sólido

Regresión con variable de control estandarizadas

Regresiones Lineales estandarizadas
Regresión estandarizada Regresión con control estandarizada
(Intercept) 0.000 0.000
(0.074) (0.073)
scale(Crecimiento_eco) -0.039 0.025
(0.076) (0.081)
scale(Regulacion_eco) -0.264** -0.119
(0.090) (0.112)
scale(Libertad_exp) -0.115 -0.119
(0.088) (0.087)
scale(Dinero_sol) -0.230*
(0.108)
Num.Obs. 165 165
R2 0.123 0.147
R2 Adj. 0.106 0.126
AIC 455.6 453.0
BIC 471.2 471.6
Log.Lik. -222.822 -220.506
F 7.507 6.894
RMSE 0.93 0.92
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Variable dependiente= Consumo de gobierno; Variables independientes= Crecimiento economico, Regulación económica y Libertad de expresión; Variable de control= Dinero sólido

Comparar modelos

Tabla ANOVA para comparar modelos
Res.Df RSS Df Sum of Sq F Pr(>F)
161 891.1630 NA NA NA NA
160 866.4904 1 24.67264 4.555876 0.0343291

Se escoge el segundo modelo.

Column {data-width=500}

Linealidad

Homocedasticidad

Normalidad


    Shapiro-Wilk normality test

data:  rl1c$residuals
W = 0.98083, p-value = 0.022

No multicolinealidad

Crecimiento_eco  Regulacion_eco    Libertad_exp      Dinero_sol 
       1.221988        2.361085        1.433327        2.168920 

Menores a 3 todos las variables.

Valores influyentes

Valores Influyentes criticos
cook.d hat

Analisis conglomerado y clusterización

Column

Analisis para pasos para la clusterización

Se empezará la clusterización y tomará como rowname una nueva variable que será el país para que se puedan clasificar los subgrupos y no se pierdan los datos.

Por un lado se ve que la correlación entre la variable central y algunos valores no son significativamente altos. La regulación económica y el dinero sólido son los valores más altos.

En el proceso de clusterización, se usa la estrategia aglomerativa. Según el algoritmo de agnes se sugiere que hayan 2 clusters. El uso del algoritmo al mismo tiempo brinda valores mal clusterizados. Hay 32 valores de esa indole.

Finalmente, se compara los clusters.

Gráfico de correlación

> Con especial enfoque en la correlación entre el consumo de gobierno respecto a las otras variables.

Column

Inicio del proceso de clusterización: se calcula número de clusters

Clusterizar vía AGNES

Consumo_gob Crecimiento_eco Regulacion_eco Libertad_exp Dinero_sol agnes
7.758824 9.783394 6.972552 6.134467 9.594155 1
3.467647 8.007513 4.836754 4.056242 7.077001 1
7.179412 7.034569 4.730618 5.539811 5.794393 1
5.691177 5.083324 5.299677 8.299711 4.041135 1
6.473529 8.776812 6.939219 7.327089 9.116849 1
2.773529 9.054364 8.124879 9.024500 9.533974 2
2.850000 7.195031 7.277437 8.954042 9.121780 2
5.770588 8.757980 6.435875 2.005701 6.922098 1
6.114706 9.630855 6.884125 9.166667 6.647761 1
3.387453 9.946282 7.375807 1.456833 9.389923 1
9.447059 9.187205 5.666930 4.065467 6.921485 1
7.685294 9.532350 7.053085 8.345167 8.380105 1
4.597059 8.390614 5.511742 1.571122 8.921535 1
2.079412 7.131524 7.695528 8.947375 9.096794 2
5.461765 9.268634 6.686046 8.888889 6.848675 1
7.941177 9.584226 6.786517 5.994565 7.147792 1
4.273529 8.085978 7.181192 6.822633 6.404401 1
5.194118 9.683447 4.810656 7.320622 9.552463 1
5.311765 8.912152 6.766043 5.998778 8.207173 1
0.000000 9.390679 6.052755 7.217300 9.284068 1
4.750000 8.470145 5.585307 6.995171 8.872048 1
0.000000 9.791632 7.660588 4.166667 8.824186 1
4.552941 8.862520 7.016358 6.198678 9.398123 2
5.351457 8.723064 6.810683 6.621032 6.667509 1
3.202941 6.627233 5.508687 1.915411 8.056838 1
3.567647 9.396087 6.743923 9.282792 9.636038 2
8.676471 7.822609 5.656288 2.961956 9.131127 1
7.614706 9.516306 6.033949 2.125694 7.158283 1
3.391176 8.540906 7.994469 9.775792 9.176755 2
9.088235 8.187364 4.877873 3.977478 6.598733 1

Column {data-width=500}

Dendograma

2 clusters

Evaluar uso

Viendo valores mal clusterizados

 [1] "Armenia"              "Bahamas, The"         "Bahrain"             
 [4] "Barbados"             "Belize"               "Bhutan"              
 [7] "Bolivia"              "Botswana"             "Brazil"              
[10] "Brunei Darussalam"    "Fiji"                 "Gambia, The"         
[13] "Georgia"              "Hong Kong SAR, China" "Kuwait"              
[16] "Lesotho"              "Liberia"              "Mauritius"           
[19] "Mongolia"             "Namibia"              "North Macedonia"     
[22] "Panama"               "Papua New Guinea"     "Peru"                
[25] "Poland"               "Romania"              "Seychelles"          
[28] "Singapore"            "South Africa"         "Thailand"            
[31] "Timor-Leste"          "United Arab Emirates"

32 países de 165

Promedio de cada cluster

  agnes Consumo_gob Crecimiento_eco Regulacion_eco Libertad_exp Dinero_sol
1     1    5.914890        8.481602       6.041727     5.256416   7.619449
2     2    3.617171        8.222307       7.462350     8.669352   9.256165

El segundo cluster se podría decir que agrupa a los mejores países respecto a las variables.