1 Introducción.

1.1 Contexto

El Grupo Banco Mundial, una de las fuentes más importantes de financiamiento y conocimiento para los países en desarrollo, tiene el compromiso de reducir la pobreza, aumentar la prosperidad compartida y promover el desarrollo sostenible.

El Grupo de gestión de datos sobre el desarrollo coordina el trabajo estadístico y mantiene una serie de bases de datos sectoriales, macroeconómicas y financieras. Los equipos recurren a ellas para preparar Estrategias de asistencia a los países, estudios sobre pobreza, documentos de investigación y otros trabajos sectoriales y económicos. El grupo se guía por estándares profesionales en la recopilación, compilación y difusión de la información para asegurar que todos los usuarios puedan confiar en la calidad e integridad del material producido.

Se tiene a disposición una base de datos que contiene una gran cantidad de información relacionada con las variables o indicadores que miden la pobreza de los países, analizando diferentes campos que serán mencionados y clasificados más adelante para darle una clasificación a dichas variables. Estos datos se clasifican por años, donde se tiene registro desde 1990 hasta el 2022.

1.2 BASE DE DATOS

Principalmente, se hizo una depuración, tomando solamente los datos de los paises del año 2013 como caso de estudio, posteriormente se eliminaron variables (columnas) que tenían muy poca o nula información, así mismo se eliminaron los paises (filas) que tuvieran tan solo un valor faltante (NA) en la base, donde se obtuvo que:

Se encontraron 338 NA en la base de datos, el cual se eliminaron las filas con estos NA de los 3024 datos iniciales (antes de eliminar los NA), quedaron 1274 datos, que representan el 42% de los datos iniciales. * de 217 observaciones, quedaron 91 en total

datos1

2 Metodologia.

2.1 Tecnica ACP

El análisis de componentes principales, es una de las técnicas de aprendizaje no supervisado. En este caso aplicaremos el PCA para hacer una reducción de variables, perdiendo la menor cantidad posible de varianza, ya que cuando contamos con un numero tan grande de variable cuantitativas, el PCA permite que transformemos estas a componentes principales que explicaran la variabilidad en los datos.

En este caso se muestra la aplicacion del PCA para encontrar patrones o agrupaciones mediante la representacion de las dos primeras componentes principales, que se utilizaran posteriormente en un analisis de clustering.

La grafica nos muestra la trasnformacion ortogonal que se ha realizado a la matriz de correlacion la varianza de cada una de las variables originales es igual a 1, por tanto la varianza de los PC, no debe ser menor a 1, porque no explicaria la suficiente variabilidad original, por tanto se ecogen, los 2 primeros componentes para realizar el analisis.

segun el criterio de kaiser,los cuatros primeros componentes cumplen con esta criterio, pero se toman los dos primeros debido a que con ellos se tiene un total de 56% de varianza para el análisis.

los siguientes graficos explican las variables que mas aportan a los componentes elegidos anteriormente:

En los siguientes diagramas mostramos la denominacion a cada factor, teniendo en cuenta las variables mas representativas:

2.2 Cluster

Cluster o agrupación, se desarrolla principalmente como un metodo para organizar grnades cantidades de datos.

la finalidad es encontrar patrones o grupos dentro de un conjunto de observaciones tal como lo vemos en el siguiente grafico:

con el grafico anterior se puede apreciar 3 grupos y se pueden vveer de forma mas clara asi:

3 Estadisticas descriptivas.

estadisticas

3.1 Variable cualitativa.

(-) Países (esta variable pasa a ser nombre de filas (rownames) ya que para realizar las técnicas solamente se necesita de variables cuantitativas

3.2 Variables cuantitativas.

3.2.1 Agricultura y desarrollo rural

(-) Acceso a la electricidad rural (% de la población rural): es el porcentaje de población rural con acceso a la electricidad.(“Acc_electric_rural”)

3.2.2 Salud

(-) Tasa de fecundidad, total (nacimientos por mujer): representa el número de hijos que nacerían de una mujer si viviera hasta el final de sus años fértiles y tuviera hijos de acuerdo con las tasas de fecundidad específicas por edad del año especificado.(“Tasa_fecundidad”)

(-) Esperanza de vida al nacer, total (años): el número de años que viviría un recién nacido si los patrones prevalecientes de mortalidad en el momento de su nacimiento permanecieran iguales durante toda su vida. (“Esperan_vida”)

(-) Tasa de mortalidad, adultos, mujeres (por 1.000 mujeres adultas): es la probabilidad de morir entre las edades de 15 y 60 años, es decir, la probabilidad de que una mujer de 15 años muera antes de cumplir los 60 años (“mortalidad_mujer”)

3.2.3 Cambio climático:

(-) Acceso a la electricidad (% de la población): es el porcentaje de la población con acceso a la electricidad (“Acc_electric”)

(-) Consumo de energía eléctrica (kWh per cápita): mide la producción de centrales eléctricas y plantas combinadas de calor y electricidad, menos las pérdidas de transmisión, distribución y transformación y el uso propio de las centrales térmicas y eléctricas.(“Consumo_energia_elec”)

(-) Superficie forestal (% de la superficie terrestre): tierra bajo rodales naturales o plantados de árboles de al menos 5 metros, ya sean productivos o no (“Superf_forestal”)

3.2.4 Medio ambiente:

(-) Acceso a combustibles y tecnologías limpias para cocinar (% de la población): es la proporción de la población total que utiliza principalmente combustibles y tecnologías de cocina limpios para cocinar. (“Acc_combust_tecnol_cocina”)

3.2.5 Infraestructura:

(-) Transporte aéreo, pasajeros transportados: Los pasajeros aéreos transportados incluyen pasajeros de aeronaves nacionales e internacionales de compañías aéreas registradas en el país.(“Trans_aereo_pasajeros_transp”)

3.2.6 Proteccion social

Empleadores, total (% del empleo total): trabajadores por cuenta propia e independientes que hacen contratación de personas (“Empleadores”)

3.2.7 Sector financiero:

(-) Gastos (% del PIB): El gasto son pagos en efectivo por las actividades operativas del gobierno en el suministro de bienes y servicios. (“Gastos”)

(-) Exportaciones de bienes y servicios (% del PIB): valor de todos los bienes y otros servicios de mercado proporcionados al resto del mundo. (“Exportaciones”)

(-) Crecimiento del PIB (%) anual: Tasa de crecimiento porcentual anual del PIB a precios de mercado basada en moneda local constante. (“Crecimiento_PIB”)

(-) Inflación, precios al consumo (%) anual: refleja el cambio porcentual anual en el costo para el consumidor promedio de adquirir una canasta de bienes y servicios (“Inflacion”)

4 Resultados principales.

4.1 Análisis de correlación.

Basándose en el gráfico y en los datos numéricos que brinda R studio, se puede inferir cómo se relaciona una variable con otra, para ello se debe tomar los valores positivos, teniendo en cuenta que entre más se acerque a 1, mayor será esa correlación de la dos variables, es decir, que tan asociadas están. Se procede a analizar las variables que tengan una correlación mayor a 0.5 para evaluar la tendencia creciente en los datos. Esto ayuda a identificar con interactúan diferentes variables para medir el crecimiento y pobreza de un país.

Dicho lo anterior se tiene que :

*Las variables de porcentaje de población tanto rural como urbana que tienen acceso a electricidad, tienen una correlación directa con un coeficiente de 0.96, donde una brinda gran información de la otra. Por consiguiente estas dos variables tienen un coeficiente de correlación aproximadamente del 0.5 con el consumo de energía eléctrica medido en kWh per cápita.

*la tasa de fecundidad (nacimientos por mujer si viviera hasta el final de sus años fértiles) tiene una correlación del 0.5 con los gastos del gobierno(% del PIB), se deduce que la razón de esto, es debido que si el gobierno invierte en la salud de la mujer y su supervivencia, la tasa de fecundidad tenderá a ser mayor. También esta tasa se correlaciona con la inflación y esperanza de vida con coeficiente aproximado a 0.5, donde tiene mucho decir que la natalidad de un país difiere mucho en su inflación, debido a la cantidad de población activa para trabajar. También si hay una esperanza de vida baja, afecta a la tasa de fecundidad, ya que un porcentaje considerable de las mujeres no vivirán hasta los últimos años de fertilidad.

*la superficie forestal tiene una correlación aproximada del 0.5 con los gastos públicos del gobierno

La demanda energética de un país se relaciona mucho con su PIB. El consumo de energía por habitante constituye, por tanto, uno de los indicadores más fiables del grado de desarrollo económico de una sociedad. Esta relación puede comprobarse analizando los consumos de energía por áreas geográficas, donde los países con mayor consumo per cápita tienen niveles más altos de bienestar económico. La inflación tiene una gran relación con el gasto público del gobierno, la tasa de fecundidad y la esperanza de vida de un país

4.2 Resultados pca

eig.val
contribucionpaises
##                               Dim.1        Dim.2
## Albania                0.3348876866 9.109580e-05
## Armenia                0.0165104466 1.297973e-02
## Australia              0.5472881139 4.957764e-01
## Austria                1.0942087416 2.779689e-01
## Azerbaijan             0.0010343831 9.978487e-03
## Bangladesh             0.9455223241 5.936749e-01
## Belarus                0.0068335082 1.580655e-03
## Belgium                0.9817957016 6.047750e-01
## Bosnia and Herzegovina 0.4422120961 1.349566e-01
## Botswana               3.4668110957 8.695536e-01
## Brazil                 0.0201534319 1.822408e+00
## Bulgaria               0.3295885302 4.604011e-01
## Cambodia               1.0305440997 2.291315e-01
## Cameroon               4.8540850346 3.713555e-01
## Canada                 0.6197969465 5.700912e-01
## Chile                  0.2085878021 4.808776e-02
## Colombia               0.0403775117 3.592932e-02
## Congo, Rep.            3.7937699114 1.062541e+00
## Costa Rica             0.2035250235 1.003782e-04
## Cote d'Ivoire          6.3521879423 1.591308e-01
## Croatia                0.5888090701 2.172249e-01
## Cyprus                 1.5102371310 7.606821e-01
## Czechia                0.6847317292 4.216933e-01
## Dominican Republic     0.0562183907 2.689816e-02
## Egypt, Arab Rep.       0.0919405629 2.023247e-01
## El Salvador            0.0284678866 8.044232e-02
## Estonia                0.4163828749 6.275784e-01
## Ethiopia               5.6356009027 8.767908e-02
## Finland                1.0132723599 1.406108e-01
## France                 0.8638266649 3.000650e-02
## Gabon                  1.6478468966 7.742170e-01
## Georgia                0.0165526588 1.249250e-01
## Germany                0.7180518505 5.108694e-01
## Ghana                  2.9181362604 1.682927e-03
## Greece                 1.5455598050 5.182115e-01
## Guatemala              0.3561271425 5.473796e-03
## Honduras               0.0910589151 1.527042e-01
## Hungary                0.4493040103 8.432107e-01
## Iceland                1.7740985116 3.568965e-02
## India                  0.8343668598 2.963724e+01
## Indonesia              0.2467747592 2.423597e+00
## Ireland                0.9789733447 1.416724e-01
## Israel                 0.3444711020 2.372009e-03
## Italy                  1.1989606303 4.310357e-07
## Jamaica                0.0028142718 2.645390e-03
## Japan                  0.6191143193 1.762455e+00
## Jordan                 0.0041931145 3.782744e-03
## Kazakhstan             0.1643416276 4.349965e-02
## Korea, Rep.            0.7528435127 1.264059e-01
## Latvia                 0.1998841324 8.193803e-01
## Lebanon                0.1472118680 2.938293e-02
## Lithuania              0.0780041534 6.364333e-01
## Luxembourg             1.3694866857 2.375424e+00
## Malaysia               0.0589420011 3.886633e-03
## Malta                  1.1124729298 1.628428e+00
## Mauritius              0.0533188380 3.208018e-02
## Moldova                0.1303014213 9.530057e-04
## Mongolia               1.4650375062 1.551706e-03
## Morocco                0.0008662152 3.513585e-04
## Myanmar                1.9205723277 3.786697e-03
## Namibia                5.0774716931 1.344345e+00
## Nepal                  0.6766097514 9.752463e-02
## Netherlands            1.0475478444 2.247753e-01
## New Zealand            0.5530279715 1.527123e-04
## Paraguay               0.0973874959 3.974283e-03
## Peru                   0.0547306827 2.259865e-02
## Philippines            0.3081503465 3.702437e-01
## Poland                 0.3997601064 1.082685e-01
## Portugal               1.0252697214 2.337103e-01
## Romania                0.1828678865 5.887887e-02
## Russian Federation     0.0153014336 6.482061e-01
## Saudi Arabia           0.1537118609 2.005865e-02
## Serbia                 0.2012186519 4.643461e-02
## Singapore              0.9298777860 9.512827e-01
## Slovak Republic        0.6031202541 1.009286e+00
## Slovenia               1.1940213518 1.134388e+00
## South Africa           1.2209598577 1.060040e-01
## Spain                  1.0707938586 2.989368e-02
## Sudan                  5.5586361499 7.065608e-01
## Sweden                 0.9561516783 4.504042e-05
## Switzerland            0.7578403017 5.537106e-03
## Tanzania               6.4675618950 1.448874e-01
## Thailand               0.0978469375 1.637156e-02
## Togo                   4.6942696337 8.378385e-01
## Turkiye                0.0138477442 1.026134e+00
## Ukraine                0.0721827769 2.690049e-01
## United Arab Emirates   0.3475172436 1.021691e-01
## United Kingdom         0.6574465305 5.575650e-01
## United States          0.5829693241 3.457148e+01
## Uzbekistan             0.2688037739 4.481497e-01
## Zambia                 6.2353007813 8.073670e-01

4.3 Graficos pca.

4.3.1 Individuos

En general, las observaciones tienden a situarse en una distancia proxima en esta representacion de dos dimensiones con las dos primeras componentes principales.

4.3.2 Variables

En este grafico podemos observer que para poder que la variable exportaciones tenga una explicacion mas clara no basta con los dos factores que se seleccionaron, sin embargo las demas variables se ven con un % de explicacion mas significativo.

4.3.3 Biplot

Fijandonos en el angulo de los vectores y su longitud vemos que es muy claro que todo el porcentaje de varianza en la componente 2 se ve explicado mayoritariamente por las variables Acc_combust_tecnol_cocina y mortalidad_mujer y aunque la longitud de la variable importaciones no es tan pronunciada, su angulo demuestra que su aporte es importante para la creacion de esta componente.

4.4 Clustering

4.4.1 Circulo de correlación

A qué variables explican mejor cada componente principal, eje x= PC1, eje y=PC2 Componente 1: Crecimiento PIB, Acceso electricidad rural, consumo de energía eléctrica, pasajeros transportados en vuelos aéreos, esperanza de vida, gastos, etc Componente 2: Acceso a combustible y energías limpias para cocinar, mortalidad mujer, empleadores se logra evidenciar que la variable exportaciones no es muy bien explicada por los componentes

4.4.2 Grafico de los individuos

coordenadas de los individuos que más optan por las variables que arroja el círculo de correlación

4.4.3 Grafico de variables

COMO LAS VARIABLES SON EXPLICADAS POR LOS COMPONENTES

4.4.3.1 GRÁFICO 1:

PC1 Y PC2

4.4.3.2 GRÁFICO 2:

PC2 Y PC1 (SE INTERCAMBIAN LOS EJES de los componentes DEL GRÁFICO 1)

4.4.4 Grafico de conjuntos

4.4.4.1 Grafico 1

Cómo se relacionan las variables e individuos, es decir, que tan significativo es el valor de una variable en un individuo (país) y que tanto lo explica.

4.4.4.2 Grafico 2

Los dos gráficos muestran lo mismo, solamente que se cambian sus ejes de sus componentes

4.4.5 Grafico de clases

4.4.5.1 Grafico 1

Representación de la tendencia que tienen los individuos en cada grupo o clase y su relación con los componente principales

4.4.5.2 Grafico 2

igualmente, se rotan los ejes de los componentes para el segundo gráfico

5 Conclusiones.

5.1 Class1:

los individuos o países que componen la clase 1 son aquellos que tuvieron un mayor crecimiento en su PIB, es decir que son países que presentaron un mayor bienestar económico específicamente en el año 2013. Su población tanto rural como urbana, tiene mayor acceso a la energía eléctrica, por ende, se deduce que hay un gran consumo de energía eléctrica en estos países como por ejemplo, francia, chile, japón, italia, corea, etc. Anteriormente se vio cómo estas variables de energía eléctrica se relacionan mucho con el crecimiento del PIB de los países. También tiene gran concentración en empleadores, es decir empresas que generaron empleo en estos países por ese año y por último, tuvieron una gran cantidad de población que viajaron en aerolíneas, ya sean nacionales e internacionales. Hubo poco gasto público, bajo índice de inflación, que tiene sentido al decir que su crecimiento de PIB fue alto, ya que el PIB se relaciona con la inflación. Y por último,hubo poca esperanza de vida y baja tasa de fecundidad.

5.2 Class2:

A la segunda clase la componen países que tuvieron la mayor tasa de mortalidad adulta, femenina que es la probabilidad de morir entre las edades de 15 y 60 años, es decir, la probabilidad de que una mujer de 15 años muera antes de cumplir los 60 años por cada 1000 mujeres para el año 2013. En estos países se concentra un mayor porcentaje de superficie forestal-terrestre y también tienen alta tasa de fecundidad, la cual se puede decir que son países con mayor población en el mundo. Hubo poco consumo de energía eléctrica y poca cantidad de empleadores

5.3 Class3:

En esta clase, se ubican países que tuvieron un mayor cambio porcentual en los precios al consumidor en ese año, por tanto esto afectó directamente al crecimiento de su PIB. Hubo gran gasto por parte del gobierno en inversiones sociales la cual es una de las razones por la que tuvieron un alto índice de inflación, ya que, gran parte de ese gasto es derivado de deudas externas del país, la cual hace que la inflación aumente considerablemente. Su esperanza de vida y tasa de fecundidad es alta para ese año. También cuentan con un buen porcentaje de superficie forestal. Hubo poco acceso a la electricidad y por ende, un bajo consumo de esta.