Sobre el Estudio

Introducción

La pobreza es un fenómeno social y económico que afecta a una gran cantidad de personas en el mundo y se genera a partir de múltiples variables según el contexto social del territorio donde se concentra esta condición. Es un tema de gran importancia, pues los efectos generados por esta problématica impactan fuertemente en la calidad de vida, la economía y la estabilidad social de aquellas personas que atraviesan esta situación.

En este estudio se pretende hacer un análisis estadístico de cómo los factores del Producto Interno Bruto (PIB) per cápita, la tasa de desempleo, los empleados informales, las muertes por terrorismo y la desigualdad económica afectan el índice de pobreza extrema en países de todo el mundo con datos publicados en la plataforma Our World in Data del año 2020. El informe plantea un análisis descriptivo, una estimación del modelo de regresión lineal múltiple de acuerdo al contexto, la evaluación de supuestos del modelo y, finalmente, conclusiones y recomendaciones basadas en los datos obtenidos.

Palabras Clave: pobreza extrema, análisis, correlación lineal, modelo de regresión lineal.

Marco Teórico

Para el completo entendimiento del desarrollo de este estudio es necesario hacer énfasis en conceptos teóricos estadísticos y respecto al tema analizado.

  • Pobreza extrema: Es un nivel de pobreza que no se atribuye únicamente a los ingresos de las personas, pues también explica la poca o nula capacidad del individuo para satisfacer sus necesidades vitales básicas, es decir, aquellas que son imprescindibles para sobrevivir, tales como el alimento, sanidad, acceso a agua potable, educación, vivienda, entre otros.

  • PIB per cápita: El Producto Interno Bruto (PIB) es el valor total de los bienes y servicios producidos dentro del territorio durante un tiempo determinado. Ahora bien, el término “per cápita” asociado al PIB es un indicador que refleja la riqueza promedio por persona que compone la población del país.

  • Correlación lineal: Se trata de una medida estadística que indica el grado de relación lineal entre dos variables. Es decir, nos dice qué tan fuerte y en qué dirección están relacionadas dos variables cuando esa relación puede representarse con una línea recta. Esta se puede medir con 3 tipos de coeficientes, el de Pearson, Sperman y Kendall.

  • Modelo de regresión lineal: Es un método estadístico usado para modelar y analizar la relación entre una variable dependiente (Y) y una o más variables independientes (Xi), con el objetivo de explicar como cambia la variable Y cuando hay variaciones en las Xi. Es usado comúnmente para hacer predicciones y, dentro de él, se ajusta una recta que se aproxima lo máximo posible a la variación de los datos.

Metodología General

Para llevar a cabo este estudio se hizo uso de la metodología propuesta por el docente Joaqui Barandica en el curso Gestión de Datos, donde se busca desarrollar 5 pasos principales a través de pequeñas tareas que componen la realización de cada uno. Estos son:

  1. Selección del Tema y Creación de la Base de Datos
  2. Análisis Descriptivo
  3. Estimación del Modelo de Regresión Múltiple
  4. Evaluación de Supuestos del Modelo
  5. Conclusiones y Recomendaciones

Cada uno de estos pasos serán descritos a continuación.

Selección del Tema y Creación de la Base de Datos

Para llevar a cabo un estudio de modelación de regresión lineal es necesario determinar el tema por analizar y sus respectivas causantes, las cuales representarán la variable dependiente y las variables independientes respectivamente dentro del modelo. A partir de esta decisión se debe recopilar información estadística correspondiente a cada una de las variables a estudiar.

Metodología

Inicialmente se escogío la pobreza extrema mundial como tema de análisis, es decir, como la variable dependiente del modelo. Posteriormente acudimos a la plataforma Our World in Data para extraer la información estadística de esta variable.

Para crear la base de datos se realizó una lluvia de ideas con los aspectos que, como grupo, asociamos como causantes de la pobreza extrema y de los cuales fue posible encontrar información pública en la plataforma anteriormente mencionada.

Ya que cada variable independiente contaba con información no pertinente al estudio realizado, fue necesario eliminar variables de cada base individual, renombrar las variables para un mayor entendimiento y practicidad del desarrollo de la base final y filtramos los datos correspondientes al año 2020 para obtener información más precisa, actual y de mayor accesibilidad.

Por último, guardamos toda la información relevante en la base de datos final para llevar a cabo los pasos restantes a seguir.

Resultados

A continuación se presenta la base de datos final, obtenida con la recopilación de la información que se atribuye a 40 países de todo el mundo.

library(jsonlite)
library(DT)
library(dplyr)
library(ggplot2)
library(plotly)
library(scales)
library(ggcorrplot)

# POBREZA data
d1 <- read.csv("https://ourworldindata.org/grapher/share-of-population-in-extreme-poverty.csv?v=1&csvType=full&useColumnShortNames=true")

df1<-d1 %>% 
  filter(Year==2020) %>% 
  rename(POBREZA0=headcount_ratio_215) %>% 
  mutate(POBREZA=POBREZA0/100) %>% 
  select(-X990305.annotations,-POBREZA0)

# DESIGUALDAD ECONOMICA data
d2 <- read.csv("https://ourworldindata.org/grapher/economic-inequality-gini-index.csv?v=1&csvType=full&useColumnShortNames=true")

df2<-d2 %>% 
  filter(Year==2020) %>% 
  rename(DESIGUALDAD_ECONOMICA=gini) %>% 
  select(-X990179.annotations)

# NUMERO DE EMPLEADOS INFORMALES data
d3 <- read.csv("https://ourworldindata.org/grapher/informal-employment-of-total-non-agricultural-employment.csv?v=1&csvType=full&useColumnShortNames=true")

df3<-d3 %>% 
  filter(Year==2020) %>% 
  rename(EMPLEADOS_INFORMALES=X_8_3_1__sl_isv_ifem__non_agriculture__both_sexes)

# NUMERO DE MUERTES POR TERRORISMO data
d4 <- read.csv("https://ourworldindata.org/grapher/terrorism-deaths.csv?v=1&csvType=full&useColumnShortNames=true")

df4<-d4 %>% 
  filter(Year==2020) %>% 
  rename(MUERTES_TERRORISMO=total_killed)

# PIB PER CAPITA  data
d5 <- read.csv("https://ourworldindata.org/grapher/gdp-per-capita-worldbank.csv?v=1&csvType=full&useColumnShortNames=true")

df5<-d5 %>% 
  filter(Year==2020) %>% 
  rename(PIB_PER_CAPITA=ny_gdp_pcap_pp_kd)

# TASA DE DESEMPLEO data
d6 <- read.csv("https://ourworldindata.org/grapher/unemployment-rate.csv?v=1&csvType=full&useColumnShortNames=true")

df6<-d6 %>% 
  filter(Year==2020) %>% 
  rename(TASA_DESEMPLEO0=sl_uem_totl_zs) %>% 
  mutate(TASA_DESEMPLEO=TASA_DESEMPLEO0/100) %>% 
  select(-TASA_DESEMPLEO0)

BASE1<-merge(df1,df2) 

BASE2<-merge(BASE1,df3)

BASE3<-merge(BASE2,df4)

BASE4<-merge(BASE3, df5)

BASE_FINAL<-merge(BASE4,df6) %>% 
  rename(PAIS=Entity) %>% 
  select(-Code) %>% 
  mutate(TASA_DESEMPLEO=ifelse(TASA_DESEMPLEO<0.07,"BAJO","ALTO"))%>%
  mutate(DESIGUALDAD_ECONOMICA=ifelse(DESIGUALDAD_ECONOMICA<0.30,"BAJO","ALTO")) %>% 
  rename(YEAR = Year) 

datatable(BASE_FINAL)
View(BASE_FINAL)

Análisis Descriptivo

En esta sección se hace uso de la estadística descriptiva para analizar el comportamiento de los factores causales dentro del estudio mediante herramientas gráficas, tales como diagramas de bloque, histogramas, gráficas de correlación lineal, etc. Esto permite evaluar patrones de las variables independientes (cuantitativas y categóricas) y hacer supuestos sobre la correlación que tendrá cada una con la variable dependiente.

Metodología

Para comenzar a tener un acercamiento a lo que será el modelo de regresión lineal, se desarollaron dos tipos de gráficos asociados al tipo de variable independiente con la finalidad de observar su comportamiento aislado. En este caso, las variables categóricas se representan mediante diagrama de barras, mientras que las variables cuantitativas se asocian a dos diagramas de cajas y un diagrama de barras.

A cada uno de estos gráficos se le proporciona una interpretación escrita para un mejor entendimiento de la información visual proporcionada.

Resultados y Análisis Interpretativo

El comportamiento individual de las variables independientes se expresa a continuación mediante diversos gráficos y su respectiva interpretación.

PIB per cápita

grafico6<-ggplot(BASE_FINAL, aes(x ="", y = PIB_PER_CAPITA)) +
  geom_boxplot(fill = "#BB3E03", width = 0.6)+
  scale_y_continuous(labels = number)+
  labs(title = "Distribución del PIB per cápita",
       x = "",
       y = "PIB per cápita")+ 
  coord_flip()+
  theme_minimal()

ggplotly(grafico6) 

En este gráfico evidenciamos que el bigote izquierdo del diagrama es más pequeño que el derecho, pero la media se encuentra centrada teniendo una distribución asimétrica positiva “leve”. Se ve una agrupación de los datos relativamente uniforme aunque se presentan valores atípicos bastante altos. En el contexto esto nos puede indicar que en algunos países hay un PIB per capita significantemente alto a comparación de los demás.

Tasa de Desempleo

grafico9<-ggplot(BASE_FINAL, aes(x = TASA_DESEMPLEO)) + 
  geom_bar(fill = "#005F73", 
           color="#001219") +
  labs(x = "Tasa de Desempleo", 
       y = "Países", 
       title = "Frecuencia en la Tasa de Desempleo Baja y Alta")+
  theme_minimal()

ggplotly(grafico9)

En el gráfico se nos muestra que la cantidad de países con una tasa de desempleo alto es igual a la cantidad del caso contrario. A simple vista este comportamiento da a entender que la variable puede no tener una gran influencia en el índice de pobreza, pues no hay un cambio notable en las frecuencias que nos indiquen fuertes impactos para el análisis.

En este caso, la tasa de desempleo baja refleja un índice entre 0.02 y menor a 0.07, mientras que los altos varían entre 0.07 y 0.16.

Empleados Informales

grafico5<-ggplot(BASE_FINAL, aes(x = "", y = EMPLEADOS_INFORMALES)) +
  geom_boxplot(fill = "#CA6702", width = 0.6)+
  labs(title = "Distribución de Cantidad de Empleados Informales",
       x = "",
       y = "Empleados Informales")+
  coord_flip()+
  theme_minimal()

ggplotly(grafico5)

En este gráfico podemos visualizar una distribución asimétrica positiva debido al tamaño de los bigotes del diagrama. Esto nos indica que los datos por debajo de la media están mayormente agrupados respecto a aquellos que la superan. También podemos visualizar valores atípicos hacia el lado derecho del diagrama, lo cual nos podría indicar la existencia de lugares con muchos empleados informales, posiblemente debido al tipo de industrias que se concentran en estos países.

Muertes por Terrorismo

grafico7<-ggplot(BASE_FINAL, aes(x = MUERTES_TERRORISMO)) +
  geom_histogram(fill = "#EE9B00", 
                 color = "#001219") + 
  labs(title="Frecuencia de Muertes por Terrorismo",
       x = "Muertes por Terrorismo",
       y = "Países")+
  theme_minimal()

ggplotly(grafico7)

En este gráfico podemos ver una distribución asimétrica ya que la mayoría de datos se encuentran en la zona izquierda del gráfico con un valor atípico muy grande. Se puede concluir que hay muchos países en los cuales no se evidencian muertes por terrorismo y en algunos hay muy pocas; sin embargo, hay dos países con muertes preocupantemente altas, siendo de 50 y 200 respectivamente, lo cual podría ser causa de un evento terrorista de alto impacto.

Desigualdad Económica

grafico8<-ggplot(BASE_FINAL, aes(x = DESIGUALDAD_ECONOMICA)) + 
  geom_bar(fill = "#0A9396", 
           color="#001219") +
  labs(x = "Desigualdad Económica", 
       y = "Países", 
       title = "Frecuencia de la Desigualdad Económica Baja y Alta")+
  coord_flip()+
  theme_minimal()

ggplotly(grafico8)

En este gráfico podemos observar que la mayoría de casos en la muestra tienen una desigualdad económica alta y que muy pocos tienen este factor en un nivel bajo. Podríamos decir que hay una distribución asimétrica con un mayor sesgo hacia la característica alto. Esto podría ser un factor importante en el estudio, ya que podemos inferir que esta variable influye en el aumento de la pobreza debido a que una mayor desigualdad económica puede significar que los recursos no están repartidos equitativamente.

En este caso, la desigualdad económica baja refleja un índice entre 0.24 y menor a 0.30, mientras que los altos varían entre 0.30 y 0.49.

Otros Datos Interpretativos

numericas <- sapply(BASE_FINAL, is.numeric)
datos_num <- BASE_FINAL[, numericas]
datos_finales <- select(datos_num, -YEAR)

media    <- sapply(datos_finales, mean, na.rm = TRUE)
mediana  <- sapply(datos_finales, median, na.rm = TRUE)
desv     <- sapply(datos_finales, sd, na.rm = TRUE)
minimo   <- sapply(datos_finales, min, na.rm = TRUE)
maximo   <- sapply(datos_finales, max, na.rm = TRUE)

ESTADISTICAS <- rbind(
  Media               = media,
  Mediana             = mediana,
  Desviación_estándar = desv,
  Mínimo              = minimo,
  Máximo              = maximo
)
View(ESTADISTICAS)
datatable(ESTADISTICAS)

En esta tabla se guardan los datos correspondientes a las medidas de tendencia central, de desviación y el rango de los intervalos de cada una de las variables independientes cuantitativas. Se puede apreciar los valores de la media y la mediana,que en todos los casos se presenta una notable diferencia de valores. Esto confirma la existencia de puntos atípicos que alteran fuertemente la compatibilidad de ambas medidas y en el modelo una posible significancia alta sobre la pobreza extrema.

Estimación del Modelo de Regresión Múltiple

La estimación del modelo de regresión múltiple muestra dos elementos importantes para concluir la relevancia del modelo ejecutado. Estas son el número de estimación entre las variables independientes y el índice de pobreza, y el valor-p. 

Metodología

En primer lugar, se organizaron las variables categóricas para determinar el punto de partida tomado en el modelo. Seguidamente, se ejecutó.

Tras analizar los resultados y ver el grado de significancia de cada variable independiente frente a la variable dependiente, se realizaron gráficas de correlación lineal para observar la interacción de cada par de variables (que incluye la dependiente). A cada gráfica se le atribuyó su interpretación.

Modelo de regresión lineal

BASE_FINAL$TASA_DESEMPLEO<-factor(BASE_FINAL$TASA_DESEMPLEO)

BASE_FINAL$TASA_DESEMPLEO<-relevel(BASE_FINAL$TASA_DESEMPLEO,ref=2)

BASE_FINAL$DESIGUALDAD_ECONOMICA<-factor(BASE_FINAL$DESIGUALDAD_ECONOMICA)

BASE_FINAL$DESIGUALDAD_ECONOMICA<-relevel(BASE_FINAL$DESIGUALDAD_ECONOMICA,ref=2)

modelo<-lm(POBREZA ~ PIB_PER_CAPITA+DESIGUALDAD_ECONOMICA+EMPLEADOS_INFORMALES+TASA_DESEMPLEO+MUERTES_TERRORISMO, data=BASE_FINAL)
summary(modelo)
## 
## Call:
## lm(formula = POBREZA ~ PIB_PER_CAPITA + DESIGUALDAD_ECONOMICA + 
##     EMPLEADOS_INFORMALES + TASA_DESEMPLEO + MUERTES_TERRORISMO, 
##     data = BASE_FINAL)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.025477 -0.004853 -0.000297  0.003904  0.042246 
## 
## Coefficients:
##                             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)               -6.628e-03  7.456e-03  -0.889  0.38027    
## PIB_PER_CAPITA             1.795e-08  1.041e-07   0.172  0.86410    
## DESIGUALDAD_ECONOMICAALTO  9.922e-04  4.086e-03   0.243  0.80959    
## EMPLEADOS_INFORMALES       4.948e-04  1.495e-04   3.309  0.00222 ** 
## TASA_DESEMPLEOALTO         8.640e-03  4.236e-03   2.040  0.04921 *  
## MUERTES_TERRORISMO         4.965e-04  6.703e-05   7.408 1.37e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.01132 on 34 degrees of freedom
## Multiple R-squared:  0.8415, Adjusted R-squared:  0.8182 
## F-statistic:  36.1 on 5 and 34 DF,  p-value: 1.156e-12

En este modelo se observa que, de las variables independientes utilizadas, solo tres de ellas son significativas para explicar el índice de pobreza extrema mundialmente. Como se sospechó desde el análisis descriptivo, no hubo impacto de la variable desigualdad económica, pero tampoco se presentó una relación directa con el PIB per cápita. Probablemente esto último se debe a que la variable estima un promedio de ingresos por ciudadano que realmente no refleja la situación de toda la población del país, pues al tratarse de un promedio, el resultado es sensible a puntos atípicos, desplazando fuertemente los valores y convirtiéndose en una variable poco representativa.

Vemos que el factor con mayor impacto dentro del modelo son las muertes por terrorismo. Esto se puede deber especialmente a la aparición de un punto atípico exageradamente extremo y la concentración del resto de puntos en un valor específico.

Las variables de empleados informales y la tasa de desempleo también son significativas y el aumento de ambas variables provoca un incremento en el índice de pobreza extrema.

Finalmente el R ajustado nos menciona que el modelo está explicando en más del 80% la variable dependiente. Este resultado puede ser dudoso para la explicación del modelo, pues es un porcentaje bastante alto y, por una regla intrínseca general, es poco posible que un modelo de regresión lineal sea perfecto o “se acerque bastante” a serlo.

Correlación Lineal entre el Índice de Pobreza y las Variables Independientes Cuantitativas

Para crear estas gráficas se hizo uso de la prueba correlacional de Pearson, donde la correlación se mide en una escala de -1 a 1, siendo el límite inferior (-1) una correlación perfectamente negativa, el límite superior (1) una correlación perfectamente positiva y 0 una correlación inexistente.

Para el análisis y explicación de la correlación lineal en el modelo (para variables cuantitativas) se plantearon las siguientes hipótesis:

  • Hipótesis nula: No hay relación significativa lineal entre índice de pobreza y variable independiente analizada.
  • Hipótesis : La variable bajo estudio tiene relación lineal significativa con el índice de pobreza.

PIB per cápita

grafico2<-ggplot(BASE_FINAL, 
                 aes(x = PIB_PER_CAPITA, 
                     y = POBREZA)) +
  geom_point(color="#BB3E03", 
             size = 2, 
             alpha = .6) +
  geom_smooth(size = .5,
              color = "#001219",method="lm") +
  scale_y_continuous(label = scales::percent)+
  scale_x_continuous(label = scales::dollar)+
  labs(x = "PIB per cápita",
       y = "Índice de Pobreza Extrema",
       title = "PIB per cápita vs Pobreza Extrema") +
  theme_minimal()

ggplotly(grafico2)

Se observa una correlación negativa moderada, lo que indicaría que, a un aumento del PIB, el índice de pobreza tendería a disminuir. Dado que el valor-p (0.38027) es menor a 0.05, se rechaza la hipótesis nula, por lo tanto, sí se puede afirmar que existe una relación lineal significativa entre el PIB y el índice de pobreza.

Empleados Informales

grafico3<-ggplot(BASE_FINAL, 
                 aes(x = EMPLEADOS_INFORMALES, 
                     y = POBREZA)) +
  geom_point(color="#CA6702", 
             size = 2, 
             alpha = .6) +
  geom_smooth(size = .5,
              color = "#001219",method="lm") +
  scale_y_continuous(label = scales::percent)+
  labs(x = "Empleados Informales",
       y = "Índice de Pobreza Extrema",
       title = "Empleados Informales vs Pobreza Extrema") +
  theme_minimal()

ggplotly(grafico3)

Se observa una correlación positiva moderada, lo que indicaría que, a mayor cantidad de empleados informales hay en un país, el índice de pobreza tiende a aumentar. Dado que el valor-p (0.00222) es menor a 0.05, se rechaza la hipótesis nula, por lo tanto, sí se puede afirmar que existe una relación lineal significativa entre la informalidad laboral y el índice de pobreza.

Muertes por terrorismo

grafico4<-ggplot(BASE_FINAL, 
                 aes(x = MUERTES_TERRORISMO, 
                     y = POBREZA)) +
  geom_point(color="#EE9B00", 
             size = 2, 
             alpha = .6) +
  geom_smooth(size = .5,
              color = "#001219",method="lm") +
  scale_y_continuous(label = scales::percent)+
  labs(x = "Muertes por Terrorismo",
       y = "Índice de Pobreza Extrema",
       title = "Muertes por Terrorismo vs Pobreza Extrema") +
  theme_minimal()

ggplotly(grafico4)

Se observa una correlación positiva alta, lo que indicaría que a mayor número de muertes generadas por terrorismo, el índice de pobreza tendería a ser mayor. Además, dado que el valor-p (1.37e-08) es significativamente menor a 0.05, se rechaza la hipótesis nula, por lo tanto, se puede afirmar que existe una relación lineal significativa entre la variable de muertes por terrorismo y el índice de pobreza.

Evaluación de Supuestos del Modelo

En esta sección se debe confirmar la viabilidad del modelo creado a partir de cuatro supuestos básicos: la normalidad, la varianza constante, la multicolinealidad y la independencia. Se evalúan los supuestos y se interpretan de acuerdo al contexto del estudio.

Resultados

Normalidad

plot(modelo, which=2)

Para este supuesto se usa la prueba de Shapiro, la cual tiene las siguientes hipótesis:

H0: Normalidad

H1: No normalidad

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.83852, p-value = 4.792e-05

Según la prueba de Shapiro, se obtiene un valor-p (0.00004792) que es menor al valor de significancia establecido (0.05), por lo que se rechaza la hipótesis nula. Esto significa que el modelo no cumple con el supuesto de normalidad, es decir, los errores no siguen una distribución normal. En consecuencia, las pruebas estadísticas podrían no ser válidas.

Varianza Constante

plot(modelo, which=3,id.n=0)

Para este supuesto se usa la prueba de Breusch-Pagan, la cual tiene las siguientes hipótesis:

H0: Varianza constante

H1: Varianza no constante

library(lmtest)
bptest(modelo)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo
## BP = 5.8037, df = 5, p-value = 0.3258

Según la prueba de Breusch-Pagan, se obtiene un valor-p (0,3258) que es mayor al valor de significancia establecido (0.05), por lo que no se rechaza la hipótesis nula. Esto implica que el modelo cumple con el supuesto de homocedasticidad, es decir, que los errores tienen varianza constante a lo largo de los valores de las variables independientes. Por ende, los estimadores obtenidos son eficientes y las inferencias estadísticas basadas en ellos son confiables.

Linealidad

plot(modelo, which=1)

Para este supuesto se tienen las siguientes hipótesis:

H0: B1=B2=B3=0 (Ninguna variable explica a Y)

H1: B1 ≠ 0 (Alguna variable explica a Y)

library(car)
vif(modelo)
##        PIB_PER_CAPITA DESIGUALDAD_ECONOMICA  EMPLEADOS_INFORMALES 
##              2.046167              1.184843              2.578137 
##        TASA_DESEMPLEO    MUERTES_TERRORISMO 
##              1.399333              1.556519

Dado que nuestro valor-p (0.000000000001156) es menor que el valor de significancia establecido (0.05), se rechaza la hipótesis nula. En este caso, lo ideal es rechazar H0, ya que esto indica que al menos uno de los coeficientes es significativamente distinto de cero. Por lo tanto, se concluye que las variables independientes explican de manera significativa la variable dependiente.

Independencia

plot(modelo, which=4)

Para este supuesto tenemos las siguientes hipotesis:

H0: Independencia

H1: No independencia

Según el gráfico se puede observar que los errores del modelo no presentan ninguna tendencia, sino que se encuentran de forma aleatoria alrededor del 0. Esto significa que los errores son independientes y aleatorios entre sí. Por lo que no se rechaza la hipótesis nula y se concluye que el modelo cumple con el supuesto de independencia.

Conclusiones y Recomendaciones

En el informe se presentaron 5 pasos importantes para determinar factores causales del índice de pobreza extrema en 40 países de todo el mundo. Se escogieron cinco variables independientes a las cuales se les realizó un análisis descriptivo para observar su comportamiento aislado. Posteriormente se estimó el modelo y se revisaron los supuestos pertinentes para determinar su viabilidad.

Con base en los resultados obtenidos por el análisis descriptivo es posible decir que el factor con menos significancia para el modelo realizado fue la desigualdad económica, debido a la particularidad de tener una misma frecuencia en los dos extremos de esta variable.

En la evaluación del modelo se determina que, además de la desigualdad económica, el PIB per cápita tampoco explica la pobreza extrema. Por otro lado, los empleados informales y la tasa de desempleo son significativos ante el tema analizado, pero las muertes por terrorismo son completamente influyentes en la variación de la variable dependiente.

A pesar de las premisas anteriores, los supuestos del modelo no se cumplen en su totalidad, pues la característica de normalidad determina que los errores no siguen una distribución normal y, por ende, el modelo realizado no es completamente válido.

Así, concluimos que a nuestro modelo le hizo falta la implicación de otras variables que, al relacionarlas, produjeran una significancia aceptable para los resultados finales, preferiblemente donde todas influyeran en el comportamiento del índice de pobreza.

Finalmente, basados en la experiencia, consideramos que es necesario contar con más de una única plataforma para extraer información útil para el estudio, teniendo así una gama más amplia de variables a utilizar y mayormente orientadas a las limitaciones del tema analizado.