Ante un mundo que se rige por la economía, se hace necesario analizar el comportamiento de sus indicadores más importantes, como lo es el Producto Interno Bruto (PIB). Este es el más utilizado para analizar el estado económico de un país, a través del resultado final de la actividad productiva dentro del mismo, ofreciendo información sobre el tamaño de la economía y su desempeño.
Como bien sabemos, la riqueza de un país depende de variables como la capacidad productiva en un periodo, el avance tecnológico y la fuerza laboral existente. Una de las variables que influyen en el comportamiento de este indicador es el porcentaje del empleo total, el cual se utiliza para evaluar la salud y el rendimiento del mercado laboral de un país. Un aumento en esta tasa generalmente se interpreta como un signo positivo de crecimiento económico, mientras que una disminución puede indicar problemas en la economía. Bajo este contexto, se hace importante analizar el porcentaje de empleo correspondiente al empleo femenino y masculino, tanto en el sector de la agricultura como en el de la industria, dos de los sectores más importantes de la economía.
Ya que el PIB es signo fundamental del estado económico de una Nación, y está determinado por las diferentes actividades económicas (Agricultura, Industria, Turismo, entre otras), esta es una herramienta que permite hacer comparaciones frente a otros países. Sin embargo, no es definitiva la noción de que a medida que el porcentaje del empleo total aumenta, lo haga también el PIB de una nación. Por esta razón, en el siguiente trabajo se pretende analizar la influencia de ciertas variables a través de métodos de regresión lineal. Esta metodología nos permitirá modelar la relación entre las variables de interés y así determinar si podemos realizar afirmaciones sobre el resto de la población mundial. Al hacerlo, podremos evaluar la validez de nuestro análisis sobre los parámetros del modelo y comprender mejor cómo estos factores impactan en nuestra sociedad.
Las variables de interés provienen de estimaciones de la Organización Internacional del Trabajo (OIT), un organismo especializado de las Naciones Unidas que se ocupa de los asuntos relativos al trabajo y las relaciones laborales. Para la base de datos estudiada, se presentan a continuación las variables seleccionadas con sus respectivas unidades.
Para el desarrollo del modelo se toma el “PIB por persona empleada” como la variable que pretendemos explicar, también conocida como variable de respuesta. Esta variable expresa cuánto de la producción económica de un país se le atribuye a cada persona empleada. Se expresa en PPA (Paridad del Poder Adquisitivo) en dólares constantes de 2017, una medida que establece la equivalencia de los costes o transacciones entre las naciones para que sean comparables. Por ejemplo, lo ideal es que un ordenador o el salario promedio tengan el mismo precio en Nueva York y en Hong Kong. Si su precio es de 500 dólares estadounidenses en Nueva York y el mismo ordenador o salario vale 2000 dólares hongkoneses en Hong Kong, la teoría de la PPA dice que el tipo de cambio debería ser de 4 dólares hongkoneses por cada dólar estadounidense. De esta manera se logra expresar el PIB de cada país con su equivalencia en el precio del dólar estadounidense de 2017.
Además, se consideró la variable “Empleados Totales”, ya que esta representa la fuerza laboral activa de una nación, y su contribución al PIB se deriva de su capacidad para producir bienes y servicios. El número de empleados totales es un indicador significativo para medir la capacidad productiva, debido a que a mayor cantidad de trabajadores, en teoría, debería existir un mayor nivel de producción.
Del mismo modo, seleccionamos las variables “Empleados.en.agricultura.hombres”, “Empleados.en.agricultura.mujeres”, “Empleados.en.industria.hombres” y “Empleados.en.industria.mujeres” como variables predictoras. La elección de estas cuatro variables se basa en su influencia para comprender la dinámica del PIB por persona empleada. Cada una de estas variables está relacionada con la estructura económica de un país, reflejando la distribución de empleos en sectores claves como la agricultura y la industria, así como las diferencias de género en la fuerza laboral. Permitiéndonos así entender cómo la estructura de la fuerza laboral, compuesta por hombres y mujeres en estos sectores, pueden afectar la productividad económica de una nación.
Figura 1: Mapa mundial de clasificación ecónomica .
La clasificación de un país como “emergente” o “desarrollado” generalmente se basa en una serie de indicadores económicos y sociales que evalúan el nivel de desarrollo económico y bienestar de la población. Sin embargo, no existe una definición única ni un conjunto fijo de criterios. En nuestro caso, para determinar la clasificación de los países como Desarrollados o Emergentes en el año 2014, hemos empleado el Índice de Desarrollo Humano (IDH), un indicador creado por el Programa de Naciones Unidas para el Desarrollo (PNUD). Desde hace tres décadas el IDH se utiliza para elaborar un ranking mundial del desarrollo humano, dando a conocer el grado de progreso de cada país. Esta clasificación anual permite, por un lado, seguir la evolución de un país a lo largo del tiempo y, por otro, comparar su situación con la del resto de países. Así, los gobiernos pueden comprender mejor sus opciones de crecimiento y las ayudas internacionales se pueden adjudicar con criterios. Aunque no existe total consenso sobre un indicador específico, se suele considerar que un país que tiene un IDH muy alto según la ONU, tiene el estatus de economía avanzada sobre la base de los estatutos del FMI y además posee ingresos altos según el Banco Mundial, es efectivamente un país desarrollado.
Tabla 1: Clasificación de los países según su nivel de economía. .
| Año | País | Clasificación |
|---|---|---|
| 2014 | Albania | emergente |
| 2014 | Argentina | emergente |
| 2014 | Austria | desarrollado |
| 2014 | Belgium | desarrollado |
| 2014 | Bosnia and Herzegovina | emergente |
| 2014 | Brazil | desarrollado |
| 2014 | Bulgaria | desarrollado |
| 2014 | Colombia | emergente |
| 2014 | Croatia | desarrollado |
| 2014 | Cyprus | desarrollado |
| 2014 | Czechia | desarrollado |
| 2014 | Denmark | desarrollado |
| 2014 | Dominican Republic | emergente |
| 2014 | Ecuador | emergente |
| 2014 | El Salvador | emergente |
| 2014 | Estonia | desarrollado |
| 2014 | Finland | desarrollado |
| 2014 | France | desarrollado |
| 2014 | Germany | desarrollado |
| 2014 | Greece | desarrollado |
| 2014 | Guatemala | emergente |
| 2014 | Honduras | emergente |
| 2014 | Hungary | desarrollado |
| 2014 | Iceland | desarrollado |
| 2014 | Ireland | desarrollado |
| 2014 | Italy | desarrollado |
| 2014 | Latvia | desarrollado |
| 2014 | Lithuania | desarrollado |
| 2014 | Luxembourg | desarrollado |
| 2014 | Mexico | emergente |
| 2014 | Montenegro | emergente |
| 2014 | Netherlands | desarrollado |
| 2014 | North Macedonia | emergente |
| 2014 | Norway | desarrollado |
| 2014 | Panama | emergente |
| 2014 | Poland | emergente |
| 2014 | Portugal | desarrollado |
| 2014 | Romania | emergente |
| 2014 | Russian Federation | emergente |
| 2014 | Serbia | emergente |
| 2014 | Slovak Republic | desarrollado |
| 2014 | Slovenia | desarrollado |
| 2014 | Spain | desarrollado |
| 2014 | Sweden | desarrollado |
| 2014 | Switzerland | desarrollado |
| 2014 | Turkiye | emergente |
| 2014 | United Kingdom | desarrollado |
| 2014 | United States | desarrollado |
La clasificación de un país como “emergente” o “desarrollado” generalmente se basa en una serie de indicadores económicos y sociales que evalúan el nivel de desarrollo económico y bienestar de la población. Sin embargo, no existe una definición única ni un conjunto fijo de criterios. En nuestro caso, para determinar la clasificación de los países como Desarrollados o Emergentes en el año 2014, hemos empleado el Índice de Desarrollo Humano (IDH), un indicador creado por el Programa de Naciones Unidas para el Desarrollo (PNUD). Desde hace tres décadas el IDH se utiliza para elaborar un ranking mundial del desarrollo humano, dando a conocer el grado de progreso de cada país. Esta clasificación anual permite, por un lado, seguir la evolución de un país a lo largo del tiempo y, por otro, comparar su situación con la del resto de países. Así, los gobiernos pueden comprender mejor sus opciones de crecimiento y las ayudas internacionales se pueden adjudicar con criterios. Aunque no existe total consenso sobre un indicador específico, se suele considerar que un país que tiene un IDH muy alto según la ONU, tiene el estatus de economía avanzada sobre la base de los estatutos del FMI y además posee ingresos altos según el Banco Mundial, es efectivamente un país desarrollado.
El desarrollo de este trabajo se llevó a cabo utilizando la herramienta Rstudio. En primer lugar, se realizó una previa limpieza de datos, en la que se identificaron y eliminaron datos faltantes. Posteriormente, se realizó la filtración de datos, enfocándonos específicamente en el año 2014. Luego, se llevó a cabo la selección de la variable de respuesta y las cinco variables predictoras que se consideraran relevantes para nuestro análisis. Además, se clasificaron los países según su nivel de economía, lo que permitió estratificar los datos y facilitar una comprensión más profunda. Adicionalmente, se efectuó un análisis exploratorio y se calcularon estadísticas descriptivas para obtener una visión completa de la distribución y características de las variables.
Dado que el objetivo principal de este estudio es analizar la correlación entre dos variables, se implementó la técnica de regresión lineal; este es un método de modelado estadístico que se emplea para describir una variable de respuesta continua como una función de una o varias variables predictoras, lo que permite una comprensión más profunda de las relaciones entre las variables estudiadas.
Las técnicas de regresión lineal permiten crear un modelo lineal. Este modelo describe la relación entre una variable dependiente Y (también conocida como la respuesta) como una función de una o varias variables independientes Xk (denominadas predictores). La ecuación general correspondiente a un modelo de regresión lineal es:
Donde β representa las estimaciones de parámetros lineales que se deben calcular y ϵ representa los términos de error debido a factores no controlados.
Con la base teórica de este modelo se pretende determinar si existe una relación entre las cinco variables elegidas y la variable de respuesta; y cuán estrecha es esta relación.
A continuación se presenta los gráficos de dispersión que relacionan El PIP por persona empleada y los porcentajes de empleabilidad correspondiente a cada una de las variables, además de reportar el Coeficiente de Correlación (CC)y su respectiva interpretación:
Figura 2.1 : Gráfico del % de empleo total vs. PIB por persona empleada.
De estos gráficos se puede deducir que para todos los casos persiste una relación negativa. Esto significa que hay una tendencia a que, a medida que la variable predictora aumenta, la variable de respuesta tienda a disminuir en base a la fuerza de relacin. Por ejemplo, para el porcentaje del empleo masculino en la agricultura presenta una relación negativa intensa. Lo que sucede es que a medida que el porcentaje de empleo aumenta, el PIB se distribuye entre un mayor número de personas, y cuando el porcentaje tiende a ser pequeño, el PIB aumenta, aunque con diferente intensidad respecto a cada una de las variables.
Figura 2.2 : Gráfico del % de empleo masculino en agricultura vs. PIB por persona empleada.
De estos gráficos se puede deducir que para todos los casos persiste una relación negativa. Esto significa que hay una tendencia a que, a medida que la variable predictora aumenta, la variable de respuesta tienda a disminuir en base a la fuerza de relacin. Por ejemplo, para el porcentaje del empleo masculino en la agricultura presenta una relación negativa intensa. Lo que sucede es que a medida que el porcentaje de empleo aumenta, el PIB se distribuye entre un mayor número de personas, y cuando el porcentaje tiende a ser pequeño, el PIB aumenta, aunque con diferente intensidad respecto a cada una de las variables.
Figura 2.3 : Gráfico del % de empleo femenino en agricultura vs. PIB por persona empleada.
De estos gráficos se puede deducir que para todos los casos persiste una relación negativa. Esto significa que hay una tendencia a que, a medida que la variable predictora aumenta, la variable de respuesta tienda a disminuir en base a la fuerza de relacin. Por ejemplo, para el porcentaje del empleo masculino en la agricultura presenta una relación negativa intensa. Lo que sucede es que a medida que el porcentaje de empleo aumenta, el PIB se distribuye entre un mayor número de personas, y cuando el porcentaje tiende a ser pequeño, el PIB aumenta, aunque con diferente intensidad respecto a cada una de las variables.
Figura 2.4 : Gráfico del % de empleo masculino en industria vs. PIB por persona empleada.
De estos gráficos se puede deducir que para todos los casos persiste una relación negativa. Esto significa que hay una tendencia a que, a medida que la variable predictora aumenta, la variable de respuesta tienda a disminuir en base a la fuerza de relacin. Por ejemplo, para el porcentaje del empleo masculino en la agricultura presenta una relación negativa intensa. Lo que sucede es que a medida que el porcentaje de empleo aumenta, el PIB se distribuye entre un mayor número de personas, y cuando el porcentaje tiende a ser pequeño, el PIB aumenta, aunque con diferente intensidad respecto a cada una de las variables.
Figura 2.4 : Gráfico del % de empleo femenino en industria vs. PIB por persona empleada.
De estos gráficos se puede deducir que para todos los casos persiste una relación negativa. Esto significa que hay una tendencia a que, a medida que la variable predictora aumenta, la variable de respuesta tienda a disminuir en base a la fuerza de relacin. Por ejemplo, para el porcentaje del empleo masculino en la agricultura presenta una relación negativa intensa. Lo que sucede es que a medida que el porcentaje de empleo aumenta, el PIB se distribuye entre un mayor número de personas, y cuando el porcentaje tiende a ser pequeño, el PIB aumenta, aunque con diferente intensidad respecto a cada una de las variables.
Figura 3: Distribución del PIB por persona empleada por Clasificación de Países.
El análisis del diagrama de cajas revela de manera más evidente la influencia de la clasificación en el Producto Interno Bruto (PIB) por persona entre los países desarrollados y aquellos que se encuentran en vías de desarrollo. Esto determina las diferencias económicas que caracterizan a estas dos categorías. Los datos muestran que el promedio del PIB por persona empleada en los países desarrollados fue de USD 93,086.9 ± 37,973, con un valor mínimo de USD 35,204.18. En contraste, en los países emergentes, el PIB por persona fue mucho más bajo, alcanzando un promedio de USD 42,862.6 ± 16414, con un valor máximo de USD 73,764.38. Estas estadísticas descriptivas reflejan las asimetrías económicas y el contraste en la distribución de la riqueza entre las naciones desarrolladas y las economías emergentes.
Luego de haber analizado la base de datos con las variables seleccionadas y la nueva variable de clasificación, se procedió a establecer un modelo de regresión lineal que pretende predecir el comportamiento del PIB (por persona empleada) y con referencia a la variable cualitativa de países desarrollados, proveniente de la nueva variable de clasificación.
B0: 198625.8 , corresponde al valor del PIB por persona empleada esperado, para cuando las demás variables son iguales a cero. Este valor no tiene interpretación, pues no es lógico que exista un valor inicial cuando en el país no hay ninguna persona empleada. Por lo anterior, B0 se considera un valor de ajuste.
B1: -2042.6, por cada unidad porcentual que se aumente en los empleados totales, el PIB por persona en países emergentes disminuye en promedio $2042.6 respecto a los países desarrollados, dejando el resto de variables constantes.
B2: -3091.8, por cada unidad porcentual que se aumente en los empleados hombres en la agricultura,el PIB por persona en países emergentes disminuye en promedio $3091.8 respecto a los países desarrollados, dejando el resto de variables constantes.
B3: 839.7, por cada unidad porcentual que se aumente en los empleados mujeres en la agricultura, el PIB por persona en países emergentes aumenta en promedio $839,7 respecto a los países desarrollados, dejando el resto de variables constantes
B4: -2639.6, por cada unidad porcentual que se aumente en los empleados hombres en la industria, el PIB por persona en países emergentes disminuye en promedio $2639.6 respecto a los países desarrollados, dejando el resto de variables constantes.
B5: 465.3759, por cada unidad porcentual que se aumente en los empleados mujeres en la industria,el PIB por persona en países emergentes aumenta en promedio $4655.3759 dejando el resto de variables constantes.
B6: -23245.5, si un país es emergente, el PIB por persona empleada disminuye en promedio $23245.5 respecto á los países desarrollados.
Tabla 2: Significancia Estadística por Variable.
Se parte de la hipótesis de que si el valor p es menor al nivel de significancia 0.05, la variable si es significativa y tiene influencia sobre la variable de respuesta. Para este caso, las variables que sí son significativas corresponden al porcentaje de empleados hombres en la agricultura, el porcentaje de empleados hombres en la industria y la clasificación del país. De esta manera se puede concluir que bajo el contexto de los países seleccionados, en el año 2014 existe una mayor presencia de hombres en la fuerza laboral. Prueba de lo anterior es que en ese año el 31.4% del total de empleados en la industria fueron hombres, mientras que solo el 13% del total de empleados en la industria fueron mujeres. Por su parte, se vé una distribución más equitativa en cuanto al empleo en la agricultura, pues el porcentaje promedio de hombres fué de 14.9 % y para las mujeres en la agricultura fué de 7.4%.
El valor de R-cuadrado (R-squared) en un modelo de regresión lineal representa la proporción de la variabilidad en la variable dependiente que es explicada por las variables independientes incluidas en el modelo. En otras palabras, R-cuadrado mide la bondad de ajuste del modelo, indicando cuánta variabilidad en los datos se puede explicar a través de la relación lineal establecida en el modelo de regresión. En nuestro caso, el valor de R-cuadrado igual a 0.5982 (o 59.82%) significa que aproximadamente el 59.82% de la variabilidad en la variable dependiente se puede explicar mediante las variables independientes incluidas en el modelo de regresión.
Las inferencias realizadas a partir de un modelo de regresión sólo presentan total validez si se cumplen los supuestos que sustentan al término de error. A continuación, realizaremos el proceso de análisis y validación de estos supuestos mediante análisis gráficos y pruebas de hipótesis.
Figura 4: Gráfico de Comprobación de la Linealidad.
Conceptualmente, hace referencia a que la dispersión de los errores no cambia a medida que avanzamos a lo largo del gráfico de las variables predictoras. Esta suposición es importante para que las estimaciones de los parámetros analizados en el modelo y las pruebas de hipótesis sean válidas. En este caso se evaluó utilizando un análisis de correlación, utilizando las hipótesis: H0 (hipótesis nula) estableciendo que existe una varianza constante y H1 (hipótesis alternativa) indicando que no hay varianza constante.
Utilizando el test de Breusch-Pagan se determina si la varianza estimada de los residuos del modelo depende de los valores de las variables independientes. En el modelo se obtuvo un valor de p-valúe que corresponde a 0,02739 < 0,05, rechazando así H0, indicando que no existe una varianza constante; respecto a la gráfica se analiza que la variación de los valores de la variable no es significativa a lo largo de su representación. Cuando comparamos este resultado teórico con el gráfico de varianza constante, podemos concluir que la dispersión de los errores no es constante a lo largo del gráfico, mostrando que la dispersión de los errores no varía a medida que se desplaza a lo largo de las variables.Figura 5: Gráfica de la Varianza constante.
La normalidad en términos conceptuales se refiere a una propiedad de distribución de datos. Esta distribución se considera normal cuando es simétrica y tiene forma de campana, lo que significa que la mayoría de datos se agrupan alrededor de la media y disminuyen gradualmente hacia los extremos. Para realizar este análisis estadístico se utilizó la herramienta shapiro.test, que se encarga de comparar los datos con la distribución normal o si se desvían significativamente de ella. La prueba genera un valor p que se compara con 0,05, para así tomar una decisión de rechazo o aceptación de las hipótesis, H0 (hipótesis nula) cuenta con una distribución normal o de H1(hipótesis alternativa) indicando que no cuenta con una distribución normal
El valor de p-value obtenido en el modelo fue de 0,006618, lo que sugiere que nuestros datos no cuentan con una distribución normal. Por tanto, se rechaza H1 (hipótesis alternativa) de normalidad y se concluye que el modelo no cuenta con una distribución normal.Figura 6: Gráfico de Normalidad.
Figura 7: Gráfico de Comprobación de la Idependencia.
Al graficar los valores residuales se puede observar que no existe una relación clara entre los puntos, esto nos indica que sí se cumple el supuesto de independencia.
En el contexto de este análisis, se empleó un modelo estadístico que evaluó la relación entre las variables seleccionadas y el Producto Interno Bruto (PIB) por persona empleada. Para medir la efectividad de este modelo en la predicción de las variaciones en el PIB por persona empleada, se utilizó el coeficiente de determinación, o R cuadrado. El coeficiente de determinación, expresado como un porcentaje, ofrece una comprensión de cuántas de las variaciones en la variable de respuesta (en este caso, el PIB por persona empleada) pueden ser explicadas por las variables independientes que se han incluido en el modelo. Nuestro análisis arrojó un valor de R cuadrado del 59.8%, lo que significa que el modelo ha logrado explicar aproximadamente el 59.8% de las fluctuaciones en el PIB por persona empleada a través de las variables analizadas. Sin embargo, es fundamental destacar que este valor, aunque significativo, revela que la relación entre las variables seleccionadas y el PIB por persona empleada es relativamente débil. En otras palabras, cerca del 40.2% de las variaciones en el PIB por persona empleada no pueden ser explicadas por las variables incluidas en el modelo. Esto indica que hay factores adicionales no considerados en este análisis que influyen en la producción económica por persona empleada.
En el proceso de evaluación de los supuestos esenciales para el análisis estadístico, se han identificado ciertas limitaciones que comprometen la solides de los resultados obtenidos.
En primer lugar, se ha observado que la varianza de los datos no se mantiene constante a lo largo del conjunto de datos, lo que es un incumplimiento del supuesto de varianza constante. Esta falta de homogeneidad en la varianza sugiere que las variaciones en las variables independientes no son uniformes y pueden cambiar a lo largo del tiempo o bajo diferentes condiciones. En segundo lugar, se ha comprobado que la distribución de los datos no sigue una forma normal, lo que da con el incumpliendo de un segundo supuesto. Estos incumplimientos de los supuestos ponen de manifiesto que los resultados y las conclusiones basadas en el análisis son válidos solo dentro de los límites de los datos y las técnicas utilizadas.
La evaluación y cumplimiento de los supuestos estadísticos es fundamental para determinar la confiabilidad de las inferencias y conclusiones que se pueden extraer de este análisis. En este caso, como no se cumplen completamente todos los supuestos necesarios, esto plantea limitaciones en la aplicabilidad de los resultados a la población mundial. Esto significa que las conclusiones derivadas de este análisis no pueden considerarse representativas para el resto de la población mundial. Sin embargo, es importante destacar que este estudio sigue siendo válido en términos de las 48 naciones seleccionadas para el año 2014, encontrado dentro de estos un patrón relacionado con la participación en el empleo entre hombres y mujeres. En particular, se ha identificado que existe una mayor participación de la población masculina en el empleo, mientras que las mujeres tienen una presencia laboral proporcionalmente menor.
Joaqui Barandica, O. (2023, April 16). Data Visualization in R. [Blog post]. Recuperado de https://www.joaquibarandica.com/post/datavizr/
Iberdrola. (s.f.). Índice de Desarrollo Humano. Recuperado el 11 de octubre de 2023, de https://www.iberdrola.com/compromiso-social/indice-desarrollo-humano
Paridad del poder adquisitivo. (s.f.). En Wikipedia. Recuperado el 15 de octubre de 2023, de https://es.wikipedia.org/wiki/Paridad_de_poder_adquisitivo
Iberdrola. (s.f.). Índice de Desarrollo Humano. Recuperado el 15 de octubre de 2023, de https://www.iberdrola.com/compromiso-social/indice-desarrollo-humano
MathWorks. (s.f.). Linear Regression. Recuperado el 15 de octubre de 2023, de https://la.mathworks.com/discovery/linear-regression.html
Expansión. (s.f.). Índice de Desarrollo Humano de Andorra. Recuperado el 17 de octubre de 2023, de https://datosmacro.expansion.com/idh/andorra?anio=2014
Banco Mundial. (s.f.). Datos por país. Recuperado el 12 de octubre de 2023, de https://data.worldbank.org/country