Indíce.

Introducción.

Como es sabido, el Producto Interno Bruto (PIB) es un indicador económico que hace referencia a la producción total de bienes y servicios de un país, en términos monetarios, durante un determinado tiempo.

Por otra parte, el PIB por persona empleada es el resultado de la división del Producto Interno Bruto (PIB) de un país entre el empleo total de la economía. Cabe recalcar, que a menudo se emplea como medida de comparación entre diferentes países, para indicar las diferencias de condiciones económicas.

Avanzando respecto a este razonamiento, el trabajo se centra en analizar el aporte al PIB por persona empleada (variable de respuesta) por parte de las personas que trabajaban en los sectores agrícolas, industriales, por cuentas propias, asalariados (con contrato fijo), y los que trabajaban en una situación vulnerable en el año 2018 a nivel global.

En particular, la metodología empleada fue vincular la cantidad de empleados en cada sector de la base de datos del Banco Mundial en el correspondiente año y usarlas como variables predictoras, es decir, se identificó la información respecto a lo que cada porcentaje de personas empleadas por cada sector podría aportar al PIB por persona empleada. Posteriormente, se procedieron a realizar gráficos de las variables elegidas, para luego crear un modelo de regresión lineal múltiple y hacer el respectivo análisis de este. Finalmente, se empleó la prueba de supuestos para saber si se puede realizar inferencias sobre la población.

1. Descripción de variables.

El siguiente aspecto trata sobre las variables que se escogieron de la base de datos, en este caso el grupo decidió trabajar con: personas empleadas en la agricultura, en la industria, trabajadores por cuenta propia, por casos de vulnerabilidad y asalariados; todas ellas con un porcentaje (%) de empleabilidad total.

Sobre todo, porque se consideraron por ser de manera neutral, es decir, no se enfocaban en ningún género en específico. Además, se creyó que estas variables podrían explicar el PIB de un país. Por lo cual, a continuación se explicará por qué se tomaron estas decisiones de selección.

- Empleo total en la Agricultura.

La agricultura hace referencia a una persona trabajadora del campo, la cual tiene un papel muy importante en la economía global, pues es una labor que se encarga de producir productos para vender y exportar, ya que al ser parte del sector agrícola, ayuda a mejorar los ingresos y el desarrollo sostenible en cada país.
## `geom_smooth()` using formula = 'y ~ x'
Como podemos observar en la anterior gráfica, se puede deducir que a mayor porcentaje de empleados del sector de agricultura, menor es la cantidad del PIB por persona empleada.

- Empleo total en la Industria.

El sector industrial influye en el PIB de un país debido a su importancia en la economía mundial, por lo que se encargan de producir bienes y servicios que se venden y generan ingresos. Por lo tanto, si hay más empleados en la industria, esto indica que hay más personas trabajando para producir bienes y servicios, de esa manera se produce más para vender más bienes y servicios, por lo que a su vez, aumenta los ingresos y contribuye al crecimiento económico.
## `geom_smooth()` using formula = 'y ~ x'
Cabe destacar, que la gráfica proyectada esta dispersa, por lo que se puede inferir que a mayor porcentaje en el sector de la industria, disminuye la cantidad de PIB que se proyecta en el año 2018.

- Empleo total por Cuenta propia.

Los empleadores por cuenta propia, son aquellos que realizan trabajos independientes, sin necesidad de algún contrato, pues de esa manera ofrecen sus servicios y productos a otras personas para obtener a cambio una remuneración económica. Cabe destacar, que este tipo de funcionarios, influyen en el PIB de un país similar a la de los empleados de diferentes sectores, quienes contribuyen a la economía mediante diferentes procesos para desempeñar una producción económica.
## `geom_smooth()` using formula = 'y ~ x'
En este caso, al análizar la gráfica de cuenta propia respecto al PIB, podemos ver claramente que a mayor porcentaje de empleados por cuenta propia, menor es la cantidad de PIB, así mismo, se puede evidenciar que si consideramos menor porcentaje de trabajadores habrá mayor cantidad de PIB.

- Empleo total en condición Vulnerable.

Los trabajadores vulnerables son importantes en el PIB, pues en muchos países que están en vía de ser desarrollado, estos representan una gran proporción de la fuerza laboral. Según su análisis, si estos trabajadores pudieran aumentar la cantidad de bienes y servicios que producen, no solo lograrían aumentar sus ingresos individuales, sino también contribuir al crecimiento económico.
## `geom_smooth()` using formula = 'y ~ x'
Se puede destacar, que mayor porcentaje de empleados en una condición vulnerable, menor es la cantidad de PIB. Además, si consideramos menor porcentaje de trabajadores, posee menor cantidad de PIB respecto al año determinado.

- Empleo total de Asalariados.

Las personas en el sector de asalariados, debido a su gran número y al hecho de que su remuneración fija les permite realizar diversas demandas y consumos en la economía. Además, estos trabajadores suelen formar parte de sectores clave para la economía, como el sector de servicios, lo que les permite contribuir de manera significativa a la producción de bienes y servicios a nivel global.
## `geom_smooth()` using formula = 'y ~ x'
Por último, tenemos la gráfica de empleados asalariados, el cual se puede deducir que a mayor porcentaje de trabajadores asalariados mayor cantidad de PIB se considera, pues esta de manera ascendente.

2. Creación y análisis del modelo.

En primer lugar, se subió la base de datos para realizar la respectiva limpieza y selección de variables a utilizar, en el cual se generó un modelo de regresión lineal para determinar si las variables predictorias establecidas influenciaban en la variable de respuesta. Cabe destacar, que en la tabla establecida, se consideró la cantidad de asteriscos como nivel de significancia, el “intercept” el cual representa un valor de ajuste porque no es posible que todas las variables del modelo sea 0 ni que se tenga un PIB negativo y finalmente, esta la bondad de ajuste del modelo, que es un R-cuadrado ajustado, que nos indica que el 64% de la variabilidad del PIB esta siendo explicado por el modelo.
## 
## Call:
## lm(formula = PIB ~ Industria + Agricultura + C_propia + Vulnerable + 
##     Emergente + Asalariados, data = Base5)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -48210 -12478  -1082  17661  77410 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -3.753e+08  1.137e+08  -3.301 0.001915 ** 
## Industria   -2.625e+03  6.452e+02  -4.069 0.000193 ***
## Agricultura -3.612e+02  7.494e+02  -0.482 0.632237    
## C_propia     3.754e+06  1.137e+06   3.302 0.001913 ** 
## Vulnerable   2.869e+02  2.393e+03   0.120 0.905135    
## Emergente1  -3.718e+04  1.209e+04  -3.076 0.003603 ** 
## Asalariados  3.755e+06  1.137e+06   3.303 0.001907 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 25680 on 44 degrees of freedom
## Multiple R-squared:  0.6853, Adjusted R-squared:  0.6424 
## F-statistic: 15.97 on 6 and 44 DF,  p-value: 1.21e-09
  • Ecuación de regresión:

PIB = B0 + B1x1 + B2X2 + B3X3 + B4X4 + B5X5 + B6X6

  • Reemplazo de valores en la ecuación:

PIB = -3.753e+08 - 2.625e+03IN - 3.612e+02AG + 3.754e+06CP + 2.869e+02VU - 3.718e+04EM + 3.755e+06AS

  • Aclaración de variables de la ecuación anterior:

IN: Industria.

AG: Agricultura.

CP: Cuenta propia.

VU: Vulnerable.

EM: Emergente.

AS: Asalariados.

Apartir de lo anterior, se realiza un analisis de los coeficientes de regresión:

• Por cada punto porcentual en que aumente la cantidad de empleados en el sector de la industria se estima que en promedio el PIB disminuirá en 2625 dólares, esta variable es significativa al 5% para explicar el PIB.

• Por cada punto porcentual en que aumente la cantidad de empleados en la agricultura se estima que en promedio el PIB disminuirá en 362.5 dólares, es de resaltar que esta variable no es significativa al 5% para explicar el PIB.

• Por cada punto porcentual en que aumente la cantidad de empleados con cuenta propia se estima que en promedio el PIB aumentará en 3754000 dólares, esta variable es significativa al 5% para explicar el PIB.

• Por cada punto porcentual en que aumente la cantidad de empleados en condiciones vulnerables se estima que en promedio el PIB aumentará en 286.9 dólares, esta variable no es significativa a un 5% para explicar el PIB.

• Por cada país que aumente en la cantidad de países emergentes se estima que en promedio el PIB disminuirá en 37180 dólares a comparacion de los países desarrollados, esta variable si es significativa para explicar al PIB.

Por cada punto porcentual en que aumente la cantidad de empleados asalariados se estima que en promedio el PIB aumentará en 3755000 dólares, esta variable si es ignificativa en un 5% para explicar el PIB.

3. Supuestos.

- Hipótesis de Linealidad.

En la prueba de linealidad, se realizó el análisis de correlación con las respectivas hipótesis, definiendo lo siguiente:

H0: no existe correlación lineal. H1: Si existe correlación lineal.

Por lo cual, con el valor p obtenido, que es 1,21x10^-9, determinando que este dato es bastante pequeño, por lo que al hacer la relación con el análisis establecido, se consideró que si existe una correlación lineal.

- Hipótesis de Normalidad.

La prueba de normalidad indica que todos los residuos (error) deben tener una distribución normal, se presentan 2 graficos para observar la distribución normal y tener una predicción sobre si se cumple el supuesto o no.

Se procedió a realizar la prueba Shapiro-Wilk donde el p-value dio 0.372, lo cual es mayor al 5% por tanto yo acepto H0 y rechazo H1 respectivamente.

Ho: Hay normalidad.

H1: No hay normalidad.

Por lo tanto, si se cumple con el supuesto de la normalidad.
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo1$residuals
## W = 0.97561, p-value = 0.372

- Homocedasticidad.

La homocedasticidad implica que los errores tengan varianza constante. Este supuesto lo analizamos mediante un gráfico de dispersión y lo verificamos con la prueba Breush-Pagan. Dónde H0 = Hay varianza constante y H1 = No hay varinaza constante. Como el P- value nos dió 0.002766 entonces se rechaza H0 y acepta H1, por lo tanto, se concluye no hay varianza constante.
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo1
## BP = 20.003, df = 6, p-value = 0.002766

La homocedasticidad implica que los errores tengan varianza constante. Este supuesto lo analizamos mediante un gráfico de dispersión, en el cual se puede observar que hay mucha variabilidad y no todos los puntos orbitan al rededor de cero. Esto lo verificamos con la prueba Breush-Pagan, donde:

H0: Hay varianza constante.

H1: No hay varianza constante.

Como el P - value nos dió 0.002766 entonces se rechaza H0 y acepta H1, por lo tanto, se concluye no hay varianza constante.

- Independencia de los errores.

Este supuesto implica que los residuos deben ser independientes entre sí y que no hay ningún tipo de correlación entre ellos.

Esto se puede verificar realizando la prueba de Durbin-Watson, cuya hipótesis nula supone, que los residuos son independientes y la alternativa que no son independientes.

## 
##  Durbin-Watson test
## 
## data:  modelo1
## DW = 1.9516, p-value = 0.4437
## alternative hypothesis: true autocorrelation is greater than 0

Con lo anterior, el p-value resultante es 0,4437, lo cual es mayor a 5% por tanto acepto H0 y rechazo H1. Por lo tanto, podemos concluir que los residuos no estan autocorrelacionados, definiendo que si se cumple con el supuesto de independencia.

4. Conclusiones de la estimación.

En conclusión, tras realizar el análisis, se ha podido comprobar que el modelo propuesto para explicar el PIB por persona empleada no logró superar el requerimiento de homocedasticidad, a pesar de haber cumplido con los supuestos de linealidad, normalidad e independencia. Esto sugiere que el modelo no es válido y, por lo tanto, no tiene la capacidad de explicar adecuadamente el fenómeno en cuestión(PIB).

Después de analizar las variables seleccionadas, tales como “empleo en la industria”, “empleo en la agricultura”, “trabajo por cuenta propia”, “empleo vulnerable” y “trabajadores asalariados”, se puede concluir que “empleo en la agricultura” y “empleo vulnerable” no son significativas para el modelo, aparte de esto la única variable con relación positiva respecto al PIB es la variable de “trabajadores asalariados”