Como es sabido, el Producto Interno Bruto (PIB) es un indicador económico que hace referencia a la producción total de bienes y servicios de un país, en términos monetarios, durante un determinado tiempo.
Por otra parte, el PIB por persona empleada es el resultado de la división del Producto Interno Bruto (PIB) de un país entre el empleo total de la economía. Cabe recalcar, que a menudo se emplea como medida de comparación entre diferentes países, para indicar las diferencias de condiciones económicas.
Avanzando respecto a este razonamiento, el trabajo se centra en analizar el aporte al PIB por persona empleada (variable de respuesta) por parte de las personas que trabajaban en los sectores agrícolas, industriales, por cuentas propias, asalariados (con contrato fijo), y los que trabajaban en una situación vulnerable en el año 2018 a nivel global.
En particular, la metodología empleada fue vincular la cantidad de empleados en cada sector de la base de datos del Banco Mundial en el correspondiente año y usarlas como variables predictoras, es decir, se identificó la información respecto a lo que cada porcentaje de personas empleadas por cada sector podría aportar al PIB por persona empleada. Posteriormente, se procedieron a realizar gráficos de las variables elegidas, para luego crear un modelo de regresión lineal múltiple y hacer el respectivo análisis de este. Finalmente, se empleó la prueba de supuestos para saber si se puede realizar inferencias sobre la población.El siguiente aspecto trata sobre las variables que se escogieron de la base de datos, en este caso el grupo decidió trabajar con: personas empleadas en la agricultura, en la industria, trabajadores por cuenta propia, por casos de vulnerabilidad y asalariados; todas ellas con un porcentaje (%) de empleabilidad total.
Sobre todo, porque se consideraron por ser de manera neutral, es decir, no se enfocaban en ningún género en específico. Además, se creyó que estas variables podrían explicar el PIB de un país. Por lo cual, a continuación se explicará por qué se tomaron estas decisiones de selección.## `geom_smooth()` using formula = 'y ~ x'
## `geom_smooth()` using formula = 'y ~ x'
## `geom_smooth()` using formula = 'y ~ x'
## `geom_smooth()` using formula = 'y ~ x'
## `geom_smooth()` using formula = 'y ~ x'
##
## Call:
## lm(formula = PIB ~ Industria + Agricultura + C_propia + Vulnerable +
## Emergente + Asalariados, data = Base5)
##
## Residuals:
## Min 1Q Median 3Q Max
## -48210 -12478 -1082 17661 77410
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -3.753e+08 1.137e+08 -3.301 0.001915 **
## Industria -2.625e+03 6.452e+02 -4.069 0.000193 ***
## Agricultura -3.612e+02 7.494e+02 -0.482 0.632237
## C_propia 3.754e+06 1.137e+06 3.302 0.001913 **
## Vulnerable 2.869e+02 2.393e+03 0.120 0.905135
## Emergente1 -3.718e+04 1.209e+04 -3.076 0.003603 **
## Asalariados 3.755e+06 1.137e+06 3.303 0.001907 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 25680 on 44 degrees of freedom
## Multiple R-squared: 0.6853, Adjusted R-squared: 0.6424
## F-statistic: 15.97 on 6 and 44 DF, p-value: 1.21e-09
PIB = B0 + B1x1 + B2X2 + B3X3 + B4X4 + B5X5 + B6X6
PIB = -3.753e+08 - 2.625e+03IN - 3.612e+02AG + 3.754e+06CP + 2.869e+02VU - 3.718e+04EM + 3.755e+06AS
IN: Industria.
AG: Agricultura.
CP: Cuenta propia.
VU: Vulnerable.
EM: Emergente.
AS: Asalariados.
Apartir de lo anterior, se realiza un analisis de los coeficientes de regresión:
• Por cada punto porcentual en que aumente la cantidad de empleados en el sector de la industria se estima que en promedio el PIB disminuirá en 2625 dólares, esta variable es significativa al 5% para explicar el PIB.
• Por cada punto porcentual en que aumente la cantidad de empleados en la agricultura se estima que en promedio el PIB disminuirá en 362.5 dólares, es de resaltar que esta variable no es significativa al 5% para explicar el PIB.
• Por cada punto porcentual en que aumente la cantidad de empleados con cuenta propia se estima que en promedio el PIB aumentará en 3754000 dólares, esta variable es significativa al 5% para explicar el PIB.
• Por cada punto porcentual en que aumente la cantidad de empleados en condiciones vulnerables se estima que en promedio el PIB aumentará en 286.9 dólares, esta variable no es significativa a un 5% para explicar el PIB.
• Por cada país que aumente en la cantidad de países emergentes se estima que en promedio el PIB disminuirá en 37180 dólares a comparacion de los países desarrollados, esta variable si es significativa para explicar al PIB.
Por cada punto porcentual en que aumente la cantidad de empleados asalariados se estima que en promedio el PIB aumentará en 3755000 dólares, esta variable si es ignificativa en un 5% para explicar el PIB.En la prueba de linealidad, se realizó el análisis de correlación con las respectivas hipótesis, definiendo lo siguiente:
H0: no existe correlación lineal. H1: Si existe correlación lineal.
Por lo cual, con el valor p obtenido, que es 1,21x10^-9, determinando que este dato es bastante pequeño, por lo que al hacer la relación con el análisis establecido, se consideró que si existe una correlación lineal.Se procedió a realizar la prueba Shapiro-Wilk donde el p-value dio 0.372, lo cual es mayor al 5% por tanto yo acepto H0 y rechazo H1 respectivamente.
Ho: Hay normalidad.
H1: No hay normalidad.
Por lo tanto, si se cumple con el supuesto de la normalidad.##
## Shapiro-Wilk normality test
##
## data: modelo1$residuals
## W = 0.97561, p-value = 0.372
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## studentized Breusch-Pagan test
##
## data: modelo1
## BP = 20.003, df = 6, p-value = 0.002766
La homocedasticidad implica que los errores tengan varianza constante. Este supuesto lo analizamos mediante un gráfico de dispersión, en el cual se puede observar que hay mucha variabilidad y no todos los puntos orbitan al rededor de cero. Esto lo verificamos con la prueba Breush-Pagan, donde:
H0: Hay varianza constante.
H1: No hay varianza constante.
Como el P - value nos dió 0.002766 entonces se rechaza H0 y acepta H1, por lo tanto, se concluye no hay varianza constante.Este supuesto implica que los residuos deben ser independientes entre sí y que no hay ningún tipo de correlación entre ellos.
Esto se puede verificar realizando la prueba de Durbin-Watson, cuya hipótesis nula supone, que los residuos son independientes y la alternativa que no son independientes.
##
## Durbin-Watson test
##
## data: modelo1
## DW = 1.9516, p-value = 0.4437
## alternative hypothesis: true autocorrelation is greater than 0
Con lo anterior, el p-value resultante es 0,4437, lo cual es mayor a 5% por tanto acepto H0 y rechazo H1. Por lo tanto, podemos concluir que los residuos no estan autocorrelacionados, definiendo que si se cumple con el supuesto de independencia.
En conclusión, tras realizar el análisis, se ha podido comprobar que el modelo propuesto para explicar el PIB por persona empleada no logró superar el requerimiento de homocedasticidad, a pesar de haber cumplido con los supuestos de linealidad, normalidad e independencia. Esto sugiere que el modelo no es válido y, por lo tanto, no tiene la capacidad de explicar adecuadamente el fenómeno en cuestión(PIB).
Después de analizar las variables seleccionadas, tales como “empleo en la industria”, “empleo en la agricultura”, “trabajo por cuenta propia”, “empleo vulnerable” y “trabajadores asalariados”, se puede concluir que “empleo en la agricultura” y “empleo vulnerable” no son significativas para el modelo, aparte de esto la única variable con relación positiva respecto al PIB es la variable de “trabajadores asalariados”