Análisis de los factores del PIB por persona empleada: un modelo de regresión lineal múltiple
Introducción
En los últimos años, la productividad laboral se ha consolidado como un factor clave para explicar las diferencias en el crecimiento económico entre países. El PIB por persona empleada constituye una medida relevante para evaluar la eficiencia con la que las economías utilizan sus recursos humanos.
El análisis del año 2014 resulta particularmente relevante, ya que la economía mundial se encontraba en un periodo de lenta recuperación posterior a la crisis financiera de 2008, un fenómeno que algunos autores denominaron la “nueva normalidad”. Este contexto estuvo marcado por eventos como la “paradoja de la productividad” (con un crecimiento anual de apenas 0.9% en Estados Unidos, según la Oficina de Estadísticas Laborales), el desplome del precio del petróleo y la persistente crisis de deuda en la Eurozona, que afectaron de manera diferenciada a los países y condicionaron el impacto de factores como la innovación o la educación en el PIB por persona empleada. Por lo tanto, estudiar este periodo ofrece una ventana única para observar cómo operan estos determinantes en un entorno de ajuste estructural post-crisis, lejos de los tradicionales ciclos de expansión acelerada.
El presente estudio tiene como objetivo analizar la relación entre dichos factores (exportaciones de alta tecnología, gasto en I+D, apertura del internet, educación terciaria y participacion laboral) y el PIB por persona empleada, utilizando información proveniente de fuentes internacionales para el año 2014.
Metodología
Inicialmente, se seleccionaron cinco variables predictoras con base en su relevancia teórica y su posible relación con la variable dependiente, priorizando indicadores asociados a la innovación, el capital humano, la tecnología y la estructura económica.
Los datos fueron obtenidos de la base de datos del World Bank, tomando como año de referencia el 2014. En una primera etapa, se consideró un conjunto aproximado de 100 países pertenecientes a las regiones de América Latina y el Caribe, Europa y Asia Central, de acuerdo con la disponibilidad de información.
Posteriormente, se llevó a cabo un proceso de depuración de la base de datos debido a la presencia de valores faltantes (NA) en varias de las variables seleccionadas. Para garantizar la consistencia del análisis, se optó por aplicar un criterio de eliminación de observaciones incompletas (listwise deletion), conservando únicamente aquellos países con información completa. Como resultado, la muestra final quedó conformada por 49 países.
La selección final de variables se fundamentó en criterios teóricos, en su relevancia empírica y en su contribución al ajuste global del modelo. Asimismo, se evaluaron posibles problemas de multicolinealidad y redundancia entre variables, con el fin de asegurar la estabilidad de las estimaciones.
Finalmente, se procedió a la estimación del modelo de regresión lineal múltiple y a la verificación de sus supuestos mediante pruebas estadísticas y análisis gráfico.
Regresión lineal múltiple
Para alcanzar el propósito de este estudio, se empleo un modelo de regresión lineal múltiple. Este modelo permite explicar el comportamiento de una variable de interés \(Y\) (llamada variable dependiente o respuesta) a partir de los cambios simultáneos en varias variables explicativas\(X_1, X_2, ..., X_k\) (llamadas independientes o predictoras). La forma general del modelo es la siguiente:
\[ Y_t = \beta_0 + \beta_1 X_{1,t} + \beta_2 X_{2,t} + \cdots + \beta_k X_{k,t} + \varepsilon_t \]
Donde:
\(Y\) es el PIB por persona empleada (variable respuesta).
\(X_1, X_2, X_3, X_4, X_5\) corresponden a las variables predictoras (exportaciones de alta tecnología,uso de internet, gasto en I+D, educación terciaria y participacion laboral, respectivamente).
\(\beta_0\) es el término independiente o intercepto.
\(\beta_1, \beta_2, \ldots, \beta_5\) son los coeficientes de regresión que miden el efecto esperado de cada variable predictora sobre \(Y\), manteniendo las demás constantes.
\(\varepsilon\) representa el error aleatorio o término de perturbación, que recoge la influencia de otros factores no incluidos en el modelo.
Descripción de Variables
A continuación, se presentan las variables que serán analizadas en el modelo de regresión lineal múltiple. La variable de interés o variable respuesta es Y, que corresponde al PIB por persona empleada. Esta variable hace referencia a la productividad y la riqueza generada por un país, es decir, la cantidad de valor económico (expresado en términos del Producto Interno Bruto) que se produce por cada persona ocupada. Este indicador refleja la eficiencia con la que se utiliza el trabajo en la economía y está asociado al nivel de desarrollo tecnológico, la calidad del capital humano y la capacidad de generar ingresos por trabajador. Un valor más alto sugiere mayor productividad y, por ende, un mayor nivel de bienestar económico potencial.
x1: Exportaciones de alta tecnologia: Representa el porcentaje que representan las exportaciones de alta tecnología dentro del total de las manufacturas exportadas por un país. Este indicador abarca productos con alta intensidad en investigación y desarrollo (I+D), como los del sector aeroespacial, informático, farmacéutico, instrumentos científicos y maquinaria eléctrica.
- Justificación: Como variable predictora del PIB por persona empleada basándome en teorías económicas que señalan a la innovación tecnológica como uno de los motores principales del crecimiento económico. Autores como Romer (1990) y Grossman & Helpman (1991) sostienen que cuando los países invierten en conocimiento y tecnología, logran aumentos sostenidos en la productividad. Esto se debe a que la tecnología permite producir más con los mismos recursos (o los mismos con menos recursos) y también genera efectos positivos en el resto de la economía, como mejoras en la calidad del empleo y en la competitividad internacional.Desde la perspectiva del comercio internacional, se ha encontrado que los países que logran exportar bienes de alta tecnología suelen tener niveles más altos de productividad laboral.
x2: Uso de internet:Corresponde al porcentaje de personas que utilizan internet, entendido como el número de individuos (de cualquier edad) que han accedido a la red desde cualquier lugar y a través de cualquier dispositivo en los últimos tres meses. Es un indicador que Se utiliza para medir la inclusión digital, brechas de género y el avance de la sociedad de la información.
- Justificación: El uso de internet se incluye como predictor del PIB por persona empleada porque actúa como una tecnología de propósito general que transforma los procesos productivos, reduce costos de comunicación y automatiza tareas, mejorando la eficiencia laboral
x3: Gasto en investigacion y desarrollo: Mide la inversión pública y privada en conocimiento, innovación y desarrollo experimental para mejorar la productividad. Este gasto incluye los recursos destinados a la creación de nuevos conocimientos, tecnologías, productos o procesos productivos. Lo realizan tanto el sector público (universidades, centros de investigación) como el privado (empresas, laboratorios). En pocas palabras, este indicador refleja el esfuerzo que hace un país por innovar y generar avances tecnológicos de manera intencionada.
- Justificación: Según la teoría del crecimiento basada en la innovación, invertir en I+D es una de las formas más directas de aumentar la productividad laboral. El gasto en I+D contribuye a que las empresas adopten maquinaria más avanzada, mejoren sus procesos y formen a sus empleados en nuevas habilidades. Esto se traduce directamente en un mayor valor agregado por persona empleada.
x4: Educacion terciaria: Corresponde a la tasa bruta de matriculación en educación terciaria, expresada como un porcentaje. Este indicador mide el número total de estudiantes matriculados en programas de educación superior (universidades, institutos tecnológicos, centros de formación profesional avanzada), refleja qué proporción de la población joven accede y permanece en la educación universitaria o superior.
- Justificación: Se eligio esta variable porque existe un amplio consenso en economía acerca de que la educación, especialmente la superior, es un determinante fundamental de la productividad laboral y a su vez de un pais ya que representa el capital humano, variable importante para el desarollo de un pais.la educación superior está estrechamente vinculada con la innovación y el progreso tecnológico. Los que egresan de las universidades son quienes desarrollan nuevos productos, mejoran procesos productivos y adoptan tecnologías avanzadas en las empresas.
x5: Participacion laboral : Corresponde al porcentaje de la población de entre 15 y 64 años que es económicamente activa, es decir, que trabaja o está disponible para trabajar y busca empleo activamente. El indicador del Banco Mundial (SL.TLF.ACTI.ZS) utiliza estimaciones modeladas por la OIT.
- Justifiación: La tasa de participación laboral se incorpora como variable predictora porque permite capturar el grado de actividad de la población en edad de trabajar, un factor que puede influir en la productividad media por empleado, aunque de manera no uniforme entre países.
Conocer esta variable es relevante porque una alta participación no implica automáticamente mayor o menor productividad: su efecto depende de quiénes se incorporan al mercado laboral. Por ejemplo, si la alta participación proviene de jóvenes sin experiencia, personas mayores con baja calificación o trabajadores en empleos informales de subsistencia, es probable que el promedio de productividad se reduzca. En cambio, si la participación alta se debe a una mayor integración de mujeres calificadas o a políticas que facilitan el acceso al empleo formal de grupos con buena formación, la productividad podría mantenerse o incluso aumentar
Resultados Descriptivos
Estadisticas Descriptivas
Variables Cuantitativas
| Variable | Min | Q1 | Median | Mean | Q3 | Max | SD |
|---|---|---|---|---|---|---|---|
| Y | 1.416548e+04 | 51083.665955 | 68766.26337 | 74807.045125 | 102469.97143 | 161312.75716 | 3.615710e+04 |
| x1 | 1.956558e-01 | 6.887543 | 10.43905 | 12.290984 | 17.12339 | 39.26344 | 8.464032e+00 |
| x2 | 2.340000e+01 | 54.551002 | 67.00000 | 66.466623 | 79.98430 | 98.15802 | 1.791408e+01 |
| x3 | 2.949000e-02 | 0.363200 | 0.79007 | 1.085631 | 1.47756 | 3.16344 | 9.254834e-01 |
| x4 | 1.825529e+01 | 51.095039 | 64.95419 | 64.055287 | 80.39509 | 119.10421 | 1.985825e+01 |
| x5 | 5.482400e+01 | 66.725000 | 70.84100 | 70.328265 | 74.48400 | 87.16800 | 6.182396e+00 |
Las estadísticas descriptivas (Tabla 1) muestran que el PIB por persona empleada (Y) varía considerablemente entre los países analizados, con un rango de aproximadamente 14.165 a 161.313 dólares, reflejando grandes brechas en productividad laboral.
En cuanto a las variables explicativas, el gasto en I+D (X3) y las exportaciones de alta tecnología (X1) presentan distribuciones asimétricas positivas: sus medias (1,09% y 12,29%) superan a sus medianas (0,79% y 10,44%), lo que indica que pocos países concentran los valores más altos. En contraste, la educación terciaria (X4) y la participación laboral (X5) son casi simétricas, con medias y medianas muy cercanas (64,06% vs 64,95% y 70,33% vs 70,84% respectivamente). Finalmente, el uso de internet (X2) presenta una media de 66,47% y una desviación estándar de 17,91%; su asociación con la productividad se evaluará mediante el modelo de regresión.
Cabe mencionar que, mientras la variable dependiente (PIB por persona empleada) se mide en unidades monetarias absolutas, todas las variables predictoras se expresan en forma de porcentajes (uso de internet, educación terciaria, participación laboral, exportación de alta tecnología y gasto en I+D como proporción del PIB).
Variables Categoricas.
A continuacion, se presenta la distribución de los paises por region geografica ,junto con la frecuencia absoluta de cada grupo en la muestra.
Tabla 2. Distribución de los países por región geográfica.
Figura 1. Distribución geográfica de la muestra.
La muestra final está compuesta por 49 países, clasificados en tres regiones geográficas. Europa concentra la mayor proporción, con 33 países (67,3%), seguida por América Latina y el Caribe con 10 países (20,4%), y finalmente Asia Central con 6 países (12,2%). Esta distribución evidencia un predominio de países europeos en la muestra.
Figura 2. Distribución del PIB por persona empleada según región geográfica 2014.
En el diagrama de cajas de la Figura 1, muestra la productividad laboral para los 49 países de la muestra, agrupados en tres regiones: Europa, Latinoamérica y el Caribe, y Asia Central.
Europa presenta la productividad más alta y la mayor dispersión. Su mediana se ubica en 80.847 USD, el primer cuartil (Q1) en 59.965 USD y el tercer cuartil (Q3) en 118.668 USD . El mínimo es de 20.735 USD y el máximo alcanza los 161.313 USD. Las cercas inferior y superior coinciden con el mínimo y el máximo (20.735 y 161.313 respectivamente), lo que indica la ausencia de valores atípicos en esta región.
Latinoamérica y el Caribe muestra valores intermedios. Su mediana es de 48.444 USD, con una cerca inferior de 23.451 USD y una cerca superior de 68.226 USD. No se identifican valores atípicos extremos.
Asia Central es la región con la productividad más baja. Su mediana es de 38.882 USD. El rango va desde aproximadamente 14.165 USD (mínimo de la muestra) hasta 72.219 USD (máximo).Podría considerarse un posible valor atípico superior dentro de la región, aunque no extremo.
Análisis exploratorio
Figura 3. Países con mayor PIB por persona empleada
Tal como se observa en el diagrama de cajas (Figura 1.), Europa es la región que concentra los niveles más altos de productividad laboral. Los cinco países con mayor PIB por persona empleada en la muestra son todos europeos: Noruega (161.313 USD), Irlanda (153.467 USD), Bélgica (140.134 USD), Dinamarca (130.074 USD) e Italia (127.704 USD). Estos valores duplican o incluso triplican la mediana europea (80.847USD) y superan ampliamente los máximos registrados en América Latina (68.226 USD) y Asia Central (72.219 USD). Este predominio refuerza la asociación entre la región geográfica y la productividad, lo que será considerado en el modelo de regresión mediante la inclusión de variables que capturan el desarrollo tecnológico y la inversión en capital humano.
Figura 4. Exportación de alta tecnologica.
El grafico ilustra la distribución de las exportaciones de alta tecnología, evidenciando una notable asimetría positiva (sesgo hacia valores más altos). La mediana se sitúa en 10.44, indicando que la mitad de los casos se encuentran por debajo de este nivel, mientras que el bloque central (la caja azul) muestra que el 50% de las observaciones se concentra en un rango moderado, entre 6.77 (primer cuartil) y 17.14 (tercer cuartil). El límite inferior desciende a un mínimo de apenas 0.20, pero el “bigote” superior se extiende significativamente hasta 27.47, demostrando mayor variabilidad en el extremo superior. Lo más destacable de esta distribución es la presencia de dos valores atípicos (outliers) por encima del límite superior, alcanzando un máximo absoluto de 39.26; esto revela la existencia de un par de casos excepcionales que logran un nivel de exportación tecnológica desproporcionadamente alto en comparación con la tendencia general de la muestra
Figura 5. Uso de internet
El grafico de caja y bigotes ilustra la distribución del uso de internet, evidenciando una amplia variabilidad en la adopción tecnológica entre los diferentes países analizados. La mediana se sitúa en un 67%, lo que indica que en la mitad de las naciones la penetración de internet alcanza a ese porcentaje de la población o menos. El bloque central, representado por la caja azul, abarca el 50% de los datos y muestra que la mayoría de los países se agrupan en un rango intercuartílico bastante amplio que va desde una conectividad moderada del 54.43% (primer cuartil) hasta un nivel alto del 80.24% (tercer cuartil). Por su parte, los extensos “bigotes” del gráfico visibilizan una profunda brecha digital global, marcando un límite inferior muy bajo de apenas 23.4% en los territorios menos conectados, contrastando fuertemente con un límite superior que alcanza una conectividad casi total del 98.16%, abarcando así todo el espectro sin registrar valores atípicos (outliers) fuera de estos extremos.
Figura 6. Gasto en investigación y desarrollo.
El grafico de caja ilustra la distribución del gasto en Investigación y Desarrollo (I+D) como porcentaje del PIB, revelando una marcada asimetría hacia valores más altos (sesgo positivo). La mediana se sitúa en un modesto 0.79%, lo que indica que la mitad de los países invierten esta proporción o menos en innovación. El rango intercuartílico, representado por la caja rosada, muestra que el 50% central de las observaciones se concentra entre el 0.35% (primer cuartil) y el 1.53% (tercer cuartil), evidenciando que la mayoría de las naciones mantienen niveles de inversión moderados-bajos. Sin embargo, el extenso “bigote” superior refleja una gran dispersión en los niveles más altos, extendiéndose hasta un valor máximo de 3.16%; esto contrasta fuertemente con el límite inferior de apenas 0.02% y demuestra que existe un grupo reducido de países altamente comprometidos que destinan una proporción significativamente mayor de su riqueza al desarrollo tecnológico.
Figura 7. Educación terciaria.
Este diagrama de caja y bigotes ilustra la distribución de la tasa bruta de matriculación en educación terciaria, evidenciando una amplia variabilidad en el acceso a la formación superior entre los distintos países. La mediana se sitúa en 64.95%, mientras que el bloque central (la caja roja) indica que la mitad central de las observaciones se concentra en un rango intercuartílico que va desde 51.09% (primer cuartil) hasta un 80.55% (tercer cuartil). Los extensos “bigotes” abarcan todo el espectro de la muestra sin registrar valores atípicos (outliers), marcando un límite inferior de 18.25% en los territorios con menor proporción de estudiantes universitarios, y extendiéndose hasta un máximo absoluto de 119.10%, una cifra que indica que en las naciones con mayor cobertura, la cantidad de matriculados supera incluso a la población que se encuentra en la edad teórica para cursar dichos estudios
Figura 8. Tasa de participación laboral
Este diagrama de caja y bigotes ilustra la distribución estadística de la tasa de participación laboral, evidenciando que la mediana se sitúa en un 70.84% de la población activa. El bloque central de los datos, representado por la caja verde que comprende el rango intercuartílico, revela que la mitad central de las observaciones se concentra en un rango relativamente estrecho entre el 66.67% (primer cuartil) y el 74.64% (tercer cuartil). Los límites o “bigotes” establecen el valor mínimo de la distribución en 54.82% y un límite superior regular de 81.49%; sin embargo, el gráfico destaca la presencia de un único valor atípico (outlier) en la parte superior, correspondiente al máximo absoluto de 87.16%, lo que señala la existencia de un caso excepcional con un nivel de integración laboral inusualmente alto en comparación con la tendencia general de la muestra.
Figura 9. Relación entre PIB por trabajdor y Gasto I+D
Este gráfico de dispersión surgiere una clara relación positiva entre el gasto en Investigación y Desarrollo (I+D) y la productividad macroeconómica (PIB por persona empleada). La tendencia general indica que la inversión tecnológica y la innovación muestran una asociación positiva con la generación de riqueza, marcando un fuerte contraste entre economías como la de Kirguistán, que registra el menor gasto en I+D (0.13) ubicándose en el fondo de la productividad, frente a casos excepcionales como Noruega, que lidera absolutamente el gráfico con un PIB de 161,312.76 a pesar de tener una inversión intermedia de 1.70. Aunque en el extremo derecho del eje hay países que invierten una mayor proporción de sus recursos en I+D (llegando a superar los 3.0), el caso noruego indica que el éxito económico no depende únicamente del volumen de gasto, sino en la eficiencia estratégica con la que esa innovación se integra al mercado laboral para maximizar el rendimiento de cada trabajador.
Figura 10. Relación entre PIB por trabajdor y uso de internet
Este grafico indica la relación entre el uso de internet y el PIB por trabajador (productividad).
Aquí se observa una relación positiva mucho más fuerte y clara: a medida que aumenta la penetración de internet en un país, su riqueza generada por persona empleada tiende a crecer de forma significativa. En la esquina inferior izquierda vemos a los países con menor conectividad (índices entre 20 y 30), los cuales también registran los niveles más bajos de productividad. Por el contrario, la zona superior derecha agrupa a las economías altamente digitalizadas y eficientes, destacando Noruega como el líder absoluto, con un uso de internet casi total (96.30) y el PIB por trabajador más alto de la muestra (161,312.76). En resumen, los datos sugieren que la conectividad tecnológica presenta una fuerte asociación positiva con la eficiencia y el desarrollo económico.
Figura 11. Relación entre PIB por trabajdor y Particpacion laboral.
En este gráfico de dispersión se observa una relación positiva pero moderada entre la participación laboral y la productividad (PIB por trabajador) de distintos países. Aunque existe una tendencia general donde un mayor nivel de empleo acompaña a una mayor riqueza, la amplia dispersión de los datos surgiere que el simple volumen de trabajadores no garantiza el éxito económico. Casos extremos como el de Noruega, que lidera en PIB, frente a Kirguistán, que registra la productividad más baja pese a tener un nivel de empleo aceptable, evidencian esta brecha.
Figura 12. Relación entre PIB por trabajdor y Educacion terciaria.
El gráfico de dispersión entre educación terciaria (medida como porcentaje de la población con estudios superiores, o tasa bruta de matrícula) y el PIB por persona empleada revela una asociación positiva. Noruega (78.11% ET, 161,313 USD) e Irlanda (73.81% ET, 153,467 USD) lideran en productividad con altos niveles educativos. En el extremo opuesto, Kirguistán (46.36% ET, 14,165 USD) y Moldavia (52.15% ET, 20,735 USD) muestran baja productividad. Sin embargo, El Salvador (27.54% ET, 23,451 USD) supera en productividad a países con mayor educación, lo que indica que el capital humano no es el único determinante. Grecia presenta una tasa de educación terciaria excepcionalmente alta (119.10%), pero su productividad (97,329 USD) es moderada en comparación con Noruega. Si bienla educación terciaria contribuye a la productividad,aunque su efecto está mediado por otros factores estructurales.
Figura 13. Relación entre PIB por trabajdor y Exportaciones de alta tecnologia.
Este gráfico de dispersión surgiere la relación entre el volumen de exportaciones de alta tecnología y la productividad medida en PIB por persona empleada. Aunque se observa una tendencia positiva moderada, la amplia dispersión de los puntos revela que liderar en exportaciones tecnológicas no se traduce automáticamente en la máxima riqueza macroeconómica. Esto queda ilustrado al comparar el caso de Noruega, que alcanza el tope de productividad (161,312.76) con un nivel intermedio de exportaciones (22.32), frente a Irlanda (24.92) y, muy especialmente, Costa Rica (36.51). En el gráfico se aprecia cómo los países ubicados en el extremo derecho como Kazajistan, a pesar de tener el mayor porcentaje de exportación de alta tecnología, mantienen niveles de PIB por trabajador considerablemente más bajos que los líderes, lo que sugiere que el impacto real en la riqueza depende de si el país desarrolla la tecnología (alto valor agregado) o si funciona principalmente como un centro de ensamblaje o manufactura.
Matriz de correlación.
Tabla 3.
La matriz de correlación muestra el grado de relación lineal entre pares de variables, donde cada celda contiene un coeficiente que varía entre -1 y 1: valores cercanos a 1 indican una relación positiva fuerte (cuando una variable aumenta, la otra también), valores cercanos a -1 indican una relación negativa fuerte (cuando una sube, la otra baja), y valores cercanos a 0 reflejan poca o ninguna relación lineal; en la representación gráfica, los tonos azules corresponden a correlaciones positivas (más oscuro = más fuerte), los tonos claros o blancos indican correlaciones débiles o cercanas a cero, y los tonos rojizos representan correlaciones negativas.
A partir de esta matriz, se observa que la variable respuesta Y tiene correlaciones positivas con todas las variables explicativas, destacándose X3 (0.79) y X2 (0.76) como las más influyentes, seguidas por X4 (0.52), X5 (0.43) y X1 (0.40) con relaciones moderadas; además, entre las variables independientes se evidencia cierta multicolinealidad, especialmente entre X2 y X3 (0.75) y en menor medida entre X2 y X5 (0.69) y X3 y X5 (0.52), lo que sugiere que algunas variables están relacionadas entre sí y podrían generar redundancia , mientras que relaciones muy bajas como X1 con X4 (0.05) indican independencia casi total; en conjunto, la matriz muestra predominio de relaciones positivas, identifica a X2 y X3 como las variables más relevantes para explicar Y.
Adicionalmente, decidimos apoyarnos en el siguiente gráfico de dispersión para evidenciar de manera más clara la relación entre la variable dependiente y las variables explicativas.
Figura 14. Grafico de dispersion entre las variables.
Finalmente, las gráficas de dispersión muestran en general patrones lineales entre las variables, los histogramas en la diagonal permiten observar la distribución de cada variable, sin evidenciar valores atípicos extremos que puedan distorsionar significativamente el análisis.
Resultados del modelo
Modelo de Regresion Lineal Multiple
Analisis del modelo
Tabla 4. Coeficientes del modelo de regresion | ||||
|---|---|---|---|---|
Variable | Estimación | Error estándar | t valor | p valor |
(Intercept) | 61826.84 | 37,298.99 | 1.66 | 0.1047 |
x1 | 576.92 | 385.83 | 1.50 | 0.1421 |
x2 | 864.91** | 292.67 | 2.96 | 0.0051 |
x3 | 18182.74*** | 4,606.94 | 3.95 | 0.0003 |
x4 | 312.16. | 164.11 | 1.90 | 0.0639 |
x5 | -1298.67* | 631.89 | -2.06 | 0.0460 |
En la tabla de coeficientes, cada componente mide:
Estimate (β): cambio estimado en la variable dependiente (PIB por persona empleada) por cada unidad de aumento en la variable independiente, manteniendo las demás constantes.
Std. Error: precisión de esa estimación; a menor valor, más fiable es el coeficiente.
t value: cociente entre Estimate y Std. Error; indica cuántas desviaciones estándar está el coeficiente de cero.
Pr(>|t|) (p-valor): probabilidad de obtener un valor t tan extremo si el coeficiente real fuera cero. Si p < 0.05 se considera estadísticamente significativo.
El término constante (intercepto) fue de 61826.8; sin embargo, presenta un p-valor de 0.1047, por lo que no es estadísticamente significativo al 5%. Dado que su interpretación implica un escenario en el que todas las variables explicativas toman valor cero (lo cual no es realista en este contexto), su falta de significancia no afecta la validez del modelo.
El gasto en investigación y desarrollo (x3) presenta el efecto más fuerte y altamente significativo (β = 18182.7, p < 0.001). Esto implica que un aumento de 1 punto porcentual en el gasto en I+D (% del PIB) se asocia con un incremento promedio de 18.183 unidades en el PIB por persona empleada, manteniendo constantes las demás variables.
El uso de internet (x2) también muestra un efecto positivo y significativo (β = 864.9, p < 0.01). En este caso, un aumento de 1 punto porcentual en la proporción de personas que utilizan internet se asocia con un incremento de aproximadamente 865 unidades en el PIB por persona empleada.
La participación laboral (x5) presenta un coeficiente negativo y significativo (β = -1298.7, p < 0.05), lo que sugiere que un incremento de 1 punto porcentual en la tasa de participación laboral se asocia con una reducción en la productividad promedio, posiblemente debido a la incorporación de trabajadores con menor capital humano o en empleos de baja productividad.
La educación terciaria (x4) presenta un efecto positivo (β = 312.2, p = 0.064), con significancia marginal al 10%. Esto indica que un aumento en la cobertura educativa superior podría estar asociado con mayores niveles de productividad, aunque la evidencia no es concluyente al nivel tradicional del 5%.
Las exportaciones de alta tecnología (x1) no resultan estadísticamente significativas (β=576.9, p = 0.142), lo que indica que, dentro de este modelo, no se puede afirmar que tengan un efecto distinto de cero sobre la variable dependiente
A partir de los resultados obtenidos, la ecuación estimada del modelo es:
\[ \hat{Y} = 61826.8 + 576.9 X_1 + 864.9 X_2 + 18182.7 X_3 + 312.2 X_4 - 1298.7 X_5 \]
Tabla 5. Medidas de bondad de ajuste del modelo | |
|---|---|
Estadístico | Valor |
R² múltiple | 0.7452 |
R² ajustado | 0.7156 |
Estadístico F | 25.15 |
p-valor (F) | 9.20e-12 |
Error residual estándar | 19284 |
El modelo de regresión explica el 74.5% de la variabilidad del PIB por persona empleada (R² = 0.7452), y tras ajustar por el número de predictores, el R² ajustado es de 0.7156. El estadístico F (25.15) es significativo (p < 0.001), lo que indica que al menos una de las variables independientes tiene un efecto distinto de cero sobre la variable dependiente. El error residual estándar (19284) representa la desviación típica de los residuos, es decir, la precisión promedio de las predicciones.
Supuestos del Modelo
Tabla 6. Supuestos del modelo
Supuesto | Estadístico | P-Valor / Valor | Criterio | Diagnóstico |
|---|---|---|---|---|
Normalidad de residuos | Shapiro-Wilk | 0.0001078761 | p > 0.05 | Violacion |
Homocedasticidad | Breusch-Pagan | 0.9817646204 | p > 0.05 | Cumple |
Multicolinealidad | Máximo VIF | 3.5480288778 | VIF < 5 | Cumple |
Normalidad: Para verificar el supuesto de normalidad se realiza la prueba de Shapiro-Wilk que arroja un valor W = 0.87729 con p-value = 0.0001079. Dado que el p-valor de la prueba de normalidad es menor al nivel de significancia habitual (α = 0,05), se rechaza la hipótesis nula de normalidad. Por lo tanto, se concluye que los residuos del modelo no siguen una distribución normal, lo que indica que este supuesto del modelo de regresión lineal no se cumple.
Homocedasticidad: La prueba de Breusch-Pagan nos da los siguientes datos; BP = 0.72156, df = 5 y p-value = 0.9818, muy superior a 0.05, lo que implica que no se rechaza la hipótesis de homocedasticidad, es decir, la varianza de los errores puede considerarse constante y este supuesto sí se cumple;
Multicolinealidad: Comprobando el supuesto de multicolinealidad, se procede a calcular el factor de inflación de la varianza para cada una de las variables independientes (VIF). Los resultados de VIF muestran que todas las variables tienen valores menores a 5 (x2 ≈ 3.55 es el más alto), lo que indica que no hay problemas graves de multicolinealidad, aunque x2 presenta una correlación moderada con otras variables, pero no lo suficientemente alta como para afectar seriamente el modelo.
Linealidad: Para evaluar si el modelo omitía términos no lineales importantes, se aplicó la prueba RESET de Ramsey (Ramsey, 1969). El estadístico obtenido fue de 2.946 con un p‑valor de 0.0638, lo que, con un nivel de significancia del 5%, no permite rechazar la hipótesis nula de correcta especificación lineal. En consecuencia, se concluye que la relación entre las variables es adecuadamente capturada por la forma lineal, corroborando lo observado en el gráfico de Residuals vs Fitted (Figura 15).
En conjunto, los resultados indican que el modelo cumple adecuadamente con los supuestos de homocedasticidad y ausencia de multicolinealidad severa. No obstante, la violación del supuesto de normalidad de los residuos sugiere que los intervalos de confianza y pruebas de significancia deben interpretarse con cautela. A pesar de ello, dado que el tamaño de muestra es moderado, el modelo puede seguir siendo útil para fines de estimación y análisis exploratorio.
Figura 15. Grafico diagnostico.
El gráfico de diagnóstico del modelo de regresión lineal múltiple permite confirmar visualmente el cumplimiento de sus principales supuestos. En el panel Residuals vs Fitted, los residuos se distribuyen alrededor de cero, lo que indica que la linealidad se cumple en términos generales, aunque con una ligera curvatura. El gráfico Normal Q-Q muestra desviaciones en los extremos, sugiriendo que los residuos no siguen completamente una distribución normal, en concordancia con la prueba de Shapiro-Wilk. Por su parte, el panel Scale-Location evidencia una dispersión relativamente constante, confirmando la ausencia de heterocedasticidad. Finalmente, en Residuals vs Leverage se identifican algunas observaciones potencialmente influyentes, como Irlanda(27), Noruega(37), Italia(28) y Costa Rica(12), sin que estas afecten de manera significativa la estabilidad del modelo.
Conclusiones
Hallazgos principales
El análisis de regresión lineal múltiple permitió identificar los principales factores asociados al PIB por persona empleada en una muestra de 49 países para el año 2014. Los resultados sugieren que variables relacionadas con la innovación y la tecnología, como el gasto en investigación y desarrollo (I+D) y el uso de internet, presentan una relación positiva y estadísticamente significativa con la productividad laboral.
Por su parte, la participación laboral muestra una relación negativa, lo que indica que un aumento en la proporción de personas activas no necesariamente se traduce en mayores niveles de productividad si no está acompañado de mejoras en capital humano o desarrollo tecnológico. En contraste, la educación terciaria presenta un efecto positivo con evidencia limitada, mientras que las exportaciones de alta tecnología no muestran una relación estadísticamente significativa dentro del modelo estimado.
En conjunto, el modelo presenta un buen desempeño explicativo, lo que sugiere que las variables incluidas capturan una parte importante de los determinantes de la productividad laboral en el contexto analizado.
Limitaciones del estudio
A pesar de los resultados obtenidos, el estudio presenta algunas limitaciones que deben considerarse. En primer lugar, la presencia de valores faltantes obligó a reducir la muestra a 49 países mediante la eliminación de observaciones incompletas, lo que puede afectar la representatividad de los resultados.
En segundo lugar, la prueba de normalidad indica que los residuos no siguen una distribución normal, lo cual puede influir en la precisión de las inferencias estadísticas. Asimismo, aunque el modelo presenta un buen nivel de ajuste, existe una proporción de la variabilidad de la variable dependiente que no es explicada, lo que sugiere la posible influencia de factores adicionales no considerados.
Finalmente, es importante señalar que el modelo identifica relaciones de asociación y no necesariamente de causalidad, por lo que los resultados deben interpretarse con cautela.
Recomendaciones
Para políticas públicas:
Los resultados sugieren que las estrategias orientadas a mejorar la productividad laboral deberían centrarse en el fortalecimiento de la inversión en investigación y desarrollo, así como en la expansión del acceso a tecnologías digitales. De igual forma, el aumento de la participación laboral debería acompañarse de políticas de formación y cualificación que permitan mejorar la eficiencia del trabajo.
Para futuras investigaciones:
Con el fin de abordar la violación del supuesto de normalidad de los residuos, se recomienda la estimación de un modelo alternativo utilizando la transformación logarítmica de la variable dependiente. Este tipo de transformación permite reducir la asimetría de la distribución y mejorar el comportamiento de los residuos, además de facilitar la interpretación de los coeficientes en términos de elasticidades.
Finalmente, se sugiere considerar la inclusión de variables adicionales y el uso de métodos de selección más robustos, con el objetivo de mejorar la capacidad explicativa del modelo.
Bibliografia.
Joaqui Barandica, O. (2023, April 16). Data Visualization in R. Recuperado de: https://www.joaquibarandica.com/post/datavizr/
Joaqui-Barandica, O. (2025, 24 de agosto). Modelo de Regresión Lineal [Diapositivas de clase]. Toma de Decisiones Basadas en Datos. https://www.joaquibarandica.com/courses/tdbd/clase03[reference:0]
Helpman, E. (2005). The Mystery of Economic Growth. The Belknap Press of Harvard University Press. (Nota: el PDF consultado corresponde a una reseña del libro de Helpman).
Vite Cristóbal, R. (2008, enero-junio). Crecimiento endógeno en un país menos desarrollado: el caso de firmas imitadoras. Economía: teoría y práctica, (28). https://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0188-33802008000100002[reference:2]
Our World in Data. (2026, 27 de febrero). Research & development spending as a share of GDP. https://ourworldindata.org/grapher/research-spending-gdp[reference:3]
Finanzas para Mortales. (s.f.). Simon Kuznets – Premio Nobel de Economía 1971. https://finanzasparamortales.es/simon-kuznets-premio-nobel-de-economia-1971/[reference:4]
Investopedia. (2010, 12 de julio). Simon Kuznets and the Kuznets Curve: Economic Insights. https://www.investopedia.com/terms/s/simon-kuznets.asp[reference:5]
Investopedia. (2015, 3 de junio). Linear vs. Multiple Regression Explained. https://www.investopedia.com/terms/m/mlr.asp[reference:6]
Our World in Data. (2026, 27 de febrero). GDP per employed person (constant 2021 PPP $). https://ourworldindata.org/grapher/gdp-per-person-employed-constant-ppp[reference:7][reference:8]
Organización Internacional del Trabajo (OIT). (2014, 20 de enero). Tendencias Mundiales del Empleo 2014: ¿Cuál es la situación laboral a nivel mundial? https://www.ilo.org/es/resource/tendencias-mundiales-del-empleo-2014-cual-es-la-situacion-laboral-nivel[reference:9]
Impacto TIC. (2024, 25 de noviembre). Innovación disruptiva: ¿qué es y cómo afrontarla? https://impactotic.co/innovacion/innovacion-disruptiva-que-es-y-como-afrontarla/[reference:10]
El Economista. (2014, 25 de diciembre). Eventos que impactaron los mercados en el 2014 latinoamericanos. https://www.eleconomista.com.mx/finanzaspersonales/Eventos-que-impactaron-los-mercados-en-el-2014-latinoamericanos-20141225-0085.html[reference:11]
Banco Mundial. (2018, enero). En ocho gráficos: las causas de la caída del precio del petróleo en 2014-16 y los motivos por los que esta no logró impulsar la economía. Blogs del Banco Mundial. https://blogs.worldbank.org/es/voices/en-ocho-graficos-las-causas-de-la-caida-del-precio-del-petroleo-en-2014-16[reference:12]
Cahyaningtyas, R. D. (2023, 28 de mayo). rmarkdown_themes. RPubs. https://rpubs.com/ranydc/rmarkdown_themes