UNIVERSIDAD DE EL SALVADOR

FACULTAD DE CIENCIAS ECONÓMICAS

ESCUELA DE ECONOMÍA


TEMA: FACTORES QUE DETERMINAN EL NIVEL DE EMPLEADOS DE UNA EMPRESA PARA DISEÑAR UNA PROPUESTA COMPETITIVA DE RETENCIÓN

MATERIA: ECONOMETRÍA

DOCENTE: CARLOS ADEMIR PÉREZ

INTEGRANTES:

APELLIDOS NOMBRES CARNET PARTICIPACIÓN
CASTRO PÉREZ LUZ IMELDA CP24023 100%
MIRANDA MANCIA KATHERINE GABRIELA MM24051 100%
SANTAMARÍA ALVARENGA MAYDELLINE NAYELY SA23039 100%

CICLO: I-2026.

FECHA: 21 DE JUNIO DEL 2026.

CIUDAD UNIVERSITARIA, SAN SALVADOR.

1 Introducción y Marco Teórico

1.1 Introducción

La determinación de los ingresos laborales es un tema central de la economía laboral, pues el salario de un trabajador no responde a decisiones administrativas arbitrarias, sino a su productividad, trayectoria y posición dentro de la estructura organizacional; comprender estas diferencias resulta clave para diseñar políticas de compensación que atraigan y retengan talento, sobre todo considerando que la rotación de personal genera costos directos e indirectos para las empresas (Mobley, 1977). Con base en la Teoría del Capital Humano (Becker, 1964; Mincer, 1974) y la Teoría de Torneos (Lazear y Rosen, 1981), se plantea que el ingreso mensual de un empleado depende de su experiencia laboral acumulada, su especialización en el puesto actual, su nivel jerárquico y su historial de movilidad laboral, hipótesis que se contrasta empíricamente mediante un Modelo Clásico de Regresión Lineal Múltiple con especificación semilogarítmica (Log-Lin), estructurado en tres partes: marco teórico y especificación del modelo, evidencia empírica y análisis descriptivo, y finalmente estimación, verificación de supuestos y ejercicio de pronóstico y simulación, con el fin de identificar los determinantes del ingreso y derivar implicaciones para una propuesta competitiva de retención del personal.

1.2 Planteamiento del Problema

La determinación del ingreso laboral es uno de los fenómenos centrales de la economía del trabajo, ya que las diferencias salariales entre individuos no surgen de manera arbitraria, sino que reflejan distintos niveles de capital humano, posición jerárquica y trayectoria profesional. A pesar de que la teoría económica ofrece marcos explicativos sólidos para entender estas diferencias —como la Teoría del Capital Humano (Becker, 1964; Mincer, 1974) y la Teoría de Torneos (Lazear y Rosen, 1981)—, en la práctica las organizaciones no siempre cuentan con evidencia cuantitativa que permita identificar con precisión cuáles de estos factores influyen realmente sobre el ingreso de sus empleados. Esta falta de claridad limita la capacidad de las empresas para diseñar estructuras salariales coherentes con la productividad y la trayectoria de su personal. En este contexto, surge la necesidad de estimar un modelo econométrico que permita cuantificar el efecto de la experiencia laboral, la especialización en el puesto, el nivel jerárquico y la movilidad laboral sobre el ingreso mensual, utilizando como fuente de información el conjunto de datos IBM HR Analytics.

1.3 Justificación.

La investigación se justifica desde una perspectiva práctica, ya que la rotación de personal genera costos directos (reclutamiento, selección y contratación) e indirectos (capacitación y pérdida temporal de productividad) para las organizaciones; identificar con precisión los determinantes del ingreso mensual permite diseñar políticas salariales más informadas que ayuden a competir por el talento humano y reducir la fuga de conocimiento institucional. Teóricamente, el estudio aporta valor al integrar en un mismo modelo dos enfoques que suelen analizarse por separado —la Teoría del Capital Humano (Becker, 1964; Mincer, 1974) y la Teoría de Torneos (Lazear y Rosen, 1981)—, enriqueciendo la discusión sobre cuál de estos mecanismos pesa más al explicar las diferencias salariales dentro de una organización.

Además, el uso de herramientas estadísticas y econométricas permite analizar de forma objetiva la relación entre las variables, facilitando resultados confiables y útiles para la toma de decisiones. La investigación tiene también relevancia social y empresarial, pues sus hallazgos pueden traducirse en recomendaciones concretas para Recursos Humanos en el diseño de una propuesta competitiva de retención, sustentada en evidencia cuantitativa y no en criterios subjetivos.

1.4 Objetivos

1.4.1 Objetivo General.

Modelar los determinantes del ingreso mensual de los empleados en el ámbito laboral corporativo mediante la aplicación del Modelo Clásico de Regresión Lineal Múltiple utilizando información del dataset IBM HR.

1.4.2 Objetivos Específicos.

-Especificar un modelo econométrico que relaciona el ingreso mensual de los empleados con la especialización en el puesto actual, el nivel Jerárquico, la experiencia laboral acumulada, y el historial de movilidad laboral..

-Estimar los parámetros del modelo de regresión lineal múltiple para cuantificar el efecto de las variables explicativas sobre el ingreso mensual.

-Evaluar la significancia estadística y económica de las variables incluidas en el modelo para identificar los principales determinantes del ingreso mensual de los empleados.

1.5 Marco Teórico.

Determinantes del ingreso y su impacto en la retención del personal.

La rotación de personal es uno de los principales desafíos para las organizaciones modernas (Mobley, 1977), pues genera costos directos de reclutamiento y contratación, costos indirectos de capacitación y pérdidas temporales de productividad mientras los nuevos empleados alcanzan su curva óptima de desempeño; por ello, comprender los factores de permanencia laboral es clave para diseñar estrategias de retención, donde la compensación salarial percibida como justa actúa como mediador central para reducir la intención de abandono voluntario.

La Teoría del Capital Humano.

La Teoría del Capital Humano, formalizada por Becker (1964) y Mincer (1974), sostiene que el ingreso de un empleado no se fija arbitrariamente, sino que refleja las inversiones que el individuo realiza en sí mismo (educación, experiencia) para incrementar sus competencias, lo cual aumenta su productividad potencial y se traduce en mayores salarios.

Capital Humano General vs. Capital Humano Específico.

Becker (1964) distingue entre el capital humano general —conocimientos transferibles a cualquier empresa, como la experiencia laboral total, que debe remunerarse para evitar la fuga de talento— y el capital humano específico —competencias valiosas solo dentro de la empresa o puesto actual, que generan interdependencia mutua entre empleado y empleador al no ser igualmente remuneradas en el exterior.

El modelo de ingresos de Mincer.

Mincer (1974) formalizó la ecuación de ingresos donde el logaritmo del salario se explica por la educación y la experiencia laboral; este modelo ha servido de base para la econometría laboral contemporánea, que incorpora además variables organizacionales como la estructura jerárquica y la trayectoria laboral como determinantes del ingreso mensual.

Nivel Jerárquico y la Teoría de Torneos.

Lazear y Rosen (1981) plantearon la Teoría de Torneos para explicar por qué los ingresos aumentan de forma marcada al ascender en la jerarquía organizacional: los salarios más altos no solo compensan la responsabilidad del cargo, sino que funcionan como un premio que motiva y retiene a los empleados de niveles inferiores, convirtiendo al nivel jerárquico en uno de los determinantes institucionales más robustos del ingreso.

Experiencia Laboral Acumulada.

En línea con Mincer (1974), los años totales de experiencia laboral representan la acumulación de capital humano general a lo largo de la vida activa del trabajador, por lo que las organizaciones competitivas deben reconocer y remunerar este stock de experiencia para atraer y retener perfiles experimentados.

Especialización Funcional.

Los años desempeñando de forma continua una misma función reflejan la acumulación de capital humano específico (Becker, 1964), pues el trabajador desarrolla mayor maestría técnica y reduce errores, por lo que las políticas salariales deben reconocer esta especialización para blindar a estos expertos frente a la rotación.

Movilidad laboral externa.

El número de empresas previas en las que ha trabajado un individuo refleja su movilidad laboral, la cual puede señalar capacidades adquiridas en distintas culturas corporativas, pero también representa un factor de riesgo que Recursos Humanos debe vigilar, pues un historial de alta movilidad puede asociarse a menor satisfacción y mayor probabilidad de abandono prematuro (Mobley, 1977).

2 Especificación del Modelo - Parte 1

2.1 Determinación de las variables

2.1.1 Variable Endógena

(Ingreso Mensual)

Representa el retorno económico fijo que percibe el trabajador por sus servicios dentro de la organización al momento del levantamiento de los datos de forma mensual, esta variable es cuantitativa y se medirá en dólares estadounidenses.

2.1.2 Variables Exógenas

(Especialización en el puesto actual)

Mide el tiempo ininterrumpido que el trabajador ha desempeñado su función, cargo o rol actual dentro de la organización. Esta métrica captura la formación de capital humano específico asociado a la tarea, esta variable será medida en años en el puesto actual en el que se ha desempeñado el empleado.

(Nivel jerárquico)

Refleja la posición o rango que ocupa el empleado dentro de la estructura corporativa de la empresa. Captura los distintos grados de responsabilidad administrativa y operativa, al ser una variable categoricá, para su medición se se tomará en cuenta desde el nivel 1 al nivel 5.

(Experiencia Laboral Acumulada)

Cuantifica el tiempo total que el individuo ha estado activo en el mercado de trabajo a lo largo de su vida profesional. Esta variable representa la acumulación de su capital humano general, esta variable se medirá en años trabajados.

NumCompaniesWorked(Historial de movilidad laboral)

Contabiliza la cantidad de empleadores o empresas externas distintas en las que el colaborador laboró de manera previa a su puesto en la organización analizada, indicando su nivel de rotación externa histórica, esta variable será medida por el número de empresas que ha trabajado el empleado.

2.2 Especificación del modelo matématico y estadístico

Especificación del modelo matemático

El modelo matemático expresa la relación funcional entre el ingreso mensual de los empleados y las variables explicativas seleccionadas, de acuerdo con la Teoría del Capital Humano y la Teoría de Torneos. Se plantea que el ingreso mensual depende de la experiencia laboral acumulada, la especialización en el puesto actual, la movilidad laboral y el nivel jerárquico ocupado dentro de la organización.

Restricciones del modelo

Determinaremos como \(m\) como el ingreso mensual que perciben los empleados en unidades monetarias de los Estados Unidos de América \(m >= 0\) se dice que es mayor o igual a 0 debido a que no existe un ingreso negativo.

Sea \(e\) la experiencia laboral acumulada medida por el total años trabajados \(e >= 0\), dado que los empleados podrían tener cero años de experiencia laboral.

Sea \(r\) la especialización en el puesto actual medida por el total de años desempeñados en el puesto actual \(r >= 0\) , dado que los empleados podrían tener cero años de desempeñar ese cargo.

Sea \(x\) el historial de movilidad laboral medida por el número de compañias que el empleado trabajó en otras compañias entonces \(x >= 0\) dado que puede que los empleados no hayan trabajado en ninguna otra compañia.

Sea \(w\) el nivel jerárquico está expresado en etiquetas de acuerdo al nivel, los cuales se muestran a continuación:

Tabla 3. Codificación de la variable Nivel Jerárquico
Descripcion Etiqueta
Nivel inicial 1
Nivel Junior 2
Nivel intermedio 3
Nivel Senior 4
Nivel ejecutivo 5

Transformación funcional del modelo

Con el propósito de reducir la asimetría presente en la distribución del ingreso mensual y mejorar el ajuste estadístico del modelo, se aplicó una transformación logarítmica a la variable dependiente. En consecuencia, la especificación adoptada corresponde a un modelo semilogarítmico (Log-Lin), en el cual el logaritmo natural del ingreso mensual es explicado por las variables independientes seleccionadas.

Por lo tanto, la relación funcional del modelo puede expresarse de la siguiente manera:

\[ \ln(m)=f(e,r,x,w) \]

Se espera una relación positiva entre el ingreso mensual (m) y cada una de las variables explicativas: experiencia laboral acumulada (e), especialización en el puesto actual (r), movilidad laboral (x) y nivel jerárquico (w). Por tanto, un aumento en cualquiera de estas variables incrementaría el ingreso mensual esperado, manteniendo constantes las demás variables.Restricciones de los parámetros del modelo De acuerdo con los fundamentos teóricos utilizados en la investigación, se espera que las variables explicativas ejerzan un efecto positivo sobre el ingreso mensual de los empleados. Por lo tanto, los parámetros del modelo deben cumplir las siguientes restricciones de signo:

\[ \ln(m)=(+,+,+,+) \]

Ecuación matematica del modelo

\[ \widehat{\ln(m_i)} = \hat{\beta}_0 + \hat{\beta}_1 e_i + \hat{\beta}_2 r_i + \hat{\beta}_3 x_i + \hat{\beta}_4 w_i \]

Modelo Estadístico

El modelo estadístico se obtiene al incorporar un término de perturbación aleatoria que recoge aquellos factores que influyen sobre el ingreso mensual de los empleados y que no han sido incluidos explícitamente dentro de la especificación del modelo, expresandose de la siguiente forma:

\[ \ln(m_i) = \beta_0 + \beta_1 e_i + \beta_2 r_i + \beta_3 x_i + \beta_4 w_i + \varepsilon_i \]

2.2.1 Hipótesis de Investigación

Hipótesis general

El ingreso mensual de los empleados no está determinado positivamente por la especialización en el puesto actual, la experiencia laboral acumulada, el nivel jerárquico y del número de empresas en las que haya trabajado el empleado.

Hipótesis especificas

Especialización en el puesto actual

H0: La especialización en el puesto actual tiene una relación lineal parcial con el ingreso mensual que percibe el empleado.

HA: La especialización en el puesto actual no tiene una relación lineal parcial con el ingreso mensual que percibe el empleado.

Experiencia laboral acumulada

H0:La experiencia laboral acumulada tiene una relación lineal parcial con el ingreso mensual que percibe el empleado.

HA: La experiencia laboral acumulada no tiene una relación lineal parcial con el ingreso mensual que percibe el empleado.

Nivel jerárquico

H0: El nivel jerárquico tiene una relación lineal parcial con el ingreso mensual que percibe el empleado.

HA: El nivel jerárquico tiene no tiene una relación lineal parcial con el ingreso mensual que percibe el empleado.

Historial de movilidad laboral

H0: El historial de movilidad laboral tiene una relación lineal parcial con ingreso mensual que percibe el empleado.

HA: El historial de movilidad laboral no tiene una relación lineal parcial con ingreso mensual que percibe el empleado.

2.3 Evidencia empirica del fenómeno económico

##   Age Attrition    BusinessTravel DailyRate             Department
## 1  41       Yes     Travel_Rarely      1102                  Sales
## 2  49        No Travel_Frequently       279 Research & Development
## 3  37       Yes     Travel_Rarely      1373 Research & Development
## 4  33        No Travel_Frequently      1392 Research & Development
## 5  27        No     Travel_Rarely       591 Research & Development
##   DistanceFromHome Education EducationField EmployeeCount EmployeeNumber
## 1                1         2  Life Sciences             1              1
## 2                8         1  Life Sciences             1              2
## 3                2         2          Other             1              4
## 4                3         4  Life Sciences             1              5
## 5                2         1        Medical             1              7
##   EnvironmentSatisfaction Gender HourlyRate JobInvolvement JobLevel
## 1                       2 Female         94              3        2
## 2                       3   Male         61              2        2
## 3                       4   Male         92              2        1
## 4                       4 Female         56              3        1
## 5                       1   Male         40              3        1
##                 JobRole JobSatisfaction MaritalStatus MonthlyIncome MonthlyRate
## 1       Sales Executive               4        Single          5993       19479
## 2    Research Scientist               2       Married          5130       24907
## 3 Laboratory Technician               3        Single          2090        2396
## 4    Research Scientist               3       Married          2909       23159
## 5 Laboratory Technician               2       Married          3468       16632
##   NumCompaniesWorked Over18 OverTime PercentSalaryHike PerformanceRating
## 1                  8      Y      Yes                11                 3
## 2                  1      Y       No                23                 4
## 3                  6      Y      Yes                15                 3
## 4                  1      Y      Yes                11                 3
## 5                  9      Y       No                12                 3
##   RelationshipSatisfaction StandardHours StockOptionLevel TotalWorkingYears
## 1                        1            80                0                 8
## 2                        4            80                1                10
## 3                        2            80                0                 7
## 4                        3            80                0                 8
## 5                        4            80                1                 6
##   TrainingTimesLastYear WorkLifeBalance YearsAtCompany YearsInCurrentRole
## 1                     0               1              6                  4
## 2                     3               3             10                  7
## 3                     3               3              0                  0
## 4                     3               3              8                  7
## 5                     3               3              2                  2
##   YearsSinceLastPromotion YearsWithCurrManager
## 1                       0                    5
## 2                       1                    7
## 3                       0                    0
## 4                       3                    0
## 5                       2                    2

2.4 Datos de las variables

Evidencia empírica por variable
MonthlyIncome YearsInCurrentRole TotalWorkingYears JobLevel NumCompaniesWorked
5993 4 8 2 8
5130 7 10 2 1
2090 0 7 1 6
2909 7 8 1 1
3468 2 6 1 9
3068 7 8 1 0
2670 0 12 1 4
2693 0 1 1 1
9526 7 10 3 0
5237 7 17 2 6

2.5 Estadisticas descriptivas

Estadísticas descriptivas de las variables
n mean sd min max
MonthlyIncome 1470 6502.93 4707.96 1009 19999
YearsInCurrentRole 1470 4.23 3.62 0 18
TotalWorkingYears 1470 11.28 7.78 0 40
JobLevel 1470 2.06 1.11 1 5
NumCompaniesWorked 1470 2.69 2.50 0 9

3 Estimación y Diagnóstico - Parte 2

3.1 Estimación Inicial por MCO

## 
## Modelo de Regresion Lineal Multiple para el Ingreso Mensual
## =================================================
##                          Dependent variable:     
##                     -----------------------------
##                          log(MonthlyIncome)      
## -------------------------------------------------
## NumCompaniesWorked           0.01210***          
##                               (0.00284)          
##                                                  
## YearsInCurrentRole           0.01164***          
##                               (0.00214)          
##                                                  
## JobLevel                     0.52706***          
##                               (0.00973)          
##                                                  
## TotalWorkingYears              0.00118           
##                               (0.00149)          
##                                                  
## Constant                     7.36963***          
##                               (0.01596)          
##                                                  
## -------------------------------------------------
## Observations                    1,470            
## R2                             0.85155           
## Adjusted R2                    0.85115           
## Residual Std. Error      0.25636 (df = 1465)     
## F Statistic         2,100.91700*** (df = 4; 1465)
## =================================================
## Note:                 *p<0.1; **p<0.05; ***p<0.01

Interpretación general del modelo estimado

Los resultados de la estimación muestran que el modelo presenta una elevada capacidad explicativa. El coeficiente de determinación (R^2 = 0.87091) indica que aproximadamente el 87.09% de la variación observada en el logaritmo del ingreso mensual de los empleados es explicada por las variables incluidas en el modelo: historial de movilidad laboral, especialización en el puesto actual, nivel jerárquico y experiencia laboral acumulada.Asimismo, el (R^2) ajustado de 0.87029 confirma que el modelo mantiene un alto poder explicativo incluso después de considerar el número de variables independientes incorporadas.

Por otra parte, el estadístico F = 1409.085 presenta significancia estadística al 1% ((p < 0.01)), lo que permite rechazar la hipótesis nula de que todos los coeficientes son simultáneamente iguales a cero. En consecuencia, se concluye que las variables explicativas incluidas en el modelo contribuyen de manera conjunta a explicar el ingreso mensual de los empleados.Finalmente, todas las variables presentan coeficientes estadísticamente significativos al nivel del 1%, lo que evidencia una relación relevante entre los factores considerados y el ingreso mensual de los trabajadores.

3.1.1 Verificacion de ajuste de los residuos

Los gráficos de diagnóstico muestran que los residuos presentan una distribución aproximadamente normal. El histograma evidencia una forma cercana a la distribución normal teórica, mientras que los gráficos CDF y P-P muestran un ajuste satisfactorio entre la distribución empírica y la distribución normal. Por su parte, el gráfico Q-Q revela ligeras desviaciones en las colas de la distribución; sin embargo, estas diferencias no son suficientemente pronunciadas como para cuestionar la validez del supuesto de normalidad. En consecuencia, puede afirmarse que los residuos del modelo presentan un comportamiento razonablemente compatible con una distribución normal, pero si sigue o no una distribución normal se determinará con las pruebas de normalidad ya conocidas.

3.2 Diagnóstico de Supuestos del MCRLM

3.2.1 Prueba de Normalidad Jarque-Bera JB

## 
##  Jarque Bera Test
## 
## data:  Modelo_Ingreso$residuals
## X-squared = 110.23, df = 2, p-value < 2.2e-16

Grafico de la prueba de normalidad Jarque Bera

El resultado de la prueba de Jarque-Bera indica que los residuos del modelo no siguen una distribución normal. El elevado valor del estadístico JB y el valor-p prácticamente igual a cero,por lo tanto, se rechaza la hipótesis nuula y se concluye que existen diferencias significativas entre la distribución observada de los residuos y una distribución normal teórica.

3.2.2 Prueba de Normalidad Kolmogorov-Smirnov KS

## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  Modelo_Ingreso$residuals
## D = 0.031641, p-value = 0.001545
## [1] 0.001544636

La prueba de normalidad de Kolmogorov-Smirnov con corrección de Lilliefors aplicada a los residuos del modelo arroja un estadístico D = 0.031641 y un valor-p de 0.001545. Dado que el valor-p es inferior al nivel de significancia del 5%, se rechaza la hipótesis nula de normalidad. En consecuencia, existe evidencia estadística para concluir que los residuos no siguen una distribución normal.

3.2.3 Prueba de Normalidad Shapiro-Wilk SW

Regla de decisión Si el valor-p es menor que 0.05, se rechaza la hipótesis nula de normalidad.

## 
##  Shapiro-Wilk normality test
## 
## data:  resid(Modelo_Ingreso)
## W = 0.98298, p-value = 0.000000000003682
## [1] 6.850427

La prueba de Shapiro-Wilk aplicada a los residuos del modelo reporta un estadístico (W = 0.98298) y un valor-p inferior a 0.01. Dado que el valor-p es menor al nivel de significancia del 5%, se rechaza la hipótesis nula de normalidad. Por consiguiente, existe evidencia estadística para concluir que los residuos no siguen una distribución normal.

3.2.4 Prueba de Multicolinealidad

Calculo del indice de condición

##   Eigenvalue Condition Index        intercept NumCompaniesWorked
## 1 4.06597967        1.000000 0.00926147697281         0.01589471
## 2 0.49808169        2.857145 0.00124367866165         0.53644740
## 3 0.21023735        4.397721 0.00000003019635         0.24310748
## 4 0.17423795        4.830713 0.70313047693887         0.14397464
## 5 0.05146334        8.888605 0.28636433723032         0.06057576
##   YearsInCurrentRole        JobLevel TotalWorkingYears
## 1         0.01405033 0.0047890544029       0.005861921
## 2         0.20335970 0.0019749491804       0.002952376
## 3         0.69297948 0.0914742960995       0.097492861
## 4         0.05133619 0.0000008575656       0.131751851
## 5         0.03827430 0.9017608427516       0.761940991

Escala para medir el indice de condición

κ < 10 → multicolinealidad muy leve

10 ≤ κ < 30 → Multicolinealidad moderada

κ ≥ 30 → Multicolinealidad severa

Resultado: κ(x) = 8.88

3.2.5 Prueba de Farrar-Glaubar

## 
## Call:
## mctest::omcdiag(mod = Modelo_Ingreso)
## 
## 
## Overall Multicollinearity Diagnostics
## 
##                        MC Results detection
## Determinant |X'X|:         0.2713         0
## Farrar Chi-Square:      1913.6484         1
## Red Indicator:             0.4204         0
## Sum of Lambda Inverse:     8.0456         0
## Theil's Method:           -0.9092         0
## Condition Number:          8.8886         0
## 
## 1 --> COLLINEARITY is detected by the test 
## 0 --> COLLINEARITY is not detected by the test
## [1] 1913.648
## [1] 12.59159

Con el propósito de detectar posibles problemas de multicolinealidad entre las variables explicativas, se calculó el Índice de Condición (Condition Index). Los resultados muestran que el valor máximo obtenido fue de 8.88, cifra inferior al umbral crítico de 10 establecido en la literatura econométrica.En consecuencia, se concluye que no existe evidencia de multicolinealidad significativa entre las variables incluidas en el modelo. Esto sugiere que las variables explicativas aportan información diferenciada para explicar el ingreso mensual de los empleados y que las estimaciones de los coeficientes son estables y confiables.

Grafico de la prueba de Farrar- Glaubar

3.2.6 Factores de Inflación de la Varianza(VIF)

## NumCompaniesWorked YearsInCurrentRole           JobLevel  TotalWorkingYears 
##           1.124408           1.343086           2.593279           2.984820

Los resultados muestran que el estadístico Chi-cuadrado de Farrar-Glauber fue igual a 1913.65 y dado que vc= 12.59 se rechaza la hipótesis nula indicando la presencia de correlación entre algunas variables explicativas. Sin embargo, los demás indicadores de diagnóstico, tales como el determinante de la matriz (X’X), el indicador Red, la suma de los inversos de los autovalores, el método de Theil y el índice de condición, no detectan problemas de multicolinealidad.

3.2.7 Pruebas de Heterocedasticidad de White.

Regla de desición: Si el p-value<0.05 se rechaza la hipótesis nula.

## # A tibble: 1 × 5
##   statistic    p.value parameter method       alternative
##       <dbl>      <dbl>     <dbl> <chr>        <chr>      
## 1      50.8 0.00000443        14 White's Test greater

Con el propósito de verificar el supuesto de homocedasticidad, se aplicó la prueba de White a los residuos del modelo estimado. Los resultados muestran un estadístico de White igual a 50.8275 y un valor-p de 0.000004434858.Dado que el valor-p es inferior al nivel de significancia del 5%, se rechaza la hipótesis nula de homocedasticidad. En consecuencia, existe evidencia estadística de heterocedasticidad en los residuos del modelo, lo que indica que la varianza del término de error no permanece constante para todas las observaciones.

3.2.8 Pruebas de Autocorrelacion.

3.2.8.1 Prueba de autocorrelación 1° de Durbin Watson

Prueba de Durbin-Watson de 1° orden es posible determinar la autocorrelación que corresponde a la presencia de asociación entre los valores precedentes de las observaciones de una variable o serie temporal.

En la prueba de Durbin-Watson Supone una estructura del residuo de la forma:

ui=ρui−1+vi

## 
##  Durbin-Watson test
## 
## data:  Modelo_Ingreso
## DW = 1.9099, p-value = 0.08413
## alternative hypothesis: true autocorrelation is not 0

Con el propósito de verificar el supuesto de ausencia de autocorrelación, se aplicó la prueba de Durbin-Watson a los residuos del modelo estimado. Los resultados muestran un estadístico DW = 1.9099 y un valor-p de 0.08413. Dado que el valor-p es superior al nivel de significancia del 5%, no se rechaza la hipótesis nula de ausencia de autocorrelación. Asimismo, el estadístico obtenido es cercano al valor teórico de 2, lo que sugiere que los residuos son independientes entre sí.En consecuencia, se concluye que no existe evidencia estadística de autocorrelación en los residuos del modelo, por lo que este supuesto se considera satisfecho.

3.2.8.2 Prueba del multiplicador de Lagrange (Breusch-Godfrey)

Supone una estructura del residuo de la forma:

uj=ρ1ui−1+ρ2ui−2+…+ρmui−m+vi

## 
##  Breusch-Godfrey test for serial correlation of order up to 1
## 
## data:  Modelo_Ingreso
## LM test = 2.9791, df = 1, p-value = 0.08435

3.2.9 Prueba de Breusch-Godfrey 2° orden

## 
##  Breusch-Godfrey test for serial correlation of order up to 2
## 
## data:  Modelo_Ingreso
## LM test = 3.2673, df = 2, p-value = 0.1952

Se aplicó la prueba del Multiplicador de Lagrange de Breusch-Godfrey para autocorrelación de primer y segundo orden.En la prueba de primer orden se obtuvo un estadístico LM de 2.9791 y un valor-p de 0.08435. Dado que el valor-p es superior al nivel de significancia del 5%, no se rechaza la hipótesis nula de ausencia de autocorrelación.

Asimismo, para la prueba de segundo orden se obtuvo un estadístico LM de 3.2673 y un valor-p de 0.1952. Al ser este valor superior a 0.05, tampoco se rechaza la hipótesis nula.Por consiguiente, los resultados de ambas pruebas indican que no existe evidencia estadística de autocorrelación serial en los residuos del modelo, por lo que se considera satisfecho el supuesto de independencia de los errores.

4 Correcciones y Simulación - Parte 3.

4.1 Medidas correctivas

  • El único supuesto violado fue el de homocedasticidad (prueba de White).
  • La heterocedasticidad no sesga los coeficientes, pero sí afecta la validez de los errores estándar y, por tanto, las pruebas de significancia.
  • Solución: reestimar el modelo con errores estándar robustos consistentes a heterocedasticidad y autocorrelación (HAC), sin modificar los coeficientes estimados.

4.2 Inferencia robusta (HAC)

library(lmtest)
library(sandwich)

# Errores estándar robustos HC1
Omega <- vcovHC(Modelo_Ingreso, type = "HC1")
coeftest(Modelo_Ingreso, vcov. = Omega)
## 
## t test of coefficients:
## 
##                     Estimate Std. Error  t value              Pr(>|t|)    
## (Intercept)        7.3696271  0.0175094 420.8958 < 0.00000000000000022 ***
## NumCompaniesWorked 0.0120958  0.0026734   4.5246          0.0000065412 ***
## YearsInCurrentRole 0.0116359  0.0021592   5.3889          0.0000000825 ***
## JobLevel           0.5270631  0.0090833  58.0252 < 0.00000000000000022 ***
## TotalWorkingYears  0.0011766  0.0013971   0.8422                0.3998    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Corrección de segundo orden (Newey-West)
EsOmega <- NeweyWest(Modelo_Ingreso, lag = 2)
coeftest(Modelo_Ingreso, vcov. = EsOmega)
## 
## t test of coefficients:
## 
##                     Estimate Std. Error  t value              Pr(>|t|)    
## (Intercept)        7.3696271  0.0178059 413.8858 < 0.00000000000000022 ***
## NumCompaniesWorked 0.0120958  0.0025865   4.6765          0.0000031872 ***
## YearsInCurrentRole 0.0116359  0.0021986   5.2923          0.0000001392 ***
## JobLevel           0.5270631  0.0090512  58.2312 < 0.00000000000000022 ***
## TotalWorkingYears  0.0011766  0.0013727   0.8571                0.3915    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

4.3 Comparación MCO vs. modelo corregido

se_mco <- sqrt(diag(vcov(Modelo_Ingreso)))
se_hc1 <- sqrt(diag(vcovHC(Modelo_Ingreso, type = "HC1")))

stargazer(
  Modelo_Ingreso, Modelo_Ingreso,
  se = list(se_mco, se_hc1),
  type = "html",
  column.labels = c("No corregido", "Corregido (HC1)")
)
Dependent variable:
log(MonthlyIncome)
No corregido Corregido (HC1)
(1) (2)
NumCompaniesWorked 0.012*** 0.012***
(0.003) (0.003)
YearsInCurrentRole 0.012*** 0.012***
(0.002) (0.002)
JobLevel 0.527*** 0.527***
(0.010) (0.009)
TotalWorkingYears 0.001 0.001
(0.001) (0.001)
Constant 7.370*** 7.370***
(0.016) (0.018)
Observations 1,470 1,470
R2 0.852 0.852
Adjusted R2 0.851 0.851
Residual Std. Error (df = 1465) 0.256 0.256
F Statistic (df = 4; 1465) 2,100.917*** 2,100.917***
Note: p<0.1; p<0.05; p<0.01

Tras identificar evidencia de heterocedasticidad mediante la prueba de White, se procedió a reestimar el modelo empleando errores estándar robustos HC1. La comparación de ambas estimaciones permite evaluar la estabilidad de los resultados obtenidos.Los resultados muestran que los coeficientes estimados permanecen inalterados entre el modelo original y el modelo corregido, lo que indica que la heterocedasticidad no afecta la magnitud ni la dirección de los efectos identificados. Asimismo, los errores estándar robustos presentan variaciones mínimas respecto a los obtenidos mediante Mínimos Cuadrados Ordinarios.

Las variables historial de movilidad laboral (NumCompaniesWorked), especialización en el puesto actual (YearsInCurrentRole) y nivel jerárquico (JobLevel) mantienen significancia estadística al 1% en ambas especificaciones, evidenciando la solidez de sus efectos sobre el ingreso mensual de los empleados. Por el contrario, la variable experiencia laboral acumulada (TotalWorkingYears) continúa siendo estadísticamente no significativa, incluso después de aplicar la corrección robusta.De igual forma, las medidas globales de ajuste del modelo permanecen constantes ((R^2 = 0.852) y (R^2) ajustado = 0.851), lo que confirma que la capacidad explicativa del modelo no se ve afectada por la corrección aplicada.

En consecuencia, puede afirmarse que los resultados obtenidos son robustos frente a la presencia de heterocedasticidad. La corrección HC1 mejora la confiabilidad de la inferencia estadística sin modificar las conclusiones económicas derivadas del modelo.

4.4 Pruebas de hipótesis individuales (con HAC)

confint(Modelo_Ingreso, vcov. = EsOmega, level = 0.95)
##                           2.5 %      97.5 %
## (Intercept)         7.338321503 7.400932720
## NumCompaniesWorked  0.006526391 0.017665185
## YearsInCurrentRole  0.007439177 0.015832567
## JobLevel            0.507975953 0.546150236
## TotalWorkingYears  -0.001736674 0.004089804

Con un nivel de confianza del 95% no se rechaza la hipótesis nula y se dice que hay evidencia que la variable especialización en el puesto actual tiene una relación lineal parcial con el ingreso mensual que percibe el empleado

Con un nivel de confianza del 95% se rechaza la hipótesis nula y se dice que hay evidencia que la variable experiencia laboral acumulada no tiene una relación lineal parcial con el ingreso mensual que percibe el empleado

Con un nivel de confianza del 95% no se rechaza la hipótesis nula y se dice que hay evidencia que la variable nivel jerárquico tiene una relación lineal parcial con el ingreso mensual que percibe el empleado

Con un nivel de confianza del 95% no se rechaza la hipótesis nula y se dice que hay evidencia que la variable historial de movilidad laboral tiene una relación lineal parcial con el ingreso mensual que percibe el empleado

4.5 Análisis de simulación: diseño.

## 
## Medidas de Performance Datos del Modelo
## ======================================================
## Statistic   N     Mean    St. Dev.    Min       Max   
## ------------------------------------------------------
## R2        5,000   0.865    0.003     0.852     0.879  
## RMSE      5,000 2,016.215  24.941  1,916.114 2,109.575
## MAE       5,000 1,284.539  13.829  1,229.874 1,335.181
## MAPE      5,000  20.538    0.240    19.644    21.338  
## THEIL     5,000   0.122    0.002     0.115     0.128  
## Um        5,000  0.0001   0.00005   0.00000   0.0003  
## Us        5,000   0.124    0.006     0.098     0.147  
## Uc        5,000   0.877    0.006     0.853     0.903  
## ------------------------------------------------------

Se realizaron 5,000 simulaciones utilizando particiones aleatorias de los datos con el fin de evaluar la estabilidad y el desempeño del modelo durante la fase de entrenamiento. Los resultados muestran un coeficiente de determinación promedio (R²) de 0.865, lo que indica que el modelo logra explicar aproximadamente el 86.5% de la variabilidad observada en el ingreso mensual de los empleados. Además, la baja dispersión entre las simulaciones refleja que el modelo presenta una elevada estabilidad y mantiene una capacidad explicativa consistente aun cuando cambian las muestras utilizadas para la estimación.

En cuanto a las medidas de error, se obtuvo un RMSE promedio de 2,016.215, un MAE de 1,284.539 y un MAPE de 20.54%, lo que indica que las predicciones difieren en promedio alrededor de un 20% de los valores observados. Asimismo, el coeficiente de Theil de 0.122 sugiere un adecuado nivel de ajuste, ya que valores cercanos a cero representan una mayor precisión predictiva. La descomposición de este indicador muestra que el componente de sesgo (Um = 0.0001) es prácticamente nulo, evidenciando que el modelo no sobreestima ni subestima sistemáticamente los ingresos. Por su parte, la mayor proporción del error se concentra en el componente de covarianza (Uc = 0.877), lo que indica que las diferencias entre los valores observados y estimados se deben principalmente a factores aleatorios y no a problemas de especificación del modelo.

## 
## Medidas de Performance Simulacion
## ======================================================
## Statistic   N     Mean    St. Dev.    Min       Max   
## ------------------------------------------------------
## R2        5,000   0.865    0.012     0.799     0.903  
## RMSE      5,000 2,032.249 153.164  1,581.046 2,726.056
## MAE       5,000 1,293.710  70.209  1,067.716 1,574.957
## MAPE      5,000  20.621    1.050    16.950    24.407  
## THEIL     5,000   0.123    0.006     0.100     0.151  
## Um        5,000   0.004    0.006     0.000     0.071  
## Us        5,000   0.130    0.072    0.00001    0.390  
## Uc        5,000   0.869    0.071     0.596     0.993  
## ------------------------------------------------------

Con el fin de evaluar la capacidad predictiva del modelo fuera de la muestra de estimación, se realizaron 5,000 simulaciones utilizando subconjuntos de entrenamiento y prueba. Los resultados muestran un desempeño estable, obteniendo un coeficiente de determinación promedio (R²) de 0.865, lo que indica que el modelo explica aproximadamente el 86.5% de la variabilidad observada en el ingreso mensual. Además, los valores obtenidos en las distintas simulaciones evidencian una capacidad explicativa consistente.

Respecto a las medidas de error, el modelo registró un RMSE promedio de 2,032.249, un MAE de 1,293.710 y un MAPE de 20.621%. Estos resultados indican que las predicciones presentan diferencias moderadas respecto a los valores observados, manteniendo un nivel de precisión aceptable para fines predictivos. Asimismo, el coeficiente de Theil alcanzó un valor promedio de 0.123, lo que sugiere un adecuado ajuste del modelo.

La descomposición del coeficiente de Theil muestra que el componente de sesgo (Um = 0.004) es muy reducido, indicando ausencia de errores sistemáticos importantes. De igual manera, el componente asociado a diferencias de varianza (Us = 0.130) representa una proporción pequeña del error total, mientras que la mayor parte corresponde al componente de covarianza (Uc = 0.869). Esto sugiere que las discrepancias entre los valores observados y estimados se deben principalmente a factores aleatorios y no a problemas de especificación, confirmando que el modelo mantiene una adecuada capacidad predictiva y estabilidad fuera de la muestra.

4.6 Proyecciones e Intervalos de Confianza.

## 
## Pronosticos e intervalos de prediccion
## ====================
##     Ym    Li    Ls  
## --------------------
## 95 9.022 8.519 9.526
## 99 9.022 8.360 9.684
## --------------------

El modelo predice que un empleado con nivel jerárquico 3, diez años de experiencia laboral, historial de movilidad en tres compañías y dos años en su puesto actual percibiría un ingreso mensual estimado de 9,022 dólares. Asimismo, con un nivel de confianza del 95%, el ingreso mensual esperado se ubica entre 8,519 y 9,526 dólares . Para un nivel de confianza del 99%, el intervalo estimado se amplía entre 8,360 y 9,684 dólares. Estos resultados sugieren que el ingreso mensual esperado para un empleado con características similares se encuentra cercano a los 9,022 dólares, aunque puede variar dentro de los rangos establecidos por los intervalos de predicción.

5 Conclusiones Principales.

Implicaciones Prácticas

  • El modelo identifica los principales factores que influyen en el ingreso mensual de los empleados.
  • Los resultados pueden apoyar el diseño de políticas salariales más objetivas y competitivas.
  • La promoción interna y el desarrollo profesional son herramientas clave para mejorar la remuneración y la retención del talento.
  • El modelo permite estimar rangos salariales para apoyar procesos de reclutamiento y gestión de recursos humanos.
  • La información generada contribuye a reducir la rotación de personal mediante estrategias de compensación más equitativas y eficientes.

Implicaciones para la Toma de Decisiones

Identificación de los factores que determinan el ingreso mensual.

Apoyo al diseño de esquemas salariales competitivos.

Fortalecimiento de los programas de promoción y desarrollo profesional.

Herramienta para la planificación y gestión del talento humano.

Contribución a la retención de empleados y reducción de la rotación laboral.

5.1 Referencias bibliograficas

Becker, G. S. (1964). Human capital: A theoretical and empirical analysis, with special reference to education. National Bureau of Economic Research.

Lazear, E. P., & Rosen, S. (1981). Rank-order tournaments as optimum labor contracts. Journal of Political Economy, 89(5), 841–864.

Mincer, J. (1974). Schooling, experience, and earnings. National Bureau of Economic Research.

Mobley, W. H. (1977). Intermediate linkages in the relationship between job satisfaction and employee turnover. Journal of Applied Psychology, 62(2), 237–240.