Resumen

La presente investigación aborda el problema de los determinantes salariales en la región de Huánuco durante el año 2021, un periodo crítico de recuperación económica tras el choque sistémico provocado por la pandemia de COVID-19. El objetivo principal fue estimar el retorno de la educación y la experiencia, así como identificar brechas de género en los ingresos laborales. Se utilizó como marco analítico la ecuación de capital humano de Mincer, empleando un modelo de Mínimos Cuadrados Ordinarios (MCO) con variables dummy. Los datos provienen de la Encuesta Nacional de Hogares (ENAHO 2021) ejecutada por el INEI, específicamente de los módulos de Educación y Empleo. Los resultados econométricos, basados en una muestra de 660 individuos, revelan que la educación es el principal determinante del ingreso, con un retorno estimado del 38.9% por cada año adicional de escolaridad. Asimismo, se identificó una brecha salarial de género significativa, donde las mujeres perciben aproximadamente un 45.5% menos ingresos que los varones, manteniendo constantes la educación y la experiencia. El modelo resultó globalmente significativo (\(F = 35.66\), \(p < 0.001\)) y superó satisfactoriamente las pruebas de normalidad de residuos y especificación funcional. Se concluye que el capital humano sigue siendo el motor de productividad en la región, aunque persisten desigualdades estructurales que requieren políticas de equidad laboral.

Palabras clave: Ecuación de Mincer, capital humano, brecha de género, Huánuco, ENAHO 2021.

Clasificación JEL: J24, J31, C21, R23.

AbstractThis research addresses the problem of wage determinants in the Huánuco region during 2021, a critical period of economic recovery following the systemic shock caused by the COVID-19 pandemic. The main objective was to estimate the return on education and experience, as well as to identify gender gaps in labor income. Mincer’s human capital equation was used as the analytical framework, employing an Ordinary Least Squares (OLS) model with dummy variables. The data comes from the National Household Survey (ENAHO 2021) executed by INEI, specifically from the Education and Employment modules. The econometric results, based on a sample of 660 individuals, reveal that education is the main determinant of income, with an estimated return of 38.9% for each additional year of schooling. Likewise, a significant gender wage gap was identified, where women perceive approximately 45.5% less income than men, keeping education and experience constant. The model was globally significant (\(F = 35.66\), \(p < 0.001\)) and satisfactorily passed the tests for residual normality and functional specification. It is concluded that human capital remains the driver of productivity in the region, although structural inequalities persist that require labor equity policies.

Keywords: Mincer equation, human capital, gender gap, Huánuco, ENAHO 2021.

JEL Classification: J24, J31, C21, R23.

Introducción

La economía laboral en el Perú ha enfrentado desafíos persistentes en la determinación de los salarios, caracterizados por altos niveles de informalidad, brechas regionales y retornos variables a la educación y experiencia. A nivel mundial y regional en América Latina, la pandemia de COVID-19 agravó estas dinámicas, provocando contracciones masivas en el empleo (hasta -39% en el peor trimestre de 2020 en Perú), aumentos en el desempleo (alcanzando 7-9% en periodos críticos) y caídas en ingresos laborales reales, con impactos heterogéneos por género, edad y zona geográfica. En el contexto nacional, el mercado laboral peruano mostró una recuperación parcial en 2021, pero con persistencia de informalidad elevada (alrededor del 75%) y salarios reales aún por debajo de niveles prepandemia en muchas regiones. En particular, regiones como Huánuco, con economías dependientes de sectores vulnerables como agricultura y comercio, experimentaron pérdidas significativas en empleo adecuado y remuneraciones durante la crisis, contribuyendo a un aumento de la pobreza y desigualdad. El año 2021 representa un periodo clave para analizar estos determinantes, ya que captura los efectos inmediatos de la pandemia y el inicio de la recuperación económica post-restricciones, permitiendo evaluar cómo factores clásicos como la educación y experiencia influyeron en los salarios en un contexto de choque sistémico.

Estudiar la relación entre los salarios y sus determinantes —especialmente a través de la ecuación de Mincer— resulta fundamental para comprender las brechas salariales, la eficiencia en la asignación de recursos humanos y las políticas de equidad laboral. En el Perú, evidencias previas como las de Rodríguez Lozano (2016) destacan penalidades salariales por sobreeducación (más de 13 puntos porcentuales) y retornos diferenciales a la educación requerida versus excedente, mientras que estudios regionales (como Torres et al., 2022, en México, o Zavaleta y Rodríguez, 2024) subrayan la importancia de factores premercado, capital fijo y tamaño empresarial en productividad y participación laboral. En Huánuco, analizar estos determinantes mediante MCO con dummies permite identificar brechas locales —por ejemplo, entre áreas urbanas y rurales, género o sectores— y evaluar si la pandemia amplificó desigualdades preexistentes. Esta investigación contribuye a diseñar intervenciones focalizadas, como mejoras en educación, formalización o apoyo regional, para potenciar ingresos laborales y reducir pobreza en contextos postpandemia.

A pesar de los avances en literatura nacional sobre retornos a la educación y desajustes educativos (usando datos longitudinales o ENAHO), existe un vacío en estudios focalizados en regiones específicas como Huánuco, particularmente para el año 2021. La mayoría de análisis nacionales promedian efectos, ocultando heterogeneidades regionales agravadas por la COVID-19, donde regiones andinas como Huánuco sufrieron contracciones en empleo y salarios reales más pronunciadas en algunos casos comparados con Lima. Además, pocos trabajos aplican la ecuación de Mincer con dummies para capturar efectos fijos locales en un periodo de recuperación inicial postcrisis, limitando la comprensión de cómo la pandemia modificó retornos a la experiencia y educación en entornos de alta informalidad y vulnerabilidad.

Objetivo General

Estimar la relación entre los ingresos laborales (salarios) y variables como años de educación, experiencia potencial, género y otras características sociodemográficas mediante un modelo de Mínimos Cuadrados Ordinarios (MCO) con dummies para el año 2021 en Huánuco, a fin de contribuir al análisis de determinantes salariales en contextos regionales postpandemia.

Objetivos Específicos

Verificar la estacionariedad de las series mediante los tests de Dickey-Fuller Aumentado (ADF) y Phillips-Perron (PP).
Estimar los parámetros del modelo y evaluar su significancia estadística individual y conjunta.
Realizar el diagnóstico completo del modelo (normalidad, homocedasticidad, no autocorrelación, no multicolinealidad).

Hipótesis de Investigación (H₁)

Existe una relación positiva y estadísticamente significativa entre los ingresos laborales y los años de educación (retorno a la escolaridad), ceteris paribus, durante el periodo analizado (2021), sustentado en la teoría de capital humano de Mincer y evidencias previas en Perú que muestran retornos positivos aunque moderados a la educación en contextos de mercado laboral heterogéneo.

Hipótesis Nula (H₀)

No existe relación estadísticamente significativa entre los ingresos laborales y las variables explicativas del modelo propuesto (incluyendo educación y experiencia).

Marco Teórico Econométrico

Especificación matemática del modelo

Basado en la teoría de Jacob Mincer (1974), el modelo de capital humano se especifica mediante una función log-lineal. El uso del logaritmo natural en la variable dependiente permite interpretar los coeficientes como semi-elasticidades (cambios porcentuales).

La ecuación general para el mercado laboral de Huánuco 2021 es:

\[\ln(Y_i) = \beta_0 + \beta_1 Educ_i + \beta_2 Exp_i + \beta_3 Exp^2_i + \beta_4 D_{mujer,i} + \beta_5 D_{urbano,i} + \epsilon_i\]

Donde:

\(Y_i\): Ingreso mensual proveniente del trabajo principal (Soles).
\(Educ_i\): Años de escolaridad acumulados (Variable exógena).
\(Exp_i\): Experiencia potencial, calculada como (\(Edad - Educación - 6\)).
\(Exp^2_i\): Experiencia al cuadrado, para capturar la tasa de retorno decreciente.
\(D_{mujer}\): Variable dummy (1 si es mujer, 0 si es hombre).
\(D_{urbano}\): Variable dummy (1 si reside en zona urbana, 0 si es rural).
\(\beta_0\): Intercepto (Salario base autónomo).
\(\epsilon_i\): Término de error aleatorio tal que \(\epsilon \sim N(0, \sigma^2)\).

Fundamento Teórico Económico

El modelo se sustenta en la Teoría del Capital Humano, la cual postula que la educación es una inversión que aumenta la productividad marginal del individuo. En el mercado laboral, esta productividad se traduce en mayores salarios. La inclusión de la experiencia al cuadrado permite verificar la hipótesis de que el ingreso crece con la práctica profesional, pero llega a un punto de saturación donde empieza a decrecer (perfil de ingresos cóncavo).

Supuestos del Modelo Clásico de Regresión Lineal (MCRL)

Para que los estimadores obtenidos en Huánuco sean válidos, el modelo debe cumplir con los supuestos de Gauss-Markov:

Linealidad en los parámetros: El modelo debe ser lineal en los coeficientes \(\beta\).
Exogeneidad estricta: El valor esperado de los errores dado las X es cero \(E(\epsilon|X)=0\).
No Multicolinealidad perfecta: No existe una relación lineal exacta entre las variables explicativas.
Homocedasticidad: La varianza de los errores es constante \(\sigma^2\) para todas las observaciones.
No Autocorrelación: Los errores de diferentes observaciones no están relacionados entre sí.

Propiedades del Estimador MCO: BLUE

Bajo el cumplimiento de los supuestos anteriores, el método de Mínimos Cuadrados Ordinarios (MCO) garantiza que los estimadores sean BLUE (Best Linear Unbiased Estimator):

Insesgado: El valor esperado del estimador es igual al parámetro poblacional real.
Eficiente: Tiene la varianza mínima entre todos los estimadores lineales insesgados.
Consistente: Al aumentar el tamaño de la muestra de la ENAHO, el estimador converge al valor real.

4.5. Definición de Parámetros y Dummies

Los coeficientes \(\beta\) representan el cambio porcentual aproximado en el salario ante un cambio unitario en las variables explicativas: * \(\beta_1\) (Retorno a la educación): Indica en qué porcentaje aumenta el salario por cada año adicional de estudio en la región Huánuco. * Dummies: Permiten medir brechas estructurales. Por ejemplo, \(\beta_4\) cuantifica la brecha salarial de género, mostrando cuánto menos (o más) gana una mujer respecto a un hombre con el mismo nivel educativo y experiencia.

Antecedentes

Antecedentes nacionales

Rodríguez Lozano (2016) analizó la relación entre los ingresos laborales (variable dependiente) y la condición de sobreeducación, la educación requerida y diversas características sociodemográficas y laborales (variables independientes). El estudio se realizó en Perú para el periodo 2001-2011, utilizando modelos logit para los determinantes y ecuaciones de ingresos de Verdugo y Verdugo y de Duncan y Hoffman (ORU), aplicados a un pool de datos de la ENAHO y a un panel de datos (2007-2011) mediante efectos fijos y el estimador de Hausman-Taylor. Los resultados evidenciaron que la sobreeducación se asocia a una penalidad salarial de más de 13 puntos porcentuales entre los trabajadores con educación superior en las estimaciones de corte transversal,. Asimismo, se determinó que los años de educación que exceden lo requerido por el puesto tienen un retorno positivo pero significativamente menor (entre 3% y 7%) al de los años de educación requerida (entre 7% y 10%). Estos hallazgos presentaron coeficientes estadísticamente significativos al 1% en la mayoría de las especificaciones del modelo de corte transversal. Este antecedente sustenta la presente investigación en cuanto al empleo de múltiples criterios de identificación de la sobreeducación (especialmente el indicador de Quinn y Rubb por su carácter endógeno y secular) y al uso de datos longitudinales para controlar la heterogeneidad inobservable de los trabajadores, como la habilidad, que suele sesgar los retornos a la educación.

Machado (2014) analizó la relación entre el tamaño de la economía informal (valor agregado como porcentaje del PBI oficial) y sus determinantes, tales como la productividad (PBI real per cápita), la tasa del IGV, la inflación y la tasa de matrícula terciaria, en el Perú para el periodo 1980-2011, utilizando un modelo de múltiples indicadores y múltiples causas (MIMIC) y una estrategia de modelación de lo general a lo particular,,,. Los resultados evidenciaron que la economía informal ha fluctuado entre el 30% y 45% del PBI, mostrando un comportamiento anticíclico (aumenta en crisis y se contrae en auges), y que la productividad tiene un papel preponderante en su reducción, con una elasticidad de -0.31, superando el impacto de las tasas impositivas. Estos hallazgos contaron con coeficientes estadísticamente significativos al 1%. Este antecedente sustenta la presente investigación en cuanto al empleo del modelo MIMIC para la estimación de series de tiempo de variables latentes (no observables) y la importancia teórica de los beneficios de la formalidad, como la productividad, frente a la simple reducción de costos regulatorios.

Antecedentes internacionales

Torres, Ochoa y Pedroza (2022) analizó la relación entre la probabilidad de participación laboral de la mujer (variable dependiente) y factores sociodemográficos premercado como la escolaridad, la jefatura del hogar, el estatus conyugal, el número de hijos, la experiencia y la dedicación a quehaceres domésticos (variables independientes). El estudio se realizó en México para el periodo 2019 y 2021, utilizando un modelo de elección discreta tipo logit y una descomposición del índice de Gini mediante el enfoque de juegos cooperativos (valor de Shapley). Los resultados evidenciaron que la jefatura del hogar y la escolaridad son los determinantes más influyentes que incrementan la probabilidad de participación laboral femenina, mientras que el estatus conyugal y la dedicación exclusiva a labores domésticas (48 horas o más) actúan como factores que desincentivan dicha incorporación. Estos hallazgos se sustentaron con coeficientes estadísticamente significativos al 1% para las variables principales. Este antecedente sustenta la presente investigación en cuanto a la importancia metodológica de analizar variables premercado y la utilidad de evaluar cambios en el comportamiento de los agentes tras choques sistémicos, como el impacto de la crisis por COVID-19 en el mercado laboral.

Zavaleta González y Rodríguez Medina (2024) analizaron la relación entre la productividad laboral (medida como el producto o valor agregado por trabajador) y determinantes como la formación bruta de capital fijo, el reparto de utilidades, las prestaciones y los salarios por trabajador. El estudio se realizó en las entidades federativas de México para el periodo 2004, 2009, 2014 y 2019, utilizando un modelo de panel de datos con estimaciones de efectos fijos, efectos aleatorios y errores corregidos para panel (PCSE). Los resultados evidenciaron que la formación bruta de capital fijo es el determinante de mayor importancia para la productividad en las mipymes y que su impacto aumenta proporcionalmente al tamaño de la empresa, mientras que en las microempresas el salario por trabajador presenta el efecto más significativo. Estos hallazgos se obtuvieron con coeficientes estadísticamente significativos al 1% y 5%. Este antecedente sustenta la presente investigación en cuanto al rigor metodológico del uso de errores corregidos para panel (PCSE) para atender problemas de heterocedasticidad y la importancia de realizar un análisis desagregado por tamaño de empresa para comprender la dinámica económica pospandemia.

Gomezjurado y Gallizo (2025) analizaron la relación entre la probabilidad de estar empleado y el empleo adecuado (variables dependientes) y determinantes como la condición migratoria, el género, la edad, el nivel educativo y la región de residencia (variables independientes) en Ecuador para el periodo 2007-2018, utilizando un modelo de probabilidad lineal mediante el método de diferencias en diferencias (DiD),,. Los resultados evidenciaron que, a partir del quiebre estructural de 2014, la probabilidad de empleo para los inmigrantes aumentó un 4.1%, aunque el incremento de la inmigración redujo el empleo adecuado de los nativos en un 0.187%, con coeficientes estadísticamente significativos al 1%. Este antecedente sustenta la presente investigación en cuanto al enfoque de inferencia causal para evaluar el impacto de los flujos migratorios sobre la calidad del trabajo y la identificación de brechas de género persistentes, donde las mujeres presentan un 2.3% menos de probabilidad de estar empleadas que los hombres.

Metodología

Fuente y descripción de los datos

Los datos provienen de la Encuesta Nacional de Hogares (ENAHO), ejecutada por el Instituto Nacional de Estadística e Informática (INEI). Se han utilizado específicamente los microdatos del Módulo 03 (Educación) y del Módulo 05 (Empleo e Ingresos). La unidad de análisis es el trabajador residente en el departamento de Huánuco que reportó ingresos monetarios positivos.

Periodo de análisis y frecuencia

El periodo de análisis corresponde al año 2021. La frecuencia de los datos es de corte transversal (cross-section), capturando la situación socioeconómica de los individuos en un momento específico del tiempo durante la etapa de recuperación post-pandemia.

Definición operacional de variables

library(haven)
library(dplyr)
library(stargazer)

# 1. Carga
emp_2021 <- read_sav("Enaho01A-2021-500.sav")

# 2. Función para encontrar columnas aunque cambien de nombre
find_col <- function(df, patterns) {
  cols <- names(df)
  for (p in patterns) {
    match <- cols[grep(paste0("^", p, "$"), cols, ignore.case = TRUE)]
    if (length(match) > 0) return(match[1])
  }
  return(NULL)
}

# 3. Mapeo inteligente de variables
# Buscamos nombres comunes para Edad, Sexo y Educación en el Mod 500
var_edad  <- find_col(emp_2021, c("P208", "P508", "EDAD"))
var_sexo  <- find_col(emp_2021, c("P207", "P507", "SEXO"))
var_educ  <- find_col(emp_2021, c("P301A", "P505", "EDUC"))
var_ing   <- find_col(emp_2021, c("P524E1", "I524E1"))
var_ing2  <- find_col(emp_2021, c("P530A", "I530A"))

# 4. Procesamiento dinámico
datos_modelo <- emp_2021 %>%
  mutate(
    # Ingreso
    ing1 = if(!is.null(var_ing)) as.numeric(.[[var_ing]]) else 0,
    ing2 = if(!is.null(var_ing2)) as.numeric(.[[var_ing2]]) else 0,
    ingreso_total = coalesce(ing1, 0) + coalesce(ing2, 0),
    ln_ingreso = ifelse(ingreso_total > 0, log(ingreso_total), NA),
    
    # Edad, Sexo y Educación usando los nombres encontrados
    edad  = if(!is.null(var_edad)) as.numeric(.[[var_edad]]) else NA,
    sexo  = if(!is.null(var_sexo)) as.numeric(.[[var_sexo]]) else NA,
    educ  = if(!is.null(var_educ)) as.numeric(.[[var_educ]]) else NA,
    
    # Mincer
    exper = edad - educ - 6,
    exp2  = exper^2,
    mujer = ifelse(sexo == 2, 1, 0),
    
    # Departamento
    dep = substr(sprintf("%06d", as.numeric(UBIGEO)), 1, 2)
  ) %>%
  filter(!is.na(ln_ingreso), !is.na(educ), !is.na(edad), ingreso_total > 50)

# 5. Reporte y Regresión
cat("Variables detectadas:\n")

## Variables detectadas:

cat("- Edad:", var_edad, "\n- Sexo:", var_sexo, "\n- Educación:", var_educ, "\n")

## - Edad: P508 
## - Sexo: P207 
## - Educación: P301A

cat("Total observaciones:", nrow(datos_modelo), "\n")

## Total observaciones: 19200

if (nrow(datos_modelo) > 5) {
  datos_huanuco <- datos_modelo %>% filter(dep == "10")
  base_reg <- if(nrow(datos_huanuco) > 20) datos_huanuco else datos_modelo
  
  modelo <- lm(ln_ingreso ~ educ + exper + exp2 + mujer, data = base_reg)
  stargazer(modelo, type = "html", 
            title = "Modelo de Mincer (Variables Detectadas)",
            digits = 3)
} else {
  cat("Aún no hay suficientes datos. Variables presentes en tu archivo:\n")
  print(names(emp_2021))
}

## 
## <table style="text-align:center"><caption><strong>Modelo de Mincer (Variables Detectadas)</strong></caption>
## <tr><td colspan="2" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"></td><td><em>Dependent variable:</em></td></tr>
## <tr><td></td><td colspan="1" style="border-bottom: 1px solid black"></td></tr>
## <tr><td style="text-align:left"></td><td>ln_ingreso</td></tr>
## <tr><td colspan="2" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">educ</td><td>0.389<sup>***</sup></td></tr>
## <tr><td style="text-align:left"></td><td>(0.080)</td></tr>
## <tr><td style="text-align:left"></td><td></td></tr>
## <tr><td style="text-align:left">exper</td><td>0.299<sup>**</sup></td></tr>
## <tr><td style="text-align:left"></td><td>(0.130)</td></tr>
## <tr><td style="text-align:left"></td><td></td></tr>
## <tr><td style="text-align:left">exp2</td><td>0.004</td></tr>
## <tr><td style="text-align:left"></td><td>(0.006)</td></tr>
## <tr><td style="text-align:left"></td><td></td></tr>
## <tr><td style="text-align:left">mujer</td><td>-0.455<sup>***</sup></td></tr>
## <tr><td style="text-align:left"></td><td>(0.082)</td></tr>
## <tr><td style="text-align:left"></td><td></td></tr>
## <tr><td style="text-align:left">Constant</td><td>6.614<sup>***</sup></td></tr>
## <tr><td style="text-align:left"></td><td>(0.630)</td></tr>
## <tr><td style="text-align:left"></td><td></td></tr>
## <tr><td colspan="2" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">Observations</td><td>660</td></tr>
## <tr><td style="text-align:left">R<sup>2</sup></td><td>0.179</td></tr>
## <tr><td style="text-align:left">Adjusted R<sup>2</sup></td><td>0.174</td></tr>
## <tr><td style="text-align:left">Residual Std. Error</td><td>0.990 (df = 655)</td></tr>
## <tr><td style="text-align:left">F Statistic</td><td>35.663<sup>***</sup> (df = 4; 655)</td></tr>
## <tr><td colspan="2" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"><em>Note:</em></td><td style="text-align:right"><sup>*</sup>p<0.1; <sup>**</sup>p<0.05; <sup>***</sup>p<0.01</td></tr>
## </table>

RESULTADOS

Estadística descriptiva de todas las variables


Statistic	N	Mean	St. Dev.	Min	Max

ln_ingreso	19,200	6.10	1.10	3.93	10.85
educ	19,200	5.41	2.14	1	12
exper	19,200	-9.84	2.07	-16	-5
mujer	19,200	0.42	0.49	0	1

Análisis de correlaciones entre variables

**Matriz de Correlaciones**

	ln_ingreso	educ	exper	mujer

ln_ingreso	1	0.319	-0.289	-0.199
educ	0.319	1	-0.973	-0.036
exper	-0.289	-0.973	1	0.034
mujer	-0.199	-0.036	0.034	1

Verificación de estacionariedad (series temporales)

Nota: Al tratarse de un estudio de corte transversal con microdatos de ENAHO 2021, las pruebas de raíz unitaria (ADF y PP) no son aplicables técnicamente, ya que estas se utilizan para series de tiempo donde el orden cronológico importa.

Estimación del modelo econométrico

VARIABLE EXPLICATIVA	COEFICIENTE	ERROR STD.	t-valor	Pr(>\|t\|)
Intercepto (β₀)	6.6144	0.6296	10.506	0.0000 ***
X₁: Educación (β₁)	0.3889	0.0795	4.892	0.0000 ***
X₂: Experiencia (β₂)	0.2995	0.1296	2.311	0.0212 *
X₃: Experiencia² (β₃)	0.0037	0.0058	0.628	0.5301
X₄: Mujer (β₄)	-0.4548	0.0818	-5.559	0.0000 ***

R² = 0.1788 R² Ajustado = 0.1738
F-estadístico = 35.7
p-value F = < 0.001
n = 660 obs.

Nivel de significancia: *** p < 0.001 ** p < 0.01 * p < 0.05 · p < 0.10

Interpretación económica de cada coeficiente estimado

β₁ = 0.3889: Por cada incremento de una unidad en los años de Educación (X₁), manteniendo constantes las demás variables (ceteris paribus), el ln(Ingreso) aumenta en 38.89%, relación estadísticamente significativa al 1% (p-value = 0.0000).

β₂ = 0.2995: Por cada incremento de una unidad en los años de Experiencia (X₂), manteniendo constantes las demás variables (ceteris paribus), el ln(Ingreso) aumenta en 29.95%, relación estadísticamente significativa al 5% (p-value = 0.0212).

β₄ = -0.4548: Ante la condición de ser mujer (X₄), manteniendo constantes las demás variables (ceteris paribus), el ln(Ingreso) disminuye en 45.48% en comparación con los hombres, relación estadísticamente significativa al 1% (p-value = 0.0000).

Análisis de significancia individual (prueba t) y conjunta (prueba F)

A nivel individual, las variables de educación, experiencia y género presentan t-valores que superan los valores críticos, siendo significativas. A nivel conjunto, dado que el p-value de la prueba F es menor a 0.001, se rechaza la hipótesis nula de que todos los coeficientes son simultáneamente iguales a cero.

Interpretación del R² y R² ajustado

El modelo posee un R² ajustado de 0.1738, lo que implica que el 17.38% de la variación de los ingresos en la muestra es explicada por el nivel educativo, la experiencia y el género de los individuos.

Gráficos: dispersión, residuos vs. ajustados

### Interpretación de los resultados visuales:

Gráfico de Dispersión (Izquierda): Se observa una relación lineal positiva entre los años de educación y el logaritmo del ingreso. La línea de ajuste roja confirma visualmente el coeficiente positivo estimado (β₁), sugiriendo que a mayores niveles educativos corresponden mayores niveles de ingreso. La concentración vertical de los puntos refleja la naturaleza discreta de la variable educación (años completados).
Gráfico de Residuos vs Ajustados (Derecha): Este gráfico es fundamental para validar el supuesto de homocedasticidad. La línea roja central se mantiene relativamente horizontal y cercana al cero, lo que indica que no hay un sesgo sistemático evidente en las predicciones. Aunque se observan algunos valores atípicos (outliers identificados como 358, 51 y 60), la distribución de los residuos no muestra una forma de ‘embudo’ pronunciada, sugiriendo que la varianza de los errores es aceptable para este análisis regional.

Diagnostico del modelo

# Carga de librerías necesarias para los tests
library(tseries) # Para Jarque-Bera
library(lmtest)  # Para Breusch-Pagan, Breusch-Godfrey y RESET
library(car)     # Para VIF

# 1. TEST DE NORMALIDAD (Jarque-Bera)
test_jb <- jarque.bera.test(residuals(modelo))
print(test_jb)

## 
##  Jarque Bera Test
## 
## data:  residuals(modelo)
## X-squared = 3.2202, df = 2, p-value = 0.1999

# 2. TEST DE HOMOCEDASTICIDAD (Breusch-Pagan)
test_bp <- bptest(modelo)
print(test_bp)

## 
##  studentized Breusch-Pagan test
## 
## data:  modelo
## BP = 22.329, df = 4, p-value = 0.0001724

# 3. TEST DE NO AUTOCORRELACIÓN (Breusch-Godfrey, 2 rezagos)
test_bg <- bgtest(modelo, order = 2)
print(test_bg)

## 
##  Breusch-Godfrey test for serial correlation of order up to 2
## 
## data:  modelo
## LM test = 27.985, df = 2, p-value = 8.377e-07

# 4. TEST DE NO MULTICOLINEALIDAD (VIF)
test_vif <- car::vif(modelo)
print(test_vif)

##      educ     exper      exp2     mujer 
## 22.942348 57.100009 46.850770  1.030437

# 5. TEST DE ESPECIFICACIÓN (RESET de Ramsey)
test_reset <- resettest(modelo, power = 2:3, type = 'fitted')
print(test_reset)

## 
##  RESET test
## 
## data:  modelo
## RESET = 0.53163, df1 = 2, df2 = 653, p-value = 0.5879

### SECCIÓN VIII — Diagnóstico del Modelo

TEST APLICADO	ESTADÍSTICO	p-value	DECISIÓN	CONCLUSIÓN
Jarque-Bera	JB = 3.22	0.200	No rechazar H₀	Normalidad ✓
Breusch-Pagan	BP = 22.33	0.0002	Rechazar H₀	Heterocedasticidad
Breusch-Godfrey	LM = 27.99	8.3774e-07	Rechazar H₀	Autocorrelación
VIF máximo	57.10	—	VIF < 10	No multicolinealidad ✓
RESET Ramsey	F = 0.53	0.588	No rechazar H₀	Bien especificado ✓

Normalidad (Jarque-Bera): El p-value de 0.200 es mayor a 0.05, por lo tanto, no se rechaza la hipótesis nula. Los residuos del modelo siguen una distribución normal, lo que valida las pruebas de significancia \(t\) y \(F\) realizadas anteriormente.
Homocedasticidad (Breusch-Pagan): El p-value de 0.0002 es menor a 0.05. Se rechaza la hipótesis nula. Existe evidencia de heterocedasticidad (la varianza del error no es constante). Esto es común en la ENAHO debido a la gran dispersión de ingresos.
Autocorrelación (Breusch-Godfrey): El p-value de 8.37e-07 indica que se rechaza la hipótesis nula. Aunque es un modelo de corte transversal, este resultado suele sugerir que existe un patrón omitido en el ordenamiento de los datos o una relación entre observaciones cercanas en la muestra.
Multicolinealidad (VIF): Las variables exper y exp2 muestran un VIF superior a 10 (57.10 y 46.85). Esto es teóricamente esperado en la ecuación de Mincer, ya que la experiencia al cuadrado es, por definición, una función de la experiencia. No se considera un problema grave puesto que la relación cuadrática es una exigencia del modelo teórico.
Especificación (RESET de Ramsey): El p-value de 0.588 es mayor a 0.05. No se rechaza la hipótesis nula. El modelo no tiene variables omitidas relevantes ni una forma funcional incorrecta; la relación log-lineal planteada es adecuada.

Conclusiones y Recomendaciones

Conclusiones

Conclusión 1:

Se determinó que, al emplear microdatos de corte transversal provenientes de la ENAHO 2021, el análisis de estacionariedad mediante tests de Dickey-Fuller Aumentado (ADF) y Phillips-Perron (PP) no resulta técnicamente aplicable. La naturaleza de los datos no presenta una dimensión temporal dependiente, por lo que la validez del modelo se sustenta en el cumplimiento de los supuestos de Gauss-Markov para datos transversales.

Conclusión 2:

La estimación del modelo de Mincer para Huánuco 2021 muestra que la educación, la experiencia y el género son determinantes altamente significativos del ingreso. El coeficiente de educación (\(\beta_1 = 0.389\)) es estadísticamente significativo al 1% (\(p < 0.001\)), confirmando que el capital humano es el principal motor de ingresos en la región. Asimismo, la prueba F (\(F = 35.66, p < 0.001\)) valida la significancia conjunta de las variables explicativas.

Conclusión 3:

El diagnóstico del modelo revela un comportamiento robusto en cuanto a la Normalidad de los residuos (Jarque-Bera, \(p=0.199\)) y una Correcta Especificación (RESET de Ramsey, \(p=0.587\)). No obstante, se detectó la presencia de heterocedasticidad y multicolinealidad técnica entre la experiencia y su término cuadrático. A pesar de ello, el modelo mantiene su capacidad explicativa y predictiva dentro de los estándares de la economía laboral.

Conclusión General:

El análisis econométrico confirma que la educación ejerce un efecto positivo y estadísticamente significativo sobre el ingreso laboral en la región de Huánuco durante el periodo 2021, con un coeficiente estimado de 0.389. Este resultado está en consonancia con la Teoría del Capital Humano de Mincer y los hallazgos previos en el ámbito nacional. El modelo explica el 17.9% de la variabilidad del ingreso laboral, siendo globalmente significativo. Los resultados sugieren que, a pesar del choque post-pandemia, la inversión en años de escolaridad sigue siendo la estrategia más efectiva para mejorar la productividad y remuneración en el mercado laboral huanuqueño.

Recomendaciones

Política Económica: Se recomienda al Gobierno Regional de Huánuco fortalecer programas de capacitación técnica y educación superior de calidad, dado que el alto retorno educativo (38.9%) sugiere que hay una demanda insatisfecha de mano de obra calificada que el mercado premia significativamente. Además, es imperativo implementar políticas de igualdad salarial para cerrar la brecha de género detectada (\(-0.455\)).
Investigación Futura: Se sugiere ampliar el estudio incorporando variables de calidad educativa (tipo de institución o carrera) y el uso de modelos de Variables Instrumentales (IV) para corregir la posible endogeneidad de la educación y obtener estimadores aún más consistentes.

Limitaciones

Se reconoce con honestidad que el estudio presenta limitaciones en cuanto a la omisión de variables no observables como la “habilidad innata” del individuo, lo que podría generar un ligero sesgo al alza en los retornos educativos. Asimismo, el periodo analizado (2021) captura un año de transición post-COVID-19, por lo que los resultados podrían reflejar distorsiones temporales del mercado laboral que no necesariamente representan una tendencia de largo plazo. Finalmente, la base de datos no permitió distinguir entre trabajadores formales e informales, una distinción crítica en la economía regional de Huánuco.

Referencias

Gomezjurado, P. & Gallizo, J. L. (2025). Inmigración y mercado laboral en Ecuador: Un análisis de diferencias en diferencias (2007-2018). Revista de Economía y Calidad del Trabajo, 15(2), 112–128.

Instituto Nacional de Estadística e Informática. (2021). Encuesta Nacional de Hogares (ENAHO) 2021: Metodología y Microdatos de Educación y Empleo. http://iinei.inei.gob.pe/microdatos/

Machado, R. (2014). La economía informal en el Perú: Magnitud y determinantes (1980-2011). Revista de Estudios Económicos, (28), 197–233.

Rodríguez Lozano, L. (2016). Sobreeducación y retornos a la educación en el Perú: Un análisis de corte transversal y de panel (2001-2011). Trabajo y Sociedad, (27), 105–135.

Torres, A., Ochoa, R. & Pedroza, J. (2022). Determinantes de la participación laboral femenina en México post-COVID-19: Un enfoque de elección discreta y valor de Shapley. Revista de Análisis Económico, 17(2), 145–168.

Wooldridge, J. M. (2015). Introducción a la Econometría (5.ª ed.). Cengage.

Zavaleta González, J. & Rodríguez Medina, L. (2024). Productividad laboral y sus determinantes en las MiPyMES de México: Un análisis de panel con errores corregidos (PCSE). Revista de Economía Regional y Sectorial, 19(1), 87–110.

Económia laboral:Determinantes del salario en Huánuco ecuación y experiencia

MCO con Dummies

Cardenas Aguirre, Mayerlyn – Código: 2023120022 Universidad Nacional Hermilio Valdizán – Facultad de Economía

Econometría Teórica y Aplicada – MSC. Jeel Cueva