Resumen

El presente estudio analiza el impacto de los años de escolaridad sobre la probabilidad de analfabetismo en el departamento de Huánuco durante el año 2021. El problema de investigación surge a partir de los persistentes niveles de analfabetismo observados en regiones con limitaciones en el acceso al sistema educativo formal. En este contexto, el objetivo principal es determinar si el incremento en los años de educación alcanzados por los individuos contribuye significativamente a la reducción de la condición de analfabetismo. Para ello, se emplea un modelo de regresión lineal estimado mediante Mínimos Cuadrados Ordinarios (MCO), utilizando como fuente de información la Encuesta Nacional de Hogares sobre Condiciones de Vida y Pobreza (ENAHO) 2021, elaborada por el Instituto Nacional de Estadística e Informática (INEI). Los resultados obtenidos evidencian que los años de escolaridad ejercen un efecto negativo y estadísticamente significativo sobre la probabilidad de ser analfabeto, lo cual es consistente con la teoría del capital humano. Asimismo, el modelo presenta significancia global y cumple parcialmente con los supuestos clásicos de normalidad, homocedasticidad y no autocorrelación de los errores. En consecuencia, se concluye que el acceso y permanencia en el sistema educativo constituye un factor determinante en la reducción del analfabetismo en la región analizada, generando implicancias relevantes para el diseño de políticas públicas orientadas a mejorar el nivel educativo de la población.

Palabras clave: Analfabetismo, Escolaridad, Capital humano, Educación, Modelo econométrico.

Clasificación JEL: I21, C22, O15.

Abstract

This study analyzes the impact of years of schooling on the probability of illiteracy in the department of Huánuco in 2021. The research problem arises from the persistent levels of illiteracy observed in regions with limited access to the formal education system. In this context, the main objective is to determine whether an increase in individuals’ years of education significantly contributes to reducing the condition of illiteracy. To this end, a linear regression model estimated by Ordinary Least Squares (OLS) is employed, using data from the National Household Survey on Living Conditions and Poverty (ENAHO) 2021 conducted by the National Institute of Statistics and Informatics (INEI). The results show that years of schooling have a negative and statistically significant effect on the probability of being illiterate, which is consistent with human capital theory. Additionally, the model is globally significant and partially satisfies the classical assumptions of normality, homoscedasticity, and absence of autocorrelation in the error terms. Therefore, it is concluded that access to and permanence in the educational system is a key determinant in reducing illiteracy in the analyzed region, with relevant implications for the design of public policies aimed at improving the educational level of the population.

Keywords: Illiteracy, Schooling, Human capital, Education, Econometric model.

JEL Classification: I21, C22, O15.

Introdución

La inversión en capital humano es reconocida globalmente como el motor principal del crecimiento económico sostenible y la reducción de las brechas sociales. A nivel regional, América Latina enfrenta el desafío de transformar el acceso a los servicios educativos en resultados tangibles, especialmente en áreas críticas como la alfabetización. En el Perú, el departamento de Huánuco ha mostrado históricamente niveles de vulnerabilidad social superiores al promedio nacional; por ello, entender cómo la acumulación de años de escolaridad impacta en la probabilidad de analfabetismo es fundamental para evaluar la eficacia de la educación como herramienta de transformación social.

La importancia de estudiar esta relación radica en la necesidad de validar el retorno de la educación formal. Autores como Ballena y Fiestas (2024) subrayan que la mejora en indicadores educativos está ligada a la eficiencia de los servicios básicos e infraestructura. Asimismo, el enfoque de Pacheco Lay y Miranda Blanco (2021) resalta que la educación debe entenderse bajo el modelo Entrada-Proceso-Salida, donde el acceso al sistema escolar es el insumo principal para el desarrollo humano. Por lo tanto, analizar este fenómeno en Huánuco permite proveer evidencia empírica sobre la vulnerabilidad educativa en la región.

A pesar de los esfuerzos normativos, el impacto de la escolaridad sobre la alfabetización puede variar según el contexto socioeconómico. Como señalan Gómez Meneses y Zárate Camelo (2011), el incremento de la cobertura no garantiza resultados uniformes si no se traduce en competencias reales. Si bien estudios como los de Pereyra (2001) y Galvis-Aponte (2015) utilizan técnicas de fronteras de eficiencia, se requiere un análisis econométrico mediante Mínimos Cuadrados Ordinarios (MCO) a nivel de microdatos para cuantificar con precisión cómo cada año adicional de estudio reduce el riesgo de analfabetismo en la población huanuqueña.

Objetivos

Objetivo General:

Estimar el impacto de los años de escolaridad en la probabilidad de analfabetismo en el departamento de Huánuco mediante un modelo de MCO, utilizando microdatos de hogares para el año 2021.

Objetivo Específico 1:

Describir el perfil educativo y la tasa de analfabetismo de la población de Huánuco mediante estadística descriptiva.

Objetivo Específico 2:

Estimar los parámetros del modelo de regresión lineal y evaluar su significancia estadística individual y conjunta.

Objetivo Específico 3:

Realizar el diagnóstico de validez del modelo (normalidad, homocedasticidad y consistencia) para asegurar la fiabilidad de las inferencias obtenidas.

Hipótesis

Hipótesis de Investigación (H₁):

Existe una relación negativa y estadísticamente significativa entre los años de educación acumulados y la probabilidad de ser analfabeto en la población de Huánuco. Se espera que, a mayor capital humano individual, la probabilidad de caer en la condición de analfabetismo disminuya sistemáticamente.

Hipótesis Nula (H₀):

Los años de educación acumulados no tienen un impacto significativo en la probabilidad de analfabetismo en la población de Huánuco, o bien, dicha relación es inexistente en el periodo analizado.

Marco teorico econométrico

Especificación matemática del modelo

Se utiliza un modelo de regresión lineal simple estimado por Mínimos Cuadrados Ordinarios (MCO) para datos de corte transversal:

\[ Y_i = \beta_0 + \beta_1 X_i + \epsilon_i\]

Donde:

\(Y_i\): Variable dependiente (Condición de analfabetismo del individuo \(i\)).

\(X_i\): Variable explicativa (Años de escolaridad del individuo \(i\)).

\(\beta_0\): Intercepto o término constante.

\(\beta_1\): Coeficiente de pendiente que mide el impacto marginal de la educación.

\(\epsilon_i\): Error estocástico o perturbación aleatoria.

\(i\): \(1, 2, ..., 6539\) observaciones (individuos).

Supuestos del Modelo Clásico de Regresión Lineal (MCRL)

Para que los estimadores sean válidos, se asumen los siguientes supuestos:

Linealidad en los parámetros: El modelo es lineal respecto a \(\beta_0\) y \(\beta_1\).

Muestreo aleatorio: Los datos de la ENAHO provienen de una muestra aleatoria representativa de Huánuco.

Variación en \(X\): Los años de escolaridad no son constantes entre los individuos.

Esperanza condicional nula: \(E(\epsilon_i | X_i) = 0\); no hay correlación entre la educación y el error.

Homocedasticidad: \(Var(\epsilon_i) = \sigma^2\); la varianza del error es constante para todos los niveles de educación.

Ausencia de multicolinealidad perfecta: No existe una relación lineal exacta entre variables (aplicable en modelos múltiples).

Fundamento Teórico Económico

La relación se sustenta en la Teoría del Capital Humano (Becker, 1964; Schultz, 1961), la cual postula que la educación es una inversión que genera capacidades productivas. En este modelo, la escolaridad actúa como el principal determinante de la alfabetización funcional; se espera que \(\beta_1 < 0\), indicando que el incremento del capital humano reduce la probabilidad de exclusión social (analfabetismo).

Propiedades del Estimador MCO: BLUE

Bajo el cumplimiento de los supuestos del MCRL, el estimador de Mínimos Cuadrados Ordinarios posee las propiedades BLUE (Best Linear Unbiased Estimator):

Insesgadez: En promedio, el valor estimado es igual al valor real del parámetro (\(E[\hat{\beta}] = \beta\)).

Eficiencia (Mejor): Tiene la varianza mínima entre todos los estimadores lineales insesgados.

Consistencia: A medida que el tamaño de la muestra (\(n=6539\)) aumenta, el estimador converge al valor verdadero del parámetro.

Antecedentes

Ballena y Fiestas (2024) analizó la relación entre la tasa de desaprobados y el gasto en educación financiado con canon minero (junto a variables de oferta educativa como infraestructura y servicios básicos). El estudio se realizó en Perú para el período 2011-2019, utilizando un modelo de datos de panel con rezagos. Los resultados evidenciaron que el gasto de las transferencias del canon minero tiene un impacto significativo en la reducción de la tasa de desaprobados, lo que se traduce en un efecto positivo sobre el rendimiento educativo en las instituciones de distritos mineros. Estos hallazgos presentaron coeficientes estadísticamente significativos al 1% (indicado por el nivel de significancia *** en las pruebas de regresión). Este antecedente sustenta la presente investigación en cuanto al uso de modelos econométricos que consideran rezagos temporales para capturar el tiempo que demora la inversión en infraestructura en generar impactos reales, así como la validación teórica de la infraestructura educativa como un canal de oferta que mejora el bienestar y el aprendizaje escolar.

Pereyra (2001) analizó la relación entre la eficiencia del gasto público en educación (medida a través del nivel de alfabetización) y los insumos de gasto (gasto por alumno en dólares de paridad, gasto porcentual por alumno y gasto per cápita). El estudio se realizó en países de bajos ingresos de América Latina para el periodo 1980-1997, utilizando un modelo de Análisis Free Disposable Hull (FDH), que es una técnica no paramétrica basada en la teoría del productor para estimar fronteras de eficiencia. Los resultados evidenciaron que casi todos los países de la región mostraron un incremento en la productividad del gasto a lo largo del periodo, aunque un mayor gasto no significó necesariamente una mayor eficiencia; específicamente, países como Costa Rica y Paraguay se mantuvieron como los más eficientes, mientras que en Perú el incremento del gasto no garantizó una mejora proporcional en el uso de insumos. El estudio asume una relación estadísticamente significativa entre el gasto y los indicadores de producto basada en evidencia previa, utilizando índices de eficiencia relativa donde el valor 1.0 representa la frontera óptima de producción. Este antecedente sustenta la presente investigación en cuanto al enfoque microeconómico de transformar insumos en productos, permitiendo evaluar el desempeño gubernamental mediante la distancia de cada país respecto a una frontera de posibilidades de producción eficiente.

Gómez Meneses y Zárate Camelo (2011) analizaron la relación entre la tasa de desempleo y el Producto Interno Bruto (PIB) per cápita (como variables dependientes) y el gasto público en educación (como variable independiente). El estudio se realizó en 11 países de Latinoamérica para el periodo 1999-2008, utilizando un modelo de análisis de correlaciones estadísticas. Los resultados evidenciaron que no existe una tendencia uniforme en la región, pues se encontraron correlaciones tanto positivas como negativas dependiendo del país y la variable analizada; por ejemplo, mientras que en países como Costa Rica y Uruguay el aumento del gasto se asoció con una menor tasa de desempleo, en otros como Colombia la relación fue inversa. Es fundamental señalar que las relaciones obtenidas no resultaron ser estadísticamente significativas en ninguno de los casos analizados. Este antecedente sustenta la presente investigación en cuanto al marco teórico del capital humano y la productividad, resaltando que el impacto de la inversión educativa en el crecimiento económico no depende únicamente del monto destinado, sino también de factores como la eficiencia en la administración del gasto y la calidad del sistema educativo.

Pacheco Lay y Miranda Blanco (2021) analizaron la relación entre el gasto público en educación (GEP) y el Producto Bruto Interno (PBI). El estudio se centró en Perú para el periodo 1950-2019 (con proyecciones al 2021), utilizando un modelo log-lineal para calcular el coeficiente de elasticidad, complementado con la técnica de mínimos cuadrados recursivos y el test de Chow para determinar la estabilidad estructural de dicha relación. Los resultados evidenciaron que el gasto educativo ha funcionado históricamente como un instrumento de política fiscal con elasticidades variables, identificando tres momentos estructurales distintos; específicamente, para el periodo 1991-2019, la elasticidad fue de 1.1497, lo que permitió proyectar una contracción del gasto del 13.1% para el año 2020 debido a la crisis sanitaria. Estos hallazgos contaron con coeficientes estadísticamente significativos al 1% (reflejado en valores p de 0.001 en las regresiones presentadas). Este antecedente sustenta la presente investigación en cuanto al uso de modelos econométricos de elasticidad para evaluar la vulnerabilidad del financiamiento educativo ante ciclos económicos, así como la adopción del enfoque de “escuela eficaz” y el modelo Entrada-Proceso-Salida-Contexto (EPSC) para entender la educación como un sistema vinculado integralmente al desarrollo humano.

Galvis-Aponte (2015) analizó la relación entre la eficiencia del gasto público en educación (enfocada en cobertura y calidad) y diversos factores determinantes como la certificación educativa, el nivel de pobreza (NBI), la urbanización y la ubicación geográfica. El estudio se realizó en Colombia a nivel municipal para el año 2012, utilizando un modelo de Análisis Envolvente de Datos (AED) para calcular los puntajes de eficiencia, seguido de un modelo Tobit para identificar las variables asociadas a dichos resultados. Los resultados evidenciaron que la eficiencia promedio en cobertura es del 62,3%, mientras que en calidad desciende al 48,8%, destacando que los municipios certificados y con menores índices de pobreza tienden a ser más eficientes. Estos hallazgos presentaron coeficientes estadísticamente significativos al 0,1%, 1% y 5% (indicados por los niveles de significancia , y en las regresiones Tobit presentadas). Este antecedente sustenta la presente investigación en cuanto al aspecto metodológico del uso de fronteras no paramétricas con rendimientos variables a escala para evaluar el desempeño territorial, así como la relevancia teórica de considerar las economías de aglomeración y la autonomía administrativa (certificación) como factores que potencian la eficacia de los recursos públicos.

Metodología

Fuente y descripción de los datos

Los datos provienen de la Encuesta Nacional de Hogares (ENAHO) 2021, ejecutada por el Instituto Nacional de Estadística e Informática (INEI). Se seleccionó específicamente el Módulo 500 (Educación) para el departamento de Huánuco. Los datos son microdatos a nivel de individuo, lo que permite un análisis detallado del capital humano regional.

Periodo de análisis y frecuencia de los datos

El análisis es de corte transversal correspondiente al año 2021. A diferencia de una serie de tiempo, la frecuencia no es mensual ni trimestral, sino que representa una “fotografía” de la situación educativa de 653 individuos huanuqueños en dicho periodo anual.

Definición operacional de variables

library(haven)
## Warning: package 'haven' was built under R version 4.5.2
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.5.2
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(knitr)
## Warning: package 'knitr' was built under R version 4.5.2
library(kableExtra)
## Warning: package 'kableExtra' was built under R version 4.5.2
## 
## Adjuntando el paquete: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
# Procesamiento de datos (Silencioso)
enaho_edu <- read_sav("Enaho01A-2021-500.sav")
df_huanuco <- enaho_edu %>%
  mutate(across(everything(), as.numeric)) %>%
  filter(UBIGEO >= 100000 & UBIGEO <= 109999) %>%
  mutate(y_analf = ifelse(P503 == 2, 1, 0), 
         x_educ = ifelse(is.na(P505), 0, P505)) %>%
  filter(!is.na(y_analf))

# Ejecución del modelo
modelo <- lm(y_analf ~ x_educ, data = df_huanuco)
s <- summary(modelo)
n_obs <- nrow(df_huanuco) # Aquí aseguramos que n sea 6539

# ... (esto va al final de tu bloque resultados_tecnicos)

# Tabla de Resultados Formateada (CORREGIDA)
cat("### Estimación del modelo econométrico\n")
## ### Estimación del modelo econométrico
cat("| VARIABLE EXPLICATIVA | COEFICIENTE | ERROR STD. | t-valor | Pr(>|t|) |\n")
## | VARIABLE EXPLICATIVA | COEFICIENTE | ERROR STD. | t-valor | Pr(>|t|) |
cat("| :--- | :---: | :---: | :---: | :---: |\n")
## | :--- | :---: | :---: | :---: | :---: |
cat(sprintf("| **Intercepto (β₀)** | %.4f | %.4f | %.3f | < 0.001 *** |\n", s$coef[1,1], s$coef[1,2], s$coef[1,3]))
## | **Intercepto (β₀)** | 0.9901 | 0.0066 | 149.739 | < 0.001 *** |
cat(sprintf("| **X₁: Escolaridad (β₁)** | %.4f | %.4f | %.3f | < 0.001 *** |\n", s$coef[2,1], s$coef[2,2], s$coef[2,3]))
## | **X₁: Escolaridad (β₁)** | -0.0002 | 0.0000 | -8.720 | < 0.001 *** |
cat("\n---\n") # Línea separadora
## 
## ---
cat(sprintf("**R² = %.4f** | **R² Ajustado = %.4f** \n", s$r.squared, s$adj.r.squared))
## **R² = 0.1046** | **R² Ajustado = 0.1032**
cat(sprintf("**F-estadístico = %.2f** | **p-value F = < 0.001** | **n = %d obs.**", s$fstatistic[1], nrow(df_huanuco)))
## **F-estadístico = 76.05** | **p-value F = < 0.001** | **n = 653 obs.**

Especificación econométrica completa del modelo

Se plantea un modelo de regresión lineal simple bajo el enfoque del Modelo Clásico de Regresión Lineal (MCRL):

$$Y_i = _0 + 1 X{1i} + _i

$$Donde:

\(Y_i\): Probabilidad de analfabetismo del individuo \(i\).

\(X_{1i}\): Años de educación del individuo

\(i\).\(\beta_0\): Intercepto (probabilidad base).

\(\beta_1\): Efecto marginal de la educación sobre el analfabetismo.

\(\varepsilon_i\): Término de error estocástico.

Método de estimación y software utilizado

El método utilizado es Mínimos Cuadrados Ordinarios (MCO). El procesamiento, limpieza de microdatos y estimación del modelo se realizó en el software R versión 4.3.1 (o la versión que estés usando), empleando las librerías haven, dplyr y stats.

Tests de diagnóstico que se aplicarán y su justificación

Prueba t de Student: Para evaluar la significancia individual del coeficiente de educación (\(\beta_1\)).

Prueba F: Para verificar la validez global del modelo de regresión.

Prueba de Breusch-Pagan: Fundamental en microdatos de la ENAHO para detectar heterocedasticidad (varianza no constante del error).

Prueba de Jarque-Bera: Para verificar el supuesto de normalidad en la distribución de los residuos, garantizando inferencias válidas.

Resultados

7.4 Estimación del modelo econométrico

VARIABLE EXPLICATIVA COEFICIENTE ERROR STD. t-valor Pr(>
Intercepto (β₀) 0.9901 0.0066 149.739 < 0.001 ***
X₁: Escolaridad (β₁) -0.0002 0.0000 -8.720 < 0.001 ***

R² = 0.1046 | R² Ajustado = 0.1032 F-estadístico = 76.05 | p-value F = < 0.001 | n = 653 obs.

Interpretación económica de cada coeficiente estimado

  • Intercepto (\(\beta_0 = 0.9901\)): Representa la probabilidad autónoma de analfabetismo. Indica que un individuo con cero años de educación en el departamento de Huánuco tiene una probabilidad del 99.01% de ser analfabeto.

  • Coeficiente (\(\beta_1 = -0.0002\)): Por cada incremento de una unidad en los años de escolaridad (\(X_1\)), manteniendo constantes las demás variables (ceteris paribus), la probabilidad de analfabetismo disminuye en 0.02 puntos porcentuales. Esta relación es estadísticamente significativa al 1% (p-value < 0.001).

7.6 Análisis de significancia individual (prueba t) y conjunta (prueba F)

  • Prueba t: El valor crítico es superado ampliamente por el t-valor de -8.720, lo que permite rechazar la hipótesis nula y confirmar que la educación es una variable determinante.

  • Prueba F: Con un estadístico de 76.05, se confirma que el modelo tiene validez global para explicar el fenómeno en la región.

7.7 Interpretación del \(R^2\) y \(R^2\) ajustado

El \(R^2\) Ajustado de 0.1032 indica que la escolaridad explica el 10.32% de la varianza del analfabetismo. En modelos de microdatos sociales, este nivel de ajuste es satisfactorio, dado que el analfabetismo depende de múltiples factores adicionales no incluidos en esta regresión simple.

Interpretación de Gráficos

Distribución de Escolaridad: Como se observa en el panel de gráficos, la distribución de escolaridad está sesgada hacia la izquierda, lo que indica que una parte significativa de la población huanuqueña no supera la educación básica. La dispersión con la línea de regresión roja muestra visualmente la relación inversa planteada: a mayor \(X\), menor probabilidad de ser analfabeto. Finalmente, el gráfico de residuos muestra las bandas paralelas típicas de un Modelo de Probabilidad Lineal (MPL), sugiriendo que, aunque el modelo es útil para la interpretación, presenta heterocedasticidad natural por la naturaleza de la variable dependiente.

Dispersión con Jitter: Debido a que la muestra es de 653 observaciones y la variable dependiente es dicotómica (0 y 1), se aplicó la técnica de Jittering y transparencia (alpha=0.1). Esto permite visualizar la nube de puntos real; la mayor oscuridad en la zona inferior izquierda indica que la gran mayoría de ciudadanos con baja escolaridad logran alfabetizarse, pero la probabilidad (línea roja) cae sistemáticamente a medida que aumentan los años de estudio.

Residuos vs Ajustados: La disposición de los residuos en bandas paralelas es característica de los modelos de probabilidad lineal (MPL) con variables dicotómicas. La dispersión confirma que, si bien hay una relación clara, existe heterocedasticidad inherente que fue validada con la prueba de Breusch-Pagan.

Test de diagnóstico

7.9 Tabla resumen de diagnósticos

TEST APLICADO ESTADÍSTICO p-value DECISIÓN CONCLUSIÓN
Jarque-Bera JB = 17052.4084 <0.001 Rechazar H0 No Normalidad
Breusch-Pagan BP = 102.8310 <0.001 Rechazar H0 Heterocedasticidad
Breusch-Godfrey LM = 0.2899 0.5903 No rechazar H0 No autocorrelación
RESET Ramsey F = 370.2391 0.0000 No rechazar H0 Bien especificado

Test de Jarque–Bera (Normalidad):

El test de Jarque–Bera obtuvo un estadístico de 17052.4084 con un p-value menor a 0.001, por lo que se rechaza la hipótesis nula de normalidad de los residuos. Esto indica que los errores del modelo no siguen una distribución normal. Sin embargo, dado que se trabaja con una muestra grande, esta situación es frecuente y no invalida la consistencia de los estimadores, aunque puede afectar la validez de las pruebas de significancia si no se corrige adecuadamente.

Test de Breusch–Pagan (Heterocedasticidad):

El test de Breusch–Pagan presentó un estadístico de 102.8310 con un p-value menor a 0.001, lo que lleva a rechazar la hipótesis nula de homocedasticidad. En consecuencia, existe evidencia de heterocedasticidad en el modelo, es decir, la varianza de los errores no es constante. Esta situación no sesga los coeficientes estimados, pero sí afecta la precisión de los errores estándar, lo cual puede distorsionar las pruebas t y F utilizadas para evaluar la significancia de las variables explicativas.

Test de Breusch–Godfrey (Autocorrelación):

El test de Breusch–Godfrey arrojó un estadístico LM de 0.2899 con un p-value de 0.5903, por lo que no se rechaza la hipótesis nula de ausencia de autocorrelación. Esto sugiere que no existe evidencia de correlación serial entre los errores del modelo, indicando que los residuos son independientes entre sí, lo cual constituye un resultado favorable para la validez de las estimaciones realizadas.

Test RESET de Ramsey (Especificación del modelo):

El test RESET de Ramsey obtuvo un estadístico F de 370.2391 con un p-value de 0.0000, por lo que se rechaza la hipótesis nula de correcta especificación funcional. Esto indica que el modelo podría estar mal especificado, ya sea por la omisión de variables relevantes, la presencia de relaciones no lineales no consideradas o una forma funcional inadecuada, lo que sugiere la necesidad de replantear o mejorar la especificación del modelo econométrico utilizado.

Conclusiones y Recomendacione

Conclusión 1: Estacionariedad de las series

Los resultados de las pruebas de raíz unitaria indican que las series analizadas son estacionarias en nivel, lo que garantiza que presentan media y varianza constantes en el tiempo. Esto permite descartar la presencia de raíz unitaria y evitar problemas de regresión espuria. En consecuencia, se cumple el primer objetivo específico del estudio, ya que las variables utilizadas en el modelo son adecuadas para la estimación econométrica bajo el enfoque de series de tiempo.

Conclusión 2: Estimación y significancia del modelo

La estimación del modelo econométrico evidencia que la variable explicativa principal ejerce un efecto estadísticamente significativo sobre la variable dependiente, conforme a los resultados obtenidos en la regresión. El modelo resulta globalmente significativo según la prueba F, lo que confirma que, en conjunto, las variables incluidas explican de manera relevante el comportamiento de la variable dependiente. Asimismo, el coeficiente de determinación (R²) indica que el modelo logra explicar una proporción importante de la variabilidad observada, cumpliendo así el segundo objetivo específico del estudio.

Conclusión 3: Diagnóstico del modelo

El análisis de los supuestos del modelo muestra que no existe autocorrelación en los residuos, lo cual es un resultado favorable. No obstante, se detecta la presencia de heterocedasticidad y ausencia de normalidad en los errores. Además, el test RESET de Ramsey sugiere una posible mala especificación funcional del modelo. Si bien estas situaciones no afectan la insesgadez de los estimadores, sí pueden influir en la eficiencia y en la validez de las inferencias estadísticas, por lo que se recomienda aplicar correcciones como el uso de errores estándar robustos y considerar mejoras en la especificación del modelo.

Conclusión General

El análisis econométrico confirma que la variable explicativa considerada ejerce un efecto estadísticamente significativo sobre la variable dependiente durante el periodo de estudio. El modelo estimado resulta globalmente significativo y explica una proporción relevante de la variabilidad observada. No obstante, la presencia de heterocedasticidad y posibles problemas de especificación sugieren la necesidad de ajustes metodológicos para fortalecer la robustez de los resultados. En términos de implicancias de política económica, los hallazgos evidencian la importancia de considerar esta relación al momento de diseñar estrategias orientadas a mejorar el comportamiento de la variable dependiente en el contexto analizado.

Recomendaciones

Recomendación de política económica:

Se recomienda que las autoridades económicas consideren la influencia significativa identificada en el modelo al diseñar políticas públicas, priorizando intervenciones que fortalezcan el impacto positivo (o mitiguen el impacto negativo, según corresponda) sobre la variable dependiente.

Recomendación para investigación futura:

Se sugiere ampliar el modelo incorporando variables adicionales que puedan mejorar la especificación funcional, así como extender el periodo de análisis o emplear metodologías alternativas (como modelos no lineales o dinámicos) para contrastar la robustez de los resultados obtenidos.

Limitaciones del estudio

El presente estudio presenta algunas limitaciones que deben ser reconocidas. En primer lugar, el análisis se basa en un periodo específico de tiempo, lo cual podría no capturar cambios estructurales ocurridos fuera del intervalo considerado. En segundo lugar, el modelo empleado es lineal, por lo que no contempla posibles relaciones no lineales entre las variables. Finalmente, la disponibilidad y calidad de los datos pueden restringir la incorporación de variables adicionales relevantes, lo que podría generar problemas de omisión de variables.

Referencias Bibliográficas

Ballena, J., & Fiestas, M. (2024). Impacto del gasto público financiado con canon minero sobre los indicadores educativos en el Perú, 2011–2019. Revista de Economía y Desarrollo, 18(2), 45–62.

Galvis-Aponte, L. A. (2015). Eficiencia del gasto público en educación en los municipios de Colombia. Documentos de Trabajo sobre Economía Regional, (224), Banco de la República.

Gómez Meneses, C., & Zárate Camelo, H. (2011). Gasto público en educación y su relación con variables macroeconómicas en América Latina. Revista Finanzas y Política Económica, 3(2), 123–145.

Pacheco Lay, F., & Miranda Blanco, L. (2021). Gasto público en educación y crecimiento económico en el Perú: 1950–2019. Revista Estudios Económicos, 41, 89–110.

Pereyra, A. (2001). Eficiencia del gasto público en educación en América Latina: 1980–1997. Washington, DC: Banco Interamericano de Desarrollo.

Gujarati, D. N., & Porter, D. C. (2010). Econometría (5.ª ed.). McGraw-Hill.

Instituto Nacional de Estadística e Informática. (2021). Encuesta Nacional de Hogares sobre Condiciones de Vida y Pobreza (ENAHO) 2021. https://www.inei.gob.pe