# INTRODUCTION
Entre 2023 y 2025, México alcanzó niveles históricos de exportación, pasando de 593 mil millones de dólares en 2023 a 617 mil millones en 2024, con un crecimiento sostenido durante 2025. Este dinamismo ha sido impulsado casi en su totalidad por el sector manufacturero (principalmente automotriz, electrónica y maquinaria) mientras que las exportaciones petroleras y agrícolas han mostrado una tendencia a la baja. Esto refleja una creciente dependencia de las cadenas de suministro de América del Norte bajo el marco del USMCA.
Ante este contexto, surge la necesidad de evaluar cómo posibles cambios en el USMCA, como reglas de origen más estrictas o nuevos estándares laborales, podrían afectar la competitividad exportadora de México. Para ello, en este reporte realizaremos primero un análisis exploratorio de datos (EDA) y posteriormente un análisis de series de tiempo con modelos de pronóstico, con el objetivo de estimar tendencias futuras y evaluar posibles escenarios económicos.
*¿Qué papel pueden desempeñar los modelos de pronóstico (ARMA, ARIMA, aprendizaje automático, simulaciones de escenarios) para ayudar a las empresas a evaluar los posibles efectos de las nuevas disposiciones del T-MEC —como reglas de origen más estrictas o requisitos de sostenibilidad— en la competitividad exportadora de México?
Los modelos como ARMA y ARIMA nos permiten proyectar la proyección futura de las exportaciones con base en tendencias históricas. Ante las posibles nuevas reglas del USMCA, estos modelos nos ayudan a estimar posibles cambios en el crecimiento exportador. Este tipo de análisis les permite a las empresas anticipar posibles impactos y ajustar su estrategia antes de que los cambios sean una realidad.
El país de México depende fuertemente del mercado estadounidense gracias a su integración en cadenas manufactureras de Norteamérica. Aunque México se podría buscar nuevos mercados, la diversificación no sería inmediata. Sin embargo, reglas mucho más estrictas podrían impulsar la diversificación hacia otros mercados.
Los equipos de BI pueden usar datos históricos para poder calcular modelos base y luego simular distintos escenarios regulatorios. Al modificar las variables clave como la inversión extranjera o los costos de producción pueden estimar como se verían afectadas las exportaciones. Esto le da a las empresas la oportunidad de prepararse y anticiparse con tiempo de antemano, en lugar de reaccionar cuando los cambios ya sean oficiales.
# install.packages("readxl")
library(readxl)
#install.packages("DataExplorer")
library(DataExplorer)
#install.packages("glmnet")
library(glmnet)
## Cargando paquete requerido: Matrix
## Loaded glmnet 4.1-10
#file.choose()
df <- read_excel("C:\\Users\\eveyu\\Downloads\\concentración\\m3_saucedo\\inegi_exports_dataset.xlsx")
df_numerico <- df[, c("Exchange_rate", "FDI","gdp_per_capita_2018",
"real_public_investment_pc","Exports")]
mean_values <- sapply(df_numerico, mean, na.rm = TRUE)
median_values <- sapply(df_numerico, median, na.rm = TRUE)
min_values <- sapply(df_numerico, min, na.rm = TRUE)
max_values <- sapply(df_numerico, max, na.rm = TRUE)
descriptive_table <- data.frame(
Mean = mean_values,
Median = median_values,
Min = min_values,
Max = max_values
)
sd_values <- sapply(df_numerico, sd, na.rm = TRUE)
sd_values
## Exchange_rate FDI gdp_per_capita_2018
## 1.281615e+00 2.748834e+04 1.062046e+03
## real_public_investment_pc Exports
## 4.463904e+02 2.786118e+08
descriptive_table$SD <- sd_values
round(descriptive_table, 2)
## Mean Median Min Max
## Exchange_rate 19.20 19.47 16.89 2.052000e+01
## FDI 18081.10 9576.79 -7412.68 2.108906e+05
## gdp_per_capita_2018 1986.91 1788.31 603.71 8.216560e+03
## real_public_investment_pc 627.38 506.42 4.14 2.423360e+03
## Exports 231931426.36 97535120.79 268782.64 1.163117e+09
## SD
## Exchange_rate 1.28
## FDI 27488.34
## gdp_per_capita_2018 1062.05
## real_public_investment_pc 446.39
## Exports 278611801.01
descriptive_table
## Mean Median Min Max
## Exchange_rate 1.919906e+01 1.947150e+01 16.890000 2.052000e+01
## FDI 1.808110e+04 9.576788e+03 -7412.676855 2.108906e+05
## gdp_per_capita_2018 1.986908e+03 1.788305e+03 603.711080 8.216562e+03
## real_public_investment_pc 6.273804e+02 5.064238e+02 4.139107 2.423360e+03
## Exports 2.319314e+08 9.753512e+07 268782.639334 1.163117e+09
## SD
## Exchange_rate 1.281615e+00
## FDI 2.748834e+04
## gdp_per_capita_2018 1.062046e+03
## real_public_investment_pc 4.463904e+02
## Exports 2.786118e+08
La información corresponde al periodo 2016–2024 e incluye datos de todos los estados de la República Mexicana, lo que permite analizar diferencias regionales y variaciones en el tiempo.
El tipo de cambio presenta una media de 19.20 y una desviación estándar de 1.28. La baja dispersión indica que esta variable se mantuvo relativamente estable durante el periodo analizado. Además, la cercanía entre la media (19.20) y la mediana (19.47) sugiere una distribución simétrica sin valores extremos significativos.
La Inversión Extranjera Directa (FDI) muestra una media de 18,081.10 y una desviación estándar elevada de 27,488.34. Esta alta dispersión, junto con un valor mínimo negativo (-7,412.68) y un máximo muy alto (210,890.60), evidencia fuerte volatilidad y concentración de flujos de inversión en ciertos estados o años específicos.
El PIB per cápita tiene una media de 1,986.91 y una desviación estándar de 1,062.05, lo que refleja diferencias importantes en los niveles de desarrollo económico entre entidades federativas.
La inversión pública real per cápita presenta una desviación estándar de 446.39, lo que indica variabilidad moderada en la asignación de recursos públicos entre estados.
Finalmente, las exportaciones registran la mayor dispersión de todas las variables, con una desviación estándar de 278,611,801.01. La gran diferencia entre la media (231,931,426.36) y la mediana (97,535,120.79) confirma una distribución altamente sesgada hacia la derecha, lo que sugiere que pocas entidades concentran la mayor parte de la actividad exportadora del país.
par(mfrow = c(2,3)) # divide pantalla
hist(df_numerico$Exchange_rate, main="Exchange Rate", col="lightblue")
hist(df_numerico$FDI, main="FDI", col="lightgreen")
hist(df_numerico$gdp_per_capita_2018, main="GDP per Capita", col="lightpink")
hist(df_numerico$real_public_investment_pc, main="Public Investment", col="lightgray")
hist(df_numerico$Exports, main="Exports", col="lightyellow")
par(mfrow = c(1,1))
# Data Interpretation
En general, las variables económicas analizadas no presentan una distribución simétrica, sino asimetría positiva (sesgo a la derecha). Esto se observa porque la mayoría de los valores se concentran en niveles bajos o medios, mientras que existe una cola larga hacia la derecha debido a algunos valores extremadamente altos.
En particular, variables como la inversión extranjera directa (FDI), el PIB per cápita, la inversión pública y las exportaciones muestran este patrón, lo que indica que pocos estados concentran niveles muy elevados en comparación con la mayoría.
También podemos ver en los histogramas la presencia de outliers, especialmente en las variables FDI y en exportaciones. En estas variables podemos ver que algunos estados presentan niveles significativamente mayores a los demás. Estos valores pueden llegar a afectar la media y los resultados de regresión. Para reducir su impacto se recomienda aplicar una transformación logarítmica a las variables que estan más sesgadas, esto nos ayudaría a disminuir la asimetría y a estabilizar la varianza.
boxplot(Exports ~ region, data=df,
main="Exports by Region",
col="lightblue")
boxplot(FDI ~ region, data=df,
main = "FDI by Region",
col="lightgreen")
boxplot(gdp_per_capita_2018 ~ region, data=df,
main = "GDP per Capita by Region",
col="lightpink")
# Data Interpretation
Al analizar los boxplots se puede ver que muestran diferencias claras en la dispersión entre regiones. En exportaciones el noroeste y el noreste presentan la mayor dispersión, esto nos indica una mayor variabilidad en el desempeño exportador dentro de estas regiones. Pero por otro lado podemos ver que la CDMX muestra menor dispersión en las exportaciones.
En la variable FDI podemos ver que la CDMX presenta los niveles más altos y una dispersión considerable ya que la región muestra una gran diferencia entre los niveles mínimos y máximos. Mientras que el Sur nos muestra una menor variabilidad y niveles mucho más bajos. Para el PIB per cápita también podemos observar diferencias importantes entre las regiones, con una mayor heterogeneidad en el Sur gracias a varios valores atípicos.
En general, podemos concluir que la variable región si es una variable relevante para poder analizar el desempeño exportador de México ya que existen muchas diferencias significativas en los niveles de dispersión entre las regiones, esto nos sugiere estructuras económicas distintas.
# create_report(df_numerico)
plot_correlation(df_numerico)
plot_qq(df_numerico)
# Data Interpretation
La matriz de correlación nos muestra que las relaciones más altas (aunque son moderadas) se presentan entre FDI y GDP per cápita (0.36), así como entre GDP per cápita y Exports (0.33). También podemos ver otra relación positiva moderada entre FDI y Exports (0.24).
En cambio, el tipo de cambio (Exchange Rate) presenta coeficientes cercanos a 0 con todas sus variables entre (-0.03 y 0.01), esto nos indica que no existe una relación lineal con las variables de exportaciones, FDI o PIB per cápita.
En general podemos ver que las correlaciones son positivas pero siguen siendo moderadas esto nos sugiere que variables como FDI y PIB per cápita podrían estar asociadas con el desempeño exportador, aunque no muestren una relación extremadamente fuerte.
Al analizar los scatterplots podemos ver que las variables con mayor relación positiva con exportaciones son GDP per cápita y FDI ya que presentan una tendecía creciente más fuerte y clara. La inversión pública también nos muestra una relación positiva aunque menos fuerte. En cambio, el tipo de cambio no nos muestra una relación lineal significativa con exportaciones.
Podemos observar que estos resultados son consistentes con la matríz de correlación, donde GDP per capita (0.33) y FDI (0.24) nos presentaban los coeficientes más altos con exportaciones, mientras que el tipo de cambio mostraba valores cercanos a 0.
Con base en los resultados del análisis exploratorio de datos y de las visualizaciones, surgen las siguientes key questions e hipótesis para explicar el desempeño de las exportaciones de México en los próximos años:
¿En qué medida el PIB per cápita (gdp_per_capita_2018) y la IED explican el desempeño exportador? Se espera que el PIB per cápita y la Inversión Extranjera Directa tengan un efecto positivo y estadísticamente significativo sobre las exportaciones, debido a que ambas variables reflejan el nivel de desarrollo económico y la capacidad productiva de los estados. Un mayor PIB per cápita suele estar asociado con mejor infraestructura, mayor capital humano y mayor actividad industrial, mientras que la IED puede impulsar la producción, la transferencia de tecnología y la integración en mercados internacionales.
¿Qué variables económicas son los predictores más fuertes del crecimiento de las exportaciones de México en los próximos años? Se espera que las variables estructurales, particularmente la Inversión Extranjera Directa y el PIB per cápita (gdp_per_capita_2018), sean los predictores más relevantes del desempeño exportador debido a que representan factores de largo plazo que influyen directamente en la capacidad productiva y competitiva de la economía.
¿El tipo de cambio es un determinante significativo del desempeño exportador? Aunque desde la teoría económica un tipo de cambio más competitivo podría favorecer las exportaciones, se espera que el impacto de esta variable sea menor en comparación con otras variables como la IED y el nivel de desarrollo económico. Esto debido a la baja correlación observada en el análisis exploratorio, lo que sugiere que su relación con las exportaciones podría no ser tan fuerte en el contexto analizado.
¿Existe una relación no lineal entre la IED y las exportaciones? Se espera que la relación entre la Inversión Extranjera Directa y las exportaciones no sea completamente proporcional. Es decir, aunque un aumento en la IED puede impulsar las exportaciones, el efecto podría ir disminuyendo cuando los niveles de inversión ya son muy altos, ya que el impacto adicional de cada nueva inversión no sería tan grande como al inicio.
model_1 <- lm(Exports ~ FDI + gdp_per_capita_2018, data = df)
summary(model_1)
##
## Call:
## lm(formula = Exports ~ FDI + gdp_per_capita_2018, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -590102292 -146970898 -98788313 112006647 898099610
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.872e+07 3.271e+07 1.795 0.0737 .
## FDI 1.353e+03 6.008e+02 2.253 0.0250 *
## gdp_per_capita_2018 7.486e+04 1.555e+04 4.814 2.4e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 261300000 on 285 degrees of freedom
## Multiple R-squared: 0.1265, Adjusted R-squared: 0.1204
## F-statistic: 20.64 on 2 and 285 DF, p-value: 4.266e-09
model_2 <- lm(Exports ~ FDI + gdp_per_capita_2018 + Exchange_rate + real_public_investment_pc, data = df)
summary(model_2)
##
## Call:
## lm(formula = Exports ~ FDI + gdp_per_capita_2018 + Exchange_rate +
## real_public_investment_pc, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -613094348 -151581636 -83722564 103312531 843089890
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.836e+08 2.320e+08 0.791 0.429357
## FDI 1.433e+03 5.911e+02 2.425 0.015926 *
## gdp_per_capita_2018 8.950e+04 1.587e+04 5.641 4.1e-08 ***
## Exchange_rate -4.050e+06 1.186e+07 -0.341 0.733016
## real_public_investment_pc -1.238e+05 3.568e+04 -3.470 0.000602 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 256800000 on 283 degrees of freedom
## Multiple R-squared: 0.1622, Adjusted R-squared: 0.1503
## F-statistic: 13.7 on 4 and 283 DF, p-value: 3.201e-10
df$GDP_log <- log(df$gdp_per_capita_2018)
df$FDI_log <- asinh(df$FDI)
df$PublicI_log <- log(df$real_public_investment_pc)
df$Exchange_log <- log(df$Exchange_rate)
model_3_LOG <- lm(Exports ~ FDI_log + GDP_log + Exchange_log + PublicI_log,
data = df)
summary(model_3_LOG)
##
## Call:
## lm(formula = Exports ~ FDI_log + GDP_log + Exchange_log + PublicI_log,
## data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -446608842 -149241263 -60534341 118797684 785578983
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.301e+09 6.691e+08 -1.945 0.052764 .
## FDI_log 2.400e+07 5.894e+06 4.071 6.08e-05 ***
## GDP_log 2.584e+08 3.332e+07 7.756 1.60e-13 ***
## Exchange_log -8.885e+07 2.069e+08 -0.429 0.667995
## PublicI_log -5.963e+07 1.770e+07 -3.369 0.000859 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 240800000 on 283 degrees of freedom
## Multiple R-squared: 0.2635, Adjusted R-squared: 0.2531
## F-statistic: 25.32 on 4 and 283 DF, p-value: < 2.2e-16
model_4_poly <- lm(Exports ~ FDI + I(FDI^2) +
gdp_per_capita_2018 +
Exchange_rate +
real_public_investment_pc,
data = df)
summary(model_4_poly)
##
## Call:
## lm(formula = Exports ~ FDI + I(FDI^2) + gdp_per_capita_2018 +
## Exchange_rate + real_public_investment_pc, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -616272928 -112856374 -37607690 61123111 815294463
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.990e+08 1.903e+08 1.572 0.1171
## FDI 1.360e+04 1.137e+03 11.960 < 2e-16 ***
## I(FDI^2) -8.758e-02 7.407e-03 -11.824 < 2e-16 ***
## gdp_per_capita_2018 8.806e+04 1.300e+04 6.775 7.23e-11 ***
## Exchange_rate -1.659e+07 9.773e+06 -1.697 0.0907 .
## real_public_investment_pc -1.193e+05 2.923e+04 -4.082 5.82e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 210400000 on 282 degrees of freedom
## Multiple R-squared: 0.4399, Adjusted R-squared: 0.43
## F-statistic: 44.29 on 5 and 282 DF, p-value: < 2.2e-16
y <- df_numerico$Exports
X <- as.matrix(df_numerico[, c("Exchange_rate",
"FDI",
"gdp_per_capita_2018",
"real_public_investment_pc")])
model_5_lasso <- cv.glmnet(X, y, alpha = 1)
model_5_lasso$lambda.min
## [1] 6238470
coef(model_5_lasso, s = "lambda.min")
## 5 x 1 sparse Matrix of class "dgCMatrix"
## lambda.min
## (Intercept) 109223421.778
## Exchange_rate .
## FDI 1248.525
## gdp_per_capita_2018 82808.749
## real_public_investment_pc -102649.195
model_6_ridge <- cv.glmnet(X, y, alpha = 0)
model_6_ridge$lambda.min
## [1] 65355192
coef(model_6_ridge, s = "lambda.min")
## 5 x 1 sparse Matrix of class "dgCMatrix"
## lambda.min
## (Intercept) 180326546.763
## Exchange_rate -2896923.716
## FDI 1315.392
## gdp_per_capita_2018 69744.421
## real_public_investment_pc -87883.542
rmse <- function(actual, predicted){
sqrt(mean((actual - predicted)^2))
}
adj_r2_1 <- summary(model_1)$adj.r.squared
rmse_1 <- rmse(df$Exports, predict(model_1, df))
adj_r2_2 <- summary(model_2)$adj.r.squared
rmse_2 <- rmse(df$Exports, predict(model_2, df))
adj_r2_3 <- summary(model_3_LOG)$adj.r.squared
rmse_3 <- rmse(df$Exports, predict(model_3_LOG, df))
adj_r2_4 <- summary(model_4_poly)$adj.r.squared
rmse_4 <- rmse(df$Exports, predict(model_4_poly, df))
pred_lasso <- predict(model_5_lasso, newx = X, s = "lambda.min")
rss_lasso <- sum((y - pred_lasso)^2)
tss <- sum((y - mean(y))^2)
r2_lasso <- 1 - rss_lasso/tss
rmse_5 <- rmse(y, pred_lasso)
pred_ridge <- predict(model_6_ridge, newx = X, s = "lambda.min")
rss_ridge <- sum((y - pred_ridge)^2)
r2_ridge <- 1 - rss_ridge/tss
rmse_6 <- rmse(y, pred_ridge)
results_table <- data.frame(
Regression_Model = c("Model 1: OLS (2 vars)",
"Model 2: OLS (4 vars)",
"Model 3: Log Model",
"Model 4: Polynomial",
"Model 5: LASSO",
"Model 6: Ridge"),
Adjusted_R2 = c(adj_r2_1,
adj_r2_2,
adj_r2_3,
adj_r2_4,
r2_lasso,
r2_ridge),
RMSE = c(rmse_1,
rmse_2,
rmse_3,
rmse_4,
rmse_5,
rmse_6)
)
results_table
## Regression_Model Adjusted_R2 RMSE
## 1 Model 1: OLS (2 vars) 0.1203692 259941675
## 2 Model 2: OLS (4 vars) 0.1503354 254577626
## 3 Model 3: Log Model 0.2531214 238683006
## 4 Model 4: Polynomial 0.4299513 208153542
## 5 Model 5: LASSO 0.1601242 254889386
## 6 Model 6: Ridge 0.1551966 255636021
# install.packages("car")
library(car)
## Cargando paquete requerido: carData
vif(model_3_LOG)
## FDI_log GDP_log Exchange_log PublicI_log
## 1.084464 1.110632 1.007958 1.047600
Los resultados del VIF para el modelo logarítmico no indican problemas de multicolinealidad. Todas las variables explicativas presentan valores de VIF cercanos a 1, lo que sugiere que las variables independientes no presentan una alta correlación y que las estimaciones del modelo son estables y fiables.
vif(model_4_poly)
## FDI I(FDI^2) gdp_per_capita_2018
## 6.334767 6.184470 1.235828
## Exchange_rate real_public_investment_pc
## 1.017476 1.103963
El modelo polinomial muestra multicolinealidad moderada entre FDI y su término cuadrático (FDI aprox. de 6). Esto es esperado debido a la correlación inherente entre una variable y su transformación cuadrática. Sin embargo, dado que los valores de VIF se mantienen por debajo de 10, la multicolinealidad no se considera grave. El resto de las variables, con valores cercanos a 1, no presentan problemas de colinealidad.
#install.packages("lmtest")
library(lmtest)
## Cargando paquete requerido: zoo
##
## Adjuntando el paquete: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
bptest(model_3_LOG)
##
## studentized Breusch-Pagan test
##
## data: model_3_LOG
## BP = 46.121, df = 4, p-value = 2.324e-09
bptest(model_4_poly)
##
## studentized Breusch-Pagan test
##
## data: model_4_poly
## BP = 55.22, df = 5, p-value = 1.176e-10
Dado que en ambos casos el p-value es menor a 0.05, se rechaza la hipótesis nula de homocedasticidad (varianza constante de los errores). Por lo tanto, se concluye que ambos modelos presentan heterocedasticidad, es decir, la varianza de los términos de error no es constante a lo largo de las observaciones.
La presencia de heterocedasticidad probablemente se debe a que el conjunto de datos incluye información de todos los estados de la República Mexicana durante el periodo 2016–2024. Existen diferencias estructurales significativas entre las entidades federativas en términos de tamaño económico, nivel de desarrollo, exportaciones e inversión, lo que genera distintos niveles de variabilidad en los residuos del modelo. En particular, los estados con mayores niveles de actividad económica tienden a presentar mayor dispersión en las variables analizadas, lo que contribuye a la varianza no constante de los errores.
#install.packages("tseries")
library(tseries)
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
jarque.bera.test(residuals(model_3_LOG))
##
## Jarque Bera Test
##
## data: residuals(model_3_LOG)
## X-squared = 48.248, df = 2, p-value = 3.335e-11
jarque.bera.test(residuals(model_4_poly))
##
## Jarque Bera Test
##
## data: residuals(model_4_poly)
## X-squared = 167.41, df = 2, p-value < 2.2e-16
La prueba de Jarque-Bera indica que los residuos de los modelos logarítmico y polinómico se desvían de la normalidad (valores p < 0,05). El modelo polinomial muestra una mayor desviación de la normalidad que el modelo logarítmico. Esto significa que los errores del modelo presentan asimetría o curtosis excesiva, por lo que no siguen una distribución normal.
Con base en los criterios de selección utilizados, el modelo polinomial fue el que mostró el mejor desempeño estadístico. Presenta el mayor R^2 ajustado (0.43), lo que implica que explica aproximadamente el 43% de la variación observada en las exportaciones, además cuenta con el menor RMSE en comparación con los modelos alternativos. El modelo también es globalmente significativo (p < 0.001), lo que confirma que, en conjunto, las variables incluidas contribuyen de manera relevante a explicar el comportamiento exportador durante el periodo analizado.
En el modelo polinomial, la Inversión Extranjera Directa (FDI) presenta un efecto positivo y altamente significativo sobre las exportaciones (p < 0.001). Esto significa que, cuando aumenta la inversión extranjera en un estado, sus exportaciones tienden a incrementarse. De manera similar, el PIB per cápita (gdp_per_capita_2018) también muestra un efecto positivo y estadísticamente significativo, lo que indica que los estados con mayor nivel de desarrollo económico tienden a exportar más. Estos resultados confirman la expectativa inicial de que tanto la inversión como el desarrollo económico son factores clave para explicar el desempeño exportador, y los posicionan como los predictores más fuertes dentro del modelo.
Además, el término cuadrático de la FDI resulta significativo y presenta un coeficiente negativo. Esto sugiere que la relación entre inversión extranjera y exportaciones no es completamente proporcional. Aunque mayores niveles de IED impulsan las exportaciones, el efecto adicional de cada nueva inversión tiende a disminuir cuando los montos de inversión ya son elevados. En otras palabras, el impacto positivo se mantiene, pero crece a un ritmo menor, lo que confirma la existencia de una relación no lineal.
Por otro lado, la inversión pública per cápita aparece con un efecto negativo y significativo. Esto sugiere que mayores niveles de inversión pública no necesariamente están asociados con mayores exportaciones. Una posible explicación es que estos recursos no siempre se destinan a sectores directamente vinculados con la actividad exportadora. En cuanto al tipo de cambio, su coeficiente es negativo pero no resulta estadísticamente significativo al 5% (p = 0.0907), lo que indica que su impacto es más débil en comparación con las demás variables. Este resultado es consistente con el análisis exploratorio previo, donde la correlación observada entre tipo de cambio y exportaciones fue baja.
En conjunto, el modelo indica que la FDI y el nivel de desarrollo económico son los factores más importantes para explicar el comportamiento de las exportaciones en los estados durante el periodo analizado. Finalmente, el modelo es globalmente significativo (p < 0.001), lo que confirma que en conjunto las variables explicativas contribuyen de manera relevante a explicar el comportamiento de las exportaciones durante el periodo 2016–2024.
Los resultados del modelo indican que la Inversión Extranjera Directa (FDI) y el nivel de desarrollo económico (PIB per cápita) son los factores más relevantes para explicar el desempeño exportador de los estados mexicanos durante el periodo 2016–2024. Esto implica que la competitividad exportadora no está determinada principalmente por movimientos cambiarios, sino por la capacidad de atraer inversión, fortalecer infraestructura productiva y mantener integración en cadenas de valor internacionales. Además, esto es consistente con la tendencia observada entre 2023 y 2025, donde el crecimiento de las exportaciones estuvo impulsado principalmente por el sector manufacturero. Dado que estos sectores dependen fuertemente de cadenas de suministro integradas en América del Norte, los resultados sugieren que México mantiene una alta dependencia estructural de la inversión extranjera y de su integración en el mercado estadounidense.
En este contexto, posibles modificaciones al USMCA podrían afectar directamente los flujos de FDI y, en consecuencia, el desempeño exportador. Si la FDI es el principal motor de las exportaciones, cualquier cambio que reduzca incentivos para invertir en México podría generar efectos negativos desproporcionados en los estados más industrializados, especialmente en el norte del país. Además, dado que el tipo de cambio mostró poca relevancia estadística en el modelo, los resultados sugieren que la competitividad exportadora mexicana depende más de factores estructurales (integración productiva, inversión y desarrollo regional) que de variaciones cambiarias.
df_time <- read_excel("C:\\Users\\eveyu\\Downloads\\time_series - inegi_exports_dataset.xlsx")
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following object is masked from 'package:car':
##
## recode
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(lubridate)
##
## Adjuntando el paquete: 'lubridate'
## The following objects are masked from 'package:base':
##
## date, intersect, setdiff, union
library(ggplot2)
# install.packages("forecast")
library(forecast)
# install.packages("tseries")
library(tseries)
# install.packages("lubridate")
library(lubridate)
df_time <- df_time %>%
mutate(date = as.Date(paste0(date, "/01"), format = "%Y/%m/%d")) %>%
arrange(date)
start_year <- year(min(df_time$date))
start_month <- month(min(df_time$date))
ts_exports <- ts(df_time$ts_exports,
start = c(start_year, start_month),
frequency = 12)
library(ggplot2)
library(forecast)
autoplot(ts_exports) +
labs(title = "Time Series Plot: ts_exports",
x = "Time",
y = "Exports") +
theme_minimal()
decomp <- decompose(ts_exports, type = "additive")
autoplot(decomp) +
labs(title = "Decomposition of ts_exports") +
theme_minimal()
library(tseries)
adf.test(ts_exports)
##
## Augmented Dickey-Fuller Test
##
## data: ts_exports
## Dickey-Fuller = -2.7908, Lag order = 7, p-value = 0.2433
## alternative hypothesis: stationary
kpss.test(ts_exports)
## Warning in kpss.test(ts_exports): p-value smaller than printed p-value
##
## KPSS Test for Level Stationarity
##
## data: ts_exports
## KPSS Level = 6.5835, Truncation lag parameter = 5, p-value = 0.01
En ambas pruebas, los resultados indican que la serie de tiempo no es estacionaria. Por lo tanto, con base en ambas pruebas estadísticas, la serie temporal requiere transformación antes de la estimación del modelo.
# Since the data is NOT stationary
ts_log <- log(ts_exports)
ts_log_d1 <- diff(ts_log)
adf.test(na.omit(ts_log_d1))
## Warning in adf.test(na.omit(ts_log_d1)): p-value smaller than printed p-value
##
## Augmented Dickey-Fuller Test
##
## data: na.omit(ts_log_d1)
## Dickey-Fuller = -9.1287, Lag order = 7, p-value = 0.01
## alternative hypothesis: stationary
kpss.test(na.omit(ts_log_d1))
## Warning in kpss.test(na.omit(ts_log_d1)): p-value greater than printed p-value
##
## KPSS Test for Level Stationarity
##
## data: na.omit(ts_log_d1)
## KPSS Level = 0.16524, Truncation lag parameter = 5, p-value = 0.1
En ambas pruebas, los resultados indican que la serie transformada es estacionaria. En el test ADF, el p-value es menor a 0.05 y por su parte, en el test KPSS el p-value es mayor a 0.05, por lo que no se rechaza la hipótesis nula de estacionariedad. En consecuencia, la serie ya cumple con el supuesto de estacionariedad y puede utilizarse para la estimación del modelo.
Acf(ts_exports)
Pacf(ts_exports)
Box.test(ts_exports, lag = 12, type = "Ljung-Box")
##
## Box-Ljung test
##
## data: ts_exports
## X-squared = 4189.3, df = 12, p-value < 2.2e-16
y <- na.omit(ts_log_d1)
m1 <- Arima(y, order = c(1,0,1))
m2 <- auto.arima(y, seasonal = FALSE)
m3 <- auto.arima(y, seasonal = TRUE)
summary(m1)
## Series: y
## ARIMA(1,0,1) with non-zero mean
##
## Coefficients:
## ar1 ma1 mean
## 0.1798 -0.7080 0.0057
## s.e. 0.0755 0.0521 0.0018
##
## sigma^2 = 0.01021: log likelihood = 356.62
## AIC=-705.23 AICc=-705.13 BIC=-689.2
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set 0.0003760599 0.1006904 0.07291238 79.89622 131.1441 0.9264964
## ACF1
## Training set 0.008594907
summary(m2)
## Series: y
## ARIMA(4,0,3) with non-zero mean
##
## Coefficients:
## ar1 ar2 ar3 ar4 ma1 ma2 ma3 mean
## -0.7017 -0.8294 0.1408 -0.1289 0.2366 0.3647 -0.6311 0.0057
## s.e. 0.0915 0.1259 0.1263 0.0669 0.0816 0.0739 0.0805 0.0018
##
## sigma^2 = 0.009265: log likelihood = 378.08
## AIC=-738.15 AICc=-737.7 BIC=-702.07
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set 0.0003392414 0.09530615 0.06989566 160.5123 270.0134 0.888163
## ACF1
## Training set 0.0005397968
summary(m3)
## Series: y
## ARIMA(4,0,1)(0,0,2)[12] with non-zero mean
##
## Coefficients:
## ar1 ar2 ar3 ar4 ma1 sma1 sma2 mean
## -0.0964 -0.2084 0.0110 -0.1919 -0.3399 0.3404 0.2316 0.0054
## s.e. 0.1846 0.0926 0.0751 0.0508 0.1853 0.0485 0.0527 0.0031
##
## sigma^2 = 0.008221: log likelihood = 402.19
## AIC=-786.37 AICc=-785.92 BIC=-750.29
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set 0.0008005815 0.08977299 0.06418281 -33.47989 214.2402 0.8155699
## ACF1
## Training set -0.0005045348
AIC(m1, m2, m3)
## df AIC
## m1 4 -705.2317
## m2 9 -738.1540
## m3 9 -786.3731
BIC(m1, m2, m3)
## df BIC
## m1 4 -689.1965
## m2 9 -702.0747
## m3 9 -750.2937
checkresiduals(m1)
##
## Ljung-Box test
##
## data: Residuals from ARIMA(1,0,1) with non-zero mean
## Q* = 168.31, df = 22, p-value < 2.2e-16
##
## Model df: 2. Total lags used: 24
checkresiduals(m2)
##
## Ljung-Box test
##
## data: Residuals from ARIMA(4,0,3) with non-zero mean
## Q* = 115.28, df = 17, p-value < 2.2e-16
##
## Model df: 7. Total lags used: 24
checkresiduals(m3)
##
## Ljung-Box test
##
## data: Residuals from ARIMA(4,0,1)(0,0,2)[12] with non-zero mean
## Q* = 26.406, df = 17, p-value = 0.06738
##
## Model df: 7. Total lags used: 24
Se estimaron tres modelos ARIMA para la serie transformada. Al comparar sus indicadores de ajuste, el modelo 3 mostró el menor AIC y el menor error (RMSE), lo que indica un mejor desempeño predictivo frente a los demás modelos. Además, este modelo incorpora un componente estacional mensual, lo cual es consistente con el comportamiento cíclico de las exportaciones mexicanas. Por estas razones, se seleccionó como el modelo más adecuado para realizar el pronóstico.
best_model <- m3
forecast_5 <- forecast(best_model, h = 5)
autoplot(forecast_5) +
labs(title = "Forecast next 5 periods",
x = "Time",
y = "Forecast") +
theme_minimal()
forecast_5
## Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
## Jan 2026 -0.036865586 -0.15306195 0.07933078 -0.2145726 0.1408414
## Feb 2026 0.026875913 -0.09989663 0.15364846 -0.1670060 0.2207578
## Mar 2026 0.051384039 -0.07685360 0.17962168 -0.1447385 0.2475066
## Apr 2026 0.002054454 -0.12691413 0.13102304 -0.1951860 0.1992949
## May 2026 -0.008619835 -0.13915364 0.12191397 -0.2082541 0.1910144
El pronóstico de cinco períodos sugiere fluctuaciones moderadas en la tasa de crecimiento mensual de las exportaciones. Para enero de 2026 se proyecta una contracción de aproximadamente el 3.7%, seguida de una recuperación en febrero (2.7%) y un crecimiento más sólido en marzo (5.1%). Sin embargo, los intervalos de confianza son relativamente amplios e incluyen valores tanto positivos como negativos, lo que indica un grado significativo de incertidumbre en las perspectivas a corto plazo.
Esta volatilidad e incertidumbre resaltan la vulnerabilidad del sector exportador mexicano a los shocks externos y a los posibles cambios en las regulaciones del USMCA. Incluso pequeños ajustes de política podrían amplificar estas fluctuaciones a corto plazo, en particular dada la alta dependencia de México de las exportaciones manufactureras.
Este estudio demuestra que el desempeño exportador de México está determinado principalmente por factores estructurales y no únicamente por variables macroeconómicas de corto plazo. La Inversión Extranjera Directa y el PIB per cápita se consolidan como los determinantes más sólidos de las exportaciones, lo que confirma que la capacidad productiva, el nivel de desarrollo y la integración en cadenas globales de valor son los verdaderos motores del crecimiento exportador. Asimismo, la evidencia de una relación no lineal entre la IED y las exportaciones indica que, aunque atraer inversión es fundamental, su impacto marginal tiende a moderarse a niveles elevados, lo que resalta la importancia de priorizar inversión estratégica y de alto valor agregado.
Por su parte, el análisis de series de tiempo confirma una tendencia de crecimiento con fluctuaciones relevantes en el corto plazo, evidenciando la vulnerabilidad del sector ante shocks externos y posibles modificaciones en el entorno comercial bajo el USMCA.
En un contexto internacional caracterizado por alta volatilidad, tensiones comerciales y cambios regulatorios, estos hallazgos refuerzan la necesidad de fortalecer la atracción de inversión productiva, consolidar el desarrollo regional y mantener una estrategia de integración competitiva. La incertidumbre actual hace indispensable continuar monitoreando y evaluando el desempeño exportador de manera constante, utilizando herramientas econométricas y de pronóstico que permitan anticipar riesgos y diseñar estrategias de adaptación oportunas. Solo mediante un análisis continuo y estratégico será posible fortalecer la resiliencia del sector exportador mexicano frente a futuros desafíos globales.