0. Libraries & Data

library(readxl)
library(dplyr)
library(tidyr)
library(stringr)
library(ggplot2)
library(sf)
library(reshape2)
library(rnaturalearth)
library(rnaturalearthdata)
file <- "C:/Users/migue/OneDrive/Desktop/inegi_exports_datasetpanel.xlsx"

data            <- read_excel(file, sheet = "data")
exports         <- read_excel(file, sheet = "exports")
fdi             <- read_excel(file, sheet = "fdi")
panel_2016_2024 <- read_excel(file, sheet = "panel")
ts_exports_raw  <- read_excel(file, sheet = "ts_exports")

I. Mexico’s Exports Performance

a. Performance 2015–2025: 3 Main Characteristics

ts_exports_plot <- ts_exports_raw %>%
  mutate(date = as.Date(paste0(str_replace(date, "/", "-"), "-01"))) %>%
  filter(date >= as.Date("2015-01-01"),
         date <= as.Date("2025-12-31"))
ggplot(ts_exports_plot, aes(x = date, y = ts_exports, group = 1)) +
  annotate("rect",
           xmin = as.Date("2020-01-01"),
           xmax = as.Date("2021-12-31"),
           ymin = -Inf, ymax = Inf,
           fill = "red", alpha = 0.2) +
  geom_line(color = "#1874CD", linewidth = 0.8) +
  scale_x_date(date_breaks = "1 year", date_labels = "%Y") +
  labs(
    title    = "Desempeño de las Exportaciones de México (2015–2025)",
    subtitle = "Zona roja: periodo de pandemia COVID-19",
    x        = "Año",
    y        = "Exportaciones (MXN)"
  ) +
  theme_minimal()

  • Tendencia creciente en el largo plazo. Las exportaciones de México muestran una tendencia general al alza durante la última década, reflejo de la integración progresiva del país a cadenas de valor globales.

  • Caída significativa en 2020. Se observa una disminución abrupta alrededor del año 2020, siendo la mayor disrupción del periodo analizado. Esta caída está directamente asociada a las interrupciones del comercio internacional provocadas por la pandemia de COVID-19.

  • Fuerte recuperación post-pandemia (2021–2025). Después de 2020, las exportaciones se recuperan rápidamente y retoman su trayectoria ascendente. Para 2023–2025, los niveles alcanzan e incluso superan los valores previos a la pandemia.


b. ¿Cómo contribuye el análisis de datos panel?

El análisis de datos panel combina información transversal (entre estados) y temporal (a lo largo de los años), lo que permite analizar cómo diferentes factores económicos influyen en el desempeño exportador de cada región. Este enfoque controla características no observables que permanecen constantes en el tiempo —como la infraestructura o la ubicación geográfica— facilitando la identificación de los determinantes estructurales que explican el comportamiento de las exportaciones en México.


c. ¿Cómo puede predecir el desempeño exportador a 1–2 años?

Al aprovechar la evolución histórica de las exportaciones en cada estado, el análisis de datos panel permite estimar el efecto de variables económicas a lo largo del tiempo. Esto facilita proyectar el comportamiento futuro de las exportaciones y anticipar posibles cambios en la demanda externa, permitiendo estimar su desempeño en el corto plazo, como en los próximos 1 a 2 años.


d. ¿Cómo pueden las herramientas de BI identificar vulnerabilidades ante cambios del USMCA?

Las herramientas de Business Intelligence permiten analizar grandes volúmenes de datos comerciales y económicos para identificar patrones en el comportamiento exportador. La analítica predictiva facilita estimar el impacto potencial de cambios en aranceles o reglas comerciales, permitiendo anticipar qué estados o sectores podrían verse más afectados. Además, estas herramientas ayudan a monitorear la dependencia comercial hacia Estados Unidos, identificando aquellas regiones cuya actividad exportadora es más sensible a modificaciones en las políticas comerciales.


II. Exploratory Data Analysis – EDA

Descriptive Statistics

Selección de variables por correlación

panel_num <- panel_2016_2024 %>%
  select(where(is.numeric))

cor_matrix  <- cor(panel_num, use = "complete.obs")
cor_exports <- cor_matrix["real_exports", ]
cor_exports <- sort(cor_exports, decreasing = TRUE)

cor_exports
##              real_exports              lq_secondary  border_economic_activity 
##               1.000000000               0.708024001               0.645127331 
##      average_daily_salary       gdp_per_capita_2018               fdi_inflows 
##               0.399570893               0.347703254               0.297079006 
##                crime_rate         college_education                      inpc 
##               0.148297493               0.058223300               0.030297127 
##                      year             exchange_rate real_public_investment_pc 
##               0.026519615               0.002299666              -0.068831138 
##               pop_density                lq_primary               lq_tertiary 
##              -0.125956361              -0.336599268              -0.518744646 
##           border_distance 
##              -0.750170777

Con base en las correlaciones con real_exports, se seleccionan las siguientes variables de interés:

vars <- c("real_exports",
          "lq_secondary",
          "border_economic_activity",
          "average_daily_salary")

a. Promedio por región

regional_avg <- panel_2016_2024 %>%
  group_by(region) %>%
  summarise(across(all_of(vars), ~ mean(.x, na.rm = TRUE))) %>%
  pivot_longer(cols      = -region,
               names_to  = "variable",
               values_to = "avg_value")

ggplot(regional_avg, aes(x = region, y = avg_value, fill = region)) +
  geom_col(show.legend = FALSE) +
  facet_wrap(~ variable, scales = "free_y", ncol = 2) +
  coord_cartesian(clip = "off") +
  scale_fill_brewer(palette = "Set2") +
  theme_minimal() +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1),
    strip.text  = element_text(size = 10),
    plot.margin = margin(10, 10, 30, 30)
  ) +
  labs(
    title = "Promedio Regional de Variables Clave",
    x     = "Región",
    y     = "Promedio"
  )

Se observa que el Noreste presenta los mayores niveles de exportaciones, acompañados de mayor especialización en el sector secundario y salarios promedio más altos, lo que sugiere una estructura productiva más orientada a la actividad industrial. En contraste, el Sur presenta menores niveles en todas estas variables, reflejando una menor participación en actividades vinculadas a mercados externos.


b. Histogramas

panel_long <- panel_2016_2024 %>%
  select(all_of(vars)) %>%
  pivot_longer(
    cols      = everything(),
    names_to  = "variable",
    values_to = "value"
  ) %>%
  mutate(
    value = if_else(variable == "real_exports",
                    log1p(pmax(value, 0)),
                    value)
  )

ggplot(panel_long, aes(x = value, fill = variable)) +
  geom_histogram(bins = 30, alpha = 0.8) +
  facet_wrap(~ variable, scales = "free") +
  scale_fill_brewer(palette = "Set2") +
  theme_minimal() +
  theme(
    strip.text      = element_text(size = 11),
    legend.position = "none"
  ) +
  labs(
    title    = "Histogramas de Variables Seleccionadas",
    subtitle = "real_exports graficado en escala log"
  )


Statistics of Dispersion

a. Boxplots por región

box_data <- panel_2016_2024 %>%
  select(region, all_of(vars)) %>%
  pivot_longer(
    cols      = -region,
    names_to  = "variable",
    values_to = "value"
  )

ggplot(box_data, aes(x = region, y = value, fill = variable)) +
  geom_boxplot(alpha = 0.7) +
  facet_wrap(~ variable, scales = "free_y") +
  scale_fill_brewer(palette = "Set2") +
  theme_minimal() +
  theme(
    axis.line       = element_line(color = "black"),
    axis.ticks      = element_line(color = "black"),
    panel.grid      = element_blank(),
    axis.text.x     = element_text(angle = 45, hjust = 1),
    strip.text      = element_text(size = 11),
    legend.position = "none"
  ) +
  labs(
    title = "Distribución de Variables por Región",
    x     = "Región",
    y     = "Valor"
  )

Las exportaciones reales presentan una distribución sesgada hacia la derecha, indicando que solo algunas regiones concentran niveles altos de exportación. El Noreste muestra la mayor mediana y dispersión, acompañado de mayor especialización industrial y salarios más altos. La concentración de valores negativos en border_economic_activity indica que la mayoría de los estados presentan menor actividad económica vinculada al comercio con EE.UU.


Visualization across Time

a. Evolución anual de exportaciones

ts_annual <- panel_2016_2024 %>%
  group_by(year) %>%
  summarise(
    avg_exports = mean(real_exports, na.rm = TRUE),
    .groups     = "drop"
  ) %>%
  mutate(avg_exports_log = log1p(avg_exports))

ggplot(ts_annual, aes(x = year, y = avg_exports_log)) +
  geom_line(color = "#52A8BC", linewidth = 1.2) +
  geom_point(color = "#E84746", size = 2) +
  theme_minimal() +
  labs(
    title = "Evolución de las Exportaciones Reales (Log)",
    x     = "Año",
    y     = "Log de Exportaciones Promedio"
  )

Las exportaciones reales muestran una tendencia general al alza, con caídas en años como 2018, 2021 y 2024. Debido al rezago temporal incorporado en las variables, estas disminuciones reflejan choques ocurridos en el año previo. La recuperación en 2024 indica una reactivación exportadora tras periodos de contracción.


b. Evolución de exportaciones por región

ts_region <- panel_2016_2024 %>%
  group_by(region, year) %>%
  summarise(
    avg_exports = mean(real_exports, na.rm = TRUE),
    .groups     = "drop"
  ) %>%
  mutate(avg_exports_log = log1p(avg_exports))

ggplot(ts_region, aes(x = year, y = avg_exports_log, color = region)) +
  geom_line(linewidth = 1.2) +
  geom_point(size = 2) +
  theme_minimal() +
  labs(
    title = "Evolución de Exportaciones Reales por Región (Log)",
    x     = "Año",
    y     = "Log de Exportaciones Promedio",
    color = "Región"
  )

Las regiones no reaccionan de forma uniforme ante choques económicos. Algunas muestran mayor estabilidad mientras que otras presentan variaciones más pronunciadas, evidenciando heterogeneidad regional y la existencia de choques generales que afectan simultáneamente a varias regiones.


c. Exportaciones vs. Tipo de Cambio

ts_macro <- panel_2016_2024 %>%
  group_by(year) %>%
  summarise(
    avg_exports = mean(real_exports,  na.rm = TRUE),
    avg_exrate  = mean(exchange_rate, na.rm = TRUE),
    .groups     = "drop"
  ) %>%
  mutate(
    exports_std = as.numeric(scale(log1p(avg_exports))),
    exrate_std  = as.numeric(scale(avg_exrate))
  ) %>%
  select(year, exports_std, exrate_std) %>%
  pivot_longer(
    cols      = -year,
    names_to  = "variable",
    values_to = "value"
  )

ggplot(ts_macro, aes(x = year, y = value, color = variable)) +
  geom_line(linewidth = 1.2) +
  geom_point(size = 2) +
  scale_color_manual(
    values = c("exports_std" = "#1874CD", "exrate_std" = "#E84746"),
    labels = c("exports_std" = "Exportaciones (std)", "exrate_std" = "Tipo de Cambio (std)")
  ) +
  theme_minimal() +
  labs(
    title = "Exports Inflows vs. Exchange Rate Performance",
    x     = "Year",
    y     = "Standardized Value",
    color = "Indicator"
  )

Se observan movimientos simultáneos en 2021 y 2024. Cuando el tipo de cambio disminuye (el peso se aprecia frente al dólar), los ingresos por exportaciones en pesos tienden a reducirse, ya que los dólares recibidos se traducen en menos pesos.


Regional Differences

a. Norte vs. Sur a lo largo del tiempo

bar_ns_time <- panel_2016_2024 %>%
  mutate(
    macro_region = case_when(
      region %in% c("Noroeste", "Noreste") ~ "North",
      region == "Sur"                      ~ "South",
      TRUE                                 ~ "Other"
    )
  ) %>%
  filter(macro_region %in% c("North", "South")) %>%
  group_by(year, macro_region) %>%
  summarise(
    avg_exports = mean(real_exports, na.rm = TRUE),
    .groups     = "drop"
  )

ggplot(bar_ns_time, aes(x = factor(year), y = avg_exports, fill = macro_region)) +
  geom_col(position = "dodge", alpha = 0.85) +
  scale_fill_manual(values = c("North" = "#52A8BC", "South" = "#E84746")) +
  theme_minimal() +
  labs(
    title = "Exportaciones Reales: Norte vs. Sur (2016–2024)",
    x     = "Año",
    y     = "Exportaciones Promedio",
    fill  = "Región"
  )


b. Mapa de exportaciones promedio por estado

exports_avg <- panel_2016_2024 %>%
  group_by(state) %>%
  summarise(
    avg_exports = mean(real_exports, na.rm = TRUE),
    .groups     = "drop"
  )

mexico_map  <- ne_states(country = "mexico", returnclass = "sf")

mexico_data <- mexico_map %>%
  left_join(exports_avg, by = c("name" = "state"))

ggplot(mexico_data) +
  geom_sf(aes(fill = avg_exports)) +
  scale_fill_gradient(low  = "lightyellow",
                      high = "#E84746",
                      name = "Exportaciones\npromedio") +
  labs(title = "Promedio de Exportaciones por Estado en México (2016–2024)") +
  theme_minimal()


c. Norte vs. Sur: Exposición a mercados internacionales

data_ns <- panel_2016_2024 %>%
  mutate(
    north_south = case_when(
      region %in% c("Noroeste", "Noreste") ~ "North",
      region == "Sur"                      ~ "South",
      TRUE                                 ~ NA_character_
    )
  ) %>%
  filter(!is.na(north_south))

data_ns_long <- data_ns %>%
  select(north_south, real_exports, fdi_inflows,
         border_economic_activity, border_distance) %>%
  pivot_longer(
    cols      = -north_south,
    names_to  = "variable",
    values_to = "value"
  )

ggplot(data_ns_long, aes(x = north_south, y = value, fill = north_south)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.5) +
  facet_wrap(~ variable, scales = "free") +
  scale_fill_manual(values = c("North" = "#52A8BC", "South" = "#E84746")) +
  theme_minimal() +
  theme(legend.position = "none") +
  labs(
    title = "Norte vs. Sur: Exposición a los Mercados Internacionales",
    x     = "",
    y     = "Value"
  )

Al comparar las regiones del Norte y Sur, se observan diferencias importantes en su nivel de exposición a los mercados internacionales. Estas diferencias se explican por los siguientes factores estructurales:

  • Proximidad geográfica a EE.UU. Los estados del Norte están más cerca de la frontera, lo que reduce costos logísticos y facilita la integración a cadenas globales de valor.
  • Mayores flujos de FDI. La mayor entrada de inversión extranjera en el Norte contribuye al desarrollo de infraestructura productiva orientada a la exportación.
  • Mayor especialización industrial (lq_secondary). Los estados del Norte concentran más actividades manufactureras vinculadas al comercio internacional.
  • Mayor actividad económica fronteriza. Una mayor intensidad de intercambios en la frontera incrementa la integración económica con otros países.
  • Menor distancia al mercado externo. La menor distancia a la frontera reduce tiempos y costos de traslado, incrementando la competitividad exportadora.

Correlation and Relationships

a. Matriz de correlación (Heatmap)

corr_melt <- melt(cor_matrix)

ggplot(corr_melt, aes(x = Var1, y = Var2, fill = value)) +
  geom_tile() +
  geom_tile(
    data      = subset(corr_melt, Var1 == "real_exports" | Var2 == "real_exports"),
    color     = "black",
    linewidth = 0.7
  ) +
  scale_fill_gradient2(
    low      = "#E84746",
    high     = "#52A8BC",
    mid      = "white",
    midpoint = 0,
    limit    = c(-1, 1),
    name     = "Correlation"
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  labs(
    title = "Matriz de Correlación – Variables del Panel",
    x     = "",
    y     = ""
  )


b. Scatterplots: Exportaciones vs. Variables Clave

scatter_data <- panel_2016_2024 %>%
  select(real_exports, lq_secondary,
         border_economic_activity,
         average_daily_salary,
         fdi_inflows) %>%
  pivot_longer(
    cols      = -real_exports,
    names_to  = "variable",
    values_to = "value"
  )

ggplot(scatter_data, aes(x = value, y = real_exports)) +
  geom_point(alpha = 0.6, color = "#52A8BC") +
  geom_smooth(method = "lm", color = "#E84746", se = TRUE) +
  facet_wrap(~ variable, scales = "free") +
  theme_minimal() +
  labs(
    title = "Exportaciones vs. Variables Económicas Seleccionadas",
    x     = "Variable Independiente",
    y     = "Exportaciones Reales"
  )

Los scatterplots muestran relaciones positivas entre las exportaciones y las variables seleccionadas. La especialización en el sector secundario y los flujos de FDI presentan las asociaciones más fuertes con el desempeño exportador, mientras que el salario diario promedio también muestra una relación positiva consistente con la teoría económica.


III. Hypotheses Statements

Con base en los resultados del EDA, se plantean las siguientes hipótesis:

H1 – Especialización industrial y exportaciones. Los estados con mayor especialización en el sector secundario (lq_secondary) presentan niveles significativamente más altos de exportaciones reales, controlando por efectos fijos de estado y año.

H2 – Salario y competitividad exportadora. Existe una relación positiva entre el salario diario promedio y las exportaciones reales, dado que salarios más altos reflejan mayor productividad y sofisticación industrial en los estados exportadores.

H3 – FDI como determinante de exportaciones. Los estados que reciben mayores flujos de Inversión Extranjera Directa presentan un mayor desempeño exportador, ya que la IED facilita la integración a cadenas de valor globales.

H4 – Proximidad a la frontera y exportaciones. Los estados con menor distancia a la frontera norte muestran mayores niveles de exportación, debido a menores costos logísticos y mayor acceso a los mercados de América del Norte.

H5 – Tipo de cambio y exportaciones. Una depreciación del tipo de cambio (aumento en el valor del dólar relativo al peso) se asocia positivamente con el nivel de exportaciones reales, al hacer más competitivos los productos mexicanos en el exterior.


IV. Main Findings

Con base en los resultados del análisis exploratorio, se identifican los siguientes hallazgos principales:

1. Tendencia creciente con choque pandémico. Las exportaciones crecieron sostenidamente entre 2016 y 2024, con una caída abrupta en 2020 por COVID-19 y una recuperación acelerada posterior que superó los niveles pre-pandemia hacia 2023–2024.

2. Alta concentración regional en el Norte. El Noreste y Noroeste concentran la mayor parte del valor exportado. Esta brecha Norte–Sur es estructural y se mantiene consistente a lo largo de todo el periodo analizado.

3. La especialización industrial es el principal correlacionado de las exportaciones. El cociente de localización del sector secundario (lq_secondary) muestra una de las correlaciones más altas con real_exports, lo que sugiere que los estados más industrializados son también los más exportadores.

4. El FDI y la cercanía a la frontera son factores diferenciadores clave. Los estados del Norte concentran mayores flujos de IED y menor distancia geográfica a EE.UU., lo que explica en gran medida su mayor integración a mercados internacionales respecto al Sur.

5. El tipo de cambio co-mueve con las exportaciones. Se identificaron periodos (2021 y 2024) donde movimientos en el tipo de cambio coinciden con cambios en el desempeño exportador, consistente con la teoría económica sobre competitividad cambiaria.

6. Distribución sesgada de exportaciones. La distribución de exportaciones reales está fuertemente sesgada hacia la derecha: la mayoría de los estados exportan volúmenes bajos, mientras que unos pocos concentran niveles muy altos.

7. Heterogeneidad regional ante choques externos. Las series de tiempo por región muestran que los choques económicos no afectan de igual forma a todas las regiones, lo que justifica el uso de datos panel con efectos fijos para controlar esta heterogeneidad no observada en modelos econométricos posteriores.

