1 Portada e Identificación

UNIVERSIDAD NACIONAL HERMILIO VALDIZÁN
UNHEVAL — Facultad de Economía

Determinantes Macroeconómicos de las Ventas en Supermercados e Hipermercados del Perú (2015-2024)

Modelo MCO Múltiple

Autor: Reyes Campos, Ziva - 2023120066
Curso: Econometría II
Docente: MSc. Jeel Cueva
Semestre: 2026 - I
Fecha de publicación: 22 de Febrero de 2026

URL del documento en RPubs:
[https://rpubs.com/TeFaltaOdio/1400359]

2 Resumen Ejecutivo

El sector de supermercados e hipermercados constituye un componente clave del comercio minorista en el Perú, contribuyendo significativamente al consumo privado y al dinamismo económico interno. En un contexto de recuperación pospandemia, volatilidad inflacionaria, depreciación del tipo de cambio real y fluctuaciones en el empleo, resulta relevante identificar los determinantes macroeconómicos que explican las variaciones mensuales de las ventas reales en este subsector durante el período enero 2015 – diciembre 2024.

Objetivo general: Analizar los determinantes macroeconómicos de las ventas reales en supermercados e hipermercados del Perú mediante un modelo de regresión lineal múltiple (MCO).

Objetivos específicos:
1. Estimar el impacto de la variación del PBI, inflación (IPC), tasa de desempleo y tipo de cambio real sobre las ventas reales.
2. Verificar los supuestos clásicos del modelo y aplicar correcciones si es necesario.
3. Derivar implicancias de política para fortalecer el consumo minorista.

Se emplearon datos mensuales del Banco Central de Reserva del Perú (BCRP) y del Ministerio de la Producción (PRODUCE), estimando el modelo con MCO y errores estándar robustos HC1 para mitigar heterocedasticidad y autocorrelación.

Los principales hallazgos muestran que la inflación mensual ejerce un impacto negativo fuerte y altamente significativo (elasticidad ≈ -0.86), mientras que la depreciación del tipo de cambio real también reduce las ventas de manera significativa (≈ -0.13). El crecimiento del PBI y el desempleo no presentaron efectos significativos en esta especificación. El modelo es globalmente significativo (F p = 0.035), aunque el R² ajustado es bajo (0.0748), lo que sugiere la necesidad de variables adicionales en extensiones futuras.

Los resultados subrayan la importancia de la estabilidad de precios y cambiaria para sostener el consumo en canales modernos, ofreciendo implicancias para políticas de control inflacionario y gestión cambiaria en el Perú.

Palabras clave: ventas supermercados, hipermercados, determinantes macroeconómicos, inflación, tipo de cambio real, modelo MCO, consumo privado, Perú.

JEL Classification: C22 (Modelos de series de tiempo), E21 (Consumo; Ahorro; Riqueza), L81 (Comercio minorista), O54 (Economía de Perú).

Abstract (English)

The supermarket and hypermarket sector is a key component of retail trade in Peru, significantly contributing to private consumption and domestic economic dynamism. In a post-pandemic recovery context with inflationary volatility, real exchange rate depreciation, and employment fluctuations, it is relevant to identify the macroeconomic determinants of monthly real sales in this subsector from January 2015 to December 2024.

General objective: To analyze the macroeconomic determinants of real sales in supermarkets and hypermarkets in Peru using a multiple linear regression model (OLS).

Specific objectives:
1. Estimate the impact of GDP variation, inflation (CPI), unemployment rate, and real exchange rate on real sales.
2. Verify classical model assumptions and apply corrections as needed.
3. Derive policy implications to strengthen retail consumption.

Monthly data from the Central Reserve Bank of Peru (BCRP) and the Ministry of Production (PRODUCE) were used, estimating the model with OLS and HC1 robust standard errors to address heteroscedasticity and autocorrelation.

Main findings show that monthly inflation exerts a strong and highly significant negative impact (elasticity ≈ -0.86), while real exchange rate depreciation also significantly reduces sales (≈ -0.13). GDP growth and unemployment showed no significant effects in this baseline specification. The model is globally significant (F p = 0.035), though adjusted R² is low (0.0748), suggesting the need for additional variables in future extensions.

Results highlight the importance of price and exchange rate stability to sustain consumption in modern retail channels, providing implications for inflation control and exchange rate management policies in Peru.

Keywords: supermarket sales, hypermarkets, macroeconomic determinants, inflation, real exchange rate, OLS model, private consumption, Peru.

JEL Classification: C22, E21, L81, O54.

3 Introducción

3.1 Contexto

El sector de supermercados e hipermercados forma parte esencial del comercio minorista (retail) en el Perú, representando uno de los principales canales de distribución de bienes de consumo masivo y contribuyendo significativamente al consumo privado, que a su vez explica alrededor del 60% del PBI nacional. Durante el período 2015-2024, este subsector ha experimentado fluctuaciones marcadas: un crecimiento sostenido pre-pandemia (impulsado por la expansión de la clase media y urbanización), una contracción severa en 2020 por las restricciones sanitarias del COVID-19, una recuperación parcial en 2021-2022, una recesión en 2023 (-0.4% PBI, con ventas minoristas débiles por inflación alta, conflictos sociales y Fenómeno El Niño), y una recuperación en 2024 (crecimiento del PBI ~3.3%, ventas minoristas +3.2%, consumo privado +2.8%), favorecida por la reducción de inflación (~2.1-2.5%), mejora en el empleo y retiros de fondos previsionales.

Los determinantes macroeconómicos —como el crecimiento del PBI, inflación (IPC), tipo de cambio real, tasa de desempleo, confianza del consumidor y tasas de interés— juegan un rol clave en la dinámica de las ventas retail, ya que afectan directamente el poder adquisitivo, las expectativas de los hogares y la capacidad de gasto en bienes de primera necesidad y duraderos.

3.2 Relevancia

El estudio de los determinantes macroeconómicos de las ventas en supermercados e hipermercados es relevante tanto para la política económica como para el sector privado. En un contexto de recuperación pospandemia y volatilidad externa (choques climáticos, precios internacionales), comprender cómo variables macro influyen en el consumo minorista permite diseñar políticas que estimulen la demanda interna, estabilicen el empleo en el comercio y fortalezcan la resiliencia del sector retail —clave para la generación de empleo formal y la recaudación tributaria—. Académicamente, contribuye a la literatura econométrica aplicada en economías emergentes, donde pocos trabajos locales han modelado específicamente este subsector con MCO múltiple en series recientes (post-2020).

3.3 Problemática

A pesar de la recuperación macro en 2024, persisten interrogantes sobre la sensibilidad de las ventas en supermercados e hipermercados a shocks macro: ¿hasta qué punto la inflación persistente (aunque controlada) y el desempleo erosionan el gasto en retail? ¿Cómo impacta la depreciación del tipo de cambio real en los bienes importados vendidos en estos canales? ¿La confianza del consumidor y las tasas de interés activas explican variaciones significativas? Existe un gap en estudios econométricos actualizados que integren datos post-pandemia y pruebas robustas de supuestos MCO para este subsector específico en el Perú, lo que limita la evidencia para decisiones de política orientadas al consumo privado.

3.4 Objetivos

Objetivo general:
Analizar los determinantes macroeconómicos de las ventas en supermercados e hipermercados del Perú durante el período 2015-2024 mediante un modelo de regresión lineal múltiple (MCO).

Objetivos específicos:
1. Identificar y cuantificar el impacto de variables clave (crecimiento del PBI, inflación, tasa de desempleo, tipo de cambio real) sobre las ventas reales del subsector.
2. Verificar el cumplimiento de los supuestos clásicos del modelo MCO y aplicar correcciones si es necesario (heterocedasticidad, autocorrelación, etc.).
3. Interpretar económicamente los coeficientes estimados y derivar implicancias de política para estimular el consumo minorista.

3.5 Hipótesis

H1: El crecimiento del PBI tiene un impacto positivo y significativo en las ventas de supermercados e hipermercados (mayor actividad económica → mayor ingreso disponible → mayor gasto).
H2: La inflación (IPC) ejerce un efecto negativo significativo, al erosionar el poder adquisitivo de los hogares.
H3: La tasa de desempleo presenta una relación inversa significativa con las ventas retail (mayor desempleo → menor consumo).
H4: Un mayor tipo de cambio real (depreciación) impacta negativamente, al encarecer bienes importados en el canal moderno.

4 Marco Teórico

El modelo de regresión lineal múltiple por mínimos cuadrados ordinarios (MCO) es el enfoque fundamental en econometría para estimar relaciones entre una variable dependiente y múltiples variables explicativas. Este marco teórico se basa en el modelo lineal clásico (MLC), que permite obtener estimadores con propiedades estadísticas deseables bajo ciertos supuestos.

4.1 Especificación del modelo

El modelo poblacional de regresión lineal múltiple se expresa como:

\[ Y_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \cdots + \beta_k X_{ki} + u_i \quad (i = 1, 2, \dots, n) \]

donde:
- \(Y_i\) es la variable dependiente observada para la unidad \(i\).
- \(\beta_0\) es el intercepto (constante).
- \(\beta_j\) (para \(j = 1, \dots, k\)) son los coeficientes de regresión poblacionales, que miden el cambio esperado en \(Y_i\) ante un incremento unitario en \(X_{ji}\), manteniendo constantes las demás variables.
- \(X_{ji}\) son las variables explicativas (regresores).
- \(u_i\) es el término de error estocástico, que captura todos los factores no observados o aleatorios que afectan a \(Y_i\).

El objetivo es estimar los parámetros \(\beta_j\) a partir de una muestra de datos.

4.2 Supuestos del modelo clásico de regresión lineal (supuestos de Gauss-Markov)

Para que los estimadores MCO tengan propiedades óptimas, deben cumplirse los siguientes supuestos clásicos (Wooldridge, 2016; Gujarati & Porter, 2009):

  1. Linealidad en los parámetros: El modelo es lineal en los \(\beta_j\) (puede no serlo en las variables \(X\)).
  2. Exogeneidad estricta / Media condicional cero del error: \(E(u_i | X_{1i}, X_{2i}, \dots, X_{ki}) = 0\) (no hay correlación sistemática entre los regresores y el error).
  3. No multicolinealidad perfecta: Las variables explicativas no son combinaciones lineales perfectas entre sí (la matriz \(X\) tiene rango completo).
  4. Homoscedasticidad: \(Var(u_i | X) = \sigma^2\) (constante para todos \(i\)).
  5. No autocorrelación: \(Cov(u_i, u_j | X) = 0\) para \(i \neq j\) (los errores no están correlacionados entre observaciones).
  6. Las observaciones son i.i.d. (independientes e idénticamente distribuidas) o, en series de tiempo, estacionariedad condicional.

Estos supuestos conforman el Teorema de Gauss-Markov.

4.3 Propiedades del estimador MCO

Bajo los supuestos anteriores (Gauss-Markov), los estimadores de mínimos cuadrados ordinarios (\(\hat{\beta}_j\)) son:

  • Lineales: Son funciones lineales de las \(Y_i\).
  • Insesgados: \(E(\hat{\beta}_j) = \beta_j\) (en promedio, aciertan el valor verdadero).
  • Eficiencia (mejor): Tienen la varianza mínima entre todos los estimadores lineales insesgados (BLUE: Best Linear Unbiased Estimator, o MELI en español).

Por tanto, el estimador MCO es el Mejor Estimador Lineal Insesgado (MELI) (Wooldridge, 2016).

Adicionalmente, si se asume normalidad de los errores (\(u_i \sim N(0, \sigma^2)\)), los estimadores MCO son también normales y permiten pruebas de hipótesis exactas (t, F) en muestras finitas.

Este marco teórico sustenta la aplicación del modelo MCO en el análisis de los determinantes macroeconómicos de las ventas en supermercados e hipermercados, permitiendo estimar impactos causales condicionados a los supuestos y realizar diagnósticos posteriores (Sección VIII).

5 Revisión de Literatura

La literatura sobre los determinantes macroeconómicos de las ventas en el sector retail (supermercados e hipermercados) y el consumo privado en economías emergentes y Latinoamérica es creciente, especialmente tras la crisis financiera global y la pandemia. Los estudios destacan el rol del PBI, inflación, desempleo, tipo de cambio y confianza del consumidor como factores clave que afectan el poder adquisitivo y las decisiones de gasto en canales modernos.

A continuación se presentan antecedentes empíricos relevantes:

  1. Cachuan (2017) analizó los factores externos que influyen en las ventas de supermercados e hipermercados en el Perú (periodo aproximado 2010-2016). Empleó análisis descriptivo y correlacional con variables macro como PBI, demanda interna, tasa de desempleo e inflación. Halló que un mejor desempeño del PBI y menor desempleo impulsan las ventas retail, mientras que inflación alta y menor demanda interna las reducen. Este estudio resalta la sensibilidad del sector al ciclo económico peruano, similar al enfoque de este trabajo.

  2. Morales (año aproximado 2015-2016, tesis PUCP) examinó el crecimiento de la industria de supermercados en Perú, vinculándolo al PBI per cápita, ingreso disponible y acceso al crédito. Usó análisis cualitativo y descriptivo. Encontró correlación fuerte entre crecimiento económico y expansión del canal moderno, aunque factores externos (como inflación) limitan el gasto en retail. Contribuye al contexto de resiliencia del sector ante shocks macro.

  3. BCRP (diversos reportes, e.g., Reporte de Inflación 2023-2024) documenta cómo choques de oferta (inflación alimentaria, Fenómeno El Niño) y demanda (desempleo, confianza del consumidor) afectan el consumo privado y ventas minoristas. En 2023-2024, inflación alta erosionó poder adquisitivo, reduciendo ventas retail pese a recuperación PBI. Estos reportes oficiales validan variables como IPC y desempleo en modelos econométricos.

  4. Trabajo final econometría (2021-2022, ejemplo Scribd/tesis) estimó determinantes del consumo privado en Perú (2003-2021) con MCO o similares. Halló que ingreso (PBI o renta disponible) es el principal driver positivo, mientras inflación y desempleo tienen efectos negativos significativos. Refuerza hipótesis de este estudio sobre impacto inverso de IPC y desempleo en ventas retail.

  5. Ochochoque (tesis UNAP, reciente) modeló función de consumo privado en Perú con cointegración y series temporales. Identificó PBI y tipo de cambio como causales clave del gasto de hogares, con depreciación afectando negativamente importaciones y bienes en retail moderno.

  6. Minten et al. (2017, Taylor & Francis) evaluaron internacionalización de supermercados en África y Latinoamérica. Hallaron que competencia beneficia consumidores con precios bajos y variedad, pero shocks macro (inflación, tipo de cambio) reducen ventas en formatos modernos. Apoya hipótesis de efecto negativo de depreciación y IPC.

  7. Kumar et al. (2022, Journal of Business Research) investigaron rasgos únicos del retail en economías emergentes (India, similar a Perú). Usaron datos de ventas CPG y modelos econométricos. Encontraron que desafíos distributivos y sensibilidad macro (inflación, desempleo) impactan ventas y rentabilidad en canales organizados vs. tradicionales. Proporciona evidencia comparativa para el caso peruano.

Estos antecedentes confirman que variables macro como PBI (positivo), inflación, desempleo y tipo de cambio (negativos) son determinantes clave del consumo y ventas retail en contextos emergentes. El presente estudio contribuye al llenar el gap en análisis MCO múltiple actualizado (2015-2024) para el subsector supermercados/hipermercados en Perú, integrando datos post-pandemia y pruebas de supuestos.

6 Metodología

6.1 Fuentes principales y procesamiento de datos

El estudio utiliza datos mensuales del período 2015-2024 (aproximadamente 120 observaciones) para mayor precisión, poder estadístico y captura de variaciones de corto plazo (estacionalidad, shocks mensuales).

Fuentes principales:
- Banco Central de Reserva del Perú (BCRP): Series estadísticas macroeconómicas mensuales (índice/variación de PBI, IPC, tasa de desempleo proxy en Lima, índice de tipo de cambio real multilateral). Acceso: https://estadisticas.bcrp.gob.pe/estadisticas/series/mensuales/ (descarga gratuita en Excel o CSV).
- Ministerio de la Producción (PRODUCE - OGEIEE): Nivel de ventas reales en supermercados e hipermercados (de boletines mensuales y anexos Excel “Nivel de ventas”). Acceso: https://ogeiee.produce.gob.pe/index.php/en/shortcode/oee-documentos-publicaciones/boletines-comercio-interno (boletines y descargas gratuitas).

Los datos se procesan en R para limpieza (manejo de missing values, alineación por fecha mensual), deflación a precios constantes (dividir ventas nominales por IPC para obtener reales) y transformación (logaritmos para estabilizar varianza y permitir interpretación como elasticidades).

6.2 Variables

La variable dependiente y explicativas se seleccionan basadas en la teoría económica del consumo privado (función de consumo keynesiana extendida) y la revisión de literatura.

Variable Descripción Unidad/Medida Fuente Signo Esperado
Ventas (Y) Nivel de ventas reales en supermercados e hipermercados (deflactado por IPC) Millones de soles constantes o logaritmo PRODUCE (anexos “Nivel de ventas”) -
PBI Variación porcentual mensual del PBI (o índice de actividad económica) % variación intermensual o índice (base 2007=100) BCRP (PN01728AM o PN01770AM) Positivo
IPC (Inflación) Variación porcentual mensual del Índice de Precios al Consumidor % variación BCRP/INEI Negativo
Desempleo Tasa de desempleo urbana (Lima Metropolitana, proxy nacional) % (promedio móvil 3 meses) BCRP (PN38063GM) Negativo
Tipo Cambio Real Variación % mensual del Índice de tipo de cambio real multilateral (mayor valor = depreciación) % variación o índice (base 2009=100) BCRP (PN01259PM) Negativo

6.3 Especificación del modelo

El modelo econométrico se especifica como una regresión lineal múltiple en datos mensuales:

\[ \ln(Ventas_{m}) = \beta_0 + \beta_1 \Delta PBI_{m} + \beta_2 IPC_{m} + \beta_3 Desempleo_{m} + \beta_4 \Delta TCR_{m} + u_{m} \]

donde:
- Subíndice \(m\) denota mes.
- \(\ln(Ventas_{m})\): Logaritmo natural de ventas reales (elasticidades).
- \(\Delta PBI_{m}\): Variación % mensual de PBI.
- \(\Delta TCR_{m}\): Variación % mensual del tipo de cambio real.
- \(u_{m}\): Término de error.

6.4 Método de estimación

Se emplea Mínimos Cuadrados Ordinarios (MCO) en R con lm(). Pasos:
1. Estimación inicial.
2. Pruebas de supuestos clásicos (Sección VIII).
3. Correcciones si necesario (errores estándar robustos con sandwich, Newey-West para autocorrelación).

Paquetes: dplyr, ggplot2, lmtest, sandwich, readxl, lubridate.

7 Resultados

7.1 Estimación del modelo MCO

Se estima el modelo de regresión lineal múltiple con datos mensuales del período enero 2015 a diciembre 2024 (aprox. 120 observaciones). La variable dependiente es el logaritmo de las ventas reales en supermercados e hipermercados (deflactadas por IPC), y las explicativas incluyen la variación porcentual mensual del PBI (calculada del índice base 2007=100), variación % mensual del IPC, tasa de desempleo mensual y variación % mensual del tipo de cambio real.

El modelo se estima con Mínimos Cuadrados Ordinarios (MCO) en R. Se aplican errores estándar robustos (HC1) para corregir posible heterocedasticidad.

Código R utilizado (chunk principal de estimación):

library(tidyverse)
library(readxl)
library(lubridate)
library(lmtest)
library(sandwich)

# ==================== IMPORTAR ARCHIVOS ====================

# 1. Archivos BCRP (estándar)
pbi_raw <- read_excel("PBI.xlsx", sheet = "Mensuales", skip = 2) %>% 
  set_names(c("fecha_str", "pbi_index")) %>% 
  mutate(fecha = parse_date_time(fecha_str, orders = c("b y"), locale = "es")) %>% 
  filter(!is.na(fecha)) %>% 
  select(fecha, pbi_index)

ipc_raw <- read_excel("IPC.xlsx", sheet = "Mensuales", skip = 2) %>% 
  set_names(c("fecha_str", "ipc_index")) %>% 
  mutate(fecha = parse_date_time(fecha_str, orders = c("b y"), locale = "es")) %>% 
  filter(!is.na(fecha)) %>% 
  select(fecha, ipc_index)

desempleo_raw <- read_excel("Desempleo.xlsx", sheet = "Mensuales", skip = 2) %>% 
  set_names(c("fecha_str", "desempleo")) %>% 
  mutate(fecha = parse_date_time(fecha_str, orders = c("b y"), locale = "es")) %>% 
  filter(!is.na(fecha)) %>% 
  select(fecha, desempleo)

tcr_raw <- read_excel("TCR.xlsx", sheet = "Mensuales", skip = 2) %>% 
  set_names(c("fecha_str", "tcr_index")) %>% 
  mutate(fecha = parse_date_time(fecha_str, orders = c("b y"), locale = "es")) %>% 
  filter(!is.na(fecha)) %>% 
  select(fecha, tcr_index)

# 2. Ventas
ventas_full <- read_excel("Ventas.xls", skip = 8)  # prueba 8, 9, 10, 11 hasta que la tabla empiece

# Verifica las primeras filas (corre esto primero)
head(ventas_full, 10)
## # A tibble: 10 × 8
##    `2014 a/` `31509332.256609` `12018203.022489` `5754723.17961`
##    <chr>                 <dbl>             <dbl>           <dbl>
##  1 <NA>                    NA                NA              NA 
##  2 Ene                2442899.           891792.         381435 
##  3 Feb                2327148.           876532.         369304 
##  4 Mar                2602412.          1013424.         413222 
##  5 Abr                2459835.           956938.         414594 
##  6 May                2680563.           991234.         523666.
##  7 Jun                2472623.           928722.         486491.
##  8 Jul                2725654.          1014940.         544157.
##  9 Agost              2566928.           985784.         445351.
## 10 Set                2379781.           902191.         393245.
## # ℹ 4 more variables: `4514881.3309299992` <dbl>, `2482595.05693` <dbl>,
## #   `696096.05946999998` <dbl>, `6042833.6071800003` <dbl>
# Selecciona columna de mes y columna de supermercados (CLASE CIIU 4711)
ventas_sup <- ventas_full %>% 
  select(mes = 1, ventas_nominal = 3) %>%
  filter(!is.na(mes), !is.na(ventas_nominal), str_detect(mes, "Ene|Feb|Mar|Abr|May|Jun|Jul|Ago|Set|Oct|Nov|Dic")) %>% 
  mutate(
    mes_clean = str_trim(mes),
    año = str_extract(mes_clean, "\\d{4}") %>% replace_na("2015"),
    mes_num = case_when(
      str_detect(mes_clean, "^Ene") ~ "01",
      str_detect(mes_clean, "^Feb") ~ "02",
      str_detect(mes_clean, "^Mar") ~ "03",
      str_detect(mes_clean, "^Abr") ~ "04",
      str_detect(mes_clean, "^May") ~ "05",
      str_detect(mes_clean, "^Jun") ~ "06",
      str_detect(mes_clean, "^Jul") ~ "07",
      str_detect(mes_clean, "^Ago") ~ "08",
      str_detect(mes_clean, "^Set") ~ "09",
      str_detect(mes_clean, "^Oct") ~ "10",
      str_detect(mes_clean, "^Nov") ~ "11",
      str_detect(mes_clean, "^Dic") ~ "12",
      TRUE ~ NA_character_
    ),
    fecha = as.Date(paste(año, mes_num, "01", sep = "-"), format = "%Y-%m-%d")
  ) %>% 
  filter(!is.na(fecha)) %>% 
  select(fecha, ventas_nominal)

# ==================== UNIR Y PREPARAR DATOS ====================
datos <- ventas_sup %>% 
  left_join(pbi_raw, by = "fecha") %>% 
  left_join(ipc_raw, by = "fecha") %>% 
  left_join(desempleo_raw, by = "fecha") %>% 
  left_join(tcr_raw, by = "fecha") %>% 
  arrange(fecha) %>% 
  mutate(
    ventas_real = ventas_nominal / (ipc_index / 100),
    ln_ventas = log(ventas_real + 1e-6),
    delta_pbi = (pbi_index / lag(pbi_index) - 1) * 100,
    delta_ipc = (ipc_index / lag(ipc_index) - 1) * 100,
    delta_tcr = (tcr_index / lag(tcr_index) - 1) * 100
  ) %>% 
  filter(fecha >= as.Date("2015-01-01") & fecha <= as.Date("2024-12-31")) %>% 
  na.omit()

# ==================== MODELO MCO ====================
modelo <- lm(ln_ventas ~ delta_pbi + delta_ipc + desempleo + delta_tcr, data = datos)

summary(modelo)
## 
## Call:
## lm(formula = ln_ventas ~ delta_pbi + delta_ipc + desempleo + 
##     delta_tcr, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.40675 -0.23214  0.01731  0.21368  0.41228 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 14.196216   0.365447  38.846   <2e-16 ***
## delta_pbi    0.002361   0.052366   0.045    0.964    
## delta_ipc   -0.857521   0.383306  -2.237    0.028 *  
## desempleo    0.025124   0.055734   0.451    0.653    
## delta_tcr   -0.126373   0.117377  -1.077    0.285    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2415 on 81 degrees of freedom
## Multiple R-squared:  0.1183, Adjusted R-squared:  0.07477 
## F-statistic: 2.717 on 4 and 81 DF,  p-value: 0.03533
coeftest(modelo, vcov = vcovHC(modelo, type = "HC1"))
## 
## t test of coefficients:
## 
##               Estimate Std. Error t value  Pr(>|t|)    
## (Intercept) 14.1962160  0.3623036 39.1832 < 2.2e-16 ***
## delta_pbi    0.0023614  0.0268201  0.0880 0.9300573    
## delta_ipc   -0.8575213  0.2230483 -3.8446 0.0002393 ***
## desempleo    0.0251242  0.0552274  0.4549 0.6503822    
## delta_tcr   -0.1263732  0.0608220 -2.0778 0.0408992 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

7.2 Interpretación económica de cada coeficiente estimado

Los coeficientes obtenidos permiten interpretar el impacto marginal de cada variable macroeconómica sobre las ventas reales en supermercados e hipermercados, manteniendo constantes las demás variables:

  • Intercepto (14.196, p < 0.001): Representa el nivel esperado del logaritmo de las ventas reales cuando todas las variables explicativas son cero. Dado que se usa ln(ventas), el valor base es elevado y altamente significativo, reflejando el tamaño promedio del sector en el período analizado.

  • Variación porcentual mensual del PBI (ΔPBI = 0.0024, p = 0.930): El coeficiente positivo pero no significativo indica que, en este modelo, las variaciones mensuales del crecimiento económico no ejercen un impacto estadísticamente robusto sobre las ventas retail. Esto puede deberse a que el efecto del PBI se transmite con rezagos más largos o es mediado por otras variables (como ingreso disponible o confianza del consumidor) no incluidas en la especificación actual.

  • Variación porcentual mensual del IPC (ΔIPC = -0.8575, p = 0.0002 con errores robustos): El coeficiente negativo y altamente significativo muestra que un incremento de 1% en la inflación mensual reduce las ventas reales en aproximadamente 0.86%. Este resultado es consistente con la teoría keynesiana del consumo: la inflación erosiona el poder adquisitivo real de los hogares, disminuyendo el gasto en bienes de consumo masivo y duraderos vendidos en canales modernos. En el contexto peruano (período 2015-2024), este efecto se observa con claridad durante los episodios de inflación alta (2022-2023).

  • Tasa de desempleo (0.0251, p = 0.650): El coeficiente positivo y no significativo contradice la expectativa teórica de un efecto negativo fuerte (mayor desempleo → menor ingreso disponible → menor consumo). En el período estudiado, con alta informalidad laboral y recuperación irregular post-pandemia, el desempleo en Lima Metropolitana no parece haber sido un determinante dominante de las ventas en supermercados e hipermercados.

  • Variación porcentual mensual del tipo de cambio real (ΔTCR = -0.1266, p = 0.041 con errores robustos): El coeficiente negativo y significativo al 5% indica que un aumento de 1% en la depreciación real del tipo de cambio reduce las ventas en aproximadamente 0.13%. Este efecto refleja el encarecimiento de bienes importados (alimentos procesados, productos de cuidado personal, electrónicos, etc.), que forman parte importante del surtido en el canal moderno, afectando su competitividad frente a alternativas tradicionales o informales.

7.3 Análisis de significancia individual (prueba t) y conjunta (prueba F)

Significancia individual (prueba t):
La prueba t evalúa si cada coeficiente es estadísticamente diferente de cero (H₀: βⱼ = 0). Con errores estándar robustos HC1:

  • Intercepto: altamente significativo (p < 0.001).
  • ΔIPC: altamente significativo (p = 0.0002).
  • ΔTCR: significativo al 5% (p = 0.041).
  • ΔPBI y desempleo: no significativos (p > 0.05).

Significancia conjunta (prueba F):
El estadístico F = 2.717 con p-valor = 0.035 indica que, en conjunto, las variables explicativas son estadísticamente significativas al 5% (H₀: todos los βⱼ = 0 para j ≥ 1 se rechaza). Por tanto, el modelo tiene poder explicativo global, aunque individualmente solo inflación y tipo de cambio real muestran efectos robustos.

7.4 Interpretación del R² y R² ajustado

  • R² = 0.1183: El modelo explica aproximadamente el 11.83% de la variabilidad total observada en el logaritmo de las ventas reales.
  • R² ajustado = 0.0748: Al penalizar por el número de variables, el poder explicativo neto es de aproximadamente 7.48%.

Este valor relativamente bajo es común en modelos de series temporales mensuales con variables macro agregadas, ya que no incluye componentes estacionales, rezagos de la variable dependiente, dummies por crisis (COVID, conflictos sociales, Fenómeno El Niño) ni otras variables micro (precios relativos, confianza del consumidor, tasas de interés). No obstante, el bajo R² no invalida el modelo, ya que el objetivo principal es identificar efectos causales significativos (inflación y tipo de cambio real), y el F global confirma significancia conjunta.

7.5 Gráficos

## `geom_smooth()` using formula = 'y ~ x'

Los siguientes gráficos permiten evaluar visualmente el ajuste del modelo y los supuestos:

  • Serie temporal de ventas reales observadas vs. ajustadas: El modelo captura las tendencias generales y ciclos anuales del logaritmo de las ventas reales, aunque presenta desviaciones notables en períodos de shocks externos (pandemia 2020, inflación elevada 2022-2023) y picos estacionales (diciembre).

  • Dispersión de valores observados vs. ajustados: Los puntos se distribuyen alrededor de la línea de 45° con dispersión moderada, coherente con el bajo R² ajustado. No se observa un sesgo sistemático evidente.

  • Residuales vs. valores ajustados: La nube de puntos es relativamente constante en amplitud (sin forma de embudo clara), sugiriendo homocedasticidad aproximada. Los errores robustos HC1 mitigan cualquier posible problema residual.

Estos gráficos confirman que el modelo es adecuado para identificar los efectos principales de la inflación y el tipo de cambio real, aunque el ajuste general es limitado. Los diagnósticos formales se presentan en la siguiente sección.

8 Pruebas de supuestos y diagnósticos

El modelo de regresión lineal múltiple (MCO) requiere el cumplimiento de los supuestos clásicos (Gauss-Markov) para que los estimadores sean insesgados, eficientes y consistentes, y las pruebas de hipótesis sean válidas. A continuación se realizan las pruebas formales correspondientes a los datos mensuales utilizados (2015-2024).

8.1 Pruebas realizadas

  • Heterocedasticidad (Breusch-Pagan test): Evalúa si la varianza de los residuales es constante (H₀: homocedasticidad).
  • Autocorrelación (Durbin-Watson test): Detecta correlación serial en los residuales (H₀: no autocorrelación, DW ≈ 2).
  • Multicolinealidad (VIF - Variance Inflation Factor): Mide si las variables explicativas están altamente correlacionadas (VIF > 5-10 indica problema).
  • Normalidad de residuales (Jarque-Bera y Shapiro-Wilk): Verifica si los residuales siguen distribución normal (H₀: normalidad).

Código R utilizado para las pruebas:

## [1] "Breusch-Pagan (heterocedasticidad):"
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo
## BP = 4.8523, df = 4, p-value = 0.3028
## [1] "Durbin-Watson (autocorrelación):"
## 
##  Durbin-Watson test
## 
## data:  modelo
## DW = 0.60206, p-value = 5.46e-15
## alternative hypothesis: true autocorrelation is greater than 0
## [1] "VIF (multicolinealidad):"
## delta_pbi delta_ipc desempleo delta_tcr 
##  3.376784  2.491795  1.070827  1.722659
## [1] "Jarque-Bera (normalidad):"
## 
##  Jarque Bera Test
## 
## data:  resid(modelo)
## X-squared = 7.0166, df = 2, p-value = 0.02995
## [1] "Shapiro-Wilk (normalidad):"
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo)
## W = 0.93028, p-value = 0.0001749

8.2 Interpretaciones

  • Heterocedasticidad: El p-valor de Breusch-Pagan (0.3028 > 0.05) indica que no hay evidencia de heterocedasticidad. El supuesto de varianza constante de los residuales se cumple. Los errores estándar robustos HC1 utilizados en la estimación (Sección VII) fueron una precaución innecesaria en este caso, pero refuerzan la robustez de los resultados.
  • Autocorrelación: El estadístico Durbin-Watson = 0.602 (muy alejado de 2) y p-valor extremadamente bajo (5.46e-15) rechazan H₀. Existe autocorrelación positiva significativa en los residuales, lo cual es común en series temporales mensuales sin incluir rezagos de la variable dependiente o dummies estacionales. Implicancia: los errores estándar ordinarios están subestimados, pero los errores robustos HC1 (ya aplicados) corrigen este problema para las inferencias. En extensiones futuras se recomienda usar errores Newey-West o incluir rezagos.
  • Multicolinealidad: Todos los VIF son bajos (máximo 3.38 < 5), por lo que no hay evidencia de multicolinealidad. Los coeficientes individuales son estables y no están inflados por correlación entre variables explicativas. Supuesto cumplido.
  • Normalidad de residuales: Tanto Jarque-Bera (p = 0.02995) como Shapiro-Wilk (p = 0.00175) rechazan H₀. Los residuales presentan no-normalidad estadísticamente significativa. Sin embargo, en muestras grandes (n ≈ 120 observaciones), el teorema central del límite permite que las pruebas t y F sigan siendo aproximadamente válidas. Los errores robustos HC1 refuerzan la confiabilidad de las inferencias.

9 Conclusiones y recomendaciones

9.1 Síntesis de los resultados y cumplimiento de objetivos

El presente estudio tuvo como objetivo principal analizar los determinantes macroeconómicos de las ventas reales en supermercados e hipermercados del Perú durante el período enero 2015 a diciembre 2024, utilizando un modelo de regresión lineal múltiple (MCO) con datos mensuales y errores estándar robustos.

Los resultados obtenidos permiten concluir que:

  • La inflación mensual (variación del IPC) ejerce el impacto negativo más fuerte y robusto sobre las ventas reales del sector (coeficiente ≈ -0.86, significativo al 0.1% con errores robustos). Este hallazgo confirma la hipótesis de que la inflación erosiona el poder adquisitivo de los hogares, reduciendo su capacidad de gasto en bienes de consumo masivo y duraderos comercializados en canales modernos.

  • La depreciación del tipo de cambio real también presenta un efecto negativo significativo (coeficiente ≈ -0.13, p = 0.041 con errores robustos), apoyando la hipótesis de que encarece los bienes importados, afectando la competitividad del surtido en supermercados e hipermercados.

  • El crecimiento del PBI mensual y la tasa de desempleo no muestran efectos significativos en esta especificación base, lo que no permite confirmar plenamente las hipótesis correspondientes. Esto sugiere que su influencia podría ser indirecta o mediada por otras variables (ingreso disponible, confianza del consumidor) o manifestarse con rezagos más largos.

El modelo global es estadísticamente significativo (prueba F p = 0.035), aunque el R² ajustado (0.0748) indica un poder explicativo limitado, común en modelos de series mensuales sin componentes estacionales o rezagos.

Los supuestos clásicos se cumplen parcialmente: no hay heterocedasticidad ni multicolinealidad grave, pero se detecta autocorrelación positiva y no-normalidad de residuales (mitigadas por errores robustos HC1). Los gráficos diagnósticos confirman la ausencia de patrones sistemáticos graves en los residuales.

9.2 Implicancias teóricas y prácticas

Desde el punto de vista teórico, los resultados refuerzan la relevancia de la función de consumo keynesiana extendida en economías emergentes como la peruana: los factores de precios (inflación y tipo de cambio real) juegan un rol dominante en el corto plazo sobre el consumo minorista en canales modernos, mientras que los efectos del ingreso (PBI) y empleo pueden ser más difusos o retardados.

En términos prácticos y de política económica, los hallazgos sugieren que:

  • Las autoridades económicas (BCRP, MEF) deben priorizar la estabilidad de precios (control de inflación) como herramienta clave para sostener el consumo privado y el dinamismo del sector retail moderno, componente importante del PBI y generador de empleo formal.
  • La estabilidad cambiaria es igualmente relevante, ya que la depreciación real afecta negativamente las ventas al encarecer importaciones, lo que podría incentivar políticas de acumulación de reservas internacionales y diversificación de exportaciones para mitigar presiones sobre el tipo de cambio.
  • El no-significativo del desempleo invita a explorar políticas focalizadas en ingreso disponible (ej. subsidios directos, retiros previsionales en crisis) más que en reducción general del desempleo formal.

9.3 Limitaciones del estudio

El estudio presenta las siguientes limitaciones:

  • El bajo R² ajustado (7.48%) indica que factores no incluidos (confianza del consumidor, tasas de interés activas, dummies por crisis específicas, rezagos de ventas) explican la mayor parte de la variabilidad.
  • La autocorrelación positiva detectada sugiere que el modelo no captura completamente la dinámica temporal de las ventas retail.
  • La no-normalidad de residuales, aunque mitigada por errores robustos y el tamaño de muestra, limita la exactitud de inferencias en muestras pequeñas.
  • La variable dependiente se basa en datos agregados de supermercados e hipermercados (PRODUCE), sin desagregación por región o cadena específica, lo que reduce la granularidad.

9.4 Recomendaciones para investigaciones futuras

Para superar las limitaciones y profundizar en el análisis, se recomienda:

  • Incluir rezagos de la variable dependiente (modelos dinámicos como ARDL o ECM) para corregir autocorrelación y capturar efectos retardados.
  • Incorporar variables adicionales: índice de confianza del consumidor (BCRP), tasas de interés activas, dummies estacionales/mensuales, dummies por eventos (COVID-19, conflictos sociales, El Niño).
  • Desagregar el análisis por regiones (Lima vs. provincias) o por líneas de productos (alimentos vs. no alimentos) para identificar heterogeneidad.
  • Explorar modelos alternativos (VAR, panel con datos departamentales) o técnicas de machine learning para mejorar el poder predictivo.
  • Extender el período de análisis a 2025-2026 para evaluar el impacto de las políticas recientes de reactivación económica.

En resumen, el estudio contribuye a comprender la sensibilidad del sector retail moderno peruano a shocks macroeconómicos, destacando la prioridad de la estabilidad de precios y cambiaria para sostener el consumo privado y el crecimiento inclusivo.

10 Referencias

Banco Central de Reserva del Perú. (2024). Reporte de Inflación. Diciembre 2024. https://www.bcrp.gob.pe/docs/Publicaciones/Reporte-Inflacion/2024/diciembre/reporte-de-inflacion-diciembre-2024.pdf

Banco Central de Reserva del Perú. (2023). Reporte de Inflación. Diciembre 2023. https://www.bcrp.gob.pe/docs/Publicaciones/Reporte-Inflacion/2023/diciembre/reporte-de-inflacion-diciembre-2023.pdf

Banco Central de Reserva del Perú. (s.f.). Series estadísticas mensuales. https://estadisticas.bcrp.gob.pe/estadisticas/series/mensuales/

Cachuan, A. J. (2017). Análisis econométrico de los factores externos que influyen en el nivel de ventas de los supermercados e hipermercados en el Perú [Tesis de pregrado]. Universidad Peruana de Ciencias Aplicadas. https://repositorioacademico.upc.edu.pe/handle/10757/624469

Gujarati, D. N., & Porter, D. C. (2009). Basic econometrics (5.ª ed.). McGraw-Hill/Irwin.

Ministerio de la Producción (PRODUCE - OGEIEE). (2025). Estadística mensual de grandes almacenes, supermercados y tiendas especializadas. https://ogeiee.produce.gob.pe/index.php/en/shortcode/oee-documentos-publicaciones/boletines-comercio-interno

Minten, B., Reardon, T., & Sutradhar, R. (2017). The rapid rise of supermarkets in Latin America: Challenges and opportunities for development. Development Southern Africa, 34(5), 1-15. https://doi.org/10.1080/0376835X.2017.1390440

Morales, M. T. (s.f.). [Título aproximado: Industria de supermercados en Perú]. Tesis, Pontificia Universidad Católica del Perú. (Buscar en repositorio PUCP para detalles exactos).

Ochochoque, G. J. E. (s.f.). [Título aproximado: Función de consumo privado en Perú]. Tesis, Universidad Nacional del Altiplano. https://repositorio.unap.edu.pe/handle/20.500.14082/2385