1 Base de datos

https://data-explorer.oecd.org/vis?pg=0&snb=14&tm=real%20gdp&df[ds]=dsDisseminateFinalDMZ&df[id]=DSD_NAMAIN1%40DF_QNA&df[ag]=OECD.SDD.NAD&df[vs]=1.1&dq=Q..USA…B1GQ._Z…IX.LR..T0102&pd=2000-Q1%2C2024-Q4&to[TIME_PERIOD]=false&isAvailabilityDisabled=false&fs[0]=Topic%2C0%7CEconomy%23ECO%23&fs[1]=Frequency%20of%20observation%2C0%7CQuarterly%23Q%23&fs[2]=Reference%20area%2C0%7CUnited%20States%23USA%23 País de observación: Estados Unidos. Periodo trimestral desde: 2000 a 2024

País de observación: Estados Unidos.

Periodo trimestral desde: 2000 a 2024

2 Introducción

El Producto Interno Bruto (PIB) real de Estados Unidos es uno de los indicadores más importantes para medir el desempeño económico del país. Su análisis histórico permite identificar períodos de crecimiento, crisis, recuperación y cambios estructurales en la economía. En este trabajo se estudia la evolución del PIB real utilizando datos trimestrales de la OECD. El análisis se enfoca especialmente en periodos de crisis financieras fuertes, y en particular en la gran caída de Wall Street, dado que las contracciones económicas suelen reflejarse claramente en este indicador. El uso de modelos ARIMA permite capturar patrones de tendencia y prever su comportamiento futuro, apoyando la toma de decisiones estratégicas y el entendimiento de posibles fluctuaciones económicas.

3 Metodología

Una serie de tiempo es un conjunto de observaciones ordenadas cronológicamente. Su análisis permite estudiar tendencias, ciclos y cambios estructurales. El modelo ARIMA (Autoregressive Integrated Moving Average) combina:

  • AR (p): dependencia de observaciones pasadas
  • AR (p): dependencia de observaciones pasadas
  • MA (q): influencia de errores pasados. Se utiliza el modelo ARIMA por su capacidad para capturar tendencias y realizar pronósticos incluso cuando la serie no es estacionaria inicialmente. En este estudio se utilizaron datos trimestrales (mínimo 60 periodos), se evaluó la estacionariedad con la prueba ADF, se diferenciaron las series cuando fue necesario, y se compararon varios modelos mediante el criterio AIC.

4 Descripción de la Serie Temporal

La serie utilizada corresponde al PIB real de Estados Unidos en índice (base OECD), con periodicidad trimestral.

4.1 Contexto histórico

El PIB real refleja la actividad económica ajustada por inflación. Su evolución muestra:

-crecimiento sostenido a largo plazo. -ciclos económicos marcados. -caídas abruptas en periodos de crisis.

Uno de los episodios más estudiados es la gran caída de Wall Street, que desencadenó recesiones profundas (como 1929 o 2008, según el periodo disponible en tus datos).

basefinal_clean <- basefinal %>%
  select(TIME_PERIOD, OBS_VALUE)

basefinal_clean$DATE <- as.yearqtr(basefinal_clean$TIME_PERIOD, format = "%Y-Q%q")

Serie <- xts(basefinal_clean$OBS_VALUE, order.by = basefinal_clean$DATE)

plot(Serie, main="PIB Real (B1GQ) de Estados Unidos")

La gráfica muestra la evolución del PIB Real (B1GQ) de Estados Unidos, medido como índice, entre el primer trimestre del año 2000 y el cuarto trimestre de 2024. La línea negra representa el comportamiento trimestral de la economía estadounidense ajustada por inflación.

en la grafica se observa:

Caída notable alrededor de 2008–2009: En el periodo 2008–2009 la gráfica presenta una caída clara del PIB real de Estados Unidos. Esta disminución coincide con la crisis financiera de Wall Street, ocasionada por la burbuja hipotecaria y la quiebra de Lehman Brothers. Esta crisis produjo una fuerte contracción económica que se reflejó directamente en el PIB, mostrando una reducción en la producción, consumo, el empleo y la inversión.

4.2 Estadísticas descriptivas

Los resultados generales de la serie son los siguientes:

autoplot(Serie) +
  ggtitle("PIB Real (Serie Original)") +
  xlab("Año") + ylab("Índice")

data <- basefinal %>% select(TIME_PERIOD, OBS_VALUE)


data$DATE <- as.yearqtr(data$TIME_PERIOD, format = "%Y-Q%q")


Serie <- xts(data$OBS_VALUE, order.by = data$DATE)


Serie_num <- as.numeric(Serie)


stats <- summary(Serie_num)
sd_value <- sd(Serie_num)


tabla_descriptivos <- data.frame(
  Estadístico = c("Mínimo", "1er Cuartil", "Mediana", "Media", "3er Cuartil", "Máximo", "Desviación Estándar"),
  Valor = c(
    stats["Min."],
    stats["1st Qu."],
    stats["Median"],
    mean(Serie_num),
    stats["3rd Qu."],
    stats["Max."],
    sd_value
  )
)


tabla_plot <- tableGrob(tabla_descriptivos)


rosa_header <- "#F4B6D4"
rosa_filas  <- "#FDECF4"


header_rows <- which(tabla_plot$layout$t == 1)
for(i in header_rows){
  tabla_plot$grobs[[i]] <- grobTree(
    rectGrob(gp = gpar(fill = rosa_header, col = NA)),
    tabla_plot$grobs[[i]]
  )
}


body_rows <- which(tabla_plot$layout$t > 1)
for(i in body_rows){
  tabla_plot$grobs[[i]] <- grobTree(
    rectGrob(gp = gpar(fill = rosa_filas, col = NA)),
    tabla_plot$grobs[[i]]
  )
}

grid.arrange(tabla_plot)

Estos valores muestran que el PIB real ha tenido una tendencia creciente, pero con episodios donde la economía se desacelera o incluso cae. En particular, la mediana (86.06) y el primer cuartil (80.31) se ubican en valores que corresponden aproximadamente a los años cercanos a la crisis financiera de 2008, cuando el PIB real cayó debido al colapso del mercado hipotecario y de instituciones financieras en Wall Street. La diferencia entre el mínimo (68.42) y el máximo (116.28) evidencia un aumento considerable a lo largo del tiempo; sin embargo, esta expansión no fue lineal. Los momentos de mayor inestabilidad económica (la crisis de 2008) provocan oscilaciones visibles en la serie, lo cual queda reflejado en la desviación estándar de 13.16, que indica variaciones significativas a lo largo del periodo. las estadísticas descriptivas no solo confirman el crecimiento económico de largo plazo, sino que también evidencian puntos críticos (la recesión de 2008)donde la actividad económica se contrajo como consecuencia directa de una caída en los mercados financieros de Wall Street.

4.3 (ACD) Función de Autocorrelación

ggAcf(Serie)

La función de autocorrelación (ACF) de la serie original del PIB real muestra valores elevados para los primeros rezagos y una disminución muy lenta conforme aumenta el lag. Este patrón indica claramente que la serie presenta fuerte persistencia temporal y una tendencia marcada. El hecho de que la ACF no caiga rápidamente hacia cero confirma que la serie no es estacionaria, lo cual es consistente con el comportamiento típico de variables macroeconómicas como el PIB, que crecen de manera sostenida en el tiempo. la crisis financiera de Wall Street en 2008 introdujo un choque negativo que no solo afectó el PIB de ese año, sino que también influyó en los trimestres siguientes, prolongando la recuperación. Esta persistencia en los efectos es coherente con la lenta caída de la ACF.

4.4 Prueba de raíz unitaria (ADF Test)

adf_original <- adf.test(Serie)


tabla_adf_original <- data.frame(
  Estadístico = c("Dickey-Fuller", "Lag order", "p-value", "Hipótesis alternativa"),
  Valor = c(
    round(adf_original$statistic, 4),
    adf_original$parameter,
    adf_original$p.value,
    adf_original$alternative
  )
)


tabla_plot <- tableGrob(tabla_adf_original)

rosa_header <- "#F4B6D4"   # rosa fuerte para encabezado
rosa_filas  <- "#FDECF4"   # rosa pastel suave para el cuerpo


header_rows <- which(tabla_plot$layout$t == 1)
for(i in header_rows){
  tabla_plot$grobs[[i]] <- grobTree(
    rectGrob(gp = gpar(fill = rosa_header, col = NA)),
    tabla_plot$grobs[[i]]
  )
}


body_rows <- which(tabla_plot$layout$t > 1)
for(i in body_rows){
  tabla_plot$grobs[[i]] <- grobTree(
    rectGrob(gp = gpar(fill = rosa_filas, col = NA)),
    tabla_plot$grobs[[i]]
  )
}


grid.arrange(tabla_plot)

Dado que el p-value es significativamente superior al nivel de significancia típico (0.05), no se rechaza la hipótesis nula, lo que confirma que el PIB real no es estacionario en niveles. Esto coincide con el comportamiento visual de la serie y con la ACF, que muestra correlaciones muy persistentes.

4.5 Serie diferenciada (1ra diferencia)

Serie_diff <- diff(Serie) %>% na.omit()

autoplot(Serie_diff) +
  ggtitle("Serie Diferenciada (1ra diferencia)")

Después de aplicar la primera diferencia a la serie del PIB real, la gráfica muestra que los valores comienzan a oscilar alrededor de cero, lo que indica que la tendencia presente en la serie original fue eliminada. Este comportamiento es característico de una serie más cercana a la estacionariedad, condición necesaria para ajustar un modelo ARIMA adecuado. En la serie diferenciada se observan dos choques importantes. El primero ocurre en el periodo 2008–2009, correspondiente a la crisis financiera de Wall Street, en la que el colapso del mercado hipotecario y la caída de grandes instituciones financieras generaron una contracción en la producción. Este impacto se manifiesta como un valor negativo significativo en la serie diferenciada. El segundo choque, mucho más pronunciado, aparece alrededor del año 2020, producto de la pandemia de COVID-19, que ocasionó la caída más abrupta del PIB en todo el periodo analizado. Aunque este evento no está relacionado con Wall Street, sirve para evidenciar la sensibilidad de la economía ante shocks externos. En general, tras la primera diferencia, la serie muestra un comportamiento estable y con fluctuaciones pequeñas en la mayor parte del periodo, lo que confirma que la transformación fue efectiva para lograr estacionariedad y proceder al ajuste del modelo ARIMA.

4.5.1 ACF de la serie diferenciada

ggAcf(Serie_diff)

La función de autocorrelación (ACF) aplicada a la serie diferenciada muestra que la mayoría de los coeficientes se encuentran muy cerca de cero y dentro de las bandas de significancia. Esto indica que, después de aplicar la primera diferencia, la serie ya no presenta tendencia ni autocorrelaciones persistentes, lo cual es un signo claro de estacionariedad. En contraste con la ACF de la serie original —que mostraba autocorrelaciones altas durante muchos rezagos—, la ACF de la serie diferenciada evidencia que el proceso ahora es mucho más estable. Este comportamiento confirma que una sola diferencia (d = 1) es suficiente para transformar el PIB real en un proceso estacionario, requisito fundamental para modelarlo mediante ARIMA. la ausencia de autocorrelaciones significativas después de diferenciar refleja que los choques pasados ( la caída del PIB asociada a la crisis financiera de Wall Street en 2008) no generan efectos prolongados cuando se analiza la variación del PIB entre trimestres, sino solo cambios puntuales en el periodo donde ocurren. Esto explica por qué, en la serie diferenciada, los impactos de 2008 y 2020 se observan como saltos aislados, pero sin persistencia temporal en los rezagos posteriores.

4.5.2 PACF de la serie diferenciada

ggPacf(Serie_diff)

La función de autocorrelación parcial (PACF) muestra uno o pocos picos significativos en los primeros rezagos y luego valores cercanos a cero, sin un patrón sistemático. Este comportamiento es característico de un proceso estacionario. El hecho de que la PACF presente significancia principalmente en los primeros rezagos sugiere que el componente autorregresivo del modelo es simple, como ARIMA(1,1,0) o ARIMA(1,1,1) la PACF revela que los choques del PIB (el impacto negativo de la crisis financiera de Wall Street en 2008) afectan principalmente el trimestre en el que ocurren y uno o dos periodos posteriores, pero no generan una dependencia prolongada. Esto se debe a que estamos observando variaciones trimestrales del PIB, donde cada shock se refleja como un cambio puntual en la serie diferenciada.

conclusión En conjunto, la ACF y la PACF de la serie diferenciada confirman que la serie es estacionaria y que los modelos ARIMA adecuados para este caso deben incluir un orden de diferenciación d=1d = 1d=1 y valores bajos de p y q.

5 Descripción del modelo ARIMA

5.1 Selección del modelo:

modelo1 <- Arima(Serie, order = c(0,1,0))
modelo2 <- Arima(Serie, order = c(1,1,0))
modelo3 <- Arima(Serie, order = c(0,1,1))
modelo4 <- Arima(Serie, order = c(1,1,1))
aic1 <- AIC(modelo1)
aic2 <- AIC(modelo2)
aic3 <- AIC(modelo3)
aic4 <- AIC(modelo4)

tabla_aic <- data.frame(
  Modelo = c("ARIMA(0,1,0)", "ARIMA(1,1,0)", "ARIMA(0,1,1)", "ARIMA(1,1,1)"),
  AIC = c(aic1, aic2, aic3, aic4)
)


tabla_plot <- tableGrob(tabla_aic)


rosa_header <- "#F4B6D4"   # rosa fuerte / encabezado
rosa_filas  <- "#FDECF4"   # rosa pastel / valores


header_rows <- which(tabla_plot$layout$t == 1)

for(i in header_rows){
  tabla_plot$grobs[[i]] <- grobTree(
    rectGrob(gp = gpar(fill = rosa_header, col = NA)),
    tabla_plot$grobs[[i]]
  )
}


body_rows <- which(tabla_plot$layout$t > 1)

for(i in body_rows){
  tabla_plot$grobs[[i]] <- grobTree(
    rectGrob(gp = gpar(fill = rosa_filas, col = NA)),
    tabla_plot$grobs[[i]]
  )
}


grid.arrange(tabla_plot)

Para identificar el modelo ARIMA adecuado, realizamos un proceso de comparación manual entre varios modelos del tipo (p,1,q), dado que la prueba ADF confirmó que la serie se vuelve estacionaria después de una sola diferenciación. De acuerdo con ello, se evaluaron los siguientes modelos candidatos: ARIMA(0,1,0)

  • ARIMA(1,1,0)

  • ARIMA(0,1,1)

  • ARIMA(1,1,1)

A cada uno se le calculó el criterio de información AIC, que permite comparar el equilibrio entre ajuste y complejidad del modelo. Los resultados mostraron que el modelo ARIMA(0,1,0) obtuvo el menor valor de AIC (AIC = 337.13), siendo por tanto el modelo más parsimonioso y el que mejor balance presenta entre simplicidad y capacidad predictiva. Aunque la función auto.arima() sugirió el modelo ARIMA(0,1,1) con drift, en este taller se requiere realizar una selección manual semejante a un “torneo de modelos”, comparando explícitamente los AIC bajo una misma lógica metodológica. Al aplicar este procedimiento, el ARIMA(0,1,0) resultó ser el modelo con el AIC más bajo entre todos los candidatos probados, incluido el modelo propuesto automáticamente. Siguiendo la metodología enseñada en clase, se selecciona entonces ARIMA(0,1,0) como modelo final para el análisis y la etapa de pronóstico.

5.2 residuos ARIMA

modelo_final <- Arima(Serie, order = c(0,1,0))

checkresiduals(modelo_final)

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(0,1,0)
## Q* = 5.6979, df = 8, p-value = 0.681
## 
## Model df: 0.   Total lags used: 8

En conjunto, la gráfica de los residuos muestra que el modelo ARIMA(0,1,0) produce residuos sin estructura, con media cercana a cero, varianza estable y sin patrones sistemáticos. Por lo tanto, se puede concluir que el modelo ajustado es apropiado y que cumple las condiciones necesarias para realizar pronósticos confiables del PIB real.

5.3 Pronostico

pronostico <- forecast(modelo_final, h = 8)

autoplot(pronostico) +
  ggtitle("Pronóstico del PIB Real de Estados Unidos (8 trimestres)") +
  xlab("Año") + ylab("Índice")

ultimo_trimestre <- end(Serie)    # Esto da 2024 Q4


trimestres_futuros <- ultimo_trimestre + seq(1, 8)/4
trimestres_futuros <- as.yearqtr(trimestres_futuros)


tabla_pronostico <- data.frame(
  Trimestre = as.character(trimestres_futuros),
  Pronostico = as.numeric(pronostico$mean),
  Lo_80 = pronostico$lower[,1],
  Hi_80 = pronostico$upper[,1],
  Lo_95 = pronostico$lower[,2],
  Hi_95 = pronostico$upper[,2]
)


tabla_plot <- tableGrob(tabla_pronostico)


rosa_header <- "#F4B6D4"   # rosa fuerte
rosa_filas  <- "#FDECF4"   # rosa pastel suave


header_rows <- which(tabla_plot$layout$t == 1)
for(i in header_rows){
  tabla_plot$grobs[[i]] <- grobTree(
    rectGrob(gp = gpar(fill = rosa_header, col = NA)),
    tabla_plot$grobs[[i]]
  )
}


body_rows <- which(tabla_plot$layout$t > 1)
for(i in body_rows){
  tabla_plot$grobs[[i]] <- grobTree(
    rectGrob(gp = gpar(fill = rosa_filas, col = NA)),
    tabla_plot$grobs[[i]]
  )
}


grid.arrange(tabla_plot)

El pronóstico generado a partir del modelo ARIMA(0,1,0) muestra La serie pronosticada se mantiene prácticamente constante alrededor de un valor cercano a 116.28, lo cual es coherente con el modelo seleccionado. El ARIMA(0,1,0), que corresponde a un “random walk”, asume que el mejor pronóstico para los periodos futuros es el último valor observado más un componente aleatorio. Por eso el pronóstico es plano, sin una trayectoria creciente o decreciente.

Esto indica que, según el modelo, no se anticipan cambios bruscos en el nivel del PIB real en los trimestres futuros.

6 Conclusiones

El análisis del PIB real de Estados Unidos entre los años 2000 y 2024 permitió identificar la evolución macroeconómica del país a lo largo de distintos ciclos económicos, incluyendo periodos de estabilidad, expansión y crisis profundas. A partir del estudio de la serie temporal, se observó una tendencia creciente en niveles, interrumpida por caídas significativas asociadas a eventos extraordinarios, especialmente la crisis financiera global de 2008 y la contracción histórica causada por la pandemia de COVID-19 en 2020.

Las pruebas estadísticas aplicadas confirmaron que la serie no es estacionaria en niveles, por lo que se requirió una primera diferencia para estabilizar. Tanto la ACF como la PACF de la serie diferenciada mostraron que el proceso se comporta de forma compatible con modelos ARIMA simples, lo cual fue corroborado mediante la comparación de varios modelos candidatos. Bajo el criterio AIC, el modelo ARIMA(0,1,0) resultó ser el más parsimonioso y con mejor equilibrio entre ajuste y simplicidad.

El análisis de los residuos demostró que el modelo seleccionado cumple con las condiciones necesarias para ser considerado adecuado: los residuos se comportan como ruido blanco, con media cercana a cero, varianza estable y ausencia de autocorrelación significativa. A partir de este modelo, el pronóstico del PIB real muestra una trayectoria estable para los próximos trimestres, con un valor central prácticamente constante y un ensanchamiento gradual de los intervalos de confianza, lo cual refleja la incertidumbre propia de las predicciones de mediano plazo.

En conjunto, los resultados confirman que los modelos ARIMA constituyen una herramienta útil para describir y proyectar el comportamiento del PIB real. Aunque no incorporan factores externos ni información económica adicional, permiten capturar la dinámica histórica de la serie y generar pronósticos coherentes que pueden servir de base para análisis económicos, académicos o de planeación. El estudio evidencia la importancia de la correcta identificación, evaluación y validación del modelo para asegurar predicciones confiables en el análisis de series temporales macroeconómicas.