A continuación se hara la presentación de nuestro analisis estadistico de exportaciones

1 Introducción

A comienzos de 2020, cuando la pandemia empezó a cambiar la forma en que vivíamos y trabajábamos, Colombia también sintió ese impacto en su economía. Uno de los sectores donde más se notó fue en las exportaciones, que son básicamente todo lo que el país vende al exterior. Desde entonces, las cosas no volvieron a ser iguales, y por eso quisimos mirar con calma qué pasó entre 2020 y 2024.

Para entender mejor esos cambios, usamos los datos abiertos del DANE y escogimos los meses de enero y julio de cada año. La idea es comparar siempre el mismo punto del calendario y ver qué tanto varió la actividad exportadora con el tiempo.

A lo largo de este trabajo buscamos responder preguntas que seguramente muchos se han hecho, pero que pocas veces se revisan con datos reales:

  • ¿Es verdad que el café y el petróleo siguen siendo lo que más exportamos?

  • ¿La pandemia afectó mucho las exportaciones o el país logró mantenerse?

  • ¿Qué departamentos tienen un papel más fuerte en este proceso?

  • ¿Y por qué son tan importantes las exportaciones para Colombia?

Nuestro objetivo es analizar la información de una forma clara y sencilla, usando gráficos, comparaciones y algunas observaciones que nos ayuden a entender lo que realmente pasó. No queremos que sea un análisis complicado, sino una forma práctica de ver cómo han cambiado las exportaciones en estos últimos años.

Al final, este recorrido nos permitirá entender mejor cómo se movió la economía colombiana en tiempos tan difíciles y cómo fue recuperándose poco a poco.

Gráfico exportaciones

2 Librerias necesarias

Se usaron las siguientes librerias para desarrollar nuestro análisis y facilitar el desarrollo del mismo.

Librerías Uso breve
tidyverse Conjunto de paquetes para manejo, transformación, limpieza y visualización de datos.
janitor Limpieza de nombres de columnas y estructuras tabulares.
stringr Manipulación y procesamiento de cadenas de texto.
forcats Manejo y ordenamiento de factores (variables categóricas).
moments Cálculo de estadísticos como asimetría (skewness) y curtosis.
dplyr Manipulación eficiente de datos: filtrar, agrupar, resumir, ordenar, unir.
ggplot2 Creación de gráficos estáticos basados en la gramática de los gráficos.
scales Formateo de números (millones, porcentajes, comas, unidades) y escalas en gráficos.
plotly Visualizaciones interactivas como barras dinámicas, líneas, mapas y tooltips.
sf Manejo de datos espaciales (shapefiles, geometrías y mapas).
rnaturalearth Descarga de mapas geográficos del mundo en diferentes resoluciones.
rnaturalearthdata Conjuntos de datos geográficos complementarios (países, regiones, límites).

3 Preparación de Datos

3.1 Archivos CSV’s originales

Se hizo la exploración de archivos CSV’s donde los archivos no presentaban problemas de valores faltantes, sin embargo la disposición de la información en los archivos no era identica para todos, ya que algunos tenian toda la informacion en una sola columna usando separadores, y otros en diferentes columnas dentro del CSV.Por esto, se realizaron los siguientes procedimientos:

  • Detectar delimitador en los archivos CSV’s
  • Leer las columnas como texto
  • Estandarizar los nombres de las columnas a minusculas
  • Normalizar columnas claves como: FOBDOL, año, etc.
  • Conversión de los tipos de datos

3.2 Carga y limpieza de datos

3.2.1 Importar librerias

  library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.5.2
## Warning: package 'ggplot2' was built under R version 4.5.2
## Warning: package 'tidyr' was built under R version 4.5.2
## Warning: package 'readr' was built under R version 4.5.2
## Warning: package 'purrr' was built under R version 4.5.2
## Warning: package 'dplyr' was built under R version 4.5.2
## Warning: package 'stringr' was built under R version 4.5.2
## Warning: package 'lubridate' was built under R version 4.5.2
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.6.0
## ✔ ggplot2   4.0.0     ✔ tibble    3.3.0
## ✔ lubridate 1.9.4     ✔ tidyr     1.3.1
## ✔ purrr     1.2.0     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
  library(janitor)
## Warning: package 'janitor' was built under R version 4.5.2
## 
## Adjuntando el paquete: 'janitor'
## 
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
  library(stringr)
  library(forcats)
  library(moments)
  library(plotly)
## Warning: package 'plotly' was built under R version 4.5.2
## 
## Adjuntando el paquete: 'plotly'
## 
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## 
## The following object is masked from 'package:stats':
## 
##     filter
## 
## The following object is masked from 'package:graphics':
## 
##     layout
  library(scales)
## Warning: package 'scales' was built under R version 4.5.2
## 
## Adjuntando el paquete: 'scales'
## 
## The following object is masked from 'package:purrr':
## 
##     discard
## 
## The following object is masked from 'package:readr':
## 
##     col_factor
  library(dplyr)
  library(sf)
## Warning: package 'sf' was built under R version 4.5.2
## Linking to GEOS 3.13.1, GDAL 3.11.4, PROJ 9.7.0; sf_use_s2() is TRUE
  library(rnaturalearth)
## Warning: package 'rnaturalearth' was built under R version 4.5.2
  library(rnaturalearthdata)
## Warning: package 'rnaturalearthdata' was built under R version 4.5.2
## 
## Adjuntando el paquete: 'rnaturalearthdata'
## 
## The following object is masked from 'package:rnaturalearth':
## 
##     countries110

3.2.2 Definir ruta de los archivos CSV’s (OJO CAMBIAR)

  ruta_base <- "C:/Users/andre/Downloads/Proyectov2/Proyectov2/proyecto"
   # ⚠️ Ajusta esta ruta

3.2.3 Cargar datos

  cargar_datos <- function(archivo) {
  cat("📄 Cargando:", basename(archivo), "\n")
  
  # Detectar delimitador
  primera_linea <- readLines(archivo, n = 1)
  delim_detectado <- if (str_detect(primera_linea, ";")) ";" else ","
  
  # Leer todo como texto
  df <- read_delim(
    archivo,
    delim = delim_detectado,
    show_col_types = FALSE,
    col_types = cols(.default = col_character()),
    locale = locale(decimal_mark = ",")
  )
  
  # Limpieza de nombres
  names(df) <- names(df) |>
    tolower() |>
    str_replace_all("\\s+", "") |>
    str_replace_all("_", "")
  
  # Detectar columnas FOB
  col_fobdol <- grep("fobdol$", names(df), value = TRUE)   # fobdol exacto
  col_fob_pesos <- grep("fobpes$", names(df), value = TRUE)
  
  # Si solo existe FOBPES y no FOBDOL → ERROR REAL DE LA DIAN
  if (length(col_fobdol) == 0 && length(col_fob_pesos) > 0) {
    warning(paste("⚠️ El archivo", basename(archivo),
                  "NO contiene columna FOBDOL. Se marca fobdol = NA."))
    df$fobdol <- NA
  }
  
  if (length(col_fobdol) == 1) {
    names(df)[names(df) == col_fobdol] <- "fobdol"
  }
  
  # Extraer año y mes 
  posible_anio <- grep("anio|ano|año|year", names(df), value = TRUE)
  if (length(posible_anio) > 0) {
    names(df)[names(df) == posible_anio[1]] <- "anio"
  } else {
    df$anio <- str_extract(basename(archivo), "20\\d{2}")
  }
  
  posible_mes <- grep("mes|month", names(df), value = TRUE)
  if (length(posible_mes) > 0) {
    names(df)[names(df) == posible_mes[1]] <- "mes"
  } else {
    mes_extraido <- str_extract(
      tolower(basename(archivo)),
      "(enero|febrero|marzo|abril|mayo|junio|julio|agosto|septiembre|octubre|noviembre|diciembre)"
    )
    df$mes <- str_to_title(mes_extraido)
  }
  
  #  Conversión 
  df <- df %>%
    mutate(
      fobdol = suppressWarnings(as.numeric(str_replace(fobdol, ",", "."))),
      anio = as.integer(anio),
      mes = str_to_title(as.character(mes))
    )
  
  return(df)
}

3.2.4 Unión de archivos

  archivos <- list.files(ruta_base, pattern = "\\.csv$", full.names = TRUE)

  datos_todos <- purrr::map_dfr(archivos, ~{
    tryCatch(cargar_datos(.x), error = function(e) {
      message(paste("❌ Error en archivo:", .x, "→", e$message))
      NULL
    })
  })
## 📄 Cargando: Enero2020.csv 
## 📄 Cargando: Enero2021.csv 
## 📄 Cargando: Enero2022.csv 
## 📄 Cargando: Enero2023.csv 
## 📄 Cargando: Enero2024.csv 
## 📄 Cargando: Julio2020.csv 
## 📄 Cargando: Julio2021.csv 
## 📄 Cargando: Julio2022.csv 
## 📄 Cargando: Julio2023.csv 
## 📄 Cargando: Julio2024.csv
  cat("✅ Archivos combinados correctamente:", nrow(datos_todos), "registros.\n")
## ✅ Archivos combinados correctamente: 369233 registros.

3.2.5 Limpieza final y detección de columnas

  datos_todos <- datos_todos %>%
  clean_names() %>%
  mutate(across(where(is.character), str_trim))
  
  datos_todos <- datos_todos %>% filter(!is.na(fobdol))

3.3 Visualización del data frame

Realizamos una pequeña visualización del data frame resultante luego de agrupar todos los archivos csv.

  #datos_todos

4 Análisis de Datos

Antes de iniciar el análisis sustantivo, es importante mencionar un punto crítico: Advertencia sobre inconsistencias en los valores FOB (fobdol) Los datos correspondientes a:

● Enero 2024

● Julio 2024

● Julio 2020

presentan valores significativamente menores a los años previos, con medias cercanas a $100.000 USD por registro, mientras que los años 2020–2022 tienen medias de varios millones. Esto puede indicar:

● Errores de formato,

● Conversiones numéricas incompletas,

● Cambio de unidad en esos años,

● Problemas en el archivo original de DIAN.

No fue posible corregir completamente este error durante el procesamiento, aun implementando varias rutinas de limpieza, por lo que estos meses deben interpretarse con cautela. Aun así, se realiza el análisis con base en lo disponible

4.1 Evolución del valor total exportado (2020–2024)

  resumen_fob <- datos_todos %>%
  mutate(
    mes_num = match(mes, c(
      "Enero","Febrero","Marzo","Abril","Mayo","Junio",
      "Julio","Agosto","Septiembre","Octubre","Noviembre","Diciembre"
    ))
  ) %>%
  group_by(anio, mes, mes_num) %>%
  summarise(
    media = mean(fobdol, na.rm = TRUE),
    mediana = median(fobdol, na.rm = TRUE),
    moda = as.numeric(names(sort(table(fobdol), decreasing = TRUE))[1]),
    varianza = var(fobdol, na.rm = TRUE),
    desviacion_estandar = sd(fobdol, na.rm = TRUE),
    curtosis = kurtosis(fobdol, na.rm = TRUE),
    sesgo = skewness(fobdol, na.rm = TRUE),
    total_fob = sum(fobdol, na.rm = TRUE),
    n = n(),
    .groups = "drop"
  ) %>%
  mutate(
    orden = anio * 100 + mes_num,
    etiqueta = paste(anio, mes)
  ) %>%
  arrange(orden)

ggplot(resumen_fob, aes(x = factor(etiqueta, levels = etiqueta), y = total_fob, group = 1)) +
  geom_line(color = "steelblue", linewidth = 1) +
  geom_point(color = "darkred", size = 2) +
  scale_y_log10(
    breaks = c(1e6, 1e7, 1e8, 1e9, 5e9),
    labels = label_number(scale_cut = cut_short_scale())
  ) +
  labs(
    title = "Evolución del valor total exportado (2020–2024)",
    x = "Año-Mes",
    y = "Valor FOB total (USD, escala logarítmica)"
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Años 2020–2022: exportaciones excepcionalmente altas

Durante estos años se registran totales FOB muy elevados. Por ejemplo, en Enero de 2022 se alcanzan más de 300 mil millones de dólares, y en julio de ese mismo año la cifra supera los 490 mil millones. Esto coincide con el hecho de que en ese periodo las exportaciones de petróleo y carbón fueron especialmente altas, impulsadas por precios internacionales favorables.

Años 2023–2024: disminución abrupta del FOB

En contraste, 2023 y especialmente 2024 muestran valores bastante más bajos, en el rango de los 3 a 4 mil millones por mes. Aunque en parte esto puede ser atribuible a las anomalías en los datos, también coincide con una disminución general de la demanda internacional y menores precios de productos clave.

Patrón estacional

Algo que se mantiene de forma estable es que Julio tiende a tener más registros de exportación que Enero, lo cual puede estar relacionado con ciclos productivos, contratos anuales y estacionalidad propia de los sectores minero-energéticos y agrícolas. Incluso en los años donde hay inconsistencias, este comportamiento sigue apareciendo.

4.2 Distribución de valores FOB (2020–2024)

  ggplot(datos_todos, aes(x = fobdol, fill = factor(anio))) +
  geom_density(alpha = 0.4) +
  scale_x_log10() +
  facet_wrap(~mes) +
  labs(title = "Distribución de valores FOB (2020–2024)",
       x = "Valor FOB (log10 USD)", y = "Densidad") +
  theme_minimal()

Al revisar la distribución de los valores FOB, se ve claramente que las exportaciones colombianas siguen patrones bien marcados. La gráfica de densidad muestra que la mayoría de los registros se concentran en valores bajos y medios, con una cola larga hacia la derecha donde están los envíos más grandes.

Lo más interesante que se observa:

Patrones mensuales consistentes: A pesar de las variaciones entre años, cada mes mantiene una forma similar en su distribución. Julio casi siempre muestra una base más amplia, confirmando que es el mes con mayor actividad exportadora

Diferencias entre años: El 2022 muestra una distribución más “aplastada”, lo que coincide con ese año de exportaciones excepcionales donde hubo más variedad en los valores. En cambio, 2023 y 2024 tienen distribuciones más concentradas.

4.3 Top 10 Departamentos Exportadores (2020/2024)

  departamento_nombres <- c(
  "05" = "Antioquia", "08" = "Atlántico", "11" = "Bogotá D.C.",
  "13" = "Bolívar", "15" = "Boyacá", "17" = "Caldas", "18" = "Caquetá",
  "19" = "Cauca", "20" = "Cesar", "23" = "Córdoba", "25" = "Cundinamarca",
  "27" = "Chocó", "41" = "Huila", "44" = "La Guajira", "47" = "Magdalena",
  "50" = "Meta", "52" = "Nariño", "54" = "Norte de Santander",
  "63" = "Quindío", "66" = "Risaralda", "68" = "Santander",
  "70" = "Sucre", "73" = "Tolima", "76" = "Valle del Cauca",
  "81" = "Arauca", "85" = "Casanare", "86" = "Putumayo",
  "88" = "San Andrés", "91" = "Amazonas", "94" = "Guainía",
  "95" = "Guaviare", "97" = "Vaupés", "99" = "Vichada"
)

datos_todos <- datos_todos %>%
  mutate(
    codigo_dpto = str_pad(as.character(dpto2), 2, pad = "0"),
    nombre_dpto = departamento_nombres[codigo_dpto] %||% "No Asignado"
  )

# Top 10 por año: anual, todos los meses combinados
top_departamentos_anual <- datos_todos %>%
  filter(nombre_dpto != "No Asignado") %>%
  group_by(anio, nombre_dpto) %>%
  summarise(valor_total = sum(fobdol, na.rm = TRUE), .groups = "drop") %>%
  arrange(desc(valor_total)) %>%
  group_by(anio) %>%
  slice_head(n = 10) %>%
  ungroup() %>%
  mutate(nombre_dpto = fct_reorder(nombre_dpto, valor_total))

plot_ly(
  top_departamentos_anual,
  x = ~valor_total,
  y = ~nombre_dpto,
  color = ~factor(anio),
  type = "bar",
  orientation = "h",
  text = ~paste(
    "Departamento:", nombre_dpto,
    "<br>Año:", anio,
    "<br>FOB USD:", comma(valor_total)
  ),
  hoverinfo = "text"
) %>%
  layout(
    title = "Top 10 Departamentos Exportadores por Año (2020–2024)",
    xaxis = list(title = "Valor FOB total (USD)"),
    yaxis = list(title = "Departamento"),
    barmode = "group"
  )

Al revisar el mapa de exportaciones, se ve claramente que unos pocos departamentos dominan las exportaciones del país. Los que más destacan son:

Antioquia

Cesar

La Guajira

Bogotá D.C.

Bolívar

Es interesante ver cómo los departamentos costeros como La Guajira y Bolívar tienen un peso enorme, seguramente porque son la salida natural de productos mineros y commodities a gran escala por los puertos. Mientras tanto, Antioquia y Bogotá reflejan su fuerza como centros industriales y manufactureros del país.

En la gráfica se nota que estos departamentos se mantienen consistentes en el top durante todo el periodo 2020-2024, lo que muestra su importancia estratégica para la economía exportadora de Colombia.

4.4 Mapa de Ganancias por Departamento

  #Carga el shapefile de departamentos
  ruta_mapa <- "C:/Users/andre/Downloads/Proyectov2/Proyectov2/proyecto/MGN2022_DPTO_POLITICO"
  departamentos_sf <- st_read(ruta_mapa)
## Reading layer `MGN_DPTO_POLITICO' from data source 
##   `C:\Users\andre\Downloads\Proyectov2\Proyectov2\Proyecto\MGN2022_DPTO_POLITICO' 
##   using driver `ESRI Shapefile'
## Simple feature collection with 33 features and 9 fields
## Geometry type: MULTIPOLYGON
## Dimension:     XY
## Bounding box:  xmin: -81.73562 ymin: -4.229406 xmax: -66.84722 ymax: 13.39473
## Geodetic CRS:  MAGNA-SIRGAS
  print(names(departamentos_sf))
##  [1] "DPTO_CCDGO" "DPTO_CNMBR" "DPTO_ANO_C" "DPTO_ACT_A" "DPTO_NAREA"
##  [6] "DPTO_CSMBL" "DPTO_VGNC"  "Shape_Leng" "Shape_Area" "geometry"
  df_map <- datos_todos %>%
    group_by(codigo_dpto) %>%
    summarise(valor_fob = sum(fobdol, na.rm = TRUE), .groups = "drop")
  
  mapa_exportaciones <- departamentos_sf %>%
    left_join(df_map, by = c("DPTO_CCDGO" = "codigo_dpto"))
  
  ggplot(mapa_exportaciones) +
    geom_sf(aes(fill = valor_fob)) +
    scale_fill_viridis_c(
      option = "magma",
      labels = label_number(scale = 1e-9, suffix = " B", big.mark = ",")
    ) +
    labs(
      title = "Mapa de Ganancias por Departamento",
      fill = "Valor FOB"
    ) +
    theme_minimal()

El mapa de ganancias por departamento nos muestra de forma visual qué zonas del país están generando más valor con sus exportaciones, confirmando y ampliando lo que veíamos en el top 10. Se ve claramente una concentración geográfica bien marcada:

Los departamentos que más aportan son principalmente los costeros y los grandes centros económicos que ya identificamos: Antioquia, Cesar, La Guajira, Bogotá y Bolívar se pintan con colores más intensos en el mapa, lo que refuerza su liderazgo exportador.

4.5 Top 10 Transporte de Salida (2020–2024)

  datos_todos <- datos_todos %>%
  mutate(tipo_transporte = case_when(
    via == "1" ~ "MARITIMO",
    via == "2" ~ "FERREO",
    via == "3" ~ "TERRESTRE",
    via == "4" ~ "AEREO",
    via == "5" ~ "CORREO",
    via == "6" ~ "MULTIMODAL",
    via == "7" ~ "INSTALACIONES FIJAS",
    via == "8" ~ "VIAS NAVEGABLES INTERIORES",
    via == "9" ~ "OTRO MODO DE TRANSPORTE",
    TRUE ~ "DESCONOCIDO"
  ))

top_vias_pie <- datos_todos %>%
  group_by(tipo_transporte) %>%
  summarise(registros = n(), .groups = "drop") %>%
  arrange(desc(registros))


plot_ly(
  top_vias_pie,
  labels = ~tipo_transporte,
  values = ~registros,
  type = "pie",
  hole = 0.5,
  textinfo = "label+percent",
  hoverinfo = "label+value+percent",
  marker = list(line = list(color = "#FFFFFF", width = 1))
) %>%
  layout(
    title = "Distribución de Vías de Salida Exportadora",
    showlegend = TRUE
  )

Al analizar las vías de transporte, los resultados son muy claros. La mayor parte de las exportaciones se realizan por las vías:

1 — Marítima, que es la dominante.

4 — Aérea, que ocupa el segundo lugar.

La vía marítima aparece como la más relevante por razones obvias: productos como petróleo, carbón, café y otros bienes de gran volumen requieren transporte en grandes buques. La vía aérea, por su parte, está asociada con mercancías de mayor valor agregado o productos perecederos que deben movilizarse rápidamente.

Notamos que la via marítima es la de mas impacto económico en el pais, sin dejar de lado la vía aérea que mantienen una diferencia minima.

4.6 Top 10 Ciudades Mas Importantes de Salida(2020–2024)

  treemap_puertos <- datos_todos %>%
  mutate(puerto_nombre = case_when(
    codsal == "BOG" ~ "Bogotá D.C.",
    codsal == "CTG" ~ "Cartagena",
    codsal == "BAQ" ~ "Barranquilla",
    codsal == "SMR" ~ "Santa Marta",
    codsal == "MDE" ~ "Medellín",
    codsal == "BUN" ~ "Buenaventura",
    codsal == "CUC" ~ "Cúcuta",
    codsal == "TRB" ~ "Turbo",
    codsal == "IPI" ~ "Ipiales",
    codsal == "MAI" ~ "Maicao",
    codsal == "CLO" ~ "Cali",
    TRUE ~ codsal
  )) %>%
  group_by(puerto_nombre) %>%
  summarise(registros = n(), .groups = "drop") %>%
  arrange(desc(registros)) %>%
  slice_head(n = 20) 

plot_ly(
  treemap_puertos,
  labels = ~puerto_nombre,
  parents = "",           
  values = ~registros,
  type = "treemap",
  textinfo = "label+value+percent entry"
) %>%
  layout(
    title = "Ciudades Mas Importantes de Salida(2020–2024)",
    margin = list(t = 50, l = 10, r = 10, b = 10)
  )

La gráfica de los principales puntos de salida del país confirma la importancia de ciertos puntos logísticos. Sorprendentemente, Bogotá es el principal punto de exportación, incluso por encima de los puertos marítimos. Esto ocurre porque Bogotá concentra una gran cantidad de exportaciones de productos enviados por vía aérea.

Luego aparecen ciudades como:

Cartagena

Buenaventura

Ipiales

Medellín

Cada una representa sectores específicos: Cartagena y Buenaventura dominan en productos que salen vía marítima; Ipiales en operaciones fronterizas; y Medellín en manufacturas y productos de valor agregado.

4.7 Top 10 Países Importadores por año

pais_diccionario <- c(
  "USA" = "Estados Unidos",
  "ESP" = "España",
  "ECU" = "Ecuador",
  "PER" = "Perú",
  "MEX" = "México",
  "PAN" = "Panamá",
  "CRI" = "Costa Rica",
  "GTM" = "Guatemala",
  "CHL" = "Chile",
  "VEN" = "Venezuela",
  "CAN" = "Canadá",
  "DOM" = "República Dominicana",
  "NLD" = "Países Bajos",
  "CUW" = "Curazao",
  "ABW" = "Aruba",
  "IND" = "India",
  "CHN" = "China",
  "TUR" = "Turquía",
  "BRA" = "Brasil",
  "POL" = "Polonia",
  "PRI" = "Puerto Rico",
  "ITA" = "Italia",
  "DEU" = "Alemania",
  "ISR" = "Israel",
  "MYS" = "Malasia",
  "LCA" = "Santa Lucía",
  "SLV" = "El Salvador"
)

datos_todos <- datos_todos %>%
  mutate(
    pais_nombre = pais_diccionario[codpai4],
    pais_nombre = ifelse(is.na(pais_nombre), codpai4, pais_nombre)
  )

top_paises_fob_global <- datos_todos %>%
  filter(!is.na(pais_nombre), !is.na(fobdol)) %>%
  group_by(pais_nombre) %>%
  summarise(total_fob = sum(fobdol, na.rm = TRUE), .groups = "drop") %>%
  arrange(desc(total_fob)) %>%
  slice_head(n = 15) %>%
  mutate(pais_nombre = fct_reorder(pais_nombre, total_fob))

plot_ly(
  top_paises_fob_global,
  x = ~total_fob,
  y = ~pais_nombre,
  type = 'bar',
  orientation = 'h',
  text = ~paste(
    "<b>FOB total USD:</b>", scales::comma(total_fob),
    "<br><b>País:</b>", pais_nombre
  ),
  hoverinfo = "text",
  marker = list(color = "#34495E")
) %>%
  layout(
    title = "Top 15 Países Importadores por Valor FOB (Total Global 2020–2024)",
    xaxis = list(title = "Valor FOB total (USD)"),
    yaxis = list(title = "Nombre del País"),
    margin = list(l = 120)
  )

Las gráficas que muestran los países destino revelan un patrón bastante consistente entre años. Estados Unidos sigue siendo el principal socio comercial, lo cual tiene sentido con nuestra historia sobre exportaciones del país.

Además, otros países cercanos como Ecuador, Perú y Panamá aparecen en los primeros lugares, junto con México y Costa Rica, que también mantienen un flujo estable.

Algo que llama la atención es que en 2023 y 2024 las exportaciones hacia Estados Unidos bajan de manera significativa, aunque aun así el país sigue liderando como destino. Esto puede estar relacionado con la coyuntura económica de esos años, y la caída de ciertos sectores exportadores.

4.8 Distribución de Paises Importadores

  world_sf <- rnaturalearth::ne_countries(scale = "medium", returnclass = "sf")


df_world <- datos_todos %>%
  group_by(codpai4) %>%
  summarise(valor_fob = sum(fobdol, na.rm = TRUE), .groups = "drop")


mapa_exportaciones_world <- world_sf %>%
  left_join(df_world, by = c("iso_a3" = "codpai4"))

ggplot(mapa_exportaciones_world) +
  geom_sf(aes(fill = valor_fob)) +
  scale_fill_viridis_c(
    option = "magma",
    labels = label_number(scale = 1e-9, suffix = " B", big.mark = ","),
    na.value = "grey90"
  ) +
  labs(
    title = "Distribución de Paises Importadores",
    fill = "Valor FOB"
  ) +
  theme_minimal()

La distribución de países destino nos muestra cómo se reparte el comercio exterior colombiano a nivel global, confirmando y ampliando lo que veíamos en el top 10. Se observa un patrón de concentración muy claro:

Estados Unidos domina abrumadoramente el panorama, apareciendo como el principal socio comercial en todos los años analizados, además,los países latinoamericanos son clave en la distribución, con naciones como Ecuador, Perú, Panamá, México y Costa Rica manteniendo una presencia constante

4.9 Top 10 Productos Más Exportados (Valor FOB USD)

  top_productos <- datos_todos %>%
  filter(!is.na(posar), !is.na(fobdol)) %>%
  group_by(posar) %>%
  summarise(total_fob = sum(fobdol, na.rm = TRUE), .groups = "drop") %>%
  arrange(desc(total_fob)) %>%
  slice_head(n = 10) %>%
  mutate(
    nombre_producto = case_when(
      posar == "2709000000" ~ "Petróleo o derivados",
      posar == "2701120010" ~ "Petróleo o derivados",
      posar == "901119000"  ~ "Café y derivados",
      posar == "7108120000" ~ "Metales preciosos",
      posar == "803901100"  ~ "Frutas (bananos)",
      posar == "2710192100" ~ "Combustibles",
      posar == "7202600000" ~ "Ferroníquel",
      posar == "2704001000" ~ "Carbón",
      posar == "603199090" ~ "Vegetales y productos Procesados",
      posar == "2710192200" ~ "Aceites combustibles",
      TRUE ~ posar
    ),
    nombre_producto = fct_reorder(nombre_producto, total_fob)
  )

plot_ly(
  top_productos,
  x = ~total_fob,
  y = ~nombre_producto,
  type = "bar",
  orientation = "h",
  text = ~paste(
    "<b>Producto:</b>", nombre_producto,
    "<br><b>Valor FOB:</b> $", comma(total_fob)
  ),
  hoverinfo = "text",
  marker = list(color = "#34495E")
) %>%
  layout(
    title = list(
      text = "Top 10 Productos Más Exportados por Valor FOB (USD)",
      x = 0.05
    ),
    xaxis = list(title = "Valor FOB (USD)"),
    yaxis = list(title = "Producto"),
    margin = list(l = 150)
  )

Esta gráfica permite observar con mucha claridad cómo se distribuyen los productos más relevantes dentro de las exportaciones colombianas. El grupo más importante sigue siendo el petróleo y sus derivados, que concentra la mayor parte del valor FOB y marca una diferencia considerable frente al resto de productos.

En segundo lugar aparecen el café y sus derivados, que continúan siendo un pilar tradicional de la oferta exportadora del país. Después se ubican los metales preciosos, especialmente el oro, que mantiene una participación significativa y estable dentro del total exportado.

A estos se suman productos como el carbón, que también representa una parte importante del sector minero–energético, y las frutas, en particular los bananos, que aportan desde el sector agrícola y complementan la estructura exportadora.

4.10 Top 10 Países Importadores de Petroleo

  mapa_paises <- c(
  "USA" = "Estados Unidos", "CHN" = "China", "PAN" = "Panamá",
  "IND" = "India", "ABW" = "Aruba", "CIV" = "Costa de Marfil",
  "BRN" = "Baréin", "LCA" = "Santa Lucía", "CAN" = "Canadá",
  "BHS" = "Bahamas", "ESP" = "España"
)

datos_todos$pais_nombre <- ifelse(
  is.na(mapa_paises[datos_todos$codpai4]),
  datos_todos$codpai4,
  mapa_paises[datos_todos$codpai4]
)

plot_ly(
  datos_todos %>%
    filter(posar == "2709000000", !is.na(fobdol), !is.na(pais_nombre)) %>%
    group_by(pais_nombre) %>%
    summarise(total_fob = sum(fobdol, na.rm = TRUE), .groups = "drop") %>%
    arrange(desc(total_fob)) %>%
    slice_head(n = 10) %>%
    mutate(pais_nombre = fct_reorder(pais_nombre, total_fob)),
  x = ~total_fob,
  y = ~pais_nombre,
  type = "bar",
  orientation = "h",
  text = ~paste("País:", pais_nombre, "<br>FOB USD:", comma(total_fob))
) %>%
  layout(
    title = "Top 10 Países Importadores de Petroleo",
    xaxis = list(title = "Valor FOB (USD)"),
    yaxis = list(title = "País"),
    margin = list(l = 120)
  )

Al analizar quiénes son los principales compradores de petróleo colombiano, los resultados concuerdan con lo que se sabe del mercado global. Los principales importadores fueron:

  • Estados Unidos

  • Panamá

  • India

  • China

Estas posiciones coinciden con la estructura internacional del transporte y refinación: Estados Unidos es históricamente el mayor comprador, Panamá es un punto de reexportación, e India y China tienen gran demanda para refinación.

Esta gráfica ayuda a contextualizar la importancia del petróleo colombiano en cadenas globales de producción.

5 Analisis General

5.1 Resumen del Problema

Entre 2020 y 2024, las exportaciones de Colombia enfrentaron uno de los periodos más inestables de los últimos años. El impacto de la pandemia modificó las dinámicas del comercio exterior, alteró los flujos logísticos y generó una caída significativa en los sectores más dependientes del mercado internacional. En este contexto surgen varias preguntas clave que orientan nuestro análisis:

  • ¿Es verdad que el café y el petróleo siguen siendo lo que más exportamos?

  • ¿La pandemia afectó mucho las exportaciones o el país logró mantenerse?

  • ¿Qué departamentos tienen un papel más fuerte en este proceso?

  • ¿Por qué son tan importantes las exportaciones para Colombia?

Responder estas preguntas permite comprender cómo cambió la estructura exportadora del país, qué sectores mostraron resiliencia y qué territorios tuvieron un papel destacado en la recuperación económica posterior a la crisis sanitaria.

5.2 Metodología y Datos

Para este análisis se utilizaron los datos abiertos de exportaciones del DANE. Con el fin de mantener un punto de comparación uniforme, se eligieron únicamente los meses de enero y julio de cada año entre 2020 y 2024. Esta decisión permite observar variaciones semestrales y reducir el impacto de fluctuaciones puntuales.

Los principales pasos metodológicos fueron:

  1. Selección y depuración de los datos de exportaciones por producto, departamento y valor FOB.

  2. Clasificación de productos para identificar categorías clave como petróleo, café, flores, banano, manufacturas, petroquímicos y agroindustria.

  3. Comparación temporal entre los mismos meses de cada año para observar tendencias y rupturas en la actividad exportadora.

  4. Agrupación por departamento para identificar las regiones más relevantes y los cambios en su participación.

  5. Análisis de variación en el contexto de la pandemia, la recuperación y el comportamiento de precios internacionales.

Este enfoque permite observar, con claridad, la evolución de las exportaciones sin perder de vista los efectos extraordinarios generados por la coyuntura global.

5.3 Resultados Principales

¿Es verdad que el café y el petróleo siguen siendo lo que más exportamos?

Las exportaciones colombianas siguen dominadas por el petróleo y sus derivados, seguido por el café, que continúan siendo los principales productos tanto en participación como en valor FOB. Aunque han surgido sectores no tradicionales con cierto crecimiento, la economía mantiene una fuerte dependencia de bienes primarios con bajo nivel de transformación. Esto aporta estabilidad en algunos periodos, pero también expone al país a riesgos derivados de las fluctuaciones internacionales y limita la diversificación productiva.

¿La pandemia afectó mucho las exportaciones o el país logró mantenerse?

En 2020 las exportaciones colombianas cayeron con fuerza debido a la menor demanda global, la caída del precio del petróleo y las restricciones logísticas. No obstante, sectores como el agrícola y el minero mostraron una recuperación rápida. Desde 2021, gracias a la mejora en los precios del crudo, la reapertura del comercio y el impulso de productos agrícolas y petroquímicos, las exportaciones se recuperaron y para 2022 superaron los niveles prepandemia. Aunque el país logró estabilizarse, la pandemia evidenció la vulnerabilidad de depender de sectores extractivos.

¿Qué departamentos tienen un papel más fuerte en este proceso?

Las exportaciones colombianas están concentradas en pocos departamentos, especialmente Antioquia, Bogotá D.C., Valle del Cauca y Bolívar, cada uno con sectores productivos específicos. También destacan Cesar y La Guajira por el carbón y los minerales. Antioquia aporta café, oro y banano; Meta y Casanare lideran en petróleo; Valle del Cauca en manufacturas y agroindustria; Atlántico y Bolívar en petroquímica y actividad portuaria; y Santander en cacao y cafés especiales. Esta concentración revela los principales polos exportadores del país y la desigualdad regional asociada.

¿Por qué son tan importantes las exportaciones para Colombia?

Las gráficas temporales y comparativas muestran cómo las exportaciones actúan como una fuente estabilizadora de ingresos para el país, especialmente en momentos de inflación interna, devaluación o desaceleración en sectores locales. Además, las exportaciones sostienen buena parte del empleo en cadenas productivas agrícolas, industriales y mineras. Son esenciales para mantener divisas, mejorar la balanza comercial y fortalecer la posición del país frente a mercados internacionales.

5.4 Limitaciones y Mejoras

Limitaciones:

  • El análisis se centra solo en dos meses por año (enero y julio), lo que disminuye la capacidad de observar tendencias mensuales más detalladas.

  • Algunas inconsistencias en los datos del DANE muestran tendencias extrañas muy salidas de lo común.

  • No tener en cuenta decisiones politicas, crisis y demas comportamientos que pueden afectar el analisis de los datos.

Posibles Mejoras:

  • Ampliar el análisis a todos los meses del año para obtener una visión más completa.

  • Incorporar variables como tipo de cambio, precios internacionales y contexto geopolítico.

6 Conclusiones

  • El café y el petróleo siguen siendo los productos más representativos de la oferta exportadora colombiana, confirmando la alta dependencia del país de sectores primarios.

  • La pandemia sí generó un impacto negativo significativo, especialmente en 2020, pero el país mostró una recuperación constante desde 2021 gracias a la reactivación global y al incremento de precios internacionales.

  • Los departamentos con mayor vocación exportadora son Antioquia, Meta, Casanare, Valle del Cauca, Atlántico y Bolívar, lo cual refleja la concentración productiva y logística del país.

  • Las exportaciones siguen siendo un pilar fundamental para la economía colombiana, ya que aportan divisas, empleo y crecimiento, además de permitir la integración en cadenas globales de valor.

  • A pesar de señales positivas, la diversificación exportadora es un reto pendiente, especialmente para reducir la vulnerabilidad frente a crisis externas y fluctuaciones de precios.

  • El análisis entre 2020 y 2024 evidencia un país que logró superar una crisis global, pero que aún debe fortalecer sectores emergentes y diversificados para alcanzar una estabilidad exportadora más sólida.

7 Referencias