1. Introducción

La contaminación atmosférica es un problema ambiental y de salud pública en las grandes ciudades, incluida Bogotá. Para evaluar su comportamiento espacial se hace necesario estudiar la estacionariedad en la media de los contaminantes, es decir, verificar si existe o no una tendencia espacial en los promedios anuales de las concentraciones.

El presente documento se basa en la base de datos , publicada en Datos Abiertos Colombia por el Instituto de Hidrología, Meteorología y Estudios Ambientales (IDEAM). La información incluye los valores promedios anuales de diferentes contaminantes registrados por estaciones de monitoreo.

2. Planteamiento del Problema

La polución del aire es un riesgo ambiental que genera consecuencias potencialmente graves para la salud de las personas. A veces puede ser visible (neblina, humo, emisiones de vehículos), pero muchas veces es imperceptible a simple vista, aunque igualmente dañina. Desde que en 1970 se establecieran los Estándares Nacionales de Calidad del Aire ha quedado evidenciado que la exposición a los contaminantes del aire no sólo afecta al sistema respiratorio, sino también que aumenta el riesgo de sufrir enfermedades cardiovasculares, diabetes, obesidad, así como trastornos neurológicos, inmunológicos y reproductivos.\ Investigaciones recientes han puesto de manifiesto que la calidad del aire está vinculada a procesos de estrés oxidativo e inflamación celular, favoreciendo la aparición de enfermedades crónicas y cáncer; por esta razón, la OMS clasifica a la calidad del aire (en 2013) como cancerígena para los humanos. Es de esta manera que la contaminación atmosférica en zonas urbanas constituye un desafío crítico para la salud pública y la sostenibilidad ambiental. Bogotá, como una de las ciudades más grandes y pobladas de Colombia, enfrenta altos niveles de contaminación derivados principalmente de la movilidad vehicular, las actividades industriales y las condiciones topográficas que dificultan la dispersión de contaminantes.

En este contexto, resulta fundamental investigar cuáles son los contaminantes más presentes en la atmósfera de la ciudad y en qué medida se manifiestan, con el fin de dimensionar el impacto real que tienen sobre la población. El análisis de contaminantes como el material particulado (PM\(_{2.5}\)) y el dióxido de nitrógeno (NO\(_2\)) durante el año 2023 permite no solo identificar la magnitud de la exposición de la ciudadanía, sino también establecer comparaciones entre ambos contaminantes para reconocer cuál representa un mayor riesgo en la zona urbana.

Este estudio busca, por lo tanto, determinar los niveles promedio anuales de PM\(_{2.5}\) y NO\(_2\) en Bogotá durante 2023, evaluando su predominancia relativa y la importancia de cada uno en la caracterización de la calidad del aire. Con ello se pretende aportar información clave para orientar y fomentar estrategias de control de emisiones, movilidad sostenible y medidas preventivas en salud pública, en beneficio de los habitantes de la capital.

Descripción del Estudio

  • Ubicación: Bogotá D.C., Colombia
  • Periodo: Año 2023
  • Variables: Concentraciones de PM2.5 y NO2
  • Unidades: Microgramos por metro cúbico (µg/m³)
  • Escala: Promedios anuales por estación de monitoreo

Carga y Preparación de Datos

Se configuró el entorno de trabajo y se cargaron los datos de calidad del aire en Colombia en formato geoespacial, disponibles públicamente en el portal de datos abiertos del Gobierno de Colombia Calidad del Aire en Colombia – Promedio Anual. Posteriormente, se filtró la información correspondiente a Bogotá para el año 2023 y se seleccionaron las variables de interés (PM2.5 y NO₂), convirtiendo los valores de concentración a formato numérico para su posterior análisis. Finalmente, se verificó la completitud de la base de datos, asegurando que no existieran valores faltantes en las observaciones utilizadas.

3. Mapa de la Zona de Estudio

El siguiente mapa interactivo constituye una herramienta fundamental para la exploración espacial de la calidad del aire en Bogotá. En él se representan las localidades de la ciudad, diferenciadas por colores, junto con la ubicación georreferenciada de las estaciones de monitoreo atmosférico activas durante el año 2023. Cada punto corresponde a una estación que registra variables clave de contaminación (como \(PM_{2.5}\) y \(NO_2\)), lo que permite visualizar de manera integrada tanto la distribución espacial de la infraestructura de medición como su relación con el territorio urbano.

Este recurso no solo facilita identificar patrones de concentración y cobertura en el sistema de vigilancia, sino que también ofrece la posibilidad de interactuar con el mapa para obtener información puntual sobre cada localidad y estación. Así, se convierte en una base esencial para el análisis exploratorio, la comparación territorial y la formulación de estrategias en torno a la gestión de la calidad del aire en Bogotá.23.

## Reading layer `Loca' from data source 
##   `C:\Users\Usuario\OneDrive\Desktop\U.Nacional\2025\2025-2S\Estad_Espacial\Proyecto\loca.gpkg' 
##   using driver `GPKG'
## Simple feature collection with 20 features and 4 fields
## Geometry type: MULTIPOLYGON
## Dimension:     XY
## Bounding box:  xmin: -74.44978 ymin: 3.73103 xmax: -73.98653 ymax: 4.836779
## Geodetic CRS:  MAGNA-SIRGAS

4. Análisis Descriptivo

Estadísticos Básicos

Estadísticos descriptivos por contaminante (µg/m³)
variable Media Mediana Máximo Mínimo Desviación geometry
NO2 28.44 25.1 42.7 18.3 8.03 MULTIPOINT ((-74.09346 4.76…
PM2.5 15.87 14.2 33.9 6.1 5.72 MULTIPOINT ((-74.39392 3.81…

Los resultados descriptivos muestran diferencias claras entre los dos contaminantes analizados. En el caso del \(NO_2\), la concentración media fue de 28.44 µg/m³, con una mediana de 25.1 µg/m³, lo que sugiere una ligera asimetría hacia valores altos dado que el máximo alcanzó 42.7 µg/m³, mientras que el mínimo fue 18.3 µg/m³. Por otro lado, el \(PM_{2.5}\) presentó valores más bajos en general, con una media de 15.87 µg/m³ y una mediana de 14.2 µg/m³, destacándose un rango de variación entre 6.1 µg/m³ y 33.9 µg/m³. Estos resultados reflejan que, aunque el \(NO_2\) presenta concentraciones promedio más elevadas, el \(PM_{2.5}\) exhibe una mayor dispersión relativa en sus valores, lo cual es relevante al momento de evaluar la exposición de la población y el cumplimiento de las normas de calidad del aire.

Distribución de Contaminantes

## Warning: package 'gridExtra' was built under R version 4.4.3
## 
## Adjuntando el paquete: 'gridExtra'
## The following object is masked from 'package:dplyr':
## 
##     combine
Distribución de concentraciones de PM2.5 y NO2

Distribución de concentraciones de PM2.5 y NO2

5. Análisis de Estacionariedad en Media

En primer lugar, a partir de los datos espaciales de calidad del aire en Bogotá, se extrajeron las coordenadas planas (X, Y) de cada estación de monitoreo, con el fin de tener una representación adecuada de la ubicación en un sistema métrico. Posteriormente, los datos se separaron por contaminante, generando dos conjuntos de información independientes: uno para PM2.5 y otro para NO2. Este paso permitió organizar la información de manera que fuera posible analizar cada contaminante por separado y estudiar si su variación espacial está asociada a la localización geográfica de las estaciones.

## 
## Call:
## lm(formula = promedio ~ X + Y, data = pm25)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.6823 -2.3683 -0.7189  1.0744 16.0797 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -6710.958   1766.698  -3.799 0.000498 ***
## X             -88.445     23.346  -3.788 0.000513 ***
## Y              37.148      8.788   4.227 0.000138 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.86 on 39 degrees of freedom
## Multiple R-squared:  0.3142, Adjusted R-squared:  0.279 
## F-statistic: 8.934 on 2 and 39 DF,  p-value: 0.0006394
## 
## Call:
## lm(formula = promedio ~ X + Y, data = no2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -9.2958 -4.1659 -0.0356  6.0776 11.3002 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)  
## (Intercept) -10460.01    3949.90  -2.648   0.0191 *
## X             -138.48      52.29  -2.648   0.0191 *
## Y               48.76      27.94   1.745   0.1028  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.992 on 14 degrees of freedom
## Multiple R-squared:  0.3366, Adjusted R-squared:  0.2418 
## F-statistic: 3.551 on 2 and 14 DF,  p-value: 0.05657

Al evaluar la estacionariedad en media, se observa que tanto en \(PM_{2.5}\) como en \(NO_2\) existe evidencia de tendencia espacial, aunque con distinta magnitud. En el caso de \(PM_{2.5}\), el modelo lineal muestra que las coordenadas X e Y son estadísticamente significativas (p < 0.01), lo que confirma la presencia de una tendencia clara en la media. Para \(NO_2\), aunque el ajuste general es más débil (\(R^2\) ajustado ≈ 0.24), la coordenada X resulta significativa (p < 0.05), indicando una tendencia incipiente, mientras que la coordenada Y no lo es. En consecuencia, concluimos que en ambos contaminantes los datos originales no son estacionarios en media y que es necesario remover la tendencia modelando la media. Para asegurar la validez del análisis geoestadístico, los semivariogramas y covariogramas deben estimarse a partir de los residuos, que constituyen un proceso aditivo con media cero y sin tendencia.

___

___

___

___

El comportamiento espacial del PM2.5 en Bogotá durante 2023 evidencia una concentración moderada de este contaminante, con valores que oscilan entre los 10 y 30 µg/m³. La mayoría de las estaciones se concentran en el sector nororiental de la ciudad, donde se observan niveles intermedios de partículas (15–25 µg/m³). Sin embargo, destaca un punto con valores elevados (cercanos a 30 µg/m³), lo que podría asociarse a zonas de alta densidad vehicular, actividad industrial localizada o condiciones microclimáticas que limitan la dispersión del contaminante. En contraste, hacia el extremo suroccidental se observa un valor atípicamente bajo, cercano a 10 µg/m³, lo que indica una heterogeneidad espacial más marcada en comparación con el NO₂. Estos resultados sugieren la presencia de un gradiente, aunque menos definido que en el caso del dióxido de nitrógeno, lo que implica que el PM2.5 muestra menor tendencia sistemática en la media y una variabilidad más localizada, probablemente asociada a fuentes puntuales de emisión y condiciones locales de ventilación.

Preparación de Coordenadas

# Extraer coordenadas para análisis geoestadístico
coords <- st_coordinates(bogota_vars)
bogota_vars$X <- coords[,1]
bogota_vars$Y <- coords[,2]

# Separar por contaminante
pm25 <- bogota_vars %>% filter(variable == "PM2.5")
no2 <- bogota_vars %>% filter(variable == "NO2")

Modelado de Tendencia Espacial

PM2.5

# Modelo lineal de tendencia espacial
modelo_pm25 <- lm(promedio ~ X + Y, data = pm25)
summary_pm25 <- summary(modelo_pm25)

cat("**Modelo de tendencia para PM2.5:**\n")
## **Modelo de tendencia para PM2.5:**
cat("R-cuadrado:", round(summary_pm25$r.squared, 3), "\n")
## R-cuadrado: 0.314
cat("Coeficiente X (p-valor):", round(coef(summary_pm25)[2,1], 5), 
    "(", round(coef(summary_pm25)[2,4], 3), ")\n")
## Coeficiente X (p-valor): -88.44482 ( 0.001 )
cat("Coeficiente Y (p-valor):", round(coef(summary_pm25)[3,1], 5), 
    "(", round(coef(summary_pm25)[3,4], 3), ")\n")
## Coeficiente Y (p-valor): 37.14848 ( 0 )

NO2

# Modelo lineal de tendencia espacial
modelo_no2 <- lm(promedio ~ X + Y, data = no2)
summary_no2 <- summary(modelo_no2)

cat("**Modelo de tendencia para NO2:**\n")
## **Modelo de tendencia para NO2:**
cat("R-cuadrado:", round(summary_no2$r.squared, 3), "\n")
## R-cuadrado: 0.337
cat("Coeficiente X (p-valor):", round(coef(summary_no2)[2,1], 5), 
    "(", round(coef(summary_no2)[2,4], 3), ")\n")
## Coeficiente X (p-valor): -138.477 ( 0.019 )
cat("Coeficiente Y (p-valor):", round(coef(summary_no2)[3,1], 5), 
    "(", round(coef(summary_no2)[3,4], 3), ")\n")
## Coeficiente Y (p-valor): 48.76214 ( 0.103 )

Variogramas

# Función para análisis completo
analizar_contaminante <- function(data, nombre) {
  
  # Modelos de tendencia
  modelo_lin <- lm(promedio ~ X + Y, data = data)
  modelo_quad <- lm(promedio ~ X + Y + I(X^2) + I(Y^2) + X:Y, data = data)
  
  # Residuales
  data$resid_lin <- residuals(modelo_lin)
  data$resid_quad <- residuals(modelo_quad)
  
  # Variogramas
  vg_orig <- variogram(promedio ~ 1, data = as(data, "Spatial"))
  vg_lin <- variogram(resid_lin ~ 1, data = as(data, "Spatial"))
  
  # Gráficos
  par(mfrow = c(2, 1))
  plot(vg_orig, main = paste("Variograma", nombre, "- Datos Originales"))
  plot(vg_lin, main = paste("Variograma", nombre, "- Residuales Lineales"))
  
  return(list(
    modelo_lin = modelo_lin,
    modelo_quad = modelo_quad,
    media_residuales = mean(data$resid_lin)
  ))
}

# Aplicar análisis
cat("=== ANÁLISIS PM2.5 ===\n")
## === ANÁLISIS PM2.5 ===
res_pm25 <- analizar_contaminante(pm25, "PM2.5")
cat("Media de residuales (lineal):", round(res_pm25$media_residuales, 6), "\n\n")
## Media de residuales (lineal): 0
cat("=== ANÁLISIS NO2 ===\n")
## === ANÁLISIS NO2 ===
res_no2 <- analizar_contaminante(no2, "NO2")
cat("Media de residuales (lineal):", round(res_no2$media_residuales, 6), "\n")
## Media de residuales (lineal): 0

Resultados y Conclusiones

Resumen de Estacionariedad

resultados <- data.frame(
  Contaminante = c("PM2.5", "NO2"),
  R2_Lineal = c(round(summary(modelo_pm25)$r.squared, 3),
                round(summary(modelo_no2)$r.squared, 3)),
  Media_Residuales = c(round(mean(residuals(modelo_pm25)), 6),
                      round(mean(residuals(modelo_no2)), 6)),
  Tendencia_Significativa = c(ifelse(any(summary(modelo_pm25)$coefficients[2:3,4] < 0.05), "Sí", "No"),
                             ifelse(any(summary(modelo_no2)$coefficients[2:3,4] < 0.05), "Sí", "No"))
)

knitr::kable(resultados, caption = "Resumen del análisis de estacionariedad")
Resumen del análisis de estacionariedad
Contaminante R2_Lineal Media_Residuales Tendencia_Significativa
PM2.5 0.314 0
NO2 0.337 0

Interpretación