REPORTE MODELACIÓN LINEAL CON DATOS TEMPORALES

# Cargar el archivo de Excel en un data frame
base_datos_temporales <- read_xlsx("Compartir2.xlsx", col_names = TRUE)

# Eliminación de filas con datos faltantes
base_datos_temporales <- na.omit(base_datos_temporales)

# Reemplazar las comas por puntos en las columnas numéricas
columnas_numericas <- c("O3  (ug/m3)", "Vel Viento  (m/s)", "Dir Viento (Grados)",
                        "Temperatura (C°)", "Humedad (%)", "Radiacion Solar (Watt/M2)", "Lluvia (mm)")
base_datos_temporales[, columnas_numericas] <- lapply(base_datos_temporales[, columnas_numericas], function(x) as.numeric(gsub(",", ".", x)))

# Convertir la columna "Fecha & Hora" al formato POSIXct
base_datos_temporales$`Fecha & Hora` <- as.POSIXct(base_datos_temporales$`Fecha & Hora`, format = "%d/%m/%Y %H:%M")

# Calcular el promedio por día y filtrar por el rango de fechas
promedio_por_dia <- base_datos_temporales %>%
  filter(`Fecha & Hora` >= as.POSIXct("2018-01-16") & `Fecha & Hora` <= as.POSIXct("2018-08-04")) %>%
  group_by(fecha = as.Date(`Fecha & Hora`)) %>%
  summarize(across(-`Fecha & Hora`, mean, na.rm = TRUE))

# Renombrar las variables utilizando colnames
colnames(promedio_por_dia) <- c("Fecha", "Ozono", "Vel_viento", "Dir_viento", "Temp.", "Humedad", "Rad_solar", "Lluvia")

# Crear serie temporal
serie_temporal <- ts(promedio_por_dia[, -1], start = min(promedio_por_dia$Fecha), frequency = 1)

Introducción sobre el contexto climático

La ciudad de Santiago de Cali, ubicada en el oriente de Colombia, es conocida por su clima característico cálido y seco, dentro de la categoría As - Tropical con verano seco según la Clasificación climática de Köppen. Estas condiciones climáticas influyen significativamente en la formación y dispersión de contaminantes atmosféricos como el ozono (O3) y en el comportamiento de las variables meteorológicas que afectan su concentración, por lo que, dentro de la ciudad, la estación Compartir juega un papel fundamental en el monitoreo de la calidad del aire y en la recopilación de datos meteorológicos.

Dicho lo anterior, es importante resaltar que la estación Compartir, a través de su sistema de monitoreo automático, registra de forma horaria una serie de contaminantes, dentro de los cuales se encuentran el material particulado (PM10 y PM2.5), así como el ozono (O3), y una serie de variables meteorológicas relevantes para estas mediciones como: La velocidad y dirección del viento, la temperatura, la humedad, la radiación solar y la precipitación. De acuerdo al primer párrafo, la siguiente tabla presenta información meteorológica que confirma las afirmaciones realizadas acerca del clima de la ciudad, donde se observa la presencia de altas temperaturas tantos máximas, medias y mínimas a lo largo del año, así como bajos valores de precipitaciones y días de lluvia y un elevado número de horas de sol anuales.

Es importante resaltar que las variables climáticas anteriormente mencionadas desempeñan un papel crucial en la formación y concentración de ozono en la atmósfera de la ciudad. La velocidad y dirección del viento influyen en el transporte y dispersión de los contaminantes, afectando la concentración de ozono en diferentes áreas de la ciudad. Por su parte, la temperatura y la radiación solar pueden acelerar las reacciones químicas que producen este material contaminante, especialmente en condiciones de alta radiación solar y temperaturas cálidas. Así mismo, la humedad también es un factor importante dentro del estudio, ya que altos niveles de humedad pueden limitar la formación de ozono, además, la presencia de precipitación puede tener un efecto significativo en la concentración del mismo, ya que la lluvia puede lavar los contaminantes atmosféricos y reducir su presencia en el aire.

Para garantizar una mayor consistencia y facilidad de análisis en este trabajo, se ha adaptado la información horaria a una escala diaria, utilizando el promedio de todas las mediciones realizadas en cada día. Esto nos permite obtener una visión más general al identificar posibles relaciones entre las variables climáticas mencionadas y la concentración de ozono en un periodo de tiempo más amplio. A continuación se presentará la ventana de observación para las muestras asignadas:

# Formatear los valores numéricos a 2 decimales
promedio_por_dia_num <- promedio_por_dia
promedio_por_dia_num[, -1] <- lapply(promedio_por_dia_num[, -1], function(x) formatC(x, format = "f", digits = 2))

# Crear tabla interactiva con valores formateados, desplazamiento horizontal y 5 filas por página
datatable(
  promedio_por_dia_num, 
  rownames = TRUE, 
  options = list(
    columnDefs = list(
      list(className = "dt-center", targets = "_all")
    ),
    scrollX = TRUE,
    pageLength = 5
  )
)

Con esta información, se pretende analizar la relación entre las variables climáticas y la presencia de ozono en la ciudad de Santiago de Cali, brindando una visión más completa y comprensiva sobre el contexto climático y su impacto en la calidad del aire. Además, es importante destacar que, debido a las características propias de las estaciones de monitoreo y a la toma de decisiones por parte de los expertos, es común encontrar discontinuidades en los datos recopilados. Estas discontinuidades pueden deberse a fallas en los equipos, interrupciones eléctricas, mantenimiento de equipos, entre otras razones. En el caso específico de la Estación Compartir, se registraron 20 datos faltantes debido a estas situaciones, por lo que hay un salto desde el 2018-02-07 hasta el 2018-02-27.

Descripción de las variables

Ozono

OZONO [UG/M3]

El ozono (O3) es un contaminante atmosférico presente en la troposfera, la capa más baja de la atmósfera. Se forma a partir de reacciones químicas complejas entre los óxidos de nitrógeno (NOx) y los compuestos orgánicos volátiles (COV) en presencia de luz solar intensa. El ozono puede tener efectos tanto beneficiosos como perjudiciales en el medio ambiente y la salud humana, dependiendo de su ubicación y concentración.

En la estratosfera, el ozono juega un papel crucial al formar una capa protectora que absorbe gran parte de la radiación ultravioleta del sol, protegiendo así la vida en la Tierra. Sin embargo, a nivel del suelo, el ozono es considerado un contaminante debido a sus efectos negativos. El ozono troposférico es un componente importante de la contaminación del aire y se forma principalmente como resultado de la interacción de los precursores (NOx y COV) en presencia de condiciones meteorológicas favorables.

La presencia de ozono en altas concentraciones en la troposfera puede tener efectos adversos en la salud humana y el medio ambiente. El ozono puede irritar los pulmones y el sistema respiratorio, causando síntomas como dificultad para respirar, tos, dolor de garganta y exacerbación de enfermedades respiratorias existentes. Además, el ozono puede dañar la vegetación, afectando negativamente los cultivos, los bosques y los ecosistemas en general.

DIAGRAMA DE PARES - GRÁFICOS DE DISPERSIÓN

La matriz presentada a continuación se enfoca en realizar un análisis exploratorio de datos utilizando una matriz de gráficos de pares. Esta matriz permite visualizar la dispersión y la relación entre múltiples variables seleccionadas.

En particular, para este caso de estudio, el interés se centra en la relación existente entre la variable “Ozono” y el resto de las variables en el conjunto de datos. Para analizar esta relación, se presta especial atención a la primera fila de la matriz, que proporciona información sobre los coeficientes de correlación entre la variable dependiente “Ozono” y las 6 variables independientes. Estos coeficientes de correlación indican la fuerza y la dirección de la relación lineal entre las variables, por lo que un valor cercano a 1 indica una correlación positiva fuerte, mientras que un valor próximo a -1 indica una correlación negativa fuerte, mientras que un valor cercano a 0 indica una correlación débil o inexistente.

Además de los coeficientes de correlación, la primera columna de la matriz muestra los gráficos de dispersión del “Ozono” en relación con cada una de las demás variables estudiadas. Estos gráficos permiten visualizar la distribución de los puntos y cualquier patrón o tendencia que pueda existir entre las variables, por lo que observar los gráficos de dispersión puede ayudar a identificar posibles relaciones lineales, no lineales o patrones atípicos entre el “Ozono” y las demás variables.

# Crear un data frame con todas las variables predictoras y la variable de respuesta
datos_modelo <- promedio_por_dia[, c("Ozono", "Vel_viento", "Dir_viento", "Temp.", "Humedad", "Rad_solar", "Lluvia")]

# Crear matriz de gráficos de pares utilizando GGally::ggpairs()
GGally::ggpairs(datos_modelo)

# Convertir promedio_por_dia a un objeto de clase ts
ts_promedio_por_dia <- ts(promedio_por_dia$Vel_viento, start = min(promedio_por_dia$Fecha), frequency = 1)

En resumen, la matriz de gráficos de pares proporciona una visión global de la relación y la dispersión entre las variables seleccionadas, y se presta especial atención a la primera fila (coeficientes de correlación) y la primera columna (gráficos de dispersión) para analizar la relación del “Ozono” con el resto de variables presentes en este caso de estudio.

Velocidad del viento

VELOCIDAD DEL VIENTO [M/S]

La velocidad del viento se refiere a la magnitud de la velocidad a la cual el aire se desplaza en un determinado lugar. En el contexto de la calidad del aire, este es un factor crucial que influye en la dispersión y dilución de los contaminantes atmosféricos, incluido el ozono. Lo anterior debido a que un viento moderado o fuerte puede ayudar a dispersar el ozono y otros contaminantes, alejándose de su fuente de emisión y favoreciendo una mezcla más homogénea en la atmósfera, lo cual puede resultar en niveles más bajos de ozono en áreas pobladas.

Sin embargo, la relación entre la velocidad del viento y la producción de ozono no es lineal ni directa. En situaciones donde hay fuentes de contaminación locales, como emisiones de vehículos o industrias, y condiciones meteorológicas específicas, como estabilidad atmosférica, un viento débil puede contribuir a la acumulación de ozono en áreas urbanas. En estas condiciones, el ozono emitido por las fuentes contaminantes tiene dificultades para dispersarse y diluirse en la atmósfera, lo que resulta en altos niveles de ozono cerca de su fuente de emisión.

Además, en áreas urbanas donde hay edificios y estructuras que pueden generar obstáculos al flujo del viento, la velocidad del viento puede ser reducida y la dispersión de contaminantes puede ser limitada. Esto puede ser especialmente relevante en calles estrechas o en áreas con una alta concentración de edificios altos. En estos casos, la velocidad del viento puede ser insuficiente para transportar los contaminantes lejos de su fuente de emisión, lo que resulta en una mayor concentración de ozono en áreas urbanas.

CORRELACIÓN Y GRÁFICO DE DISPERSIÓN

A pesar de lo argumentado anteriormente, el análisis de los datos revela que existe una correlación positiva entre la velocidad del viento y la producción de ozono en la ciudad de Cali. Esto significa que a medida que la velocidad del viento aumenta, también tiende a aumentar la producción de ozono. La correlación positiva sugiere que hay una relación lineal directa entre estas dos variables. Es importante destacar que el coeficiente de correlación obtenido de 0.249951 indica una correlación moderada. Si bien no es una correlación muy fuerte, aún muestra una tendencia general de que a mayor velocidad del viento, mayor es la producción de ozono. Lo anterior se explica a través de la topografía característica de Cali, ya que al haber montañas y valles cercanos, el flujo del viento puede ser canalizado o bloqueado, lo que puede afectar la dispersión de los contaminantes y favorecer su acumulación en ciertas áreas. Esto puede resultar en una mayor concentración de ozono en la ciudad, incluso con un aumento en la velocidad del viento.

# Ajuste de un modelo lineal
modelo <- lm(Ozono ~ Vel_viento, data = promedio_por_dia)

# Crear el gráfico base utilizando ggplot2
grafico <- ggplot(data = promedio_por_dia, aes(x = Vel_viento, y = Ozono)) +
  geom_point(color = "#0A7300") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +  
  labs(x = "Velocidad del Viento", y = "Producción de Ozono",
       title = " ") +
  theme_bw()

ggplotly(grafico)

# Análisis de la relación entre velocidad del viento y producción de ozono
correlacion <- cor(promedio_por_dia$Vel_viento, promedio_por_dia$Ozono)
cat("Coeficiente de correlación: ", correlacion, "\n")

## Coeficiente de correlación:  0.249951

if (correlacion > 0) {
  cat("Existe una correlación positiva entre la velocidad del viento y la producción de ozono.\n")
} else if (correlacion < 0) {
  cat("Existe una correlación negativa entre la velocidad del viento y la producción de ozono.\n")
} else {
  cat("No se encontró una correlación significativa entre la velocidad del viento y la producción de ozono.\n")
}

## Existe una correlación positiva entre la velocidad del viento y la producción de ozono.

Dirección del viento

DIRECCIÓN DEL VIENTO [GRADOS]

La dirección del viento se refiere a la orientación desde la cual proviene el flujo de aire. En el contexto de la calidad del aire, la dirección del viento es un factor importante que influye en la dispersión y transporte de los contaminantes atmosféricos, incluido el ozono. Esta variable nos proporciona información sobre la trayectoria y el origen de los vientos que interactúan con el entorno local.

La dirección del viento puede influir en la producción de ozono de diferentes maneras. Por ejemplo, si el viento proviene de áreas con poca o ninguna fuente de contaminación, como zonas rurales o áreas con una menor concentración de emisiones, puede transportar aire más limpio hacia una determinada ubicación, lo que ayuda a diluir y dispersar el ozono presente en la zona. En este caso, la dirección del viento puede contribuir a niveles más bajos de ozono al alejar el aire contaminado y reemplazarlo por aire más limpio.

Sin embargo, la relación entre la dirección del viento y la producción de ozono puede ser compleja y depende de varios factores. En ciertas situaciones, la dirección del viento puede llevar consigo aire contaminado desde áreas con altas emisiones de ozono hacia una ubicación determinada, lo que resulta en una mayor concentración de ozono en ese lugar. Esto puede ocurrir cuando el viento proviene de áreas industriales, zonas urbanas densamente pobladas o áreas con fuentes de contaminación significativas.

CORRELACIÓN Y GRÁFICO DE DISPERSIÓN

Según los resultados obtenidos, se observa una correlación positiva muy débil entre la dirección del viento y la producción de ozono en la ciudad de Cali. El coeficiente de correlación de 0.001452424 indica que la relación entre estas dos variables es prácticamente inexistente. Una correlación positiva tan baja sugiere que la dirección del viento tiene una influencia mínima en la producción de ozono. A pesar de que existe una correlación positiva muy débil, es importante interpretarla con precaución y no establecer una relación causal directa entre la dirección del viento y la producción de ozono.

# Ajuste de un modelo lineal
modelo <- lm(Ozono ~ Dir_viento, data = promedio_por_dia)

# Crear el gráfico base utilizando ggplot2
grafico <- ggplot(data = promedio_por_dia, aes(x = Dir_viento, y = Ozono)) +
  geom_point(color = "#0A7300") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +  
  labs(x = "Dirección del Viento", y = "Producción de Ozono",
       title = " ") +
  theme_bw()

ggplotly(grafico)

# Análisis de la relación entre velocidad del viento y producción de ozono
correlacion <- cor(promedio_por_dia$Dir_viento, promedio_por_dia$Ozono)
cat("Coeficiente de correlación: ", correlacion, "\n")

## Coeficiente de correlación:  0.001452424

if (correlacion > 0) {
  cat("Existe una correlación positiva débil entre la dirección del viento y la producción de ozono.\n")
} else if (correlacion < 0) {
  cat("Existe una correlación negativa entre la dirección del viento y la producción de ozono.\n")
} else {
  cat("No se encontró una correlación significativa entre la dirección del viento y la producción de ozono.\n")
}

## Existe una correlación positiva débil entre la dirección del viento y la producción de ozono.

Temperatura

TEMPERATURA [C°]

La temperatura es una medida de la energía térmica presente en el aire y se refiere al grado de calor o frío en un determinado lugar. En el contexto de la calidad del aire, la temperatura es un factor clave que influye en la producción y acumulación del ozono, ya que la formación de este está impulsada por reacciones fotoquímicas que son altamente sensibles a la temperatura. Por lo tanto, a medida que la temperatura aumenta, la velocidad de estas reacciones también se incrementa, lo que puede resultar en una mayor producción de este contaminante.

La relación entre la temperatura y la producción de ozono se explica a través de varios mecanismos. En primer lugar, a temperaturas más altas, las moléculas de aire tienen una mayor energía cinética, lo que aumenta la probabilidad de colisiones entre los precursores de ozono y los radicales libres necesarios para su formación. Esto acelera las reacciones químicas que generan ozono, contribuyendo a niveles más altos de O3.

Además, la temperatura también influye en otros factores que afectan la formación y acumulación de ozono. Por ejemplo, temperaturas más altas están asociadas con una mayor radiación solar, lo que impulsa la fotólisis de los precursores de O3 y su conversión en ozono.

CORRELACIÓN Y GRÁFICO DE DISPERSIÓN

Los resultados obtenidos revelan una correlación positiva significativa entre la temperatura y la producción de ozono en la ciudad de Cali. El coeficiente de correlación de 0.7011023 indica una relación fuerte y positiva entre estas dos variables. Esta correlación positiva sugiere que a medida que la temperatura aumenta, también aumenta la producción de ozono. La relación entre la temperatura y la producción de ozono puede estar relacionada con diferentes procesos atmosféricos.

# Ajuste de un modelo lineal
modelo <- lm(Ozono ~ Temp., data = promedio_por_dia)

# Crear el gráfico base utilizando ggplot2
grafico <- ggplot(data = promedio_por_dia, aes(x = Temp., y = Ozono)) +
  geom_point(color = "#0A7300") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +  
  labs(x = "Temperatura", y = "Producción de Ozono",
       title = " ") +
  theme_bw()

ggplotly(grafico)

# Análisis de la relación entre velocidad del viento y producción de ozono
correlacion <- cor(promedio_por_dia$Temp., promedio_por_dia$Ozono)
cat("Coeficiente de correlación: ", correlacion, "\n")

## Coeficiente de correlación:  0.7011023

if (correlacion > 0) {
  cat("Existe una correlación positiva entre la temperatura y la producción de ozono.\n")
} else if (correlacion < 0) {
  cat("Existe una correlación negativa entre la temperatura y la producción de ozono.\n")
} else {
  cat("No se encontró una correlación significativa entre la temperatura y la producción de ozono.\n")
}

## Existe una correlación positiva entre la temperatura y la producción de ozono.

Humedad

HUMEDAD [%]

La humedad relativa se refiere a la cantidad de vapor de agua presente en el aire en relación con la cantidad máxima que el aire puede contener a una determinada temperatura. En el contexto de la calidad del aire, la humedad juega un papel importante en la formación y acumulación del ozono.

La humedad relativa afecta la producción de ozono de varias maneras. En primer lugar, la reacción química que genera ozono es influenciada por la presencia de agua. A niveles de humedad más altos, las moléculas de agua pueden interactuar con los precursores de ozono y los radicales libres involucrados en su formación, lo que puede ralentizar o inhibir estas reacciones. Por lo tanto, se espera que niveles más altos de humedad relativa estén asociados con una menor producción de ozono.

Además, la humedad también puede influir en la disponibilidad de precursores de ozono en la atmósfera. La presencia de humedad puede promover la condensación y la formación de aerosoles, lo que puede llevar a una disminución en la concentración de precursores de ozono gaseosos. Estos precursores son necesarios para las reacciones químicas que generan ozono, por lo que una mayor humedad relativa puede limitar la disponibilidad de estos compuestos y reducir la producción de ozono.

CORRELACIÓN Y GRÁFICO DE DISPERSIÓN

Los resultados obtenidos revelan una correlación negativa significativa entre la humedad y la producción de ozono en la ciudad de Cali. El coeficiente de correlación de -0.7472878 indica una relación fuerte y negativa entre estas dos variables. Esta correlación negativa sugiere que a medida que la humedad aumenta, la producción de ozono tiende a disminuir. La relación entre la humedad y la producción de ozono puede estar relacionada con diversos factores. Por ejemplo, en condiciones de alta humedad, la concentración de óxidos de nitrógeno (NOx) y compuestos orgánicos volátiles (COV), que son los precursores del ozono, tiende a ser menor debido a su mayor solubilidad en el agua.

# Ajuste de un modelo lineal
modelo <- lm(Ozono ~ Humedad, data = promedio_por_dia)

# Crear el gráfico base utilizando ggplot2
grafico <- ggplot(data = promedio_por_dia, aes(x = Humedad, y = Ozono)) +
  geom_point(color = "#0A7300") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +  
  labs(x = "Humedad", y = "Producción de Ozono",
       title = " ") +
  theme_bw()

ggplotly(grafico)

# Análisis de la relación entre velocidad del viento y producción de ozono
correlacion <- cor(promedio_por_dia$Humedad, promedio_por_dia$Ozono)
cat("Coeficiente de correlación: ", correlacion, "\n")

## Coeficiente de correlación:  -0.7472878

if (correlacion > 0) {
  cat("Existe una correlación positiva entre la humedad y la producción de ozono.\n")
} else if (correlacion < 0) {
  cat("Existe una correlación negativa entre la humedad y la producción de ozono.\n")
} else {
  cat("No se encontró una correlación significativa entre la humedad y la producción de ozono.\n")
}

## Existe una correlación negativa entre la humedad y la producción de ozono.

Radiación solar

RADIACIÓN SOLAR [WATT/M2]

La radiación solar se refiere a la energía electromagnética emitida por el Sol que llega a la tierra Y es un factor clave en la producción de ozono debido a su capacidad para impulsar reacciones fotoquímicas en la atmósfera. La radiación solar, especialmente en la banda de luz ultravioleta (UV), puede desencadenar la fotólisis de los precursores de ozono y su conversión en ozono. Esta reacción ocurre cuando la radiación solar rompe los enlaces químicos de los compuestos orgánicos volátiles (COV) y los óxidos de nitrógeno (NOx), liberando radicales libres que reaccionan entre sí para formar moléculas de ozono.

La relación entre la radiación solar y la producción de ozono es generalmente positiva. A medida que aumenta la radiación solar, se espera que la producción de ozono también aumente, siempre y cuando haya una cantidad suficiente de precursores de ozono presentes en la atmósfera. Sin embargo, es importante tener en cuenta que la relación no es lineal y puede ser modulada por otros factores.

La disponibilidad de precursores de ozono, como los COV y los NOx, también influye en la relación entre la radiación solar y la producción de ozono. Si hay una cantidad limitada de precursores en la atmósfera, incluso con una alta radiación solar, la producción de ozono puede verse limitada. Además, otros factores como la temperatura, la humedad y la presencia de contaminantes atmosféricos pueden interactuar con la radiación solar y afectar la formación y acumulación de ozono de manera compleja.

CORRELACIÓN Y GRÁFICO DE DISPERSIÓN

Los resultados obtenidos revelan una correlación positiva significativa entre la radiación solar y la producción de ozono en la ciudad de Cali. Esto significa que a medida que aumenta la radiación solar, también se observa un aumento en la producción de ozono. La radiación solar desempeña un papel crucial en la formación de ozono, ya que proporciona la energía necesaria para que ocurran las reacciones químicas que generan ozono a partir de los precursores, como los óxidos de nitrógeno (NOx) y los compuestos orgánicos volátiles (COV). En otras palabras, la presencia de una mayor radiación solar favorece las reacciones fotoquímicas que conducen a una mayor producción de ozono.

# Ajuste de un modelo lineal
modelo <- lm(Ozono ~ Rad_solar, data = promedio_por_dia)

# Crear el gráfico base utilizando ggplot2
grafico <- ggplot(data = promedio_por_dia, aes(x = Rad_solar, y = Ozono)) +
  geom_point(color = "#0A7300") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +  
  labs(x = "Radiación solar", y = "Producción de Ozono",
       title = " ") +
  theme_bw()

ggplotly(grafico)

# Análisis de la relación entre velocidad del viento y producción de ozono
correlacion <- cor(promedio_por_dia$Rad_solar, promedio_por_dia$Ozono)
cat("Coeficiente de correlación: ", correlacion, "\n")

## Coeficiente de correlación:  0.6326235

if (correlacion > 0) {
  cat("Existe una correlación positiva entre la radiación solar y la producción de ozono.\n")
} else if (correlacion < 0) {
  cat("Existe una correlación negativa entre la radiación solar y la producción de ozono.\n")
} else {
  cat("No se encontró una correlación significativa entre la radiación solar y la producción de ozono.\n")
}

## Existe una correlación positiva entre la radiación solar y la producción de ozono.

Lluvia

LLUVIA [MM]

La precipitación se refiere a la caída de agua en forma líquida o sólida desde la atmósfera hacia la superficie terrestre. En el contexto de la calidad del aire y la producción de ozono, la precipitación juega un papel importante en la dispersión y la eliminación de los contaminantes atmosféricos, incluido el ozono.

La precipitación puede afectar la producción de ozono de varias maneras. En primer lugar, la lluvia actúa como un mecanismo de limpieza en la atmósfera, lavando los contaminantes y reduciendo su concentración. Cuando llueve, el ozono y otros contaminantes presentes en la atmósfera son arrastrados hacia el suelo, lo que disminuye su nivel y mejora la calidad del aire.

Además, la precipitación también puede influir en la producción de ozono a través de la humedad y la disponibilidad de precursores. La lluvia puede contribuir a un aumento en la humedad relativa del aire, lo que puede limitar la formación de ozono, ya que altos niveles de humedad pueden inhibir las reacciones químicas necesarias para la producción de ozono. Además, la precipitación también puede eliminar los precursores de ozono presentes en la atmósfera, como los compuestos orgánicos volátiles (COV) y los óxidos de nitrógeno (NOx), reduciendo así su disponibilidad para la formación de ozono.

CORRELACIÓN Y GRÁFICO DE DISPERSIÓN

Los resultados revelan una correlación negativa significativa entre la lluvia y la producción de ozono en la ciudad de Cali. Esto implica que cuando la lluvia es más abundante, la producción de ozono tiende a disminuir. Esta relación negativa se debe al efecto lavador de la lluvia, ya que actúa como un agente limpiador al arrastrar y dispersar los contaminantes atmosféricos, incluyendo el ozono. En otras palabras, la presencia de lluvia contribuye a reducir los niveles de ozono en el aire. Es importante destacar que esta relación puede estar influenciada por otros factores ambientales y condiciones meteorológicas. La lluvia generalmente está asociada con una mayor humedad y menor radiación solar, lo que puede afectar la formación y estabilidad del ozono.

# Ajuste de un modelo lineal
modelo <- lm(Ozono ~ Lluvia, data = promedio_por_dia)

# Crear el gráfico base utilizando ggplot2
grafico <- ggplot(data = promedio_por_dia, aes(x = Lluvia, y = Ozono)) +
  geom_point(color = "#0A7300") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +  
  labs(x = "Precipitación", y = "Producción de Ozono",
       title = " ") +
  theme_bw()

ggplotly(grafico)

# Análisis de la relación entre velocidad del viento y producción de ozono
correlacion <- cor(promedio_por_dia$Lluvia, promedio_por_dia$Ozono)
cat("Coeficiente de correlación: ", correlacion, "\n")

## Coeficiente de correlación:  -0.2138864

if (correlacion > 0) {
  cat("Existe una correlación positiva entre la precipitación y la producción de ozono.\n")
} else if (correlacion < 0) {
  cat("Existe una correlación negativa entre la precipitación y la producción de ozono.\n")
} else {
  cat("No se encontró una correlación significativa entre la precipitación y la producción de ozono.\n")
}

## Existe una correlación negativa entre la precipitación y la producción de ozono.

Presentación de la metodología

METODOLOGÍA MODELACIÓN LINEAL EN DATOS TEMPORALES

La modelación lineal en datos temporales se representa mediante un modelo de regresión lineal, donde la variable de respuesta (\(y_t\)) se modela como una combinación lineal de las variables predictoras (\(x_{1,t}, x_{2,t}, ..., x_{k,t}\)) más un término de error (\(ε_t\)). La ecuación del modelo se expresa de la siguiente manera:

\[y_t\ =\ \beta_0\ + \beta_1*x_{1,t} + \beta_2*x_{2,t} +\ ...\ + \beta_k*x_{k,t}\ + \varepsilon_t\]

Donde:

\(x_{j,t} =\) Representa el valor del j-ésimo predictor en el tiempo t.

\(β_{0} =\) (Intercepto) Que valor asumiría \(y_t\) en la eventualidad de ausencia en \(x_{j,t}\).

\(y_t =\) Es la variable que deseamos predecir, es decir, la variable de respuesta en el tiempo t.

\(β_k =\) Son los coeficientes que miden el efecto de cada predictor después de tener en cuenta el efecto de los demás predictores en el modelo.

\(ε_t\) = Es un término de error o ruido blanco que representa la variación no explicada por las variables predictoras. Se asume que sigue una distribución normal con media cero y varianza constante.

Conocida ya la ecuación general para el modelo lineal con datos temporales que se planea implementar, es importante a su vez definir que tipo de datos van a representar las variables predictoras \(x_{j,t}\) y la variable de respuesta \(y_t\). De tal manera se tiene entonces que:

\(y_t =\) Producción de Ozono - O3 (ug/m3).

\(x_{1,t} =\) Velocidad del Viento (m/s).

\(x_{2,t} =\) Dirección del Viento (Grados).

\(x_{3,t} =\) Temperatura (C°).

\(x_{4,t} =\) Humedad (%).

\(x_{5,t} =\) Radiacion Solar (Watt/M2).

\(x_{6,t} =\) Lluvia - Precipitación (mm)

Dicho lo anterior, se procede entonces a remplazar las variables de respuesta \(x_{j,t}\) y la variable predictoria \(y_t\) por sus respectivos nombres en la ecuación planteada al inicio de este apartado, Obteniendose:

\[ \small \text{Producción de Ozono}\;=\;β_{0}\;+\;β_{1}*\text{Velocidad del Viento}\;+\;β_{2}*\text{Dirección del Viento} \] \[ \small \;+\;β_{3}*\text{Temperatura}\;+\;β_{4}*\text{Humedad}\;+\;β_{5}*\text{Radiacion Solar}\;+\;β_{6}*\text{Precipitación}\;+\;\varepsilon_t \]

Finalmente, se aclara que los betas \((β)\) son los coeficientes de regresión que se estiman a partir de los datos estudiados. En este caso, hay seis variables explicativas (\(x_{1,t}\), \(x_{2,t}\), \(x_{3,t}\), \(x_{4,t}\), \(x_{5,t}\), \(x_{6,t}\)) que se utilizan para predecir la variable de respuesta \(y_t\), y cada variable explicativa tiene su propio coeficiente de regresión \(β_{i}\) (donde \(i\)= 1, 2, 3, 4, 5, 6). El coeficiente de regresión \(β_{0}\) es el término de intersección, que indica el valor esperado de \(y_t\) cuando todas las variables explicativas son iguales a cero. Los coeficientes de regresión \(β_{1}\) a \(β_{6}\) representan el cambio esperado en la variable de respuesta \(y_t\) por unidad de cambio en las variables explicativas \(x_{1,t}\) a \(x_{6,t}\), respectivamente, manteniendo todas las demás variables explicativas constantes.

SUPUESTOS NECESARIOS PARA LA MODELACIÓN LINEAL EN DATOS TEMPORALES

El supuesto clave en la modelación lineal de datos temporales es la autocorrelación de los errores. La autocorrelación implica que los errores en un momento determinado están correlacionados con los errores en momentos anteriores. Se utiliza la función de autocorrelación (\(ACF\)) para medir y visualizar la autocorrelación en los residuos del modelo. Si se encuentra autocorrelación en los residuos, esto indica que el modelo estimado viola el supuesto de que no hay autocorrelación en los errores. Esto puede conducir a pronósticos ineficientes y sesgados. Para abordar este problema, se pueden emplear modelos autorregresivos (\(AR\)) o modelos de media móvil (\(MA\)). Dicho lo anterior y con el objetivo de realizar pronósticos eficientes, los supuestos necesarios para la modelación lineal en datos temporales son los siguientes:

Los errores (\(ε_t\)) no están correlacionados y tienen media cero. Es decir, que no haya una relación sistemática entre los errores en diferentes puntos en el tiempo, o sea, que el valor del error en un momento dado no está influenciado por el valor del error en momentos anteriores o posteriores.Esto se expresa matemáticamente como:

\[E(\varepsilon_t) = 0\]

Los errores (\(ε_t\)) no están correlacionados con cada predictor (\(x_{j,t}\)). Esto significa que la covarianza entre el error en un momento dado (\(ε_t\)) y el valor de cualquier predictor (\(x_{j,t}\)) es igual a cero para todos los predictores j. En otras palabras, la variación en los errores no está relacionada con los valores de los predictores en el mismo momento. Esto se expresa matemáticamente como:

\[Cov(\varepsilon_t, x_{j,t}) = 0, \text{ para todo } j.\]

Es útil asumir que los errores (\(ε_t\)) siguen una distribución normal al realizar intervalos de predicción y pruebas estadísticas. Esto permite establecer límites de confianza y realizar inferencias sobre los parámetros del modelo. Esta suposición implica que los errores siguen una distribución normal con una media de cero y una varianza constante (\(σ^2\)), y se expresa matemáticamente como:

\[\varepsilon_t \sim N(0, \sigma^2)\]

Estos supuestos son esenciales para garantizar la validez de los coeficientes estimados y para obtener pronósticos precisos y confiables. Si alguno de estos supuestos no se cumple, es necesario considerar técnicas más avanzadas, como modelos autorregresivos integrados de media móvil (\(ARIMA\)) o modelos de series temporales más complejos, que pueden tener en cuenta la estructura de autocorrelación en los datos.

Modelo de series temporales

# Ajustar modelo lineal con estructura de serie temporal
modelo_st <- tslm(Ozono ~ Vel_viento + Dir_viento + Temp. + Humedad + Rad_solar + Lluvia, data = serie_temporal)

# Obtención de la tabla de coeficientes.
coef_table <- round(coef(summary(modelo_st)), digits = 4)
pvalues <- coef_table[,4]
symbols <- ifelse(pvalues < 0.001, sprintf("*** (%.4f)", pvalues), 
                  ifelse(pvalues < 0.01, sprintf("** (%.4f)", pvalues), 
                         ifelse(pvalues < 0.05, sprintf("* (%.4f)", pvalues), sprintf(" (%.4f)", pvalues))))
coef_table[,4] <- symbols

# Mostrar la tabla de coeficientes.
kable(coef_table, format = "html", align = "c") %>%
  add_header_above(c(" " = 1, " " = 4)) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), font_size = 12) %>%
  row_spec(0, background = "#FACD89") %>%
  row_spec(which(coef_table[,4] == "***"), background = "#FFC0CB") %>%
  row_spec(which(coef_table[,4] == "**"), background = "#F5DEB3") %>%
  row_spec(which(coef_table[,4] == "*"), background = "#E0FFFF")


	Estimate	Std. Error	t value	Pr(>\|t\|)
(Intercept)	97.585	25.7802	3.7853	*** (0.0002)
Vel_viento	-1.6161	1.2009	-1.3458	(0.1801)
Dir_viento	-0.0119	0.0086	-1.3825	(0.1686)
Temp.	-0.6198	0.6364	-0.9739	(0.3315)
Humedad	-0.9153	0.1463	-6.2563	*** (0.0000)
Rad_solar	0.0869	0.013	6.6587	*** (0.0000)
Lluvia	0.2319	0.5248	0.4419	(0.6591)

# Extraer el valor del R-cuadrado ajustado y el valor p
r_ajustado <- round(summary(modelo_st)$adj.r.squared, 4)
p_valor <- summary(modelo_st)$coefficients[7, 4]

# Mostrar los valores del R-cuadrado ajustado y el valor p
cat("El R-cuadrado ajustado es:", r_ajustado, "\n")

## El R-cuadrado ajustado es: 0.6504

cat("El valor p es:", p_valor, "\n")

## El valor p es: 0.6590872

Prueba de bondad

Para juzgar la bondad de un modelo de series temporales se deben realizar diferentes análisis:

En primer lugar, se tiene el análisis del coeficiente de determinación (R²) del modelo, el cual mide la proporción de la varianza total de la variable dependiente que es explicada por el modelo.
Otro análisis importante es el de los valores-p obtenidos para cada uno de los coeficientes de regresión. Los valores-p se utilizan para evaluar la significancia de los coeficientes de regresión obtenidos en un análisis y determinar si las variables independientes tienen algún efecto sobre la dependiente que se está evaluado.
Por último, se debe analizar cada uno de los coeficientes de regresión, interpretando su magnitud y signo, ya que al analizar los coeficientes de regresión, podemos determinar la dirección y la fuerza de la relación entre cada variable predictor y la variable de respuesta.

Dicho lo anterior, a continuación se realizarán los diferentes análisis mencionados previamente junto con su respectiva interpretación:

Interpretación del R²:

Tal como se puede observar en la tabla del modelo de series temporales presentada anteriormente, se tiene un valor del \((R^2)\) ajustado de:

# Extraer el valor del R-cuadrado ajustado y el valor p
r_ajustado <- summary(modelo_st)$adj.r.squared

# Mostrar los valores del R-cuadrado ajustado y el valor p
cat("El R-cuadrado ajustado es:", round(r_ajustado, 4), "\n")

## El R-cuadrado ajustado es: 0.6504

Por lo tanto, se interpreta que el modelo de series temporales que se ha ajustado explica el 65.04% de la variabilidad total en la producción del contaminante Ozono \((O_3)\), utilizando las variables independientes: Velocidad del viento, dirección del viento, temperatura, humedad, radiación solar y precipitación. En otras palabras, el modelo es capaz de explicar el 65.04% de las variaciones en la producción de Ozono, mientras que el 34.96% restante se debe a factores no incluidos en el modelo o a errores aleatorios.

En términos generales, un \((R^2)\) de 0.6504 sugiere que el modelo tiene un ajuste moderadamente bueno a los datos, pero podría mejorarse con la inclusión de otras variables o mejoras en el modelo.

Interpretación de los coeficientes de regresión y valores - p:

Intercepto: La significancia del intercepto proporciona información sobre el nivel inicial de ozono y la relación general entre las variables predictoras y la variable de respuesta. El valor del intercepto indica el nivel inicial de “Ozono” cuando todas las demás variables predictoras del modelo son cero o se mantienen constantes, para este caso particular el modelo sugiere que la producción inicial del contaminante O3 sería de aproximadamente 97.58 ug/m3. En otras palabras, si todas las variables predictoras no tienen efecto sobre el nivel de ozono, el intercepto nos proporciona una estimación del valor del contaminante O3 para este escenario inicial. Sin embargo, es importante tener en cuenta que en este modelo en particular, es posible que algunas de las variables predictoras no puedan ser iguales a cero en la práctica (por ejemplo, la velocidad o dirección del viento). Por lo tanto, la interpretación del intercepto en este contexto puede no ser tan relevante.

\[0.000211\;<\;0.05\]

Velocidad del viento: Para esta variable el coeficiente de regresión es de -1.6161, lo cual indica que, manteniendo constantes todas las otras variables predictorias, un aumento de 1 m/s en la velocidad del viento medida para la ciudad de Cali se asocia con una disminución de -1.6161 ug/m3 en la producción del contaminante Ozono. Tal como se puede observar, este resultado contradice las afirmaciones realizadas en el apartado de presentación de las variables, donde a mayor velocidad de viento se produce mayor cantidad de Ozono, sin embargo, como el valor p (0.180136) para esta variable es mayor a 0.05 se concluye que no es estadísticamente significativa. Dicho lo anterior, no se pueden respaldar los resultados obtenidos en este apartado y se concluye que esta variable no tiene una relación significativa con la producción de Ozono en este modelo.

\[0.1801\;>\;0.05\]

Dirección del viento: El coeficiente de regresión para esta variable es de -0.0119, con un valor p de (0.1686), lo que indica que esta variable no es estadísticamente significativa en el modelo a un nivel de significancia del 5%. La interpretación del coeficiente negativo es que, manteniendo constante el efecto de las demás variables independientes en el modelo, un aumento del 1% en el porcentaje de la dirección del viento en este modelo se relaciona con una disminución de -0.0119 ug/m3 en la producción del contaminante Ozono. Tal como se puede observar, este resultado contradice las afirmaciones realizadas en el apartado de presentación de las variables, donde una dirección de viento mas pronunciada se relaciona con una mayor cantidad de Ozono, sin embargo, como esta variable no es estadísticamente significativa, no se pueden respaldar los resultados obtenidos en este apartado y se concluye que es muy probable que la relación observada entre esta variable y la variable dependiente sea simplemente un efecto aleatorio, es decir, que no haya una verdadera relación causal entre ellas.

\[0.1686\;>\;0.05\]

Temperatura: El coeficiente de regresión estimado para esta variable es de -0.6198, lo cual indica que, manteniendo todas las demás variables constantes, un aumento de 1 C° en la temperatura registrada para la ciudad de Cali se asocia con una disminución de aproximadamente -0.6198 ug/m3 en la producción del contaminante Ozono. Tal como se puede observar, este resultado contradice las afirmaciones realizadas en el apartado de presentación de las variables, donde las temperaturas mas altas se asocian con una mayor producción de Ozono, sin embargo, como el valor p (0.3315) para esta variable es mayor a 0.05 se concluye que no es estadísticamente significativa. Dicho lo anterior, no se pueden respaldar los resultados obtenidos en este apartado y se concluye que por lo tanto, en este modelo, no se puede hacer una inferencia confiable sobre la relación entre la temperatura y la producción de Ozono.

\[0.3315\;>\;0.05\]

Humedad: En este caso el coeficiente de regresión estimado para el % de humedad es de -0.9153, lo que sugiere que un aumento del 1% en la humedad media registrada en la ciudad de Cali se asocia con una disminución de -0.9153 ug/m3 en la producción del contaminante Ozono, manteniendo constantes las demás variables del modelo. Además, el valor p para esta variable es de 3.00e-09, lo que indica que es estadísticamente significativo a un nivel de significancia del 5%. Esto significa que hay suficiente evidencia para rechazar la hipótesis nula de que el coeficiente de regresión para el % de humedad es igual a cero. En consecuencia, podemos afirmar que % de humedad tiene un efecto significativo sobre la producción de Ozono.

\[3.00*e^{-09}\;<\;0.05\]

Radiación solar: En el modelo presentado, la variable de radiación solar tiene un coeficiente de regresión estimado de 0.0869 y un valor p de 3.52e-10. Esto indica que, en promedio, un aumento de 1 Watt/M2 en la proporción de radiación solar emitida se asocia con un aumento de aproximadamente 0.0869 ug/m3 en la producción del contaminante Ozono, manteniendo todas las demás variables constantes. Por lo tanto, dado que el valor-p es menor que 0.05, podemos rechazar la hipótesis nula de que el coeficiente de regresión sea igual a cero y, por lo tanto, se puede concluir que esta variable tiene un efecto significativo en la producción de Ozono.

\[3.52*e^{-10}\;<\;0.05\]

Precipitación: Para esta variable el coeficiente de regresión es de 0.2319, lo cual indica que, manteniendo constantes todas las otras variables predictorias, un aumento de 1 mm en el nivel de precipitación medido para la ciudad de Cali se asocia con una aumento de 0.2319 ug/m3 en la producción del contaminante Ozono. Tal como se puede observar, este resultado contradice las afirmaciones realizadas en el apartado de presentación de las variables, donde a un mayor nivel de precipitación se genera una mayor producción de Ozono, sin embargo, como el valor p (0.6591) para esta variable es mayor a 0.05 se concluye que no es estadísticamente significativa. Dicho lo anterior, no se pueden respaldar los resultados obtenidos en este apartado y por lo tanto se puede interpretar que el nivel de precipitación o lluvias medido en la ciudad de Cali no tiene una relación significativa con la producción de Ozono en este modelo.

\[0.659087\;>\;0.05\]

Análisis de supuestos

El análisis de supuestos en el contexto de modelos estadísticos, se refiere al proceso de evaluación y comprobación de las cuatro condiciones necesarias para que el modelo sea válido y confiable en la inferencia estadística que se desea aplicar sobre la población de interés. Por lo tanto, es necesario realizar ciertas verificaciones para comprobar que los datos muestrales cumplen con las condiciones necesarias para determinar, a partir de estos, propiedades generales de una población estadística.

Estas condiciones son los supuestos de: Linealidad de la relación entre las variables, normalidad de los residuos, homogeneidad de varianzas e independencia de los errores. Si alguno de estos supuestos no se cumplen, los resultados del modelo pueden ser incorrectos o engañosos, lo que puede llevar a decisiones equivocadas o inexactas. Por lo cual no se podría concluir acerca de las características de la población general pero sí sobre las características del grupo de estudio del cual se tomaron las muestras.

Supuesto de linealidad

Gráfico - Residuales vs. Ajustados

Este primer supuesto establece que la relación entre la variable dependiente y las variables independientes es lineal. Es decir, que se espera que el cambio en la variable dependiente sea proporcional a los cambios en las variables independientes, y que esta relación entre variables pueda ser descrita mediante una recta en un gráfico de residuos como el presentado.

A partir de este gráfico podemos observar que los residuos parecen estar distribuidos aleatoriamente alrededor de cero, lo cual podría sugerir que el modelo se ajusta bien a los datos dado que no se presentan formas no aleatorias en la distribución de los residuos, como una curva en forma de U o una línea diagonal. Sin embargo, para tener mayor certeza acerca de esta afirmación se procederá a realizar la prueba de ANOVA en la siguiente pestaña.

# Crear un data frame de ejemplo
df <- data.frame(
  fitted.values = modelo_st$fitted.values,
  residuals = modelo_st$residuals
)

# Crear el gráfico interactivo
grafico_linealidad <- plot_ly(data = df, x = ~fitted.values, y = ~residuals, type = "scatter", mode = "markers", name = "Puntos")

# Agregar línea de referencia en y = 0
grafico_linealidad <- add_trace(grafico_linealidad, x = ~fitted.values, y = ~0, type = "scatter", mode = "lines", line = list(color = "red", dash = "dash"), name = "Línea de referencia")

# Personalizar etiquetas de los ejes
grafico_linealidad <- layout(grafico_linealidad, xaxis = list(title = "Valores ajustados"), yaxis = list(title = "Residuales")) 

# Eliminar la leyenda
grafico_linealidad <- layout(grafico_linealidad, showlegend = FALSE)

# Mostrar el gráfico interactivo
grafico_linealidad

Prueba - ANOVA

Hipótesis a probar:

\[ H_{0}:β_{0}+β_{1}+β_{2}+..+β_{k}=0 \] \[ H_{1}:β_{j}≠0,\;\text{ Para al menos un j}\]

Se rechaza \(H_{0}\) si:

\[ Valor-p\;<\;Alpha\]

Siendo Alpha el nivel de significancia, cuyo valor es del 5% → (0.05). De tal modo tenemos entonces que:

# Extraer el valor p
p_valor <- "< 2.2e-16"

# Mostrar el valor p
cat("El valor p es:", format(p_valor, scientific = TRUE, digits = 4), "\n")

## El valor p es: < 2.2e-16

Por lo tanto:

\[2.2*e^{-16}\;<\;0.05\]

De esta forma, se concluye entonces que se rechaza \(H_{0}\) y acetptamos \(H_{1}\), lo cual implica que existe al menos un \(β\) diferente de 0. Por lo tanto se cumple el supuesto de linealidad y nuestro análisis del gráfico de residuos fue correcto.

Supuesto de normalidad

Gráfico #1 - histograma

Este supuesto establece que los valores residuales, que son la diferencia entre los valores observados y los valores predichos por el modelo, deben seguir una distribución normal. Si los residuos no siguen una distribución normal, es posible que el modelo no sea apropiado y que las inferencias basadas en el modelo sean inexactas .

Dicho lo anterior, si los residuos siguen una distribución normal, el histograma debería tener una forma de campana simétrica, es decir, una forma de distribución Gaussiana. Por otro lado, si los residuos no siguen una distribución normal, el histograma puede tener diferentes formas. Como por ejemplo este caso, donde los residuos tienen una distribución sesgada a la derecha ya que el gráfico presenta una cola más larga de este lado. Por lo tanto se infiere que el modelo no se ajusta bien a los datos y que el supuesto de normalidad probablemente no se esté cumpliendo. A esto se le suma el hecho de que el gráfico Cuantil - Cuantil también presenta indicios de no normalidad dado que las colas se despegan de la línea en los extremos de la gráfica.

Sin embargo, para tener mayor certeza acerca de esta afirmación se procederá a realizar la prueba Shapiro - Wilk en la última pestaña.

# Crear un data frame con los residuos del modelo
residuos_df <- data.frame(residuos = modelo_st$residuals)

# Crear el histograma con ggplot2
x <- ggplot(residuos_df, aes(x = residuos, fill = after_stat(count))) + 
  geom_histogram(color = "black", alpha = 0.5) +
  scale_fill_gradient(low = "blue", high = "red") +
  labs(tittle = "Histograma de los residuales", x = "Residuos", y = "Frecuencia") +
  theme_bw()

ggplotly(x)

Gráfico #2 - Densidad

Sin embargo, para tener mayor certeza acerca de esta afirmación se procederá a realizar la prueba Shapiro - Wilk en la última pestaña.

# Crear un data frame con los residuos del modelo
residuos_df <- data.frame(residuos = modelo_st$residuals)

# Crear el gráfico de densidad con ggplot2
densidad <- ggplot(residuos_df, aes(x = residuos)) + 
  geom_density(fill = "#69b3a2", alpha = 0.5, color = "#e9ecef") +
  geom_vline(xintercept = 0, color = "red") +
  labs(x = "Residuos", y = "Densidad") +
  theme_bw()

# Convertir el gráfico a plotly
ggplotly(densidad)

Gráfico #3 - Cuantil ~ Cuantil

Sin embargo, para tener mayor certeza acerca de esta afirmación se procederá a realizar la prueba Shapiro - Wilk en la última pestaña.

# Crear un data frame con los residuos del modelo
residuos_df <- data.frame(residuos = modelo_st$residuals)

# Crear el gráfico Q-Q con ggplot2
qq <- ggplot(residuos_df, aes(sample = residuos)) + 
  geom_qq(color = "blue") +
  geom_qq_line(color = "red") +
  labs(x = "Cuantiles teóricos", y = "Cuantiles muestrales") +
  theme_bw()

# Convertir el gráfico a plotly
qq_interactivo <- ggplotly(qq)

# Mostrar el gráfico interactivo
qq_interactivo

Prueba - Shapiro ~ Wilk

Hipótesis a probar:

\[ H_{0}:\text{ Hay normalidad.}\] \[ H_{1}:\text{No hay normalidad.}\]

Se rechaza \(H_{0}\) si:

\[ Valor-p\;<\;Alpha\]

Siendo Alpha el nivel de significancia, cuyo valor es del 5% → (0.05). De tal modo tenemos entonces que:

shapiro.test(modelo_st$residuals)

## 
##  Shapiro-Wilk normality test
## 
## data:  modelo_st$residuals
## W = 0.98806, p-value = 0.133

Por lo tanto:

\[0.133\;>\;0.05\]

A pesar de lo argumentado anteriormente y dado el resultado de la prueba Shapiro ~ Wilk, se concluye entonces que se acepta \(H_{0}\) y rechazamos \(H_{1}\), lo cual implica que hay normalidad. Por lo tanto se cumple el supuesto de normalidad y nuestro análisis visual de los gráficos de histograma, densidad y cuantil-cuantil no reflejó la realidad en este caso.

Supuesto de homocedasticidad

Gráfico - Residuales vs. Ajustados

El supuesto de homocedasticidad se refiere a la igualdad de la varianza de los errores de predicción a través de los diferentes niveles de las variables independientes. En otras palabras, cuando los errores tienen una varianza constante a lo largo del rango de los valores de las variables independientes, se cumple el supuesto de homocedasticidad. Esto es importante porque si los errores tienen una varianza diferente para diferentes valores de las variables independientes, la precisión de las predicciones puede ser inconsistente y la estimación de los coeficientes de regresión pueden ser sesgados.

Tal como se puede observar en la gráfica de Residuales vs. Ajustados, no todos los puntos se encuentran orbitando homogéneamente alrededor de 0, debido a que hay valores que no están orbitando constantemente en torno a la linea central y parece que tienden a abrirse. Sin embargo, para tener mayor certeza acerca de esta afirmación se procederá a realizar la prueba Breusch - Pagan en la siguiente pestaña.

# Crear un data frame de ejemplo
df <- data.frame(
  fitted.values = modelo_st$fitted.values,
  residuals = modelo_st$residuals
)

# Crear el gráfico interactivo
grafico_linealidad <- plot_ly(data = df, x = ~fitted.values, y = ~residuals, type = "scatter", mode = "markers", name = "Puntos")

# Agregar línea de referencia en y = 0
grafico_linealidad <- add_trace(grafico_linealidad, x = ~fitted.values, y = ~0, type = "scatter", mode = "lines", line = list(color = "red", dash = "dash"), name = "Línea de referencia")

# Personalizar etiquetas de los ejes
grafico_linealidad <- layout(grafico_linealidad, xaxis = list(title = "Valores ajustados"), yaxis = list(title = "Residuales")) 

# Eliminar la leyenda
grafico_linealidad <- layout(grafico_linealidad, showlegend = FALSE)

# Mostrar el gráfico interactivo
grafico_linealidad

Prueba - Breusch ~ Pagan

Hipótesis a probar:

\[ H_{0}:\text{ Hay varianza constante.}\] \[ H_{1}:\text{ No hay varianza constante.}\]

Se rechaza \(H_{0}\) si:

\[ Valor-p\;<\;Alpha\]

Siendo Alpha el nivel de significancia, cuyo valor es del 5% → (0.05). De tal modo tenemos entonces que:

bptest(modelo_st)

## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_st
## BP = 4.7272, df = 6, p-value = 0.5793

Por lo tanto:

\[0.5793\;>\;0.05\]

De esta forma, se concluye entonces que se acepta \(H_{0}\) y rechazamos \(H_{1}\), lo cual implica que hay varianza constante. Por lo tanto se cumple el supuesto de homocedasticidad y nuestro análisis del gráficos de Residuales vs. Ajustados fue incorrecto.

Supuesto de independencia

Análisis de residuos

En el análisis de series de tiempo, uno de los supuestos clave es el de la independencia de las observaciones. Este supuesto establece que cada punto de datos en la serie de tiempo es independiente de los demás, lo que significa que no hay relación sistemática o dependencia entre ellos. En un contexto de series de tiempo, la independencia implica que la información contenida en una observación no proporciona ninguna pista o indicio sobre el valor de la siguiente observación. En otras palabras, los valores pasados de la serie no deberían influir en los valores futuros una vez que se han considerado todas las otras variables relevantes.

invisible(capture.output({checkresiduals(modelo_st); NULL}))

Complementando esta idea, la evaluación de los gráficos generados por la función checkresiduals nos permite investigar si se cumplen estos supuestos de independencia. El gráfico de residuos estandarizados nos ayuda a identificar patrones sistemáticos o no aleatorios en los residuos, lo que podría indicar la presencia de dependencia o autocorrelación en los datos. Por otro lado, el histograma de residuos nos proporciona información sobre la distribución de los residuos y nos permite evaluar si siguen una distribución normal. Cualquier desviación de la normalidad podría sugerir la presencia de dependencia o patrones sistemáticos. Finalmente, el gráfico de cuantiles normales nos permite comparar los cuantiles de los residuos con los cuantiles de una distribución normal estándar. Si los puntos siguen una línea recta, esto respalda el supuesto de independencia y normalidad de los residuos.

Interpretación de los gráficos:

Gráfico de residuos estandarizados: El gráfico de residuos estandarizados muestra que los residuos suben y bajan de forma aleatoria, sin exhibir patrones sistemáticos. Esta aparente aleatoriedad sugiere que no hay una relación clara o dependencia entre las observaciones y respalda el supuesto de independencia en el análisis de series de tiempo.
Histograma de residuos: El histograma muestra una forma de campana gaussiana, lo cual indica una distribución aproximadamente normal de los residuos. Sin embargo, se observa que la cola del lado derecho es más larga, lo que sugiere una asimetría hacia valores más altos. Esto puede indicar la presencia de valores atípicos o alguna estructura en los datos que está causando una desviación de la normalidad.
Gráfico de cuantiles normales: En el gráfico de cuantiles normales, se observa que la mayoría de las líneas están inclinadas hacia arriba y son relativamente largas. Esta distribución sugiere que los residuos tienen una tendencia a tener valores más altos que los esperados bajo una distribución normal. Por otro lado, la presencia de pocas líneas inclinadas hacia abajo y cortas indica que hay pocos residuos con valores más bajos de lo esperado. Esta desviación del comportamiento esperado en una distribución normal puede indicar una falta de normalidad en los residuos.

Prueba Breusch ~ Godfrey

Hipótesis a probar:

\[ H_{0}:\text{ No existe correlación serial.}\] \[ H_{1}:\text{ Existe correlación serial.}\]

Se rechaza \(H_{0}\) si:

\[ Valor-p\;<\;Alpha\]

Siendo Alpha el nivel de significancia, cuyo valor es del 5% → (0.05). De tal modo tenemos entonces que:

checkresiduals(modelo_st, plot = FALSE)

## 
##  Breusch-Godfrey test for serial correlation of order up to 10
## 
## data:  Residuals from Linear regression model
## LM test = 24.26, df = 10, p-value = 0.006938

Por lo tanto:

\[0.006938\;<\;0.05\]

De esta forma, se concluye entonces que se rechaza \(H_{0}\) y aceptamos \(H_{1}\), lo cual implica que existe correlación serial. Por lo tanto no se cumple el supuesto de independencia y nuestro análisis del histograma de residuos y del grafico de cuantiles normales fue acertado al observar posibles anormalidades dentro de la serie temporal.

Resultados principales

Resultado #1 - Estación de verano

Los primeros escenarios evaluados corresponde a los generados por la estación seca de verano que experimenta la ciudad de Cali durante parte del año. Esta estación suele coincidir con los meses de junio a septiembre, cuando la precipitación es más baja y las condiciones son relativamente más soleadas. Durante este período, la ciudad puede experimentar temperaturas más altas y una menor probabilidad de lluvia.

# Definición del escenario 1 con valores de variables
escenario1 <- data.frame(Vel_viento = c(1.80, 2.05, 2.19),
                         Dir_viento = c(94.28, 131.53, 145.71),
                         Temp. = c(31.68, 30.27, 29.80),
                         Humedad = c(42.50, 50.23, 51.62),
                         Rad_solar = c(232.82, 145.66, 128.32),
                         Lluvia = c(0.00, 0.16, 0.35))

# Obtención de las predicciones del modelo para el escenario 1
predicciones <- predict(modelo_st, escenario1)

# Definición de los nombres de los escenarios
escenarios <- c("Escenario 1 - Verano Extremo", "Escenario 2 - Verano Intenso", "Escenario 3 - Verano Moderado")

# Creación de la tabla de predicciones
tabla_predicciones <- data.frame(Predicción_de_escenarios = escenarios, Produccion_de_Ozono = predicciones)

# Generación de la tabla con formato HTML
tabla_predicciones <- tabla_predicciones %>%
  rename(" " = Predicción_de_escenarios, "Prediccion de la Produccion de Ozono (ug/m3)" = Produccion_de_Ozono) %>%
  kable(format = "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>% 
  column_spec(1, bold = TRUE, color = "white", background = "#3498DB", width = "20%") %>% 
  column_spec(2, width = "20%") %>% 
  row_spec(0, bold = TRUE, color = "white", background = "#3498DB", align = "c") %>% 
  row_spec(1:nrow(tabla_predicciones), align = "c")

# Mostrar la tabla de predicciones
tabla_predicciones

	Prediccion de la Produccion de Ozono (ug/m3)
Escenario 1 - Verano Extremo	55.24702
Escenario 2 - Verano Intenso	40.66137
Escenario 3 - Verano Moderado	37.82248

Al analizar los resultados obtenidos para los diferentes escenarios en la predicción de la producción de ozono en la ciudad de Cali durante la estación de verano, se puede proporcionar una explicación más detallada de por qué se seleccionaron cada conjunto de valores para las variables independientes. A continuación se presentan los resultados obtenidos:

Escenario 1: En este escenario de verano extremo, se seleccionaron valores que representan condiciones climáticas intensas y propias de la estación seca. Se eligió una velocidad del viento baja (1.80 m/s) para indicar condiciones de calma y estabilidad atmosférica. La dirección del viento (94.28 grados) fue elegida específicamente para representar una dirección común en la estación de verano en Cali. La temperatura se estableció en un nivel alto (31.68 °C) para simbolizar las altas temperaturas típicas de esta estación. La humedad se mantuvo moderada (42.50%) para reflejar la disminución de la humedad relativa durante el verano. La radiación solar se estableció en un nivel alto (232.82 W/m²) para representar la fuerte irradiación solar que ocurre durante esta estación. Finalmente, se consideró una lluvia prácticamente nula (0.00 mm) para reflejar la falta de precipitación durante la estación seca. Estas condiciones extremas dieron como resultado una producción de ozono de 55.24702 (ug/m3).

Escenario 2: En este escenario, se buscaron condiciones de verano menos extremas pero aún significativas. Se seleccionaron valores ligeramente más altos para la velocidad del viento (2.05 m/s) y la dirección del viento (131.53 grados), que todavía reflejan la calma y la dirección predominante del viento en la estación de verano en Cali. La temperatura se redujo ligeramente (30.27 °C) para indicar una moderación del calor intenso. La humedad se incrementó a un nivel ligeramente más alto (50.23%) para reflejar un aumento relativo durante esta temporada. La radiación solar disminuyó ligeramente (145.66 W/m²) para indicar una menor intensidad de la radiación, aunque sigue siendo alta en comparación con otras estaciones. Además, se incluyó una lluvia de 0.16 mm para representar la posibilidad de precipitación ocasional. Estas condiciones resultaron en una producción de ozono de 40.66137 (ug/m3).

Escenario 3: En este escenario, se consideraron condiciones de verano más moderadas. Se utilizó una velocidad del viento ligeramente más alta (2.19 m/s) para indicar una mayor ventilación atmosférica. La dirección del viento (145.71 grados) fue elegida para reflejar una variación en la dirección predominante. La temperatura se redujo aún más (29.80 °C) para indicar un nivel más moderado de calor. La humedad se incrementó a un nivel más alto (51.62%) para reflejar una mayor humedad relativa durante esta temporada. La radiación solar disminuyó aún más (128.32 W/m²) para indicar una disminución de la intensidad solar en comparación con escenarios anteriores. Además, se incluyó una lluvia de 0.35 mm para representar una posible precipitación. Estas condiciones más moderadas resultaron en una producción de ozono de 37.82248 (ug/m3).

- En conclusión…

Finalmente, estos resultados resaltan la importancia de considerar las condiciones climáticas y meteorológicas al analizar la producción de ozono en la ciudad de Cali. Cada escenario representa un conjunto específico de variables que influyen en los procesos atmosféricos relacionados con la formación y degradación del ozono. A medida que se simulan diferentes condiciones climáticas, se observa una variación en la producción de ozono, lo que subraya la complejidad de este fenómeno. Estos hallazgos proporcionan información crucial para la toma de decisiones en la gestión de la calidad del aire y resaltan la necesidad de considerar los cambios estacionales y las características geográficas al abordar la problemática de la contaminación atmosférica en Cali.

Resultado #2 - Clima tropical húmedo

Los siguientes cuatro escenarios se representarán teniendo en cuenta que Cali se encuentra en una región tropical y, por lo tanto, experimenta un clima cálido y húmedo durante la mayor parte del año. Las temperaturas suelen ser altas, con promedios anuales superiores a los 28 °C. Además, la humedad relativa es generalmente elevada, lo que contribuye a una sensación de bochorno en la ciudad.

# Definición del escenario 2 con valores de variables
escenario2 <- data.frame(Vel_viento = c(2.16, 2.45, 2.49, 2.76),
                         Dir_viento = c(202.22, 208.36, 215.04, 227.92),
                         Temp. = c(28.24, 28.40, 28.62, 29.10),
                         Humedad = c(56.55, 57.09, 58.40, 64.24),
                         Rad_solar = c(99.84, 102.74, 104.30, 123.99),
                         Lluvia = c(0.29, 0.40, 1.08, 1.26))

# Obtención de las predicciones del modelo para el escenario 2
predicciones <- predict(modelo_st, escenario2)

# Definición de los nombres de los escenarios
escenarios <- c("Escenario 4 - Tropical Cálido", "Escenario 5 - Tropical Ventoso", "Escenario 6 - Tropical intermedio", "Escenario 7 - Tropical Moderado")

# Creación de la tabla de predicciones
tabla_predicciones <- data.frame(Predicción_de_escenarios = escenarios, Produccion_de_Ozono = predicciones)

# Generación de la tabla con formato HTML
tabla_predicciones <- tabla_predicciones %>%
  rename(" " = Predicción_de_escenarios, "Prediccion de la Produccion de Ozono (ug/m3)" = Produccion_de_Ozono) %>%
  kable(format = "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>% 
  column_spec(1, bold = TRUE, color = "white", background = "#3498DB", width = "20%") %>% 
  column_spec(2, width = "20%") %>% 
  row_spec(0, bold = TRUE, color = "white", background = "#3498DB", align = "c") %>% 
  row_spec(1:nrow(tabla_predicciones), align = "c")

# Mostrar la tabla de predicciones
tabla_predicciones

	Prediccion de la Produccion de Ozono (ug/m3)
Escenario 4 - Tropical Cálido	31.16309
Escenario 5 - Tropical Ventoso	30.30528
Escenario 6 - Tropical intermedio	29.11887
Escenario 7 - Tropical Moderado	24.63879

Al analizar los resultados obtenidos para estos nuevos escenarios relacionados a un clima tropical húmedo en la predicción de la producción de ozono en la ciudad de Cali, se puede proporcionar una explicación detallada de por qué se seleccionaron cada conjunto de valores para las variables independientes. A continuación se presentan los resultados obtenidos:

Escenario 4: En este escenario de clima tropical húmedo, se seleccionaron valores que representan las condiciones climáticas características de esta región. La velocidad del viento se estableció en 2.16 m/s, lo cual indica una ventilación moderada. La dirección del viento (202.22 grados) fue elegida para representar una dirección común en este tipo de clima. La temperatura se mantuvo en un nivel cálido (28.24 °C), que es típico de las temperaturas promedio en esta región. La humedad relativa se estableció en un nivel elevado (56.55%), lo que refleja la humedad característica del clima tropical húmedo. La radiación solar se redujo a 99.84 W/m², indicando una menor intensidad de la radiación en comparación con los escenarios anteriores. Además, se incluyó una lluvia de 0.29 mm para reflejar la precipitación común en esta región. Estas condiciones resultaron en una producción de ozono de 31.16309 (ug/m3).

Escenario 5: En este escenario, se seleccionaron valores ligeramente diferentes para las variables climáticas y meteorológicas del clima tropical húmedo. La velocidad del viento se incrementó ligeramente a 2.45 m/s, lo que indica una mayor ventilación. La dirección del viento (208.36 grados) se ajustó para reflejar una variación en la dirección predominante. La temperatura se mantuvo en un nivel similar (28.40 °C) para representar la persistencia del clima cálido en esta región. La humedad relativa se elevó ligeramente a 57.09%, reflejando el ambiente húmedo característico. La radiación solar también aumentó ligeramente a 102.74 W/m², indicando una mayor intensidad solar en comparación con el escenario anterior. Además, se incluyó una lluvia de 0.40 mm para representar una posible precipitación adicional. Estas condiciones resultaron en una producción de ozono de 30.30528 (ug/m3).

Escenario 6: En este escenario, se mantuvieron las condiciones generales del clima tropical húmedo, pero con algunas modificaciones. La velocidad del viento se estableció en 2.49 m/s para indicar una mayor ventilación atmosférica. La dirección del viento (215.04 grados) se modificó nuevamente para representar una variación en la dirección predominante. La temperatura se mantuvo en un nivel cálido (28.62 °C), aunque ligeramente más bajo que en escenarios anteriores. La humedad relativa se elevó a 58.40%, reflejando un aumento en la humedad atmosférica. La radiación solar se redujo a 104.30 W/m², indicando una menor intensidad de la radiación solar. Además, se incluyó una lluvia de 1.08 mm para representar una precipitación más significativa. Estas condiciones resultaron en una producción de ozono de 29.11887 (ug/m3).

Escenario 7: En este último escenario, se seleccionaron valores que representan condiciones más moderadas dentro del clima tropical húmedo. La velocidad del viento se incrementó a 2.76 m/s, lo que indica una mayor ventilación atmosférica. La dirección del viento (227.92 grados) se ajustó nuevamente para reflejar una variación en la dirección predominante. La temperatura se mantuvo en un nivel cálido (29.10 °C), aunque ligeramente más alta que en los escenarios anteriores. La humedad relativa se elevó a 64.24%, reflejando un ambiente más húmedo. La radiación solar aumentó a 123.99 W/m², indicando una mayor intensidad de la radiación solar. Además, se incluyó una lluvia de 1.26 mm para representar una precipitación adicional. Estas condiciones más moderadas resultaron en una producción de ozono de 24.63879 (ug/m3).

- En conclusión…

En el escenario de clima tropical húmedo, Cali se ve influenciada por condiciones climáticas distintivas que incluyen una mayor humedad relativa, temperaturas cálidas, radiación solar moderada y la presencia de lluvias durante la temporada de verano. Estas características climáticas contribuyen a una producción de ozono ligeramente más baja en comparación con el escenario de clima seco y cálido. La mayor humedad relativa crea un entorno propicio para la formación de ozono, mientras que las temperaturas cálidas y la radiación solar moderada promueven las reacciones químicas que generan ozono. Sin embargo, la presencia de lluvias en este escenario reduce la concentración de ozono en el aire al favorecer la dispersión y la deposición de contaminantes. En conjunto, estos factores climáticos en el contexto del clima tropical húmedo en Cali influyen en la calidad del aire y la producción de ozono, resaltando la importancia de considerar las condiciones meteorológicas locales al evaluar y gestionar la calidad del aire en la ciudad durante la temporada de verano.

Resultado #3 - Temporada de Lluvias

Finalmente, para estos escenarios se consideró que Cali también tiene una estación lluviosa, que generalmente abarca los meses de octubre a mayo. Durante este período, la precipitación es más frecuente y las lluvias pueden ser intensas. La ciudad experimenta una mayor humedad y las temperaturas pueden ser ligeramente más bajas debido a la presencia de nubosidad y precipitación.

# Definición del escenario 3 con valores de variables
escenario3 <- data.frame(Vel_viento = c(2.84, 3.02, 3.82),
                         Dir_viento = c(243.08, 249.94, 279.91),
                         Temp. = c(26.67, 26.10, 24.22),
                         Humedad = c(64.83, 68.65, 73.03),
                         Rad_solar = c(67.13, 54.37, 30.33),
                         Lluvia = c(0.64, 1.51, 5.29))

# Obtención de las predicciones del modelo para el escenario 3
predicciones <- predict(modelo_st, escenario3)

# Definición de los nombres de los escenarios
escenarios <- c("Escenario 8 - Temporada de Lluvias", "Escenario 9 - Precipitación persistente", "Escenario 10 - Precipitación extrema")

# Creación de la tabla de predicciones
tabla_predicciones <- data.frame(Predicción_de_escenarios = escenarios, Produccion_de_Ozono = predicciones)

# Generación de la tabla con formato HTML
tabla_predicciones <- tabla_predicciones %>%
  rename(" " = Predicción_de_escenarios, "Prediccion de la Produccion de Ozono (ug/m3)" = Produccion_de_Ozono) %>%
  kable(format = "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>% 
  column_spec(1, bold = TRUE, color = "white", background = "#3498DB", width = "20%") %>% 
  column_spec(2, width = "20%") %>% 
  row_spec(0, bold = TRUE, color = "white", background = "#3498DB", align = "c") %>% 
  row_spec(1:nrow(tabla_predicciones), align = "c")

# Mostrar la tabla de predicciones
tabla_predicciones

	Prediccion de la Produccion de Ozono (ug/m3)
Escenario 8 - Temporada de Lluvias	20.21044
Escenario 9 - Precipitación persistente	15.78771
Escenario 10 - Precipitación extrema	10.08162

Al analizar los resultados obtenidos para los diferentes escenarios en la predicción de la producción de ozono en la ciudad de Cali durante la temporada de lluvias, se puede proporcionar una explicación más detallada de por qué se seleccionaron cada conjunto de valores para las variables independientes. A continuación se presentan los resultados obtenidos:

Escenario 8: En este escenario de la temporada de lluvias en Cali, se seleccionaron valores que reflejan las condiciones climáticas características durante este período. La velocidad del viento se estableció en 2.84 m/s, lo cual indica una ventilación moderada en medio de las lluvias. La dirección del viento (243.08 grados) fue elegida para representar una dirección común en esta temporada. La temperatura se mantuvo en un nivel cálido (26.67 °C), ligeramente más bajo debido a la presencia de nubosidad y precipitación. La humedad relativa se incrementó a 64.83%, reflejando el ambiente húmedo típico de la temporada de lluvias. La radiación solar disminuyó a 67.13 W/m², indicando una menor intensidad de la radiación debido a la presencia de nubes. Además, se incluyó una lluvia de 0.64 mm para reflejar la precipitación común en esta época del año. Estas condiciones resultaron en una producción de ozono de 20.21044 (ug/m3).

Escenario 9: En este escenario, se seleccionaron valores ligeramente diferentes para las variables climáticas y meteorológicas durante la temporada de lluvias en Cali. La velocidad del viento se incrementó ligeramente a 3.02 m/s, indicando una mayor ventilación en medio de las lluvias. La dirección del viento (249.94 grados) se ajustó para reflejar una variación en la dirección predominante en esta época del año. La temperatura se mantuvo en un nivel similar (26.10 °C) para representar la persistencia del clima cálido, aunque ligeramente más bajo debido a la influencia de las lluvias. La humedad relativa se elevó ligeramente a 68.65%, reflejando el ambiente húmedo característico de la temporada de lluvias. La radiación solar también disminuyó a 54.37 W/m², indicando una menor intensidad solar debido a la presencia de nubes. Además, se incluyó una lluvia de 1.51 mm para representar una posible precipitación adicional. Estas condiciones resultaron en una producción de ozono de 15.78771 (ug/m3).

Escenario 10: En este último escenario, se seleccionaron valores que representan condiciones más pronunciadas durante la temporada de lluvias en Cali. La velocidad del viento se incrementó a 3.82 m/s, lo que indica una mayor ventilación atmosférica en medio de las intensas lluvias. La dirección del viento (279.91 grados) se ajustó nuevamente para reflejar una variación en la dirección predominante durante esta época del año. La temperatura se mantuvo en un nivel cálido (24.22 °C), ligeramente más bajo debido a la influencia de las lluvias y la nubosidad. La humedad relativa se elevó a 73.03%, reflejando un ambiente más húmedo durante la temporada de lluvias. La radiación solar disminuyó significativamente a 30.33 W/m², indicando una menor intensidad de la radiación solar debido a la presencia de nubes y precipitación. Además, se incluyó una lluvia más significativa de 5.29 mm para representar una precipitación adicional. Estas condiciones más pronunciadas resultaron en una producción de ozono de 10.08162 (ug/m3).

- En conclusión…

En el escenario de la temporada de lluvias, Cali experimenta un aumento en la humedad relativa, temperaturas ligeramente más bajas debido a la presencia de nubosidad y precipitación, y una reducción significativa en la intensidad de la radiación solar. Estas condiciones climáticas contribuyen a una producción de ozono aún más baja en comparación con los escenarios anteriores. La mayor humedad relativa favorece la dispersión de los contaminantes, mientras que las temperaturas más frescas y la menor radiación solar limitan las reacciones químicas que generan ozono. La presencia de lluvia también juega un papel importante al lavar los contaminantes del aire. Estos factores combinados en el escenario de la temporada de lluvias influyen en la calidad del aire y la producción de ozono en Cali durante este período, destacando la importancia de considerar los cambios estacionales y sus efectos en la gestión de la calidad del aire.

Conclusiones

I.

En el contexto de la estación seca de verano en Cali, es esencial profundizar en los resultados obtenidos para comprender mejor cómo las variables climáticas y meteorológicas afectan la producción de ozono y la calidad del aire en la ciudad.

En primer lugar tenemos que los escenarios extremos de verano, con altas temperaturas, baja velocidad del viento, dirección predominante del viento y radiación solar intensa, muestran una mayor concentración de ozono en el aire. Estas condiciones favorables para la formación de ozono pueden generar niveles más altos de contaminación atmosférica. Las altas temperaturas aceleran las reacciones químicas que generan ozono a partir de los precursores presentes en la atmósfera. Además, la baja velocidad del viento y la dirección predominante pueden contribuir a la acumulación de contaminantes en áreas específicas de la ciudad, lo que aumenta la concentración de ozono.

En contraste, los escenarios con condiciones más moderadas, como temperaturas más suaves, mayor velocidad del viento, incremento en la humedad relativa y menor intensidad de la radiación solar, muestran una disminución en la producción de ozono. Estas condiciones atmosféricas pueden limitar las reacciones químicas y la acumulación de contaminantes en la atmósfera. La mayor velocidad del viento favorece la dispersión de los precursores del ozono, dificultando su acumulación. Además, el incremento en la humedad relativa puede afectar la disponibilidad de los precursores químicos y reducir la formación de ozono. La disminución en la intensidad de la radiación solar también puede limitar las reacciones fotoquímicas que generan ozono.

Finalmente, es importante destacar que la estación seca de verano en Cali se caracteriza por la escasez de lluvias, lo que puede tener un impacto en la producción de ozono. La falta de precipitación durante esta temporada limita la capacidad de lavado atmosférico, lo que significa que los contaminantes, incluido el ozono, pueden acumularse en la atmósfera durante períodos prolongados. Sin embargo, los escenarios específicos considerados en el análisis no mencionan explícitamente la presencia o ausencia de lluvias, por lo que no es posible evaluar su influencia directa en los resultados.

En resumen, los resultados de los escenarios de producción de ozono durante la estación seca de verano en Cali enfatizan la importancia de considerar las variables climáticas y meteorológicas al analizar la calidad del aire. Las altas temperaturas, la velocidad y dirección del viento, la humedad relativa y la radiación solar son factores clave que influyen en la producción de ozono. Estos hallazgos subrayan la necesidad de implementar estrategias de mitigación de la contaminación atmosférica y de promover prácticas sostenibles en la ciudad para mantener una buena calidad del aire durante la estación seca de verano.

II.

En el contexto de un clima tropical húmedo, como el de la ciudad de Cali, es importante profundizar en los resultados obtenidos para comprender mejor cómo las variables climáticas y meteorológicas influyen en la producción de ozono y en la calidad del aire en la región.

La velocidad Y dirección del viento son factores cruciales que afectan la producción de ozono. Se ha observado que un aumento en la velocidad del viento y una mayor ventilación atmosférica tienden a disminuir la concentración de ozono. Esto se debe a que un mayor movimiento del aire facilita la dispersión de los contaminantes y reduce la probabilidad de que ocurran reacciones químicas que generen ozono. Por otro lado, diferentes patrones de circulación atmosférica pueden influir en la formación y acumulación de ozono, lo que resalta la importancia de comprender los patrones locales de viento para evaluar los niveles de ozono en la ciudad de Cali.

La temperatura es otro factor clave en la producción de ozono. Las altas temperaturas, características del clima tropical de Cali, pueden promover la formación de ozono a través de reacciones químicas. Las altas temperaturas aceleran las reacciones entre los precursores de ozono presentes en la atmósfera, lo que lleva a una mayor producción de ozono. Es importante tener en cuenta este efecto al evaluar la calidad del aire y desarrollar estrategias de control de la contaminación.

La humedad relativa elevada en un clima tropical húmedo también influye en la producción de ozono. La humedad proporciona las condiciones adecuadas para las reacciones químicas involucradas en la formación de ozono. La presencia de una alta humedad relativa puede favorecer la producción de ozono al permitir una mayor disponibilidad de precursores químicos y facilitar las reacciones necesarias para su generación.

La radiación solar es otro factor determinante en la formación de ozono. Aunque la radiación solar disminuye en comparación con otros escenarios, sigue siendo relativamente alta en un clima tropical húmedo. La radiación solar es crucial para las reacciones fotoquímicas que generan ozono. La energía solar promueve la descomposición de los precursores de ozono y facilita su conversión en ozono. Por lo tanto, la radiación solar sigue siendo un factor importante a considerar en la producción de ozono en la ciudad de Cali.

La presencia de lluvias en un clima tropical húmedo también desempeña un papel significativo en la reducción de la concentración de ozono en el aire. La lluvia actúa como un mecanismo de limpieza atmosférica al ayudar a eliminar los contaminantes, incluido el ozono, a través de la dispersión y la deposición. Durante la temporada de lluvias, se espera una mayor eliminación de ozono y otros contaminantes, lo que puede resultar en niveles más bajos de ozono en la atmósfera.

En resumen, los resultados obtenidos en los escenarios que representan un clima tropical húmedo en Cali destacan la compleja interacción entre las variables climáticas y meteorológicas en la producción de ozono. La velocidad y dirección del viento, la temperatura, la humedad relativa, la radiación solar y la presencia de lluvias influyen en los niveles de ozono en el aire. Estos hallazgos resaltan la importancia de considerar estos factores al evaluar la calidad del aire y al desarrollar estrategias efectivas de gestión y control de la contaminación atmosférica en la ciudad de Cali durante la temporada de verano.

III.

La temporada de lluvias en Cali introduce cambios significativos en las condiciones climáticas que influyen en la producción de ozono y la calidad del aire en la ciudad. Durante este período, que generalmente abarca los meses de octubre a mayo, se observan variaciones en la velocidad y dirección del viento, temperatura, humedad relativa, radiación solar y precipitación. Estos cambios estacionales tienen un impacto directo en la formación, dispersión y eliminación de contaminantes atmosféricos, incluyendo el ozono. En conjunto, estos cambios estacionales en el clima durante la temporada de lluvias en Cali conducen a una disminución general en la producción de ozono. La mayor humedad relativa, las temperaturas ligeramente más bajas, la reducción en la intensidad de la radiación solar y la presencia de lluvias contribuyen a una menor concentración de ozono en el aire. Esto implica que durante este período, la calidad del aire en Cali puede ser mejor en términos de niveles de ozono. Dicho lo anterior se tiene que:

La mayor humedad relativa durante la temporada de lluvias crea un entorno más propicio para la dispersión de contaminantes. La humedad atmosférica afecta la reactividad química del ozono y de otros contaminantes, lo que limita su producción. Además, la humedad contribuye a la formación de nubes y a la presencia de precipitación, lo que a su vez favorece la eliminación de los contaminantes a través del lavado atmosférico. Las lluvias actúan como un mecanismo natural de limpieza al arrastrar partículas y gases presentes en el aire, incluyendo el ozono, hacia la superficie terrestre.

Las temperaturas durante la temporada de lluvias suelen ser ligeramente más bajas debido a la influencia de la nubosidad y la precipitación. Las temperaturas más frescas reducen la velocidad de las reacciones químicas que generan ozono, lo que a su vez limita su producción. Aunque las temperaturas siguen siendo cálidas en el contexto de un clima tropical húmedo, la moderación de las temperaturas contribuye a una menor formación de ozono en comparación con los períodos más secos y cálidos.

La radiación solar también experimenta cambios durante la temporada de lluvias. La presencia de nubes y la mayor cobertura de nubosidad disminuyen la intensidad de la radiación solar que alcanza la superficie terrestre. La radiación solar es un factor clave en la producción de ozono, ya que estimula las reacciones fotoquímicas que generan este contaminante. La reducción en la radiación solar durante la temporada de lluvias contribuye a una menor producción de ozono en comparación con los períodos más soleados y secos.

En términos de gestión de la calidad del aire, es fundamental tener en cuenta estos cambios estacionales al desarrollar estrategias y políticas. Durante la temporada de lluvias, es posible que se requieran medidas adicionales para controlar otros contaminantes que pueden verse menos afectados por las condiciones climáticas, como partículas finas (PM2.5) y compuestos orgánicos volátiles (COV). Asimismo, se debe considerar el monitoreo continuo de la calidad del aire para evaluar los niveles de ozono y otros contaminantes durante esta temporada y realizar ajustes en las estrategias de control y mitigación en función de los resultados obtenidos. Además, es crucial promover la conciencia pública sobre los efectos de las condiciones climáticas en la producción de ozono y fomentar prácticas individuales y colectivas que contribuyan a reducir la emisión de precursores de ozono.

IV.

Basándonos en los análisis realizados para los supuestos de normalidad, homocedasticidad, independencia y linealidad, podemos llegar a las siguientes conclusiones generales:

Supuesto de linealidad: El análisis visual del gráfico de Residuales vs. Ajustados muestra una dispersión aparentemente aleatoria de los residuos alrededor de cero, indicando una posible relación lineal entre las variables. Además, la prueba de ANOVA proporcionó evidencia significativa de que al menos uno de los coeficientes de las variables independientes es diferente de cero. Por lo tanto, se cumple el supuesto de linealidad en este caso.

Supuesto de normalidad: A pesar de que inicialmente se observaron indicios de no normalidad en los gráficos de histograma y cuantil-cuantil, la prueba de Shapiro-Wilk no proporcionó suficiente evidencia para rechazar la hipótesis nula de normalidad. Por lo tanto, se acepta que los residuos siguen una distribución normal en este caso.

Supuesto de homocedasticidad: Aunque en la inspección visual del gráfico de residuos vs. ajustados se observaron algunas desviaciones de la homocedasticidad, la prueba de Breusch-Pagan no mostró evidencia suficiente para rechazar la hipótesis nula de varianza constante. Por lo tanto, se cumple el supuesto de homocedasticidad en este análisis.

Supuesto de independencia: El análisis de los gráficos de residuos estandarizados, histograma de residuos y cuantil-cuantil sugiere la presencia de dependencia o correlación serial en los datos. Esto se confirmó mediante la prueba de Breusch-Godfrey, que rechazó la hipótesis nula de no correlación serial. Por lo tanto, no se cumple el supuesto de independencia en este caso.

En resumen, el análisis reveló que se cumple el supuesto de normalidad, homocedasticidad y linealidad, pero no se cumple el supuesto de independencia. Es importante tener en cuenta estas conclusiones al interpretar los resultados y realizar inferencias basadas en el modelo utilizado. Además, se debe considerar la posible presencia de correlación serial en los datos y tomar medidas adecuadas si es necesario, como utilizar modelos que tengan en cuenta esta dependencia o realizar ajustes adicionales en el análisis.

V.

Basándonos en los análisis realizados para los coeficientes de regresión y los valores-p en el modelo de series temporales, podemos llegar a las siguientes conclusiones generales:

Velocidad del viento: El coeficiente de regresión indica que un aumento de 1 m/s en la velocidad del viento está asociado con una disminución de -1.6161 ug/m3 en la producción de Ozono. Sin embargo, el valor-p (0.1801) no es estadísticamente significativo, lo que indica que la velocidad del viento no tiene una relación significativa con la producción de Ozono en este modelo.

Dirección del viento: El coeficiente de regresión muestra que un aumento del 1% en la dirección del viento se relaciona con una disminución de -0.0119 ug/m3 en la producción de Ozono. Sin embargo, el valor-p (0.1686) no es estadísticamente significativo, lo que sugiere que esta variable no tiene un efecto significativo en la producción de Ozono en este modelo.

Temperatura: El coeficiente de regresión indica que un aumento de 1 C° en la temperatura está asociado con una disminución de -0.6198 ug/m3 en la producción de Ozono. Sin embargo, el valor-p (0.3315) no es estadísticamente significativo, lo que implica que no se puede inferir una relación confiable entre la temperatura y la producción de Ozono en este modelo.

Humedad: El coeficiente de regresión muestra que un aumento del 1% en la humedad se relaciona con una disminución de -0.9153 ug/m3 en la producción de Ozono. Además, el valor-p (3.00e-09) es estadísticamente significativo, lo que indica que la humedad tiene un efecto significativo en la producción de Ozono en este modelo.

Radiación solar: El coeficiente de regresión indica que un aumento de 1 Watt/M2 en la radiación solar se asocia con un aumento de 0.0869 ug/m3 en la producción de Ozono. Además, el valor-p (3.52e-10) es estadísticamente significativo, lo que sugiere que la radiación solar tiene un efecto significativo en la producción de Ozono en este modelo.

Precipitación: El coeficiente de regresión muestra que un aumento de 1 mm en la precipitación está asociado con un aumento de 0.2319 ug/m3 en la producción de Ozono. Sin embargo, el valor-p (0.6591) no es estadísticamente significativo, lo que indica que el nivel de precipitación no tiene una relación significativa con la producción de Ozono en este modelo.

En resumen, en este modelo de series temporales, se encontró que la humedad y la radiación solar tienen efectos significativos en la producción de Ozono. Por otro lado, la velocidad y dirección del viento, la temperatura y la precipitación no mostraron efectos significativos en la producción de Ozono. Es importante considerar estas conclusiones al interpretar los resultados y realizar predicciones o inferencias basadas en el modelo utilizado.

Referencias bibliográficas

Modelación de los niveles de ozono promedio en el transcurso del día mediante el uso de modelos aditivos generalizados en la ciudad de Cali en la estación del Exito La Flora. Recuperado el 18 de junio de 2023, de http://chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://bibliotecadigital.univalle.edu.co/bitstream/id/cf34b159-ac43-46a2-b7b0-fc8c2c5331c4/0519905.pdf
Datos de Calidad del Aire en la Estación Compartir en Santiago de Cali - Datos Abiertos Cali. (s/f). Gov.co. Recuperado el 17 de junio de 2023, de http://datos.cali.gov.co/dataset/datos-de-calidad-del-aire-en-la-estacion-compartir-2014-a-2021-en-santiago-de-cali
¿Qué es el ozono troposférico y por qué hay que evitar su formación? (s/f). Life Heatland. Recuperado el 17 de junio de 2023, de https://heatlandlife.eu/que-es-el-ozono-troposferico-y-por-que-hay-que-evitar-su-formacion/
Pronóstico de calidad del aire para Cali, Valle del Cauca, Colombia - The Weather Channel. The Weather Channel. Recuperado el 17 de junio de 2023, de https://n9.cl/pronostico_calidad_aire_cali
Sistema de Vigilancia de Calidad del Aire de Cali - SVCAC. (s/f). Gov.co. Recuperado el 17 de junio de 2023, de https://www.cali.gov.co/dagma/publicaciones/38365/sistema_de_vigilancia_de_calidad_del_aire_de_cali_svcac/
Wikipedia contributors. (s/f). Cali. Wikipedia, The Free Encyclopedia. https://es.wikipedia.org/w/index.php?title=Cali&oldid=151897979
Lamarti, N. J. (2015). Our mandate: Branching out and bearing fruit. Createspace Independent Publishing Platform.
AQI basics. (s/f). Airnow.gov. Recuperado el 17 de junio de 2023, de https://www.airnow.gov/aqi/aqi-basics/
Ambient (outdoor) air pollution. (s/f). Who.int. Recuperado el 17 de junio de 2023, de https://acortar.link/bmhRyp

REPORTE MODELACIÓN LINEAL CON DATOS TEMPORALES

Realizado por: Diego Felipe Salcedo Granada - Analista de Datos

2023-06-23

Introducción sobre el contexto climático

Descripción de las variables

Ozono

Velocidad del viento

Dirección del viento

Temperatura

Humedad

Radiación solar

Lluvia

Presentación de la metodología

Modelo de series temporales

Prueba de bondad

Interpretación del R²:

Interpretación de los coeficientes de regresión y valores - p:

Análisis de supuestos

Supuesto de linealidad

Gráfico - Residuales vs. Ajustados

Prueba - ANOVA

Supuesto de normalidad

Gráfico #1 - histograma

Gráfico #2 - Densidad

Gráfico #3 - Cuantil ~ Cuantil

Prueba - Shapiro ~ Wilk

Supuesto de homocedasticidad

Gráfico - Residuales vs. Ajustados

Prueba - Breusch ~ Pagan

Supuesto de independencia

Análisis de residuos

Prueba Breusch ~ Godfrey

Resultados principales

Resultado #1 - Estación de verano

Resultado #2 - Clima tropical húmedo

Resultado #3 - Temporada de Lluvias

Conclusiones

I.

II.

III.

IV.

V.

Referencias bibliográficas

Realizado por:

Diego Felipe Salcedo Granada - Analista de Datos