Sinopsis

Este análisis explora la base de datos de tormentas de NOAA (1950–2011) para identificar qué tipos de eventos meteorológicos severos son más dañinos para la salud pública y cuáles generan más pérdidas económicas. A partir del archivo original, se procesan los datos para calcular el total de muertes, heridos y daños materiales. Se presentan gráficos que resumen los principales tipos de eventos en estas dos categorías, con el fin de ayudar a gobiernos y municipios a priorizar recursos para la preparación ante emergencias.

Procesamiento de datos

Se carga el archivo CSV comprimido directamente en R. Se limpian las variables de daño económico para calcular el valor total en dólares. También se agrupan los datos por tipo de evento (EVTYPE) para analizar el impacto en salud y economía.

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.3.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
library(readr)
## Warning: package 'readr' was built under R version 4.3.3
# Ruta del archivo (ajusta según donde lo guardaste)
datos <- read.csv(bzfile("C:/Users/AAmaya/Downloads/repdata_data_StormData.csv.bz2"))

# Función para convertir el multiplicador de daños
convertir_multiplicador <- function(exp) {
  exp <- toupper(exp)
  if (exp == "K") return(1e3)
  if (exp == "M") return(1e6)
  if (exp == "B") return(1e9)
  if (grepl("^[0-9]+$", exp)) return(10 ^ as.numeric(exp))
  return(1)
}

# Aplicar multiplicadores
datos$PROPDMGEXP <- sapply(datos$PROPDMGEXP, convertir_multiplicador)
datos$CROPDMGEXP <- sapply(datos$CROPDMGEXP, convertir_multiplicador)

# Calcular daños totales
datos <- datos %>%
  mutate(
    daño_propiedad = PROPDMG * PROPDMGEXP,
    daño_cultivos = CROPDMG * CROPDMGEXP,
    daño_total = daño_propiedad + daño_cultivos
  )

Resultados

salud <- datos %>%
  group_by(EVTYPE) %>%
  summarise(
    muertes = sum(FATALITIES, na.rm = TRUE),
    heridos = sum(INJURIES, na.rm = TRUE),
    total_salud = muertes + heridos
  ) %>%
  arrange(desc(total_salud)) %>%
  slice(1:10)

# Gráfico
ggplot(salud, aes(x=reorder(EVTYPE, -total_salud), y=total_salud, fill=EVTYPE)) +
  geom_col() +
  theme(axis.text.x = element_text(angle=45, hjust=1)) +
  labs(
    title = "Eventos meteorológicos más dañinos para la salud pública",
    x = "Tipo de evento",
    y = "Total de muertes + heridos"
  )

## Conclusión

Los tornados son los eventos meteorológicos más peligrosos para la salud humana en EE.UU., seguidos por el calor extremo y las inundaciones. En cuanto al impacto económico, las inundaciones, huracanes y tornados generan las mayores pérdidas económicas. Esta información es útil para definir prioridades en la preparación ante emergencias climáticas.