1. CARGA Y PREPARACIÓN DE LOS DATOS

library(readxl)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(gt)

# Lectura del archivo Excel (previamente cargado al proyecto)
datos_nuevoartes <- read_excel("datos_nuevoartes.xlsx")

# Conversión de la variable fecha
event_date <- as.Date(datos_nuevoartes$event_date)

# Eliminación de valores perdidos
event_date <- event_date[!is.na(event_date)]

2. IDENTIFICACIÓN DE LOS MESES DEL AÑO

# Extracción del mes en formato numérico

mes_num <- as.numeric(format(event_date, "%m"))

# Nombres de los meses

meses <- c(
"Enero", "Febrero", "Marzo", "Abril",
"Mayo", "Junio", "Julio", "Agosto",
"Septiembre", "Octubre", "Noviembre", "Diciembre"
)

3. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

3.1. Cálculo de frecuencias

# Frecuencia absoluta

ni_m <- sapply(1:12, function(i) sum(mes_num == i))

# Frecuencia relativa

hi_m <- ni_m / sum(ni_m) * 100

3.2. Elaboración de la tabla

tabla_meses <- data.frame(
  Mes = meses,
  ni = ni_m,
  hi = ni_m / sum(ni_m) * 100
)

# Fila total

tabla_meses_r <- tabla_meses %>%
  add_row(
    Mes = "Total",
    ni = sum(ni_m),
    hi = sum(ni_m / sum(ni_m) * 100)
  )

# Impresión
tabla_meses_r
##           Mes    ni         hi
## 1       Enero   945   8.565213
## 2     Febrero   797   7.223783
## 3       Marzo   985   8.927762
## 4       Abril   841   7.622587
## 5        Mayo   788   7.142210
## 6       Junio   974   8.828061
## 7       Julio  1243  11.266201
## 8      Agosto  1175  10.649869
## 9  Septiembre   896   8.121091
## 10    Octubre   761   6.897489
## 11  Noviembre   668   6.054564
## 12  Diciembre   960   8.701169
## 13      Total 11033 100.000000

3.3. Presentación de la tabla

tabla_meses_presentacion <- tabla_meses_r %>%
  mutate(
    hi = round(hi, 2)
  )

tabla_meses_presentacion %>%
  gt() %>%
  tab_header(
    title = md("**Tabla Nro. 1**"),
    subtitle = md("Distribución de frecuencias de la variable cualitativa ordinal")
  ) %>%
  tab_source_note(
    source_note = md("Elaborado por: Grupo 2 – Carrera de Geología")
  ) %>%
  cols_label(
    Mes = "Mes",
    ni = "Frecuencia absoluta (ni)",
    hi = "Frecuencia relativa (%)"
  ) %>%
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(rows = Mes == "Total")
  )
Tabla Nro. 1
Distribución de frecuencias de la variable cualitativa ordinal
Mes Frecuencia absoluta (ni) Frecuencia relativa (%)
Enero 945 8.57
Febrero 797 7.22
Marzo 985 8.93
Abril 841 7.62
Mayo 788 7.14
Junio 974 8.83
Julio 1243 11.27
Agosto 1175 10.65
Septiembre 896 8.12
Octubre 761 6.90
Noviembre 668 6.05
Diciembre 960 8.70
Total 11033 100.00
Elaborado por: Grupo 2 – Carrera de Geología

4. DIAGRAMA DE BARRAS

4.1. Frecuencia absoluta

barplot(
ni_m,
names.arg = meses,
las = 2,
col = "gray",
main = "Gráfica 1: Distribución mensual de eventos (frecuencia absoluta)",
ylab = "Frecuencia absoluta (ni)",
xlab = "Mes"
)

4.2. Frecuencia Relativa

barplot(
hi_m,
names.arg = meses,
las = 2,
col = "lightblue",
main = "Gráfica 2: Distribución mensual de eventos (frecuencia relativa)",
ylab = "Frecuencia relativa (%)",
xlab = "Mes"
)

5. DIAGRAMA CIRCULAR

hi_m_red <- round(hi_m, 2)

colores <- c(
"#66c2a5", "#fc8d62", "#8da0cb", "#e78ac3",
"#a6d854", "#ffd92f", "#e5c494", "#b3b3b3",
"#1b9e77", "#d95f02", "#7570b3", "#e7298a"
)

pie(
  hi_m_red,
  col = colores,
  labels = paste0(hi_m_red, " %"),
  main = "Grafica 3: Distribución porcentual de eventos por mes"
)

legend(
"topright",
legend = meses,
fill = colores,
cex = 0.7,
bty = "n"
)

6. INDICADORES ESTADÍSTICOS

6.1. Moda

indice_moda <- which.max(ni_m)
moda_mes <- meses[indice_moda]
moda_valor <- ni_m[indice_moda]

cat(
  "La moda de la variable Mes es:",
  moda_mes,
  "con una frecuencia absoluta de",
  moda_valor,
  "eventos."
)
## La moda de la variable Mes es: Julio con una frecuencia absoluta de 1243 eventos.
# Tabla Resumen 

tabla_resumen <- data.frame(
Variable = "Mes",
Indicador = "Moda",
Resultado = paste0(moda_mes, " (", moda_valor, " eventos)")
)

tabla_resumen %>%
gt() %>%
tab_header(
title = md("**Tabla Nro. 2**"),
subtitle = md("Resumen de indicadores estadísticos de la variable Mes")
) %>%
cols_label(
Variable = "Variable analizada",
Indicador = "Indicador estadístico",
Resultado = "Resultado"
) %>%
tab_source_note(
source_note = md("Elaborado por: Grupo 2 – Carrera de Geología")
) %>%
opt_all_caps() %>%
tab_style(
style = cell_text(weight = "bold"),
locations = cells_body()
)
Tabla Nro. 2
Resumen de indicadores estadísticos de la variable Mes
Variable analizada Indicador estadístico Resultado
Mes Moda Julio (1243 eventos)
Elaborado por: Grupo 2 – Carrera de Geología

7. CONCLUSIÓN

La variable Mes es de tipo cualitativa ordinal, utilizada para identificar la estacionalidad de los desastres, donde el valor que más se repite es “Julio”. Esta concentración temporal coincide con los periodos de mayor intensidad climática en diversas regiones.