1. CARGA Y PREPARACIÓN DE LOS DATOS

library(readxl)
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(gt)

# Lectura del archivo Excel (previamente cargado al proyecto)
datos_nuevoartes <- read_excel("datos_nuevoartes.xlsx")

# Conversión de la variable fecha
event_date <- as.Date(datos_nuevoartes$event_date)

# Eliminación de valores perdidos
event_date <- event_date[!is.na(event_date)]

2. IDENTIFICACIÓN DE LOS MESES DEL AÑO

# Extracción del mes en formato numérico

mes_num <- as.numeric(format(event_date, "%m"))

# Nombres de los meses

meses <- c(
"Enero", "Febrero", "Marzo", "Abril",
"Mayo", "Junio", "Julio", "Agosto",
"Septiembre", "Octubre", "Noviembre", "Diciembre"
)

3. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

3.1. Cálculo de frecuencias

# Frecuencia absoluta

ni_m <- sapply(1:12, function(i) sum(mes_num == i))

# Frecuencia relativa

hi_m <- ni_m / sum(ni_m) * 100

3.2. Elaboración de la tabla

tabla_meses <- data.frame(
  Mes = meses,
  ni = ni_m,
  hi = ni_m / sum(ni_m) * 100
)

# Fila total

tabla_meses_r <- tabla_meses %>%
  add_row(
    Mes = "Total",
    ni = sum(ni_m),
    hi = sum(ni_m / sum(ni_m) * 100)
  )

# Impresión
tabla_meses_r

##           Mes    ni         hi
## 1       Enero   945   8.565213
## 2     Febrero   797   7.223783
## 3       Marzo   985   8.927762
## 4       Abril   841   7.622587
## 5        Mayo   788   7.142210
## 6       Junio   974   8.828061
## 7       Julio  1243  11.266201
## 8      Agosto  1175  10.649869
## 9  Septiembre   896   8.121091
## 10    Octubre   761   6.897489
## 11  Noviembre   668   6.054564
## 12  Diciembre   960   8.701169
## 13      Total 11033 100.000000

3.3. Presentación de la tabla

tabla_meses_presentacion <- tabla_meses_r %>%
  mutate(
    hi = round(hi, 2)
  )

tabla_meses_presentacion %>%
  gt() %>%
  tab_header(
    title = md("**Tabla Nro. 1**"),
    subtitle = md("Distribución de frecuencias de la variable cualitativa ordinal")
  ) %>%
  tab_source_note(
    source_note = md("Elaborado por: Grupo 2 – Carrera de Geología")
  ) %>%
  cols_label(
    Mes = "Mes",
    ni = "Frecuencia absoluta (ni)",
    hi = "Frecuencia relativa (%)"
  ) %>%
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(rows = Mes == "Total")
  )

Mes	Frecuencia absoluta (ni)	Frecuencia relativa (%)
Tabla Nro. 1
Distribución de frecuencias de la variable cualitativa ordinal
Enero	945	8.57
Febrero	797	7.22
Marzo	985	8.93
Abril	841	7.62
Mayo	788	7.14
Junio	974	8.83
Julio	1243	11.27
Agosto	1175	10.65
Septiembre	896	8.12
Octubre	761	6.90
Noviembre	668	6.05
Diciembre	960	8.70
Total	11033	100.00
Elaborado por: Grupo 2 – Carrera de Geología

4. DIAGRAMA DE BARRAS

4.1. Frecuencia absoluta

barplot(
ni_m,
names.arg = meses,
las = 2,
col = "gray",
main = "Gráfica 1: Distribución mensual de eventos (frecuencia absoluta)",
ylab = "Frecuencia absoluta (ni)",
xlab = "Mes"
)

4.2. Frecuencia Relativa

barplot(
hi_m,
names.arg = meses,
las = 2,
col = "lightblue",
main = "Gráfica 2: Distribución mensual de eventos (frecuencia relativa)",
ylab = "Frecuencia relativa (%)",
xlab = "Mes"
)

5. DIAGRAMA CIRCULAR

hi_m_red <- round(hi_m, 2)

colores <- c(
"#66c2a5", "#fc8d62", "#8da0cb", "#e78ac3",
"#a6d854", "#ffd92f", "#e5c494", "#b3b3b3",
"#1b9e77", "#d95f02", "#7570b3", "#e7298a"
)

pie(
  hi_m_red,
  col = colores,
  labels = paste0(hi_m_red, " %"),
  main = "Grafica 3: Distribución porcentual de eventos por mes"
)

legend(
"topright",
legend = meses,
fill = colores,
cex = 0.7,
bty = "n"
)

6. INDICADORES ESTADÍSTICOS

6.1. Moda

indice_moda <- which.max(ni_m)
moda_mes <- meses[indice_moda]
moda_valor <- ni_m[indice_moda]

cat(
  "La moda de la variable Mes es:",
  moda_mes,
  "con una frecuencia absoluta de",
  moda_valor,
  "eventos."
)

## La moda de la variable Mes es: Julio con una frecuencia absoluta de 1243 eventos.

# Tabla Resumen 

tabla_resumen <- data.frame(
Variable = "Mes",
Indicador = "Moda",
Resultado = paste0(moda_mes, " (", moda_valor, " eventos)")
)

tabla_resumen %>%
gt() %>%
tab_header(
title = md("**Tabla Nro. 2**"),
subtitle = md("Resumen de indicadores estadísticos de la variable Mes")
) %>%
cols_label(
Variable = "Variable analizada",
Indicador = "Indicador estadístico",
Resultado = "Resultado"
) %>%
tab_source_note(
source_note = md("Elaborado por: Grupo 2 – Carrera de Geología")
) %>%
opt_all_caps() %>%
tab_style(
style = cell_text(weight = "bold"),
locations = cells_body()
)

Variable analizada	Indicador estadístico	Resultado
Tabla Nro. 2
Resumen de indicadores estadísticos de la variable Mes
Mes	Moda	Julio (1243 eventos)
Elaborado por: Grupo 2 – Carrera de Geología

7. CONCLUSIÓN

La variable Mes es de tipo cualitativa ordinal, utilizada para identificar la estacionalidad de los desastres, donde el valor que más se repite es “Julio”. Esta concentración temporal coincide con los periodos de mayor intensidad climática en diversas regiones.

VARIABLE CUALITATIVA ORDINAL: MES

Grupo 2 – Carrera de Geología

2025-12-18