1 Introducción

En el presente documento se desarrolla un análisis estadístico descriptivo de la variable cualitativa ordinal Era Histórica, que representa el período histórico en el que se registró la actividad eruptiva más reciente de los volcanes estudiados. Esta variable organiza los volcanes en diferentes categorías temporales ordenadas cronológicamente, permitiendo identificar la distribución de la actividad volcánica a través de distintas épocas históricas. El estudio comprende la preparación de los datos, la elaboración de tablas de frecuencias, la construcción de representaciones gráficas y el análisis de medidas descriptivas apropiadas para variables ordinales


2 Preparación de los Datos

2.1 Lectura del Dataset

Volcanes_Globales <- read.csv("global_volcano_eruption_intelligence.csv", header = T, sep = ";", dec = ".")

2.2 Selección de la Variable

era_historica <- Volcanes_Globales$era

2.3 Limpieza de Datos

sum(is.na(era_historica))
## [1] 0

3 Distribución de Frecuencias

3.1 Ordenación de Categorias

# Orden según la jerarquía 
niveles_era <- c(
  "Prehistoric/Ancient",
  "Classical Antiquity",
  "Early Medieval",
  "Late Medieval",
  "Early Modern",
  "Industrial Age",
  "Early 20th Century",
  "Late 20th Century",
  "21st Century"
)

era_historica <- factor(
  era_historica,
  levels = niveles_era,
  ordered = TRUE
)

3.2 Distribucion de Frecuencias

3.2.1 Cálculo de ni y hi

# Generar tabla de frecuencias
TDFEra <- table(era_historica)

# Convertir datos a dataframe
TDFEra <- as.data.frame(TDFEra)

# Cambiar nombres
colnames(TDFEra) <- c("Era", "Freq")

# Frecuencia absoluta (ni)
TDFEraFinal <- TDFEra %>%
  group_by(Era) %>%
  summarise(
    ni = sum(Freq),
    
# Frecuencia relativa (hi)
# hi porcentual
   hi = round((ni / sum(TDFEra$Freq)) * 100, 2),
    
# hi decimal
    hi_decimal = round(ni / sum(TDFEra$Freq), 4)
  )

# Agregar numeración en tabla
TDFEraFinal <- TDFEraFinal %>%
  mutate(Nro = row_number())

# Añadir fila de totales
TDFEraFinal <- TDFEraFinal %>%
  add_row(
    Nro = NA,
    Era = "Total",
    ni = sum(TDFEraFinal$ni),
    hi = 100,
    hi_decimal = 1
  )

tabla_presentacion <- TDFEraFinal %>%
  mutate(
    hi = round(hi, 2),
    hi_decimal = round(hi_decimal, 4)
  )
#Ver tabla
tabla_presentacion 

3.3 Tabla de Distribución de Frecuencias

tabla_presentacion %>%
  gt() %>%
  
  tab_header(
    title = md("**Tabla Nro. 1**"),
    subtitle = md("Distribución de frecuencias de la era histórica a nivel mundial")
  ) %>%
  
  cols_label(
    Nro = "N°",
    Era = "Era histórica",
    ni = "ni",
    hi = "hi %",
    hi_decimal = "hi dec."
  ) %>%
  
  tab_spanner(
    label = "Frecuencia absoluta",
    columns = c(ni)
  ) %>%
  
  tab_spanner(
    label = "Frecuencia relativa (hi)",
    columns = c(hi, hi_decimal)
  ) %>%
  
  tab_source_note(
    source_note = md("Elaborado por: Grupo 2 – Carrera de Geología")
  ) %>%
  
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(rows = Era == "Total")
  )
Tabla Nro. 1
Distribución de frecuencias de la era histórica a nivel mundial
Era histórica
Frecuencia absoluta
Frecuencia relativa (hi)
ni hi % hi dec.
Prehistoric/Ancient 25 2.78 0.0278 1
Classical Antiquity 11 1.22 0.0122 2
Early Medieval 15 1.67 0.0167 3
Late Medieval 31 3.45 0.0345 4
Early Modern 138 15.37 0.1537 5
Industrial Age 150 16.70 0.1670 6
Early 20th Century 139 15.48 0.1548 7
Late 20th Century 239 26.61 0.2661 8
21st Century 150 16.70 0.1670 9
Total 898 100.00 1.0000 NA
Elaborado por: Grupo 2 – Carrera de Geología

4 Gráficas de Distribución de Frecuencias (GDFs)

4.1 Diagrama de barras de Frecuencia Absoluta Local

# Eliminar fila de total
TDFEraPlot <- TDFEraFinal[
  TDFEraFinal$Era != "Total", ]

# Diagrama de barras local
par(mar = c(10,6,4,2))

barplot(
  TDFEraPlot$ni,
  
  main = "Gráfica Nº1: Frecuencia absoluta de la era histórica a nivel mundial (local)",
  
  ylab = "Cantidad (ni)",
  
  col = "orange",
  
  names.arg = TDFEraPlot$Era,
  
  cex.names = 0.8,
  
  las = 2
)

mtext(
  "Era histórica",
  side = 1,
  line = 8
)

4.2 Diagrama de barras de Frecuencia Absoluta Global

par(mar = c(10,6,4,2))

barplot(
  TDFEraPlot$ni,
  
  main = "Gráfica Nº2: Frecuencia absoluta de la era histórica a nivel mundial (global)",
  
  ylab = "Cantidad (ni)",
  
  col = "green",
  
  names.arg = TDFEraPlot$Era,
  
  cex.names = 0.8,
  
  las = 2,
  
  ylim = c(0, 898)
)

mtext(
  "Era histórica",
  side = 1,
  line = 8
)

4.3 Diagrama de barras de Frecuencia Relativa Local

par(mar = c(10,6,4,2))

barplot(
  TDFEraPlot$hi,
  
  main = "Gráfica Nº3: Frecuencia relativa de la era histórica a nivel mundial (local)",
  
  ylab = "Porcentaje (%)",
  
  col = "orange",
  
  names.arg = TDFEraPlot$Era,
  
  cex.names = 0.8,
  
  las = 2
)

mtext(
  "Era histórica",
  side = 1,
  line = 8
)

4.4 diagrama de barras de Frecuencia Relativa Global

par(mar = c(10,6,4,2))

barplot(
  TDFEraPlot$hi,
  
  main = "Gráfica Nº4: Frecuencia relativa de la era histórica a nivel mundial (global)",
  
  ylab = "Porcentaje (%)",
  
  col = "green",
  
  names.arg = TDFEraPlot$Era,
  
  cex.names = 0.8,
  
  las = 2,
  
  ylim = c(0, 100)
)

mtext(
  "Era histórica",
  side = 1,
  line = 8
)

4.5 Diagrama Circular hi

# COLORES (escala cronológica: antiguo → moderno)
colores_era <- c(
  "Prehistoric/Ancient"    = "#3B2F2F",  # marrón oscuro (origen)
  "Classical Antiquity"    = "#8B0000",  # rojo oscuro
  "Early Medieval"         = "#4B0082",  # índigo
  "Late Medieval"          = "#1F4E79",  # azul profundo
  "Early Modern"           = "#0F766E",  # verde azulado
  "Industrial Age"         = "#E67E22",  # naranja
  "Early 20th Century"     = "#F1C40F",  # amarillo
  "Late 20th Century"      = "#5DADE2",  # celeste
  "21st Century"           = "#2ECC71"   # verde moderno
)

par(mar = c(3, 3, 3, 9))

# GRÁFICO CIRCULAR
pie(
  TDFEraPlot$hi,
  
  col = colores_era[TDFEraPlot$Era],
  
  labels = NA,
  
  border = "black",
  lwd = 2,
  
  main = "Gráfica Nº 5: Distribución porcentual de eras históricas a nivel mundial"
)

# LEYENDA
legend(
  "right",
  
  title = "Era histórica",
  
  legend = paste(
    TDFEraPlot$Era,
    "-",
    round(TDFEraPlot$hi, 2),
    "%"
  ),
  
  fill = colores_era[TDFEraPlot$Era],
  
  cex = 0.8,
  title.cex = 1,
  
  xpd = TRUE,
  inset = c(-0.30, 0)
)

5 Indicadores Estadísticos

5.1 Moda

moda_era <- TDFEraFinal %>%
  filter(Era != "Total") %>%
  filter(ni == max(ni))

5.2 Mediana

TDFEraMed <- TDFEraFinal %>%
  filter(Era != "Total") %>%
  mutate(
    Ni = cumsum(ni),
    Hi_acum = cumsum(hi)
  )

N <- sum(TDFEraMed$ni)

pos_mediana <- N / 2

mediana_era <- TDFEraMed %>%
  filter(Ni >= pos_mediana) %>%
  slice(1)

6 Resumen General de Indicadores

tabla_medidas <- data.frame(
  Medida = c("Moda", "Mediana"),
  Categoria = c(
    as.character(moda_era$Era),
    as.character(mediana_era$Era)
  ),
  Frecuencia = c(
    moda_era$ni,
    mediana_era$ni
  ),
  Porcentaje = c(
    moda_era$hi,
    mediana_era$hi
  )
)

tabla_medidas %>%
  gt() %>%
  
  tab_header(
    title = md("*Tabla Nro. 2*"),
    subtitle = md("Medidas de tendencia central de la era histórica de los volcanes a nivel mundial")
  ) %>%
  
  cols_label(
    Medida = "Medida",
    Categoria = "Categoría",
    Frecuencia = "ni",
    Porcentaje = "hi (%)"
  ) %>%
  
  fmt_number(
    columns = Porcentaje,
    decimals = 2
  ) %>%
  
  tab_source_note(
    source_note = md("Elaborado por: Grupo 2 – Carrera de Geología")
  ) %>%
  
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(rows = Medida == "Moda")
  )
Tabla Nro. 2
Medidas de tendencia central de la era histórica de los volcanes a nivel mundial
Medida Categoría ni hi (%)
Moda Late 20th Century 239 26.61
Mediana Early 20th Century 139 15.48
Elaborado por: Grupo 2 – Carrera de Geología

7 Conclusiones

Los resultados evidencian que la era más frecuente de erupciones fue a finales del Siglo 20, mientras que la mediana se ubica en el principio del Siglo 20, lo que indica el punto central de la distribución acumulada. En conjunto, estos resultados reflejan una mayor concentración de eventos volcánicos en las eras más recientes, evidenciando la evolución temporal de la actividad volcánica a nivel mundial.