1 Introducción

El documento desarrolla un análisis estadístico descriptivo de la variable cualitativa nominal Tipo de volcán, la cual clasifica los volcanes según sus características morfológicas y estructurales. Esta variable agrupa los registros en diferentes categorías sin un orden jerárquico entre ellas. El estudio comprende la preparación de los datos, la elaboración de tablas de frecuencias, la construcción de representaciones gráficas y el análisis de medidas descriptivas adecuadas para variables nominales.


2 Preparación de los Datos

2.1 Lectura del Dataset

Volcanes_Globales <- read.csv("global_volcano_eruption_intelligence.csv", header = T, sep = ";", dec = ".")

2.2 Selección de la Variable

tipo_Vol <- Volcanes_Globales$volcano_type

2.3 Limpieza de Datos

sum(is.na(tipo_Vol))
## [1] 0

2.4 Agrupacion de Categorias

tipo_Vol_agrupado <- case_when(
  
  tipo_Vol %in% c(
    "Stratovolcano",
    "Compound volcano"
  ) ~ "Estratovolcanes",
  
  tipo_Vol %in% c(
    "Shield volcano",
    "Pyroclastic shield"
  ) ~ "Volcanes escudo",
  
  tipo_Vol %in% c(
    "Complex volcano",
    "Caldera"
  ) ~ "Complejos y calderas",
  
  tipo_Vol %in% c(
    "Cinder cone",
    "Pyroclastic cone",
    "Pumice cone",
    "Tuff cone"
  ) ~ "Conos piroclasticos",
  
  tipo_Vol %in% c(
    "Lava dome",
    "Lava cone"
  ) ~ "Domos y conos de lava",
  
  tipo_Vol %in% c(
    "Fissure vent",
    "Crater rows",
    "Volcanic field"
  ) ~ "Fisuras y campos volcanicos",
  
  tipo_Vol %in% c(
    "Submarine volcano",
    "Submarine volcanoes",
    "Subglacial volcano"
  ) ~ "Volcanes submarinos y subglaciares",
  
  tipo_Vol == "Maar" ~ "Maar",
  
  tipo_Vol == "Mud volcano" ~ "Mud volcano"
)

3 Distribucion de Frecuencias

3.1 Cálculo de ni y hi

# Tabla de frecuencias
TDFVolcanes <- table(tipo_Vol_agrupado)

# Convertir a dataframe
TDFVolcanes <- as.data.frame(TDFVolcanes)   

# Cambiar nombres de columnas
colnames(TDFVolcanes) <- c("Grupo", "Freq")

# Calcular frecuencia absoluta (ni)
TDFVolcanesFinal <- TDFVolcanes %>%
  group_by(Grupo) %>%
  summarise(
    ni = sum(Freq),

#Calcular Frecuencia relativa (hi)

# hi porcentual 
hi = (ni / sum(TDFVolcanes$Freq)) * 100,
    
# hi decimal
hi_decimal = ni / sum(TDFVolcanes$Freq)
  )

#Añadir fila de totales 
TDFVolcanesFinal <- TDFVolcanesFinal %>%
  add_row(
    Grupo = "Total",
    ni = sum(TDFVolcanesFinal$ni),
    hi = sum(TDFVolcanesFinal$hi),
    hi_decimal = sum(TDFVolcanesFinal$hi_decimal)
  )

# Redondear Frecuencias
TDFVolcanesFinal <- TDFVolcanesFinal %>%
  mutate(
    hi = round(hi, 2),
    hi_decimal = round(hi_decimal, 4)
  )

# Ver tabla
TDFVolcanesFinal

3.2 Tabla de Distribución de Frecuencias

tabla_presentacion <- TDFVolcanesFinal

tabla_presentacion %>%
  gt() %>%
  
  # AGREGAR TITULO Y SUBTITULO
  tab_header(
    title = md("**Tabla Nro. 1**"),
    subtitle = md("Distribución de frecuencias de los tipos de volcanes a nivel mundial")
  ) %>%
  
  # Etiquetas de columnas
  cols_label(
    Grupo = "Tipo de volcán",
    ni = "ni",
    hi = "hi %",
    hi_decimal = "hi dec."
  ) %>%
  
  # Agrupar columnas
  tab_spanner(
    label = "Frecuencia relativa (hi)",
    columns = c(hi, hi_decimal)
  ) %>%
  
  tab_spanner(
    label = "Frecuencia absoluta",
    columns = c(ni)
  ) %>%
  
  # Nota al pie
  tab_source_note(
    source_note = md("Elaborado por: Grupo 2 – Carrera de Geología")
  ) %>%
  
  # Resaltar fila Total
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(rows = Grupo == "Total")
  )
Tabla Nro. 1
Distribución de frecuencias de los tipos de volcanes a nivel mundial
Tipo de volcán
Frecuencia absoluta
Frecuencia relativa (hi)
ni hi % hi dec.
Complejos y calderas 164 18.26 0.1826
Conos piroclasticos 10 1.11 0.0111
Domos y conos de lava 11 1.22 0.0122
Estratovolcanes 576 64.14 0.6414
Fisuras y campos volcanicos 9 1.00 0.0100
Maar 2 0.22 0.0022
Mud volcano 1 0.11 0.0011
Volcanes escudo 84 9.35 0.0935
Volcanes submarinos y subglaciares 41 4.57 0.0457
Total 898 100.00 1.0000
Elaborado por: Grupo 2 – Carrera de Geología

4 Gráficas de Distribución de Frecuencias (GDFs)

4.1 Diagrama de barras de Frecuencia Absoluta Local

#Eliminar fila TOTAL
TDFVolcanesPlot <- TDFVolcanesFinal[
  TDFVolcanesFinal$Grupo != "Total", ]

# Diagrama de barras local
par(mar = c(13,6,4,2))

barplot(
  TDFVolcanesPlot$ni,
  main = "Gráfica Nº1: Frecuencia absoluta de los Tipos de Volcanes a Nivel Mundial (local)",
  ylab = "Cantidad (ni)",
  col = "orange",
  names.arg = TDFVolcanesPlot$Grupo,
  cex.names = 0.8,
  las = 2
)

mtext(
  "Tipo de volcán",
  side = 1,
  line = 4
)

4.2 Diagrama de barras de Frecuencia Absoluta Global

barplot(
  TDFVolcanesPlot$ni,
  
  main = "Gráfica Nº2: Frecuencia absoluta de los Tipos de Volcanes (global)",
  
  xlab = "Tipo de volcán",
  
  ylab = "Cantidad (ni)",
  
  col = "green",
  
  names.arg = TDFVolcanesPlot$Grupo,
  
  cex.names = 0.7,
  
  las = 2,
  
  ylim = c(0, 889) )

4.3 Diagrama de barras de Frecuencia Relativa Local

barplot(
  TDFVolcanesPlot$hi,
  
  main = "Gráfica Nº3: Frecuencia Relativa de los Tipos de Volcanes (local) ",
  
  xlab = "Tipo de volcán",
  
  ylab = "Porcentaje (%)",
  
  col = "orange",
  
  names.arg = TDFVolcanesPlot$Grupo,
  
  cex.names = 0.7,
  
  las = 2

)

4.4 Diagrama de barras de Frecuencia Relativa Global

barplot(
  TDFVolcanesPlot$hi,
  
  main = "Gráfica Nº4: Frecuencia Relativa de los Tipos de Volcanes (global)",
  
  xlab = "Tipo de volcán",
  
  ylab = "Porcentaje (%)",
  
  col = "green",
  
  names.arg = TDFVolcanesPlot$Grupo,
  
  cex.names = 0.7,
  
  las = 2,
  
  ylim = c(0, 100)
)

4.5 Diagrama Circular hi

par(mar = c(4, 4, 4, 10))

# Paleta de colores contrastantes
Colores <- brewer.pal(
  nrow(TDFVolcanesPlot),
  "Paired"
)

# Gráfico circular
pie(
  TDFVolcanesPlot$hi,
  
  col = Colores,
  
  labels = NA,
  
  border = "white",
  
  lwd = 2,
  
  main = "Gráfica Nº5: Porcentaje de los Tipos de Volcanes a Nivel Mundial"
)

# Leyenda
legend(
  "right",
  
  title = "Tipos de volcán",
  
  legend = paste(
    TDFVolcanesPlot$Grupo,
    "-",
    round(TDFVolcanesPlot$hi, 2),
    "%"
  ),
  
  fill = Colores,
  
  cex = 0.8,
  
  title.cex = 1,
  
  xpd = TRUE,
  
  inset = c(-0.40, 0)
)

5 Indicadores Estadísticos

5.1 Moda

moda_volcanes <- TDFVolcanesPlot[
  TDFVolcanesPlot$ni == max(TDFVolcanesPlot$ni),
]

print(moda_volcanes)
## # A tibble: 1 × 4
##   Grupo              ni    hi hi_decimal
##   <chr>           <int> <dbl>      <dbl>
## 1 Estratovolcanes   576  64.1      0.641
#Tabla Estilizada
moda_volcanes %>%
  gt() %>%
  
  tab_header(
    title = md("**Tabla Nro. 2**"),
    subtitle = md("Moda de los tipos de volcanes a nivel mundial")
  ) %>%
  
  cols_label(
    Grupo = "Tipo de volcán",
    ni = "Frecuencia absoluta (ni)",
    hi = "Frecuencia relativa (%)",
    hi_decimal = "Frecuencia relativa decimal"
  ) %>%
  
  fmt_number(
    columns = c(hi),
    decimals = 2
  ) %>%
  
  fmt_number(
    columns = c(hi_decimal),
    decimals = 4
  ) %>%
  
  tab_source_note(
    source_note = md("Elaborado por: Grupo 2 – Carrera de Geología")
  )
Tabla Nro. 2
Moda de los tipos de volcanes a nivel mundial
Tipo de volcán Frecuencia absoluta (ni) Frecuencia relativa (%) Frecuencia relativa decimal
Estratovolcanes 576 64.14 0.6414
Elaborado por: Grupo 2 – Carrera de Geología

6 Conclusiones

El grupo de volcanes de tipo Estratovolcanes presenta la frecuencia absoluta más alta, con 576 registros, por lo que constituye la moda de la variable nominal Tipo de volcán. Esto evidencia que los estratovolcanes son la categoría más frecuente dentro del conjunto de datos analizado, mostrando una clara predominancia respecto a los demás tipos de volcanes considerados en el estudio.