1 Introducción

Análisis estadístico descriptivo de la variable cualitativa nominal Región Tectónica, la cual identifica la zona tectónica en la que se ubican los volcanes considerados en el estudio. El estudio comprende la preparación de los datos, la elaboración de tablas de frecuencias, la construcción de representaciones gráficas y el análisis de medidas descriptivas adecuadas para variables nominales.


2 Preparación de los Datos

2.1 Lectura del Dataset

Volcanes_Globales <- read.csv("global_volcano_eruption_intelligence.csv", header = T, sep = ";", dec = ".")

2.2 Selección de la Variable

reg_tec <- Volcanes_Globales$tectonic_region

2.3 Limpieza de Datos

sum(is.na(reg_tec))
## [1] 0

3 Distribucion de Frecuencias

3.1 Cálculo de ni y hi

# Tabla de frecuencias
TDFTectonica <- table(reg_tec)

# Convertir a dataframe
TDFTectonica <- as.data.frame(TDFTectonica)  

# Cambiar nombres de columnas
colnames(TDFTectonica) <- c("Grupo", "Freq")

# Calcular frecuencia absoluta (ni)
TDFTectonicaFinal <- TDFTectonica %>%
  group_by(Grupo) %>%
  summarise(
    ni = sum(Freq),

#Calcular Frecuencia relativa (hi)

# hi porcentual 
hi = (ni / sum(TDFTectonica$Freq)) * 100,
    
# hi decimal
  hi_decimal = ni / sum(TDFTectonica$Freq)
  )

#Añadir fila de totales 
TDFTectonicaFinal <- TDFTectonicaFinal %>%
  add_row(
    Grupo = "Total",
    ni = sum(TDFTectonicaFinal$ni),
    hi = sum(TDFTectonicaFinal$hi),
    hi_decimal = sum(TDFTectonicaFinal$hi_decimal)
  )

# Redondear Frecuencias
TDFTectonicaFinal <- TDFTectonicaFinal %>%
  mutate(
    hi = round(hi, 2),
    hi_decimal = round(hi_decimal, 4)
  )

# Ver tabla
TDFTectonicaFinal

3.2 Tabla de Distribución de Frecuencias

tabla_presentacion <- TDFTectonicaFinal

tabla_presentacion$Grupo <- iconv(
  tabla_presentacion$Grupo,
  from = "",
  to = "UTF-8",
  sub = ""
)

tabla_presentacion %>%
  gt() %>%
  
  # AGREGAR TITULO Y SUBTITULO
   tab_header(
    title = md("**Tabla Nro. 1**"),
    subtitle = "Distribución de frecuencias de las regiones tectónicas de los volcanes a nivel mundial"
  ) %>%
  
  # Etiquetas de columnas
  cols_label(
    Grupo = "Región tectónica",
    ni = "ni",
    hi = "hi %",
    hi_decimal = "hi dec."
  ) %>%
  
  # Agrupar columnas
  tab_spanner(
    label = "Frecuencia relativa (hi)",
    columns = c(hi, hi_decimal)
  ) %>%
  
  tab_spanner(
    label = "Frecuencia absoluta",
    columns = c(ni)
  ) %>%
  
  # Nota al pie
   tab_source_note(
    source_note = "Elaborado por: Grupo 2 - Carrera de Geologia"
  ) %>%
  
  # Resaltar fila Total
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(rows = Grupo == "Total")
  )
Tabla Nro. 1
Distribución de frecuencias de las regiones tectónicas de los volcanes a nivel mundial
Región tectónica
Frecuencia absoluta
Frecuencia relativa (hi)
ni hi % hi dec.
Antarctica 1 0.11 0.0011
Canary Islands Atlantic Hot Spot 5 0.56 0.0056
East African Rift 28 3.12 0.0312
Intraplate / Other 41 4.57 0.0457
Japan Arc 149 16.59 0.1659
Mediterranean Volcanic Belt 71 7.91 0.0791
Mid-Atlantic Ridge Iceland 54 6.01 0.0601
Philippine Arc 48 5.35 0.0535
Ring of Fire Pacific 279 31.07 0.3107
Sunda Arc Indonesia 222 24.72 0.2472
Total 898 100.00 1.0000
Elaborado por: Grupo 2 - Carrera de Geologia

4 Gráficas de Distribución de Frecuencias (GDFs)

4.1 Diagrama de barras de Frecuencia Absoluta Local

# Eliminar fila total
TDFTectonicaPlot <- TDFTectonicaFinal[
  TDFTectonicaFinal$Grupo != "Total", ]

#Correccion de datos corruptos
TDFTectonicaPlot$Grupo <- iconv(
  TDFTectonicaPlot$Grupo,
  from = "",
  to = "UTF-8",
  sub = ""
)

TDFTectonicaPlot$Grupo <- gsub("–", "-", TDFTectonicaPlot$Grupo)

# Diagrama de barras local

par(mar = c(13, 6, 4, 2))

barplot(
  TDFTectonicaPlot$ni,
  
main = "Gráfica Nº1: Frecuencia absoluta de las Regiones Tectónicas 
de los Volcanes a Nivel Mundial (local)",
  
ylab = "Cantidad (ni)",
  
col = "orange",
  
names.arg = TDFTectonicaPlot$Grupo,

cex.names = 0.8,
  
las = 2
)

mtext(
  "Región tectónica",
  side = 1,
  line = 8
)

4.2 Diagrama de barras de Frecuencia Absoluta Global

par(mar = c(13, 6, 4, 2))

barplot(
  TDFTectonicaPlot$ni,
  
  main = "Gráfica Nº2: Frecuencia absoluta de las Regiones Tectónicas 
  de los Volcanes a Nivel Mundial (global)",
  
  ylab = "Cantidad (ni)",
  
  col = "green",
  
  names.arg = TDFTectonicaPlot$Grupo,
  
  cex.names = 0.8,
  
  las = 2,
  
  ylim = c(0, 898)
)

mtext(
  "Región tectónica",
  side = 1,
  line = 8
)

4.3 Diagrama de barras de Frecuencia Relativa Local

par(mar = c(13, 6, 4, 2))

barplot(
  TDFTectonicaPlot$hi,
  
  main = "Gráfica Nº3: Frecuencia relativa de las Regiones Tectónicas 
  de los Volcanes a Nivel Mundial (local)",
  
  ylab = "Porcentaje (%)",
  
  col = "orange",
  
  names.arg = TDFTectonicaPlot$Grupo,
  
  cex.names = 0.8,
  
  las = 2
)

mtext(
  "Región tectónica",
  side = 1,
  line = 8
)

4.4 Diagrama de barras de Frecuencia Relativa Global

par(mar = c(13, 6, 4, 2))

barplot(
  TDFTectonicaPlot$hi,
  
  main = "Gráfica Nº4: Frecuencia relativa de las Regiones Tectónicas 
  de los Volcanes a Nivel Mundial (global)",
  
  ylab = "Porcentaje (%)",
  
  col = "green",
  
  names.arg = TDFTectonicaPlot$Grupo,
  
  cex.names = 0.8,
  
  las = 2,
  
  ylim = c(0, 100)
)

mtext(
  "Región tectónica",
  side = 1,
  line = 8
)

4.5 Diagrama Circular hi

par(mar = c(4, 4, 4, 10))

# Paleta personalizada (10 colores)
Colores <- c(
  "#4E79A7",  # azul
  "#F28E2B",  # naranja
  "#59A14F",  # verde
  "#E15759",  # rojo
  "#76B7B2",  # turquesa
  "#EDC948",  # amarillo
  "#B07AA1",  # morado
  "#FF9DA7",  # rosado
  "#9C755F",  # marrón
  "#BAB0AC"   # gris
)

# Gráfico circular
pie(
  TDFTectonicaPlot$hi,
  
  col = Colores,
  
  labels = NA,
  
  border = "white",
  
  lwd = 2,
  
  main = "Gráfica Nº5: Porcentaje de las Regiones Tectónicas 
  de los Volcanes a Nivel Mundial"
)

# Leyenda
legend(
  "right",
  
  title = "Regiones tectónicas",
  
  legend = paste(
    TDFTectonicaPlot$Grupo,
    "-",
    round(TDFTectonicaPlot$hi, 2),
    "%"
  ),
  
  fill = Colores,
  
  cex = 0.8,
  
  title.cex = 1,
  
  xpd = TRUE,
  
  inset = c(-0.40, 0)
)

5 Indicadores Estadísticos

5.1 Moda

moda_tectonica <- TDFTectonicaPlot[
  TDFTectonicaPlot$ni == max(TDFTectonicaPlot$ni),
]

print(moda_tectonica)
## # A tibble: 1 × 4
##   Grupo                    ni    hi hi_decimal
##   <chr>                 <int> <dbl>      <dbl>
## 1 Ring of Fire  Pacific   279  31.1      0.311
# Tabla estilizada
moda_tectonica %>%
  gt() %>%
  
  tab_header(
    title = md("**Tabla Nro. 2**"),
    subtitle = md("Moda de las regiones tectónicas de los volcanes a nivel mundial")
  ) %>%
  
  cols_label(
    Grupo = "Región tectónica",
    ni = "Frecuencia absoluta (ni)",
    hi = "Frecuencia relativa (%)",
    hi_decimal = "Frecuencia relativa decimal"
  ) %>%
  
  fmt_number(
    columns = c(hi),
    decimals = 2
  ) %>%
  
  fmt_number(
    columns = c(hi_decimal),
    decimals = 4
  ) %>%
  
  tab_source_note(
    source_note = md("Elaborado por: Grupo 2 – Carrera de Geología")
  )
Tabla Nro. 2
Moda de las regiones tectónicas de los volcanes a nivel mundial
Región tectónica Frecuencia absoluta (ni) Frecuencia relativa (%) Frecuencia relativa decimal
Ring of Fire Pacific 279 31.07 0.3107
Elaborado por: Grupo 2 – Carrera de Geología

6 Conclusiones

Los resultados evidencian que la región tectónica más frecuente corresponde al Anillo de fuego del pacifico, lo cual refleja su mayor presencia dentro del conjunto de regiones tectonicas de los volcanes analizados a nivel mundial. Este comportamiento sugiere una concentración significativa de eventos volcánicos en dicha región con respecto a las demas.