ANÁLISIS ESTADÍSTICO

1. CARGA DE DATOS Y LIBRERÍAS

library(dplyr)
library(knitr)
library(e1071)
library(moments)
library(kableExtra)
library(gt)
library(magrittr)

Sedimentos_Marinos <- read.csv(
  "C:\\Users\\dougl\\Downloads\\Sedimentos_Marinos.csv",
  header = TRUE,
  sep = ";",
  dec = ".",
  stringsAsFactors = FALSE  
)
# Extraer la variable
Sedimentos_Marinos$Area_raw <- Sedimentos_Marinos$AREA
length(Sedimentos_Marinos$Area_raw)
## [1] 14205

Agrupacion de datos geograficos

Sedimentos_Marinos <- Sedimentos_Marinos %>%
  mutate(
    # Primero normalizamos el texto original
    AREA_clean = toupper(trimws(Area_raw)),
    
    # Creamos la nueva variable agrupada 'Area'
    Area = case_when(
      AREA_clean %in% c("STELLWAGEN BANK","STELLWAGEN BASIN","MASS BAY","MASSBAY",
                        "MASSACHUSETTS BAY","BOSTON HARBOR","BOSTON HARBOR ISLANDS",
                        "MERRIMACK","MERRIMACK EMBAYMENT","COASTAL MASSACHUSETTS",
                        "MARTHA'S VINEYARD","BUZZARDS BAY","PROVINCETOWN HARBOR",
                        "IPSWICH BAY","CAPE COD BAY","COASTAL MA") ~ "New England Shelf",
      
      AREA_clean %in% c("LONG ISLAND SOUND","NEW YORK BIGHT","BLOCK ISLAND SOUND",
                        "NEW YORK","FIRE ISLAND","LIS") ~ "Long Island & New York Bight",
      
      AREA_clean %in% c("NORTH CAROLINA","CAPE HATTERAS","BARNEGAT BAY",
                        "HUDSON CANYON","HUDSON SHELF VALLEY") ~ "Mid-Atlantic Coast",
      
      AREA_clean %in% c("GULF OF MAINE","MAINE","BAY OF FUNDY","NEW HAMPSHIRE") ~ "Gulf of Maine Region",
      
      AREA_clean %in% c("RHODE ISLAND SOUND","NANTUCKET SOUND","NANTUCKET") ~ "Southern New England & Rhode Island",
      
      AREA_clean %in% c("FLORIDA","SOUTH CAROLINA","APALACHICOLA BAY") ~ "Southeast USA",
      
      AREA_clean %in% c("GULF OF MEXICO") ~ "Gulf of Mexico",
      
      AREA_clean %in% c("PUERTO RICO","CARIBBEAN","MONA CANYON") ~ "Caribbean Region",
      
      AREA_clean %in% c("CALIFORNIA","WASHINGTON","ALASKA","CASCADIA") ~ "Western USA",
      
      TRUE ~ NA_character_
    )
  )

Limpieza de datos

Sedimentos_Marinos_Area <- Sedimentos_Marinos %>%
  filter(!is.na(Area))

2. TABLA DE DISTRIBUCIÓN DE FRECUENCIA

Creacion de tabla

TDF_Area <- table(Sedimentos_Marinos_Area$Area)
TDF_Area <- as.data.frame(TDF_Area)
colnames(TDF_Area) <- c("Area", "Freq")

TDF_Area_Final <- TDF_Area %>%
  group_by(Area) %>%
  summarise(
    ni = sum(Freq),
    hi = round((ni / sum(TDF_Area$Freq)) * 100, 2)
  ) %>%
  as.data.frame()
#Fila Total
fila_total <- data.frame(
  Area = "Total",
  ni = sum(TDF_Area_Final$ni),
  hi = 100
)

TDF_Area_Final <- rbind(TDF_Area_Final, fila_total)

Tabla final estilizada

tabla_area_gt <- TDF_Area_Final %>%
  gt() %>%
  tab_header(
    title = md("**Tabla N°4**"),
    subtitle = md("Frecuencias Absolutas y Relativas del Área de Recolección de Sedimentos Marinos (1995–2024)")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo Geo-Minas")
  ) %>%
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(rows = Area == "Total")
  )

tabla_area_gt
Tabla N°4
Frecuencias Absolutas y Relativas del Área de Recolección de Sedimentos Marinos (1995–2024)
Area ni hi
Caribbean Region 332 3.24
Gulf of Maine Region 520 5.07
Gulf of Mexico 819 7.98
Long Island & New York Bight 2242 21.86
Mid-Atlantic Coast 1560 15.21
New England Shelf 4005 39.05
Southeast USA 466 4.54
Southern New England & Rhode Island 97 0.95
Western USA 216 2.11
Total 10257 100.00
Autor: Grupo Geo-Minas

Los datos fueron agrupados debido a la gran cantidad de los mismos.

3. GRÁFICAS DE DISTRIBUCIÓN DE FRECUENCIA

# Excluir fila Total
TDF_Area_Plot <- TDF_Area_Final[TDF_Area_Final$Area != "Total", ]

Diagrama de barras Local (ni)

barplot(
  TDF_Area_Plot$ni,
  main = "Gráfica Nº1: Frecuencia Local por Área (ni)",
  xlab = "Áreas",
  ylab = "Cantidad",
  col = "yellow",
  names.arg = TDF_Area_Plot$Area,
  las = 2,
  cex.names = 0.6
)

Diagrama de barras Global (ni)

barplot(
  TDF_Area_Plot$ni,
  main = "Gráfica Nº2: Frecuencia Global por Área (ni)",
  xlab = "Áreas",
  ylab = "Cantidad",
  col = "orange",
  names.arg = TDF_Area_Plot$Area,
  las = 2,
  ylim = c(0, sum(TDF_Area_Plot$ni))
)

Diagrama de barras Local (hi)

barplot(
  TDF_Area_Plot$hi,
  main = "Gráfica Nº3: Frecuencia Relativa Local (hi)",
  xlab = "Áreas",
  ylab = "Porcentaje (%)",
  col = "cyan",
  names.arg = TDF_Area_Plot$Area,
  las = 2
)

Diagrama de barras Global (hi)

barplot(
  TDF_Area_Plot$hi,
  main = "Gráfica Nº4: Frecuencia Relativa Global (hi)",
  xlab = "Áreas",
  ylab = "Porcentaje (%)",
  col = "#86D0B9",
  names.arg = TDF_Area_Plot$Area,
  las = 2,
  ylim = c(0, 100)
)

Diagrama Circular hi %

Colores <- c(
  "#41B7C4","#FECEA3","#5182AF","#AADD9C",
  "#EBC4E1","#D4C95F","#B8936B"
)

etiquetas <- paste0(round(TDF_Area_Plot$hi), "%")

# Permitir dibujar fuera del área del gráfico
par(xpd = TRUE)

pie(
  TDF_Area_Plot$hi,
  labels = etiquetas,
  col = Colores,
  radius = 0.8,
  main = "Gráfica Nº5: Distribución Porcentual por Área (%)"
)

legend(
  "right",
  inset = -0.25,      # mueve la leyenda fuera del gráfico
  legend = TDF_Area_Plot$Area,
  fill = Colores,
  cex = 0.7,
  bty = "n"
)

# Volver a la configuración normal
par(xpd = FALSE)

4. INDICADORES ESTADISTICOS

Moda

tabla_freq_area <- table(Sedimentos_Marinos_Area$Area)
moda_area <- names(tabla_freq_area)[which.max(tabla_freq_area)]

moda_area
## [1] "New England Shelf"

Tabla de indicadores estadisticos

tabla_freq_area <- table(Sedimentos_Marinos_Area$Area)
moda_area <- names(tabla_freq_area)[which.max(tabla_freq_area)]

tabla_indicadores_area <- data.frame(
  Indicador = c("Tamaño muestral (n)", "Moda"),
  Resultado = c(
    sum(tabla_freq_area),
    moda_area
  )
)

tabla_indicadores_area %>%
  gt() %>%
  tab_header(
    title = md("**Tabla N°5**"),
    subtitle = md("Indicadores Estadísticos del Área de Recolección")
  )
Tabla N°5
Indicadores Estadísticos del Área de Recolección
Indicador Resultado
Tamaño muestral (n) 10257
Moda New England Shelf

5. CONCLUSIÓN

La variable Área de Recolección presenta registros que fluctúan entre la región del Caribe (Caribbean Region) y la costa oeste de EE. UU. (Western USA), y sus valores se encuentran predominantemente en torno a la categoría New England Shelf. Al analizar esta distribución en conjunto con la Clasificación Granulométrica, se evidencia una relación directa entre la región geográfica y la textura del sedimento conforme aumenta la profundidad; por ejemplo, en la plataforma de Nueva Inglaterra predominan las arenas y gravas que mantienen una alta porosidad, mientras que en regiones de menor energía los registros tienden hacia texturas finas como arcillas. Esta relación es fundamental para el análisis minero y geotécnico, ya que la variación de la textura con la profundidad en cada región condiciona la resistencia del macizo y la estabilidad de las excavaciones.