ANÁLISIS INFERENCIAL

CARGA DE DATOS Y LIBRERÍAS

# Limpiar entorno
rm(list = ls())

# Librerías
if (!require("dplyr")) install.packages("dplyr")
if (!require("stringr")) install.packages("stringr")
if (!require("gt")) install.packages("gt")

library(dplyr)
library(stringr)
library(gt)

# Cargar datos
datos <- read.csv("D:/sampling_methods_2500.csv")

cat("✓ Datos cargados correctamente\n")
## ✓ Datos cargados correctamente
cat("✓ Número de observaciones:", nrow(datos), "\n")
## ✓ Número de observaciones: 2500
# Extraer variable

df_muestreo <- data.frame(
  muestreo = toupper(trimws(datos$SAMPLING_METHOD))
)

# Reemplazar categorías

df_muestreo$muestreo <- case_when(

  toupper(df_muestreo$muestreo) == "DIAMOND CORE DRILLING" ~ "Diamond Core Drilling",

  toupper(df_muestreo$muestreo) == "REVERSE CIRCULATION (RC)" ~ "Reverse Circulation (RC)",

  toupper(df_muestreo$muestreo) == "CHANNEL SAMPLING" ~ "Channel Sampling",

  toupper(df_muestreo$muestreo) == "CHIP SAMPLING" ~ "Chip Sampling",

  toupper(df_muestreo$muestreo) == "COMPOSITE SAMPLING" ~ "Composite Sampling",

  toupper(df_muestreo$muestreo) == "SYSTEMATIC SAMPLING" ~ "Systematic Sampling",

  toupper(df_muestreo$muestreo) == "RANDOM SAMPLING" ~ "Random Sampling",

  toupper(df_muestreo$muestreo) == "STRATIFIED SAMPLING" ~ "Stratified Sampling",

  TRUE ~ "Sin registro"

)

# Orden de categorías

orden_muestreo <- c(

  "Diamond Core Drilling",

  "Reverse Circulation (RC)",

  "Channel Sampling",

  "Chip Sampling",

  "Composite Sampling",

  "Systematic Sampling",

  "Random Sampling",

  "Stratified Sampling",

  "Sin registro"

)

# Convertir en factor ordenado

df_muestreo$muestreo <- factor(

  df_muestreo$muestreo,

  levels = orden_muestreo

)

TABLA DE DISTRIBUCIÓN DE PROBABILIDAD

# Frecuencias y probabilidades

ni <- table(df_muestreo$muestreo)

hi <- round(prop.table(ni), 4)

P <- round(hi * 100, 2)

# Crear tabla base

tabla_finalsampling <- data.frame(

  Sampling_Method = names(ni),

  ni = as.numeric(ni),

  hi = as.numeric(hi),

  P = as.numeric(P)

)

# Fila TOTAL

fila_total <- data.frame(

  Sampling_Method = "TOTAL",

  ni = sum(tabla_finalsampling$ni),

  hi = round(sum(tabla_finalsampling$hi), 4),

  P = round(sum(tabla_finalsampling$P), 2)

)

# Agregar TOTAL

tabla_finalsampling <- rbind(

  tabla_finalsampling,

  fila_total

)

tabla_finalsampling
##             Sampling_Method   ni     hi      P
## 1     Diamond Core Drilling  878 0.3512  35.12
## 2  Reverse Circulation (RC)  608 0.2432  24.32
## 3          Channel Sampling  276 0.1104  11.04
## 4             Chip Sampling  184 0.0736   7.36
## 5        Composite Sampling  169 0.0676   6.76
## 6       Systematic Sampling  205 0.0820   8.20
## 7           Random Sampling   71 0.0284   2.84
## 8       Stratified Sampling  109 0.0436   4.36
## 9              Sin registro    0 0.0000   0.00
## 10                    TOTAL 2500 1.0000 100.00
# Tabla gt

tabla_sampling_gt <- tabla_finalsampling %>%

gt() %>%

tab_header(

title = md("**Tabla N° 1**"),

subtitle = md("Distribución de probabilidad de los métodos de obtención de muestras en el análisis geoquímico y geológico de depósitos minerales en Estados Unidos")

) %>%

tab_source_note(

source_note = md("Autor: Grupo 2")

) %>%

tab_options(

table.border.top.color = "black",

table.border.bottom.color = "black",

heading.border.bottom.color = "black",

heading.border.bottom.width = px(2),

column_labels.border.top.color = "black",

column_labels.border.bottom.color = "black",

column_labels.border.bottom.width = px(2),

table_body.hlines.color = "gray",

table_body.border.bottom.color = "black",

row.striping.include_table_body = TRUE

) %>%

tab_style(

style = cell_text(weight = "bold"),

locations = cells_body(rows = Sampling_Method == "TOTAL")

)

tabla_sampling_gt
Tabla N° 1
Distribución de probabilidad de los métodos de obtención de muestras en el análisis geoquímico y geológico de depósitos minerales en Estados Unidos
Sampling_Method ni hi P
Diamond Core Drilling 878 0.3512 35.12
Reverse Circulation (RC) 608 0.2432 24.32
Channel Sampling 276 0.1104 11.04
Chip Sampling 184 0.0736 7.36
Composite Sampling 169 0.0676 6.76
Systematic Sampling 205 0.0820 8.20
Random Sampling 71 0.0284 2.84
Stratified Sampling 109 0.0436 4.36
Sin registro 0 0.0000 0.00
TOTAL 2500 1.0000 100.00
Autor: Grupo 2

TABLA DE DISTRIBUCIÓN DE PROBABILIDAD AGRUPADA

# Frecuencias acumuladas

Ni <- cumsum(ni)

Hi <- round(cumsum(hi), 4)

Pi <- round(cumsum(P), 2)

# Tabla agrupada

tabla_agrupada <- data.frame(

  Sampling_Method = names(ni),

  ni = as.numeric(ni),

  hi = as.numeric(hi),

  P = as.numeric(P),

  Ni = Ni,

  Hi = Hi,

  Pi = Pi

)

tabla_agrupada
##                                   Sampling_Method  ni     hi     P   Ni     Hi
## Diamond Core Drilling       Diamond Core Drilling 878 0.3512 35.12  878 0.3512
## Reverse Circulation (RC) Reverse Circulation (RC) 608 0.2432 24.32 1486 0.5944
## Channel Sampling                 Channel Sampling 276 0.1104 11.04 1762 0.7048
## Chip Sampling                       Chip Sampling 184 0.0736  7.36 1946 0.7784
## Composite Sampling             Composite Sampling 169 0.0676  6.76 2115 0.8460
## Systematic Sampling           Systematic Sampling 205 0.0820  8.20 2320 0.9280
## Random Sampling                   Random Sampling  71 0.0284  2.84 2391 0.9564
## Stratified Sampling           Stratified Sampling 109 0.0436  4.36 2500 1.0000
## Sin registro                         Sin registro   0 0.0000  0.00 2500 1.0000
##                              Pi
## Diamond Core Drilling     35.12
## Reverse Circulation (RC)  59.44
## Channel Sampling          70.48
## Chip Sampling             77.84
## Composite Sampling        84.60
## Systematic Sampling       92.80
## Random Sampling           95.64
## Stratified Sampling      100.00
## Sin registro             100.00
# Tabla agrupada gt

tabla_agrupada_gt <- tabla_agrupada %>%

gt() %>%

tab_header(

title = md("**Tabla N° 2**"),

subtitle = md("Distribución acumulada de probabilidad de los métodos de muestreo")

) %>%

tab_source_note(

source_note = md("Autor: Grupo 2")

)

tabla_agrupada_gt
Tabla N° 2
Distribución acumulada de probabilidad de los métodos de muestreo
Sampling_Method ni hi P Ni Hi Pi
Diamond Core Drilling 878 0.3512 35.12 878 0.3512 35.12
Reverse Circulation (RC) 608 0.2432 24.32 1486 0.5944 59.44
Channel Sampling 276 0.1104 11.04 1762 0.7048 70.48
Chip Sampling 184 0.0736 7.36 1946 0.7784 77.84
Composite Sampling 169 0.0676 6.76 2115 0.8460 84.60
Systematic Sampling 205 0.0820 8.20 2320 0.9280 92.80
Random Sampling 71 0.0284 2.84 2391 0.9564 95.64
Stratified Sampling 109 0.0436 4.36 2500 1.0000 100.00
Sin registro 0 0.0000 0.00 2500 1.0000 100.00
Autor: Grupo 2

GRÁFICAS DE DISTRIBUCIÓN DE PROBABILIDAD

# Extraer probabilidades sin TOTAL

P_global <- as.numeric(

  tabla_finalsampling$P[
    1:(nrow(tabla_finalsampling)-1)
  ]

)

# Gráfico de barras

barplot(

  P_global,

  main = "Gráfica Nº1: Distribución de probabilidad de los métodos de\nobtención de muestras en depósitos minerales de Estados Unidos",

  cex.main = 0.7,

  xlab = "Métodos de muestreo",

  ylab = "Probabilidad (%)",

  col = "blue",

  names.arg = tabla_finalsampling$Sampling_Method[
    1:(nrow(tabla_finalsampling)-1)
  ],

  cex.names = 0.8,

  ylim = c(0, 100),

  las = 2

)

CÁLCULO DE PROBABILIDAD

# Eliminar fila TOTAL

tabla_sin_total <- tabla_finalsampling[
  tabla_finalsampling$Sampling_Method != "TOTAL",
]

# Probabilidad Diamond Core Drilling

prob_diamond <- tabla_sin_total$P[
  tabla_sin_total$Sampling_Method == "Diamond Core Drilling"
]

# Gráfico explicativo

plot(

  1,

  type = "n",

  axes = FALSE,

  xlab = "",

  ylab = ""

)

text(

  x = 1,
  y = 1,

  labels = paste(

    "Cálculo de probabilidad\n(Estimación general)\n\n",

    "¿Qué probabilidad existe de que una muestra\n",

    "geoquímica o geológica en depósitos minerales\n",

    "de Estados Unidos sea obtenida mediante el método\n",

    "Diamond Core Drilling?\n\n",

    "Probabilidad = ", prob_diamond, " (%)",

    sep = ""

  ),

  cex = 1.3,

  col = "black",

  font = 2

)

CONCLUSIONES

"Los métodos de obtención de muestras presentan una distribución probabilística heterogénea dentro de los depósitos minerales analizados en Estados Unidos. El método Diamond Core Drilling registra una de las mayores probabilidades de ocurrencia, reflejando su amplio uso en campañas de exploración geológica y geoquímica. La distribución acumulada permite observar el comportamiento progresivo de las probabilidades entre categorías, mientras que las gráficas evidencian diferencias importantes entre los métodos de muestreo utilizados."
## [1] "Los métodos de obtención de muestras presentan una distribución probabilística heterogénea dentro de los depósitos minerales analizados en Estados Unidos. El método Diamond Core Drilling registra una de las mayores probabilidades de ocurrencia, reflejando su amplio uso en campañas de exploración geológica y geoquímica. La distribución acumulada permite observar el comportamiento progresivo de las probabilidades entre categorías, mientras que las gráficas evidencian diferencias importantes entre los métodos de muestreo utilizados."