ANÁLISIS INFERENCIAL

CARGA DE DATOS Y LIBRERÍAS

# Limpiar entorno
rm(list = ls())

# Librerías
if (!require("dplyr")) install.packages("dplyr")
if (!require("stringr")) install.packages("stringr")
if (!require("gt")) install.packages("gt")

library(dplyr)
library(stringr)
library(gt)

# Cargar datos
datos <- read.csv("D:/sampling_methods_2500.csv")

cat("✓ Datos cargados correctamente\n")

## ✓ Datos cargados correctamente

cat("✓ Número de observaciones:", nrow(datos), "\n")

## ✓ Número de observaciones: 2500

# Extraer variable

df_muestreo <- data.frame(
  muestreo = toupper(trimws(datos$SAMPLING_METHOD))
)

# Reemplazar categorías

df_muestreo$muestreo <- case_when(

  toupper(df_muestreo$muestreo) == "DIAMOND CORE DRILLING" ~ "Diamond Core Drilling",

  toupper(df_muestreo$muestreo) == "REVERSE CIRCULATION (RC)" ~ "Reverse Circulation (RC)",

  toupper(df_muestreo$muestreo) == "CHANNEL SAMPLING" ~ "Channel Sampling",

  toupper(df_muestreo$muestreo) == "CHIP SAMPLING" ~ "Chip Sampling",

  toupper(df_muestreo$muestreo) == "COMPOSITE SAMPLING" ~ "Composite Sampling",

  toupper(df_muestreo$muestreo) == "SYSTEMATIC SAMPLING" ~ "Systematic Sampling",

  toupper(df_muestreo$muestreo) == "RANDOM SAMPLING" ~ "Random Sampling",

  toupper(df_muestreo$muestreo) == "STRATIFIED SAMPLING" ~ "Stratified Sampling",

  TRUE ~ "Sin registro"

)

# Orden de categorías

orden_muestreo <- c(

  "Diamond Core Drilling",

  "Reverse Circulation (RC)",

  "Channel Sampling",

  "Chip Sampling",

  "Composite Sampling",

  "Systematic Sampling",

  "Random Sampling",

  "Stratified Sampling",

  "Sin registro"

)

# Convertir en factor ordenado

df_muestreo$muestreo <- factor(

  df_muestreo$muestreo,

  levels = orden_muestreo

)

TABLA DE DISTRIBUCIÓN DE PROBABILIDAD

# Frecuencias y probabilidades

ni <- table(df_muestreo$muestreo)

hi <- round(prop.table(ni), 4)

P <- round(hi * 100, 2)

# Crear tabla base

tabla_finalsampling <- data.frame(

  Sampling_Method = names(ni),

  ni = as.numeric(ni),

  hi = as.numeric(hi),

  P = as.numeric(P)

)

# Fila TOTAL

fila_total <- data.frame(

  Sampling_Method = "TOTAL",

  ni = sum(tabla_finalsampling$ni),

  hi = round(sum(tabla_finalsampling$hi), 4),

  P = round(sum(tabla_finalsampling$P), 2)

)

# Agregar TOTAL

tabla_finalsampling <- rbind(

  tabla_finalsampling,

  fila_total

)

tabla_finalsampling

##             Sampling_Method   ni     hi      P
## 1     Diamond Core Drilling  878 0.3512  35.12
## 2  Reverse Circulation (RC)  608 0.2432  24.32
## 3          Channel Sampling  276 0.1104  11.04
## 4             Chip Sampling  184 0.0736   7.36
## 5        Composite Sampling  169 0.0676   6.76
## 6       Systematic Sampling  205 0.0820   8.20
## 7           Random Sampling   71 0.0284   2.84
## 8       Stratified Sampling  109 0.0436   4.36
## 9              Sin registro    0 0.0000   0.00
## 10                    TOTAL 2500 1.0000 100.00

# Tabla gt

tabla_sampling_gt <- tabla_finalsampling %>%

gt() %>%

tab_header(

title = md("**Tabla N° 1**"),

subtitle = md("Distribución de probabilidad de los métodos de obtención de muestras en el análisis geoquímico y geológico de depósitos minerales en Estados Unidos")

) %>%

tab_source_note(

source_note = md("Autor: Grupo 2")

) %>%

tab_options(

table.border.top.color = "black",

table.border.bottom.color = "black",

heading.border.bottom.color = "black",

heading.border.bottom.width = px(2),

column_labels.border.top.color = "black",

column_labels.border.bottom.color = "black",

column_labels.border.bottom.width = px(2),

table_body.hlines.color = "gray",

table_body.border.bottom.color = "black",

row.striping.include_table_body = TRUE

) %>%

tab_style(

style = cell_text(weight = "bold"),

locations = cells_body(rows = Sampling_Method == "TOTAL")

)

tabla_sampling_gt

Sampling_Method	ni	hi	P
Tabla N° 1
Distribución de probabilidad de los métodos de obtención de muestras en el análisis geoquímico y geológico de depósitos minerales en Estados Unidos
Diamond Core Drilling	878	0.3512	35.12
Reverse Circulation (RC)	608	0.2432	24.32
Channel Sampling	276	0.1104	11.04
Chip Sampling	184	0.0736	7.36
Composite Sampling	169	0.0676	6.76
Systematic Sampling	205	0.0820	8.20
Random Sampling	71	0.0284	2.84
Stratified Sampling	109	0.0436	4.36
Sin registro	0	0.0000	0.00
TOTAL	2500	1.0000	100.00
Autor: Grupo 2

TABLA DE DISTRIBUCIÓN DE PROBABILIDAD AGRUPADA

# Frecuencias acumuladas

Ni <- cumsum(ni)

Hi <- round(cumsum(hi), 4)

Pi <- round(cumsum(P), 2)

# Tabla agrupada

tabla_agrupada <- data.frame(

  Sampling_Method = names(ni),

  ni = as.numeric(ni),

  hi = as.numeric(hi),

  P = as.numeric(P),

  Ni = Ni,

  Hi = Hi,

  Pi = Pi

)

tabla_agrupada

##                                   Sampling_Method  ni     hi     P   Ni     Hi
## Diamond Core Drilling       Diamond Core Drilling 878 0.3512 35.12  878 0.3512
## Reverse Circulation (RC) Reverse Circulation (RC) 608 0.2432 24.32 1486 0.5944
## Channel Sampling                 Channel Sampling 276 0.1104 11.04 1762 0.7048
## Chip Sampling                       Chip Sampling 184 0.0736  7.36 1946 0.7784
## Composite Sampling             Composite Sampling 169 0.0676  6.76 2115 0.8460
## Systematic Sampling           Systematic Sampling 205 0.0820  8.20 2320 0.9280
## Random Sampling                   Random Sampling  71 0.0284  2.84 2391 0.9564
## Stratified Sampling           Stratified Sampling 109 0.0436  4.36 2500 1.0000
## Sin registro                         Sin registro   0 0.0000  0.00 2500 1.0000
##                              Pi
## Diamond Core Drilling     35.12
## Reverse Circulation (RC)  59.44
## Channel Sampling          70.48
## Chip Sampling             77.84
## Composite Sampling        84.60
## Systematic Sampling       92.80
## Random Sampling           95.64
## Stratified Sampling      100.00
## Sin registro             100.00

# Tabla agrupada gt

tabla_agrupada_gt <- tabla_agrupada %>%

gt() %>%

tab_header(

title = md("**Tabla N° 2**"),

subtitle = md("Distribución acumulada de probabilidad de los métodos de muestreo")

) %>%

tab_source_note(

source_note = md("Autor: Grupo 2")

)

tabla_agrupada_gt

Sampling_Method	ni	hi	P	Ni	Hi	Pi
Tabla N° 2
Distribución acumulada de probabilidad de los métodos de muestreo
Diamond Core Drilling	878	0.3512	35.12	878	0.3512	35.12
Reverse Circulation (RC)	608	0.2432	24.32	1486	0.5944	59.44
Channel Sampling	276	0.1104	11.04	1762	0.7048	70.48
Chip Sampling	184	0.0736	7.36	1946	0.7784	77.84
Composite Sampling	169	0.0676	6.76	2115	0.8460	84.60
Systematic Sampling	205	0.0820	8.20	2320	0.9280	92.80
Random Sampling	71	0.0284	2.84	2391	0.9564	95.64
Stratified Sampling	109	0.0436	4.36	2500	1.0000	100.00
Sin registro	0	0.0000	0.00	2500	1.0000	100.00
Autor: Grupo 2

GRÁFICAS DE DISTRIBUCIÓN DE PROBABILIDAD

# Extraer probabilidades sin TOTAL

P_global <- as.numeric(

  tabla_finalsampling$P[
    1:(nrow(tabla_finalsampling)-1)
  ]

)

# Gráfico de barras

barplot(

  P_global,

  main = "Gráfica Nº1: Distribución de probabilidad de los métodos de\nobtención de muestras en depósitos minerales de Estados Unidos",

  cex.main = 0.7,

  xlab = "Métodos de muestreo",

  ylab = "Probabilidad (%)",

  col = "blue",

  names.arg = tabla_finalsampling$Sampling_Method[
    1:(nrow(tabla_finalsampling)-1)
  ],

  cex.names = 0.8,

  ylim = c(0, 100),

  las = 2

)

CÁLCULO DE PROBABILIDAD

# Eliminar fila TOTAL

tabla_sin_total <- tabla_finalsampling[
  tabla_finalsampling$Sampling_Method != "TOTAL",
]

# Probabilidad Diamond Core Drilling

prob_diamond <- tabla_sin_total$P[
  tabla_sin_total$Sampling_Method == "Diamond Core Drilling"
]

# Gráfico explicativo

plot(

  1,

  type = "n",

  axes = FALSE,

  xlab = "",

  ylab = ""

)

text(

  x = 1,
  y = 1,

  labels = paste(

    "Cálculo de probabilidad\n(Estimación general)\n\n",

    "¿Qué probabilidad existe de que una muestra\n",

    "geoquímica o geológica en depósitos minerales\n",

    "de Estados Unidos sea obtenida mediante el método\n",

    "Diamond Core Drilling?\n\n",

    "Probabilidad = ", prob_diamond, " (%)",

    sep = ""

  ),

  cex = 1.3,

  col = "black",

  font = 2

)

CONCLUSIONES

"Los métodos de obtención de muestras presentan una distribución probabilística heterogénea dentro de los depósitos minerales analizados en Estados Unidos. El método Diamond Core Drilling registra una de las mayores probabilidades de ocurrencia, reflejando su amplio uso en campañas de exploración geológica y geoquímica. La distribución acumulada permite observar el comportamiento progresivo de las probabilidades entre categorías, mientras que las gráficas evidencian diferencias importantes entre los métodos de muestreo utilizados."

## [1] "Los métodos de obtención de muestras presentan una distribución probabilística heterogénea dentro de los depósitos minerales analizados en Estados Unidos. El método Diamond Core Drilling registra una de las mayores probabilidades de ocurrencia, reflejando su amplio uso en campañas de exploración geológica y geoquímica. La distribución acumulada permite observar el comportamiento progresivo de las probabilidades entre categorías, mientras que las gráficas evidencian diferencias importantes entre los métodos de muestreo utilizados."

MUESTREO INFERENCIAL

Grupo 2

2026-05-27

ANÁLISIS INFERENCIAL

CARGA DE DATOS Y LIBRERÍAS

TABLA DE DISTRIBUCIÓN DE PROBABILIDAD

TABLA DE DISTRIBUCIÓN DE PROBABILIDAD AGRUPADA

GRÁFICAS DE DISTRIBUCIÓN DE PROBABILIDAD

CÁLCULO DE PROBABILIDAD

CONCLUSIONES