ANÁLISIS INFERENCIAL
CARGA DE DATOS Y LIBRERÍAS
# Limpiar entorno
rm(list = ls())
# Librerías
if (!require("dplyr")) install.packages("dplyr")
if (!require("stringr")) install.packages("stringr")
if (!require("gt")) install.packages("gt")
library(dplyr)
library(stringr)
library(gt)
# Cargar datos
datos <- read.csv("D:/sampling_methods_2500.csv")
cat("✓ Datos cargados correctamente\n")
## ✓ Datos cargados correctamente
cat("✓ Número de observaciones:", nrow(datos), "\n")
## ✓ Número de observaciones: 2500
# Extraer variable
df_muestreo <- data.frame(
muestreo = toupper(trimws(datos$SAMPLING_METHOD))
)
# Reemplazar categorías
df_muestreo$muestreo <- case_when(
toupper(df_muestreo$muestreo) == "DIAMOND CORE DRILLING" ~ "Diamond Core Drilling",
toupper(df_muestreo$muestreo) == "REVERSE CIRCULATION (RC)" ~ "Reverse Circulation (RC)",
toupper(df_muestreo$muestreo) == "CHANNEL SAMPLING" ~ "Channel Sampling",
toupper(df_muestreo$muestreo) == "CHIP SAMPLING" ~ "Chip Sampling",
toupper(df_muestreo$muestreo) == "COMPOSITE SAMPLING" ~ "Composite Sampling",
toupper(df_muestreo$muestreo) == "SYSTEMATIC SAMPLING" ~ "Systematic Sampling",
toupper(df_muestreo$muestreo) == "RANDOM SAMPLING" ~ "Random Sampling",
toupper(df_muestreo$muestreo) == "STRATIFIED SAMPLING" ~ "Stratified Sampling",
TRUE ~ "Sin registro"
)
# Orden de categorías
orden_muestreo <- c(
"Diamond Core Drilling",
"Reverse Circulation (RC)",
"Channel Sampling",
"Chip Sampling",
"Composite Sampling",
"Systematic Sampling",
"Random Sampling",
"Stratified Sampling",
"Sin registro"
)
# Convertir en factor ordenado
df_muestreo$muestreo <- factor(
df_muestreo$muestreo,
levels = orden_muestreo
)
TABLA DE DISTRIBUCIÓN DE PROBABILIDAD
# Frecuencias y probabilidades
ni <- table(df_muestreo$muestreo)
hi <- round(prop.table(ni), 4)
P <- round(hi * 100, 2)
# Crear tabla base
tabla_finalsampling <- data.frame(
Sampling_Method = names(ni),
ni = as.numeric(ni),
hi = as.numeric(hi),
P = as.numeric(P)
)
# Fila TOTAL
fila_total <- data.frame(
Sampling_Method = "TOTAL",
ni = sum(tabla_finalsampling$ni),
hi = round(sum(tabla_finalsampling$hi), 4),
P = round(sum(tabla_finalsampling$P), 2)
)
# Agregar TOTAL
tabla_finalsampling <- rbind(
tabla_finalsampling,
fila_total
)
tabla_finalsampling
## Sampling_Method ni hi P
## 1 Diamond Core Drilling 878 0.3512 35.12
## 2 Reverse Circulation (RC) 608 0.2432 24.32
## 3 Channel Sampling 276 0.1104 11.04
## 4 Chip Sampling 184 0.0736 7.36
## 5 Composite Sampling 169 0.0676 6.76
## 6 Systematic Sampling 205 0.0820 8.20
## 7 Random Sampling 71 0.0284 2.84
## 8 Stratified Sampling 109 0.0436 4.36
## 9 Sin registro 0 0.0000 0.00
## 10 TOTAL 2500 1.0000 100.00
# Tabla gt
tabla_sampling_gt <- tabla_finalsampling %>%
gt() %>%
tab_header(
title = md("**Tabla N° 1**"),
subtitle = md("Distribución de probabilidad de los métodos de obtención de muestras en el análisis geoquímico y geológico de depósitos minerales en Estados Unidos")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 2")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black",
row.striping.include_table_body = TRUE
) %>%
tab_style(
style = cell_text(weight = "bold"),
locations = cells_body(rows = Sampling_Method == "TOTAL")
)
tabla_sampling_gt
| Tabla N° 1 |
| Distribución de probabilidad de los métodos de obtención de muestras en el análisis geoquímico y geológico de depósitos minerales en Estados Unidos |
| Sampling_Method |
ni |
hi |
P |
| Diamond Core Drilling |
878 |
0.3512 |
35.12 |
| Reverse Circulation (RC) |
608 |
0.2432 |
24.32 |
| Channel Sampling |
276 |
0.1104 |
11.04 |
| Chip Sampling |
184 |
0.0736 |
7.36 |
| Composite Sampling |
169 |
0.0676 |
6.76 |
| Systematic Sampling |
205 |
0.0820 |
8.20 |
| Random Sampling |
71 |
0.0284 |
2.84 |
| Stratified Sampling |
109 |
0.0436 |
4.36 |
| Sin registro |
0 |
0.0000 |
0.00 |
| TOTAL |
2500 |
1.0000 |
100.00 |
| Autor: Grupo 2 |
TABLA DE DISTRIBUCIÓN DE PROBABILIDAD AGRUPADA
# Frecuencias acumuladas
Ni <- cumsum(ni)
Hi <- round(cumsum(hi), 4)
Pi <- round(cumsum(P), 2)
# Tabla agrupada
tabla_agrupada <- data.frame(
Sampling_Method = names(ni),
ni = as.numeric(ni),
hi = as.numeric(hi),
P = as.numeric(P),
Ni = Ni,
Hi = Hi,
Pi = Pi
)
tabla_agrupada
## Sampling_Method ni hi P Ni Hi
## Diamond Core Drilling Diamond Core Drilling 878 0.3512 35.12 878 0.3512
## Reverse Circulation (RC) Reverse Circulation (RC) 608 0.2432 24.32 1486 0.5944
## Channel Sampling Channel Sampling 276 0.1104 11.04 1762 0.7048
## Chip Sampling Chip Sampling 184 0.0736 7.36 1946 0.7784
## Composite Sampling Composite Sampling 169 0.0676 6.76 2115 0.8460
## Systematic Sampling Systematic Sampling 205 0.0820 8.20 2320 0.9280
## Random Sampling Random Sampling 71 0.0284 2.84 2391 0.9564
## Stratified Sampling Stratified Sampling 109 0.0436 4.36 2500 1.0000
## Sin registro Sin registro 0 0.0000 0.00 2500 1.0000
## Pi
## Diamond Core Drilling 35.12
## Reverse Circulation (RC) 59.44
## Channel Sampling 70.48
## Chip Sampling 77.84
## Composite Sampling 84.60
## Systematic Sampling 92.80
## Random Sampling 95.64
## Stratified Sampling 100.00
## Sin registro 100.00
# Tabla agrupada gt
tabla_agrupada_gt <- tabla_agrupada %>%
gt() %>%
tab_header(
title = md("**Tabla N° 2**"),
subtitle = md("Distribución acumulada de probabilidad de los métodos de muestreo")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 2")
)
tabla_agrupada_gt
| Tabla N° 2 |
| Distribución acumulada de probabilidad de los métodos de muestreo |
| Sampling_Method |
ni |
hi |
P |
Ni |
Hi |
Pi |
| Diamond Core Drilling |
878 |
0.3512 |
35.12 |
878 |
0.3512 |
35.12 |
| Reverse Circulation (RC) |
608 |
0.2432 |
24.32 |
1486 |
0.5944 |
59.44 |
| Channel Sampling |
276 |
0.1104 |
11.04 |
1762 |
0.7048 |
70.48 |
| Chip Sampling |
184 |
0.0736 |
7.36 |
1946 |
0.7784 |
77.84 |
| Composite Sampling |
169 |
0.0676 |
6.76 |
2115 |
0.8460 |
84.60 |
| Systematic Sampling |
205 |
0.0820 |
8.20 |
2320 |
0.9280 |
92.80 |
| Random Sampling |
71 |
0.0284 |
2.84 |
2391 |
0.9564 |
95.64 |
| Stratified Sampling |
109 |
0.0436 |
4.36 |
2500 |
1.0000 |
100.00 |
| Sin registro |
0 |
0.0000 |
0.00 |
2500 |
1.0000 |
100.00 |
| Autor: Grupo 2 |
GRÁFICAS DE DISTRIBUCIÓN DE PROBABILIDAD
# Extraer probabilidades sin TOTAL
P_global <- as.numeric(
tabla_finalsampling$P[
1:(nrow(tabla_finalsampling)-1)
]
)
# Gráfico de barras
barplot(
P_global,
main = "Gráfica Nº1: Distribución de probabilidad de los métodos de\nobtención de muestras en depósitos minerales de Estados Unidos",
cex.main = 0.7,
xlab = "Métodos de muestreo",
ylab = "Probabilidad (%)",
col = "blue",
names.arg = tabla_finalsampling$Sampling_Method[
1:(nrow(tabla_finalsampling)-1)
],
cex.names = 0.8,
ylim = c(0, 100),
las = 2
)

CÁLCULO DE PROBABILIDAD
# Eliminar fila TOTAL
tabla_sin_total <- tabla_finalsampling[
tabla_finalsampling$Sampling_Method != "TOTAL",
]
# Probabilidad Diamond Core Drilling
prob_diamond <- tabla_sin_total$P[
tabla_sin_total$Sampling_Method == "Diamond Core Drilling"
]
# Gráfico explicativo
plot(
1,
type = "n",
axes = FALSE,
xlab = "",
ylab = ""
)
text(
x = 1,
y = 1,
labels = paste(
"Cálculo de probabilidad\n(Estimación general)\n\n",
"¿Qué probabilidad existe de que una muestra\n",
"geoquímica o geológica en depósitos minerales\n",
"de Estados Unidos sea obtenida mediante el método\n",
"Diamond Core Drilling?\n\n",
"Probabilidad = ", prob_diamond, " (%)",
sep = ""
),
cex = 1.3,
col = "black",
font = 2
)

CONCLUSIONES
"Los métodos de obtención de muestras presentan una distribución probabilística heterogénea dentro de los depósitos minerales analizados en Estados Unidos. El método Diamond Core Drilling registra una de las mayores probabilidades de ocurrencia, reflejando su amplio uso en campañas de exploración geológica y geoquímica. La distribución acumulada permite observar el comportamiento progresivo de las probabilidades entre categorías, mientras que las gráficas evidencian diferencias importantes entre los métodos de muestreo utilizados."
## [1] "Los métodos de obtención de muestras presentan una distribución probabilística heterogénea dentro de los depósitos minerales analizados en Estados Unidos. El método Diamond Core Drilling registra una de las mayores probabilidades de ocurrencia, reflejando su amplio uso en campañas de exploración geológica y geoquímica. La distribución acumulada permite observar el comportamiento progresivo de las probabilidades entre categorías, mientras que las gráficas evidencian diferencias importantes entre los métodos de muestreo utilizados."