MUESTREO INFERENCIAL

library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(stringr)
library(gt)

datos <- read.csv("D:/sampling_methods_2500.csv")


# Extraer variable

df_muestreo <- data.frame(

muestreo = toupper(trimws(datos$SAMPLING_METHOD))

)

# Reemplazar categorías

df_muestreo$muestreo <- case_when(

toupper(df_muestreo$muestreo) == "DIAMOND CORE DRILLING" ~ "Diamond Core Drilling",

toupper(df_muestreo$muestreo) == "REVERSE CIRCULATION (RC)" ~ "Reverse Circulation (RC)",

toupper(df_muestreo$muestreo) == "CHANNEL SAMPLING" ~ "Channel Sampling",

toupper(df_muestreo$muestreo) == "CHIP SAMPLING" ~ "Chip Sampling",

toupper(df_muestreo$muestreo) == "COMPOSITE SAMPLING" ~ "Composite Sampling",

toupper(df_muestreo$muestreo) == "SYSTEMATIC SAMPLING" ~ "Systematic Sampling",

toupper(df_muestreo$muestreo) == "RANDOM SAMPLING" ~ "Random Sampling",

toupper(df_muestreo$muestreo) == "STRATIFIED SAMPLING" ~ "Stratified Sampling",

TRUE ~ "Sin registro"

)

# Orden de categorías

orden_muestreo <- c(

"Diamond Core Drilling",

"Reverse Circulation (RC)",

"Channel Sampling",

"Chip Sampling",

"Composite Sampling",

"Systematic Sampling",

"Random Sampling",

"Stratified Sampling",

"Sin registro"

)

# Convertir en factor ordenado

df_muestreo$muestreo <- factor(

df_muestreo$muestreo,

levels = orden_muestreo

)

# Frecuencias y probabilidad

ni <- table(df_muestreo$muestreo)

hi <- round(prop.table(ni), 4)

P <- round(hi * 100, 2)



# Crear tabla base

tabla_finalsampling <- data.frame(

Sampling_Method = names(ni),

ni = as.numeric(ni),

hi = as.numeric(hi),

P = as.numeric(P)

)

# Fila TOTAL

fila_total <- data.frame(

Sampling_Method = "TOTAL",

ni = sum(tabla_finalsampling$ni),

hi = round(sum(tabla_finalsampling$hi), 4),

P = round(sum(tabla_finalsampling$P), 2)

)

# Mostrar

tabla_finalsampling <- rbind(tabla_finalsampling, fila_total)

tabla_finalsampling

##             Sampling_Method   ni     hi      P
## 1     Diamond Core Drilling  878 0.3512  35.12
## 2  Reverse Circulation (RC)  608 0.2432  24.32
## 3          Channel Sampling  276 0.1104  11.04
## 4             Chip Sampling  184 0.0736   7.36
## 5        Composite Sampling  169 0.0676   6.76
## 6       Systematic Sampling  205 0.0820   8.20
## 7           Random Sampling   71 0.0284   2.84
## 8       Stratified Sampling  109 0.0436   4.36
## 9              Sin registro    0 0.0000   0.00
## 10                    TOTAL 2500 1.0000 100.00

tabla_sampling_gt <- tabla_finalsampling %>%

gt() %>%

tab_header(

title = md("**Tabla N° 1**"),

subtitle = md("Distribución de probabilidad de los métodos de obtención de muestras en el análisis geoquímico y geológico de depósitos minerales en Estados Unidos")

) %>%

tab_source_note(

source_note = md("Autor: Grupo 2")

) %>%

tab_options(

table.border.top.color = "black",

table.border.bottom.color = "black",

heading.border.bottom.color = "black",

heading.border.bottom.width = px(2),

column_labels.border.top.color = "black",

column_labels.border.bottom.color = "black",

column_labels.border.bottom.width = px(2),

table_body.hlines.color = "gray",

table_body.border.bottom.color = "black",

row.striping.include_table_body = TRUE

) %>%

tab_style(

style = cell_text(weight = "bold"),

locations = cells_body(rows = Sampling_Method == "TOTAL")

)

tabla_sampling_gt

Sampling_Method	ni	hi	P
Tabla N° 1
Distribución de probabilidad de los métodos de obtención de muestras en el análisis geoquímico y geológico de depósitos minerales en Estados Unidos
Diamond Core Drilling	878	0.3512	35.12
Reverse Circulation (RC)	608	0.2432	24.32
Channel Sampling	276	0.1104	11.04
Chip Sampling	184	0.0736	7.36
Composite Sampling	169	0.0676	6.76
Systematic Sampling	205	0.0820	8.20
Random Sampling	71	0.0284	2.84
Stratified Sampling	109	0.0436	4.36
Sin registro	0	0.0000	0.00
TOTAL	2500	1.0000	100.00
Autor: Grupo 2

# Extraer probabilidad (%) sin la fila TOTAL

P_global <- as.numeric(tabla_finalsampling$P[1:(nrow(tabla_finalsampling)-1)])

barplot(

P_global,

main = "Gráfica Nº1: Distribución de probabilidad de los métodos de\nobtención de muestras en depósitos minerales de Estados Unidos",

cex.main = 0.7,

xlab = "Métodos de muestreo",

ylab = "Probabilidad (%)",

col = "blue",

names.arg = tabla_finalsampling$Sampling_Method[1:(nrow(tabla_finalsampling)-1)],

cex.names = 0.8,

ylim = c(0, 100),

las = 2

)

# Eliminar fila TOTAL

tabla_sin_total <- tabla_finalsampling[

tabla_finalsampling$Sampling_Method != "TOTAL",

]

# Extraer probabilidad de la categoría "Diamond Core Drilling"

prob_diamond <- tabla_sin_total$P[

tabla_sin_total$Sampling_Method == "Diamond Core Drilling"

]

# Gráfico de texto explicativo

plot(1, type = "n", axes = FALSE, xlab = "", ylab = "")

text(

x = 1, y = 1,

labels = paste(

"Cálculo de probabilidad\n(Estimación general)\n\n",

"¿Qué probabilidad existe de que una muestra\n",

"geoquímica o geológica en depósitos minerales\n",

"de Estados Unidos sea obtenida mediante el método\n",

"Diamond Core Drilling?\n\n",

"Probabilidad = ", prob_diamond, " (%)",

sep = ""

),

cex = 1.4,

col = "black",

font = 2

)