CARGA DE DATOS
knitr::opts_chunk$set(
echo = TRUE, # Muestra el código R en el reporte final.
message = FALSE,
warning = FALSE, # Evita que se impriman alertas o mensajes de carga estorbosos en el HTML.
fig.align = "center" # Centra automáticamente todas las gráficas generadas.
)
datos <- read.csv("C:/Users/Martin/Desktop/Estadistica/CMDB_Data.csv",
header = TRUE, # Indica que la primera fila contiene los nombres de las variables.
sep = ";", # Define el punto y coma como separador.
dec = ".", # Establece el punto como el operador decimal.
fileEncoding = "latin1")
# Limpieza básica para evitar valores en blanco
datos$CONTINENT[datos$CONTINENT == ""] <- "Desconocido"
# Verificación inicial del set de datos
str(datos)
## 'data.frame': 1366 obs. of 103 variables:
## $ ï..LAB_ID : chr "C355417" "C360759" "C360762" "C360763" ...
## $ PREVIOUS_LAB_ID1 : chr "" "" "" "" ...
## $ PREVIOUS_LAB_ID2 : chr "" "" "" "" ...
## $ PREVIOUS_LAB_ID3 : chr "" "" "" "" ...
## $ FIELD_ID : chr "RM0001" "RM0027" "RM0030" "RM0031" ...
## $ JOB_ID : chr "MRP11968" "MRP12307" "MRP12307" "MRP12307" ...
## $ PREVIOUS_JOB_ID1 : chr "" "" "" "" ...
## $ PREVIOUS_JOB_ID2 : chr "" "" "" "" ...
## $ PREVIOUS_JOB_ID3 : chr "" "" "" "" ...
## $ SUBMITTER : chr "Rare Metals Task" "Rare Metals Task" "Rare Metals Task" "Rare Metals Task" ...
## $ PROJECT_NAME : chr "Critical and Rare Metals" "Critical and Rare Metals" "Critical and Rare Metals" "Critical and Rare Metals" ...
## $ X0 : chr "30/6/2011" "31/8/2011" "31/8/2011" "31/8/2011" ...
## $ COLLECTION : chr "Mackay-Keck Ore Deposits Collection" "Mackay-Stanford Ore Deposits Collection" "Mackay-Stanford Ore Deposits Collection" "Mackay-Stanford Ore Deposits Collection" ...
## $ COLLECTION_ID : chr "PHNC08_39_1183" "OD21441" "OD22811" "OD25716" ...
## $ CONTINENT : chr "North America" "South America" "South America" "Africa" ...
## $ COUNTRY : chr "United States" "Chile" "Chile" "South Africa" ...
## $ STATE_PROVINCE : chr "Nevada" "Antofagasta" "Tarapacá" "Transvaal" ...
## $ COUNTY : chr "Lyon" "El Loa" "El Tamarugal" "" ...
## $ DISTRICT_NAME : chr "Yerington" "Chuquicamata" "Collahuasi/Quebrada Blanca" "" ...
## $ DEPOSIT_NAME : chr "Pumpkin Hollow" "" "" "" ...
## $ MINE_NAME : chr "Pumpkin Hollow" "Chuquicamata mine" "Collahuasi district" "" ...
## $ DISTRICT_NAME_COLLECT: chr "Yerington" "" "" "" ...
## $ DEPOSIT_NAME_COLLECT : chr "" "" "" "" ...
## $ MINE_NAME_COLLECT : chr "Pumpkin Hollow" "Chuquicamata" "Poduosa mine" "Messina Mines Ltd." ...
## $ LOCATE_DESC : chr "" "" "Level 25" "" ...
## $ LATITUDE : chr "38,94021" "-22,2871" "-21,0309" "-24,7" ...
## $ LONGITUDE : chr "-119,05178" "-68,8991" "-68,74951" "29,3" ...
## $ DATUM : chr "WGS84" "WGS84" "WGS84" "" ...
## $ LATITUDE_COLLECT : chr "38,92492" "22,28944" "" "" ...
## $ LONGITUDE_COLLECT : chr "-119,1071" "-68,90111" "" "" ...
## $ DATUM_COLLECT : chr "" "WGS84" "" "" ...
## $ COORDINATES_QUAL : chr "100 m" "0m" "" "" ...
## $ COORDINATES_SOURCE : chr "1) iTouchMap.com, approx, A. Orkild-Norton; 2) Mineral Resource Deposit Database Deposit ID 10174173, ore body, M. Granitto" "1) Mindat.org, approx, A. Orkild-Norton; 2) Open-File Report 2017-1079 ID 549, mine, M. Granitto" "1) No coordinates; 2) Mineral Resource Deposit Database Deposit ID 10057511, district, M. Granitto" "1) No coordinates; 2) Google Earth Pro, approx ctr of former province of Transvaal, M. Granitto" ...
## $ PRIMARY_CLASS : chr "rock" "rock" "rock" "rock" ...
## $ SYSTEM_TYPE : chr "IOA-IOCG" "Porphyry Cu-Mo-Au" "Porphyry Cu-Mo-Au" "IOA-IOCG" ...
## $ DEPOSIT_TYPE : chr "IOCG" "Supergene Cu" "Porphyry Cu" "IOCG" ...
## $ SAMPLE_DESC : chr "Nearly solid chalcopyrite mixed with small light brown irregular inclusions of unknown mineralogy; clouds of ma"| __truncated__ "Chalcocite-bronchatite-antlerite(?); highly microfractured igneous rock with green copper sulfates coating microfractures" "Bornite-chalcopyrite; mostly massive chalcopyrite with numerous inclusions of micro-chalcopyrite and widely sca"| __truncated__ "Massive chalcopyrite, IOCG in shear zone; mostly massive fine grain cuprite with widely distributed malachite t"| __truncated__ ...
## $ Al_pct_AES_ST : chr "0,33" "6,65" "0,46" "0,7" ...
## $ Ca_pct_AES_ST : chr "1,1" "0,4" "-0,1" "0,3" ...
## $ Fe_pct_AES_ST : chr "42,4" "0,25" "6,98" "27,8" ...
## $ K_pct_AES_ST : chr "-0,1" "6,1" "0,2" "-0,1" ...
## $ Mg_pct_AES_ST : chr "0,57" "0,1" "0,01" "0,33" ...
## $ Mn_pct_AES_ST : chr "0,02" "-0,01" "-0,01" "-0,01" ...
## $ P_pct_AES_ST : chr "-0,01" "0,01" "0,05" "0,01" ...
## $ S_pct_AES_ST : chr "" "" "" "" ...
## $ Si_pct_AES_ST : chr "" "" "" "" ...
## $ Ti_pct_AES_ST : chr "0,01" "0,11" "-0,01" "-0,01" ...
## $ F_pct_ISE_Fuse : chr "" "" "" "" ...
## $ Ag_ppm_MS_ST : chr "58" "6" "468" "16" ...
## $ As_ppm_MS_ST : chr "-30" "-30" "90" "-30" ...
## $ Au_ppm : chr "" "" "" "" ...
## $ Au_AM : chr "" "" "" "" ...
## $ B_ppm_AES_ST : int NA NA NA NA NA NA NA NA NA NA ...
## $ Ba_ppm_AES_ST : chr "-0,5" "924" "121" "174" ...
## $ Be_ppm_AES_ST : int -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 ...
## $ Bi_ppm_MS_ST : chr "1,5" "3,6" "190" "0,4" ...
## $ Cd_ppm_MS_ST : chr "3,6" "-0,2" "0,9" "-0,2" ...
## $ Ce_ppm_MS_ST : chr "0,4" "8,8" "16,3" "3,5" ...
## $ Co_ppm_MS_ST : chr "209" "-0,5" "1,3" "44,8" ...
## $ Cr_ppm_AES_ST : int -10 -10 -10 30 20 20 60 40 20 10 ...
## $ Cs_ppm_MS_ST : chr "0,5" "1,4" "0,2" "-0,1" ...
## $ Cu_ppm_AES_ST : chr "50000,11111" "23300" "50000,11111" "50000,11111" ...
## $ Dy_ppm_MS_ST : chr "-0,05" "0,32" "1,38" "0,37" ...
## $ Er_ppm_MS_ST : chr "-0,05" "0,22" "0,77" "0,23" ...
## $ Eu_ppm_MS_ST : chr "-0,05" "0,14" "0,17" "0,1" ...
## $ Ga_ppm_MS_ST : chr "5" "15" "6" "3" ...
## $ Gd_ppm_MS_ST : chr "-0,05" "0,45" "1,5" "0,39" ...
## $ Ge_ppm_MS_ST : int -1 5 -1 -1 3 8 8 1 2 2 ...
## $ Hf_ppm_MS_ST : int -1 4 -1 -1 5 13 12 2 3 6 ...
## $ Ho_ppm_MS_ST : chr "-0,05" "0,07" "0,25" "0,07" ...
## $ In_ppm_MS_ST : chr "6,4" "-0,2" "3,7" "0,2" ...
## $ La_ppm_MS_ST : chr "0,2" "4,6" "7,2" "1,7" ...
## $ Li_ppm_AES_ST : int -10 -10 -10 -10 30 20 20 20 -10 20 ...
## $ Lu_ppm_MS_ST : chr "-0,05" "-0,05" "0,08" "-0,05" ...
## $ Mo_ppm_MS_ST : chr "-2" "60" "3" "2" ...
## $ Nb_ppm_MS_ST : chr "-1" "4" "-1" "-1" ...
## $ Nd_ppm_MS_ST : chr "0,2" "3,8" "9,1" "1,7" ...
## $ Ni_ppm_AES_ST : chr "144" "6" "-5" "48" ...
## $ Pb_ppm_MS_ST : chr "23" "16" "188" "39" ...
## $ Pd_ppm_FA_MS : chr "" "" "" "" ...
## $ Pr_ppm_MS_ST : chr "-0,05" "1,09" "2,21" "0,46" ...
## $ Pt_ppm_FA_MS : chr "" "" "" "" ...
## $ Rb_ppm_MS_ST : chr "1,2" "148" "7,1" "0,7" ...
## $ Re_ppm_MS_HF : chr "" "" "" "" ...
## $ Sb_ppm_MS_ST : chr "1,2" "2,4" "2,9" "0,3" ...
## $ Sc_ppm_AES_ST : int -5 -5 -5 -5 11 6 15 10 5 6 ...
## $ Se_ppm_MS_ST : int NA NA NA NA NA NA NA NA NA NA ...
## $ Sm_ppm_MS_ST : chr "-0,1" "0,6" "1,6" "0,4" ...
## $ Sn_ppm_MS_ST : chr "2" "3" "106" "-1" ...
## $ Sr_ppm_AES_ST : chr "26,6" "114" "22,5" "38,4" ...
## $ Ta_ppm_MS_ST : chr "-0,5" "-0,5" "-0,5" "-0,5" ...
## $ Tb_ppm_MS_ST : chr "-0,05" "0,07" "0,23" "-0,05" ...
## $ Te_ppm_MS_ST : chr "" "" "" "" ...
## $ Th_ppm_MS_ST : chr "0,2" "9,7" "2,6" "0,2" ...
## $ Tl_ppm_MS_ST : chr "-0,5" "0,5" "-0,5" "-0,5" ...
## $ Tm_ppm_MS_ST : chr "-0,05" "-0,05" "0,08" "-0,05" ...
## $ U_ppm_MS_ST : chr "0,3" "1,75" "0,63" "34,8" ...
## $ V_ppm_AES_ST : int 51 24 -5 493 68 20 40 159 39 61 ...
## $ W_ppm_MS_ST : chr "-1" "28" "22" "11" ...
## [list output truncated]
Se cargaron correctamente los datos para el análisis de distribución geográfica por continentes
ANÁLISIS POR CONTINENTE (DE VALORES)
# Cargar las librerías necesarias
library(dplyr)
library(gt)
# 1. CONTAR LAS MUESTRAS POR CONTINENTE (Datos crudos)
TDF_CONT_BASE <- table(datos$CONTINENT)
# 2. ORDENAR LOS CONTEOS EN UNA TABLA
tabla_agrupada <- as.data.frame(TDF_CONT_BASE)
colnames(tabla_agrupada) <- c("Continente", "ni")
# 3. CALCULAR PROPORCIONES Y PORCENTAJES
tabla_agrupada$hi <- tabla_agrupada$ni / sum(tabla_agrupada$ni)
tabla_agrupada$hi_porc <- round(tabla_agrupada$hi * 100, 2)
# 4. CREAR LA FILA DE TOTALES
Total <- data.frame(Continente = "TOTAL",
ni = sum(tabla_agrupada$ni),
hi = sum(tabla_agrupada$hi),
hi_porc = sum(tabla_agrupada$hi) * 100)
# 5. UNIR TODO EN UNA SOLA TABLA FINAL
tabla_final <- rbind(tabla_agrupada, Total)
# 6. MOSTRAR LA TABLA CON LA ESTÉTICA 'gt'
tabla_cont_gt <- tabla_final %>%
gt() %>%
tab_header(
title = md("**Tabla N° 1**"),
subtitle = md("Distribución de muestras de minerales críticos por continente <br> (Desglose Original)")
) %>%
tab_source_note(
source_note = md("Autores: Grupo 1 <br> Semestre 2026 - 2026")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black",
row.striping.include_table_body = TRUE
)
# Renderizar la tabla en el documento
tabla_cont_gt
| Tabla N° 1 | |||
| Distribución de muestras de minerales críticos por continente (Desglose Original) |
|||
| Continente | ni | hi | hi_porc |
|---|---|---|---|
| Africa | 28 | 0.0204978038 | 2.05 |
| Asia | 37 | 0.0270863836 | 2.71 |
| Europe | 54 | 0.0395314788 | 3.95 |
| North America | 1113 | 0.8147877013 | 81.48 |
| Oceania | 40 | 0.0292825769 | 2.93 |
| South America | 93 | 0.0680819912 | 6.81 |
| unknown | 1 | 0.0007320644 | 0.07 |
| TOTAL | 1366 | 1.0000000000 | 100.00 |
| Autores: Grupo 1 Semestre 2026 - 2026 |
|||
CLASIFICACIÓN CON AMÉRICA UNIFICADA Y FILTRADO
# 1. CREAR UNA COLUMNA EN BLANCO COMO RESPALDO PARA LA UNIFICACIÓN
datos$CONTINENT_UNIF <- as.character(datos$CONTINENT)
# 2. UNIFICAR NORTEAMÉRICA Y SUDAMÉRICA EN "AMÉRICA"
datos$CONTINENT_UNIF[datos$CONTINENT_UNIF %in% c("North America", "South America")] <- "America"
# 3. CONTAR LAS MUESTRAS AHORA POR CONTINENTE UNIFICADO
TDFCONTINENT <- table(datos$CONTINENT_UNIF)
# Filtrar "Desconocido" o "unknown" si existen para un análisis más limpio
TDFCONTINENT <- TDFCONTINENT[names(TDFCONTINENT) != "Desconocido" & names(TDFCONTINENT) != "unknown"]
# 4. ESTRUCTURAR LA NUEVA TABLA
tabla_continentes <- as.data.frame(TDFCONTINENT)
colnames(tabla_continentes) <- c("Continente", "ni")
# 5. CALCULAR PROPORCIONES Y PORCENTAJES
tabla_continentes$hi <- tabla_continentes$ni / sum(tabla_continentes$ni)
tabla_continentes$hi_porc <- round(tabla_continentes$hi * 100, 2)
# 6. FILA DE TOTALES GENERALES
Total_Cont <- data.frame(Continente = "TOTAL",
ni = sum(tabla_continentes$ni),
hi = sum(tabla_continentes$hi),
hi_porc = sum(tabla_continentes$hi) * 100)
# 7. ACOPLAR Y MOSTRAR LA TABLA CON LA ESTÉTICA 'gt'
tabla_final_continentes <- rbind(tabla_continentes, Total_Cont)
tabla_unif_gt <- tabla_final_continentes %>%
gt() %>%
tab_header(
title = md("**Tabla N° 2**"),
subtitle = md("Distribución unificada de muestras de minerales críticos <br> por Continente")
) %>%
tab_source_note(
source_note = md("Autores: Grupo 1 <br> Semestre 2026 - 2026")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black",
row.striping.include_table_body = TRUE
)
# Renderizar la tabla en el documento
tabla_unif_gt
| Tabla N° 2 | |||
| Distribución unificada de muestras de minerales críticos por Continente |
|||
| Continente | ni | hi | hi_porc |
|---|---|---|---|
| Africa | 28 | 0.02051282 | 2.05 |
| America | 1206 | 0.88351648 | 88.35 |
| Asia | 37 | 0.02710623 | 2.71 |
| Europe | 54 | 0.03956044 | 3.96 |
| Oceania | 40 | 0.02930403 | 2.93 |
| TOTAL | 1365 | 1.00000000 | 100.00 |
| Autores: Grupo 1 Semestre 2026 - 2026 |
|||
GRÁFICA DE BARRAS LOCAL Y GLOBAL
# 1. PRIMERA GRÁFICA (LOCAL - ESCALA AJUSTADA AL MÁXIMO VALOR)
limite_y <- max(TDFCONTINENT) * 1.2
barplot(TDFCONTINENT,
main = "Gráfica 1: Muestras de Elementos Críticos (LOCAL)",
ylab = "Cantidad de depósitos",
xlab = "Continente",
col = "pink",
las = 1,
cex.names = 0.7,
ylim = c(0, limite_y))
# 2. SEGUNDA GRÁFICA (GLOBAL - EJE Y PERSONALIZADO)
barplot(TDFCONTINENT,
main = "Gráfica 2: Muestras de Elementos Críticos (GLOBAL)",
ylab = "Cantidad de muestras",
xlab = "Continente",
col = "skyblue",
las = 1,
cex.names = 0.7,
ylim = c(0, limite_y),
yaxt = "n")
# 3. Dibujar el eje Y personalizado
axis(2, at = seq(0, limite_y, length.out = 6), las = 1)
ANÁLISIS DE FRECUENCIA ABSOLUTA
# 1. ASIGNAR LOS DATOS A UNA VARIABLE LOCAL
freq_abs <- TDFCONTINENT
# 2. DIBUJAR LA GRÁFICA Y GUARDAR SUS COORDENADAS
bar_centers <- barplot(freq_abs,
main = "Gráfica 3: Distribución de Muestras por Continente",
ylab = "Cantidad",
xlab = "Continente",
col = "orange",
las = 1,
cex.names = 0.7,
ylim = c(0, max(freq_abs) * 1.2))
# 3. PONER LAS ETIQUETAS NUMÉRICAS ENCIMA DE LAS BARRAS
text(x = bar_centers,
y = freq_abs,
labels = freq_abs,
pos = 3,
cex = 0.8,
col = "black")
ANÁLISIS DE FRECUENCIA RELATIVA (PORCENTAJES)
# 1. TRANSFORMAR LAS CANTIDADES EN PORCENTAJES
freq_rel <- prop.table(TDFCONTINENT)
freq_rel_porc <- round(freq_rel * 100, 2)
# 2. DIBUJAR LAS BARRAS Y PERSONALIZAR EL LIENZO
bar_centers_rel <- barplot(freq_rel_porc,
main = "Gráfica 4: Distribución Porcentual Total",
ylab = "Porcentaje (%)",
xlab = "Continente",
col = "orchid",
las = 1,
cex.names = 0.7,
ylim = c(0, 100),
yaxt = "n",
yaxs = "i")
# 3. CONSTRUIR UN EJE Y PERSONALIZADO CON SÍMBOLO %
axis(2, at = seq(0, 100, by = 20), labels = paste0(seq(0, 100, by = 20), "%"), las = 1, cex.axis = 0.8)
# 4. COLOCAR LAS ETIQUETAS CON EL SÍMBOLO "%" EN LAS BARRAS
text(x = bar_centers_rel,
y = freq_rel_porc,
labels = paste0(freq_rel_porc, "%"),
pos = 3,
cex = 0.8,
col = "black")
GRÁFICA CIRCULAR
# 1. ALISTAR LOS DATOS DE LOS CONTINENTES
Grupo_cont <- TDFCONTINENT
hi_cont_porc <- round(prop.table(Grupo_cont) * 100, 1)
colores <- c("#66C2A5", "#FC8D62", "#8DA0CB", "#E78AC3", "#A6D854", "#FFD92F")
etiquetas_leyenda <- paste0(names(Grupo_cont), " (", hi_cont_porc, "%)")
# 2. AJUSTAR EL LIENZO DE TRABAJO
par(mar = c(2, 6, 3, 12), xpd = TRUE)
# 3. DIBUJAR LA GRÁFICA CIRCULAR
pie(hi_cont_porc,
labels = NA,
col = colores,
main = "Gráfica 5: Distribución Porcentual por Continente",
radius = 0.9)
# 4. MARCAR LAS COORDENADAS DEL CUADRO DE LEYENDA
x0 <- 1.0 # Límite izquierdo
x1 <- 2.5 # Límite derecho
y1 <- 0.9 # Techo del cuadro
y0 <- -0.5 # Piso del cuadro
# 5. DIBUJAR EL CUADRO BLANCO DE FONDO
rect(xleft = x0, ybottom = y0, xright = x1, ytop = y1, col = "white", border = "black")
# 6. PONER EL TÍTULO DENTRO DE LA TARJETA
text(x = (x0 + x1)/2, y = y1 - 0.15, labels = "Continentes", font = 2, cex = 1.0)
# 7. LLENAR LA TARJETA CON LOS COLORES Y PORCENTAJES
legend(x = (x0 + x1)/2,
y = y1 - 0.25,
legend = etiquetas_leyenda,
fill = colores,
cex = 0.8,
bty = "n",
xjust = 0.5,
y.intersp = 1.4)
CONCLUSIÓN DE LA VARIABLE CONTINENT
La distribución de frecuencias a nivel global indica una alta concentración de datos geoquímicos provenientes de minas archivadas ubicadas en el continente de América (tras unificar las regiones del norte y sur). Esta concentración resulta estratégica, ya que el reprocesamiento de esta información histórica incrementa significativamente el potencial para revaluar y perfilar nuevos yacimientos de minerales críticos en la región americana frente al resto de continentes documentados.