ANÁLISIS INFERENCIAL
CARGA DE DATOS Y LIBRERÍAS
library(dplyr)
library(stringr)
library(gt)
library(readxl)
library(here)
library(readxl)
datos <- read.csv("D:/mineralogia_2500.csv")
# Extraer variable
df_mineralogia <- data.frame(
mineralogia = toupper(trimws(datos$MINERALOGIA))
)
# Reemplazar categorías
df_mineralogia$mineralogia <- case_when(
toupper(df_mineralogia$mineralogia) == "CUARZO" ~ "Cuarzo",
toupper(df_mineralogia$mineralogia) == "FELDESPATO" ~ "Feldespato",
toupper(df_mineralogia$mineralogia) == "BIOTITA" ~ "Biotita",
toupper(df_mineralogia$mineralogia) == "PLAGIOCLASA" ~ "Plagioclasa",
toupper(df_mineralogia$mineralogia) == "HORNBLENDA" ~ "Hornblenda",
TRUE ~ "Otros"
)
# Orden de categorías
orden_mineralogia <- c(
"Cuarzo",
"Feldespato",
"Biotita",
"Plagioclasa",
"Hornblenda",
"Otros"
)
# Convertir en factor ordenado
df_mineralogia$mineralogia <- factor(
df_mineralogia$mineralogia,
levels = orden_mineralogia
)
TABLA DE DISTRIBUCIÓN DE PROBABILIDAD
# Frecuencias y probabilidad
ni <- table(df_mineralogia$mineralogia)
hi <- round(prop.table(ni), 4)
P <- round(hi * 100, 2)
# Crear tabla base
tabla_finalmineralogia <- data.frame(
Mineralogia = names(ni),
ni = as.numeric(ni),
hi = as.numeric(hi),
P = as.numeric(P)
)
# Fila TOTAL
fila_total <- data.frame(
Mineralogia = "TOTAL",
ni = sum(tabla_finalmineralogia$ni),
hi = round(sum(tabla_finalmineralogia$hi), 4),
P = round(sum(tabla_finalmineralogia$P), 2)
)
TABLA DE DISTRIBUCIÓN DE PROBABILIDAD AGRUPADA
# Mostrar
tabla_finalmineralogia <- rbind(tabla_finalmineralogia, fila_total)
tabla_finalmineralogia
## Mineralogia ni hi P
## 1 Cuarzo 720 0.288 28.8
## 2 Feldespato 610 0.244 24.4
## 3 Biotita 430 0.172 17.2
## 4 Plagioclasa 515 0.206 20.6
## 5 Hornblenda 225 0.090 9.0
## 6 Otros 0 0.000 0.0
## 7 TOTAL 2500 1.000 100.0
tabla_mineralogia_gt <- tabla_finalmineralogia %>%
gt() %>%
tab_header(
title = md("**Tabla N° 4**"),
subtitle = md("Distribución de probabilidad de la mineralogía presente en depósitos minerales")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 2")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black",
row.striping.include_table_body = TRUE
) %>%
tab_style(
style = cell_text(weight = "bold"),
locations = cells_body(rows = Mineralogia == "TOTAL")
)
tabla_mineralogia_gt
| Tabla N° 4 |
| Distribución de probabilidad de la mineralogía presente en depósitos minerales |
| Mineralogia |
ni |
hi |
P |
| Cuarzo |
720 |
0.288 |
28.8 |
| Feldespato |
610 |
0.244 |
24.4 |
| Biotita |
430 |
0.172 |
17.2 |
| Plagioclasa |
515 |
0.206 |
20.6 |
| Hornblenda |
225 |
0.090 |
9.0 |
| Otros |
0 |
0.000 |
0.0 |
| TOTAL |
2500 |
1.000 |
100.0 |
| Autor: Grupo 2 |
GRÁFICAS DE DISTRIBUCIÓN DE PROBABILIDAD
# Extraer probabilidad (%) sin la fila TOTAL
P_global <- as.numeric(tabla_finalmineralogia$P[1:(nrow(tabla_finalmineralogia)-1)])
barplot(
P_global,
main = "Gráfica Nº1: Distribución de probabilidad de la mineralogía\n en depósitos minerales de Estados Unidos",
cex.main = 0.8,
xlab = "Mineralogía",
ylab = "Probabilidad (%)",
col = "blue",
names.arg = tabla_finalmineralogia$Mineralogia[1:(nrow(tabla_finalmineralogia)-1)],
cex.names = 0.9,
ylim = c(0, 100),
las = 1
)

CÁLCULO DE PROBABILIDAD
# Eliminar fila TOTAL
tabla_sin_total <- tabla_finalmineralogia[
tabla_finalmineralogia$Mineralogia != "TOTAL",
]
# Extraer probabilidad de la categoría "Cuarzo"
prob_cuarzo <- tabla_sin_total$P[
tabla_sin_total$Mineralogia == "Cuarzo"
]
# Gráfico de texto explicativo
plot(1, type = "n", axes = FALSE, xlab = "", ylab = "")
text(
x = 1, y = 1,
labels = paste(
"Cálculo de probabilidad\n(Estimación general)\n\n",
"¿Qué probabilidad existe de que un depósito\n",
"mineral analizado presente mineralogía de\n",
"tipo cuarzo?\n\n",
"Probabilidad = ", prob_cuarzo, " (%)",
sep = ""
),
cex = 1.3,
col = "black",
font = 2
)

CONCLUSIONES
"La mineralogía presente en los depósitos minerales analizados en Estados Unidos presenta una distribución probabilística heterogénea. El mineral Cuarzo registra la mayor probabilidad de ocurrencia, reflejando su amplia presencia dentro de los sistemas geológicos estudiados. Feldespato, Plagioclasa y Biotita también muestran probabilidades significativas, evidenciando una composición mineral diversa en los depósitos evaluados. La distribución acumulada permite observar el comportamiento progresivo de las probabilidades entre las distintas asociaciones mineralógicas, mientras que las gráficas muestran diferencias relevantes en la frecuencia de ocurrencia de los minerales identificados."
## [1] "La mineralogía presente en los depósitos minerales analizados en Estados Unidos presenta una distribución probabilística heterogénea. El mineral Cuarzo registra la mayor probabilidad de ocurrencia, reflejando su amplia presencia dentro de los sistemas geológicos estudiados. Feldespato, Plagioclasa y Biotita también muestran probabilidades significativas, evidenciando una composición mineral diversa en los depósitos evaluados. La distribución acumulada permite observar el comportamiento progresivo de las probabilidades entre las distintas asociaciones mineralógicas, mientras que las gráficas muestran diferencias relevantes en la frecuencia de ocurrencia de los minerales identificados."