ANÁLISIS ESTADÍSTICO

CARGA DE DATOS Y LIBRERÍAS

CARGA DE DATOS

#Carga de datos

setwd("~/UNI/ESTADISTICA")
datos <- read.csv("Depositos_Sulfuro.csv", header = TRUE, sep = ";", dec = ".")

CARGA DE LÍBRERIAS

#Carga de librerias
library(countrycode)
library(gt)
library(dplyr)
library(knitr)

TABLA DE DISTRIBUCIÓN DE PROBABILIDAD

TABLA DE DISTRIBUCIÓN DE PROBABILIDAD

# Extraer variable
Vetas_Secundarias <- datos$stringer

# Reemplazar NA, espacios, guiones, etc.
Vetas_Secundarias[
  Vetas_Secundarias == "" |
    Vetas_Secundarias == " " |
    Vetas_Secundarias == "-" |
    is.na(Vetas_Secundarias)
] <- "Sin registro"

# Frecuencias y probabilidad
ni <- table(Vetas_Secundarias)
hi <- round(prop.table(ni), 4)
P <- round(hi * 100, 2)

# Crear tabla base
tabla_finalvetas <- data.frame(
  Vetas_Secundarias = names(ni),
  ni = as.numeric(ni),
  hi = as.numeric(hi),
  P  = as.numeric(P)
)

# Fila TOTAL
fila_total <- data.frame(
  Vetas_Secundarias = "TOTAL",
  ni = sum(tabla_finalvetas$ni),
  hi = round(sum(tabla_finalvetas$hi), ),
  P  = round(sum(tabla_finalvetas$P), )
)

# Mostrar
tabla_finalvetas <- rbind(tabla_finalvetas, fila_total)

tabla_finalvetas
##   Vetas_Secundarias   ni     hi      P
## 1                no  431 0.3954  39.54
## 2      Sin registro  275 0.2523  25.23
## 3               yes  384 0.3523  35.23
## 4             TOTAL 1090 1.0000 100.00

TABLA DE DISTRIBUCIÓN DE PROBABILIDAD

tabla_vetas_gt <- tabla_finalvetas %>%
  gt() %>%
  tab_header(
    title = md("**Tabla N° 1**"),
    subtitle = md("Distribución de probabibilidad de la presencia de
    vetas secundarias en Depósitos Masivos de Sulfuro Volcánicos")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 2")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black",
    row.striping.include_table_body = TRUE
  ) %>%
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(rows = Vetas_Secundarias == "Total")
  )

tabla_vetas_gt
Tabla N° 1
Distribución de probabibilidad de la presencia de vetas secundarias en Depósitos Masivos de Sulfuro Volcánicos
Vetas_Secundarias ni hi P
no 431 0.3954 39.54
Sin registro 275 0.2523 25.23
yes 384 0.3523 35.23
TOTAL 1090 1.0000 100.00
Autor: Grupo 2

GRÁFICAS DE DISTRIBUCIÓN DE PROBABILIDAD

Diagrama de barras

# Extraer probabilidad (%) sin la fila TOTAL
P_global <- as.numeric(tabla_finalvetas$P[1:(nrow(tabla_finalvetas)-1)])

barplot(
  P_global,
  main = "Gráfica Nº1: Distribución de probabilidad de la presencia de\n
vetas secundarias en depósitos masivos de sulfuros volcánicos",
  cex.main = 0.7,
  xlab = "Presencia de vetas secundarias",
  ylab = "Probabilidad (%)",
  col = "blue",
  names.arg = tabla_finalvetas$Vetas_Secundarias[1:(nrow(tabla_finalvetas)-1)],
  cex.names = 0.9,
  ylim = c(0, 100),
  las = 1
)

CÁLCULO DE PROBABILIDAD

# Eliminar fila TOTAL
tabla_sin_total <- tabla_finalvetas[
  tabla_finalvetas$Vetas_Secundarias != "TOTAL",
]

# Extraer probabilidad de la categoría "no"
prob_no <- tabla_sin_total$P[
  tabla_sin_total$Vetas_Secundarias == "no"
]

# Gráfico de texto explicativo
plot(1, type = "n", axes = FALSE, xlab = "", ylab = "")

text(
  x = 1, y = 1,
  labels = paste(
    "Cálculo de probabilidad\n(Estimación general)\n\n",
    "¿Qué probabilidad existe de que un depósito\n",
    "masivo de sulfuros volcánicos NO presente\n",
    "vetas secundarias?\n\n",
    "Probabilidad = ", prob_no, " (%)",
    sep = ""
  ),
  cex = 1.4,
  col = "black",
  font = 2
)