ANÁLISIS ESTADÍSTICO

1. CARGA DE LIBRERÍAS Y DATOS

                    #=========================ENCABEZADO================================
                    # TEMA: ESTADÍSTICA INFERENCIAL- CUENCA
                    # AUTOR: GRUPO 3
                    # FECHA: 03-2026
                    #========================================================================
library(gt)
library(dplyr)
setwd("C:/Users/HP/Documents/PROYECTO ESTADISTICA/RStudio")
datos <- read.csv("tablap.csv", header = TRUE, dec = ",", sep = ";")

2. TABLA DE DISTRIBUCIÓN DE PROBABILIDAD

Cuenca_Raw <- datos$Basin
Cuenca_Limpia <- ifelse(
  is.na(Cuenca_Raw) | trimws(Cuenca_Raw) == "",
  "Sin Registro",
  trimws(Cuenca_Raw)
)
CUENCA <- factor(Cuenca_Limpia)

TablaCUENCA <- as.data.frame(table(CUENCA))
colnames(TablaCUENCA) <- c("CUENCA", "ni")
TablaCUENCA$hi <- round(TablaCUENCA$ni / sum(TablaCUENCA$ni), 4)
TablaCUENCA$P  <- round(TablaCUENCA$hi * 100, 4)

Total <- data.frame(
  CUENCA = "TOTAL",
  ni = sum(TablaCUENCA$ni),
  hi = sum(TablaCUENCA$hi),
  P  = sum(TablaCUENCA$P)
)
TablaFinalC <- rbind(TablaCUENCA, Total)
Tabla Nº1. Distribución de probabilidad por Cuenca de los pozos de gas natural en Nuevo México
CUENCA ni hi P
Permian 3277 0.2609 26.09
Rotan Ski 655 0.0521 5.21
San Juan 8629 0.6870 68.70
TOTAL 12561 1.0000 100.00
Tabla 1 de 1

3. GRÁFICA DE DISTRIBUCIÓN DE PROBABILIDAD

par(oma = c(1, 1, 1, 1))

P_global <- as.numeric(TablaFinalC$P[1:(nrow(TablaFinalC)-1)])
Nombres_C <- TablaFinalC$CUENCA[1:(nrow(TablaFinalC)-1)]

color_barras_abs <- "#76D7C4" 

barplot(
  P_global,
  main = "Gráfica Nº1: Distribución de probabilidad 
  de las cuencas de gas natural en Nuevo México",
  cex.main = 1.3,
  xlab = "Cuenca",
  ylab = "Probabilidad (%)",
  col = color_barras_abs,
  names.arg = Nombres_C,
  cex.names = 1.2,
  ylim = c(0, 100),
  las = 1
)
box(which = "outer", col = "black")

4. CÁLCULO DE PROBABILIDAD

tabla_sin_total <- TablaFinalC[TablaFinalC$CUENCA != "TOTAL", ]
cuenca_mayor <- tabla_sin_total$CUENCA[which.max(tabla_sin_total$P)]
prob_mayor <- tabla_sin_total$P[which.max(tabla_sin_total$P)]

5. CONCLUSIÓN

Los resultados muestran que la cuenca San Juan es el tipo de depósito con mayor probabilidad con un 68.7%.