ESTADÍSTICA INFERENCIAL

1. CARGA DE LIBRERÍAS Y DATOS

#==============================ENCABEZADO================================
# TEMA: ESTADÍSTICA INFERENCIAL- ECORREGIÓN
# AUTOR: GRUPO 3
# FECHA: 03-2026
#========================================================================

# 1. CARGA DE LIBRERÍAS Y DATOS
library(gt)
library(dplyr)

setwd("C:/Users/HP/Documents/PROYECTO ESTADISTICA/RStudio")
datos <- read.csv("tablap.csv", header = TRUE, dec = ",", sep = ";")

2. TABLA DE DISTRIBUCIÓN DE PROBABILIDAD

# 2. TABLA DE DISTRIBUCIÓN DE PROBABILIDAD
Eco_Raw <- datos$Ecoregion
Eco_Limpia <- ifelse(
  is.na(Eco_Raw) | trimws(Eco_Raw) == "",
  "Sin Registro",
  trimws(Eco_Raw)
)
ECOREGION <- factor(Eco_Limpia)

# Generar frecuencias
TablaECO <- as.data.frame(table(ECOREGION))
colnames(TablaECO) <- c("ECOREGION", "ni")

# Cálculo de hi y P
TablaECO$hi <- round(TablaECO$ni / sum(TablaECO$ni), 4)
TablaECO$P  <- round(TablaECO$hi * 100, 2)

Total_eco <- data.frame(
  ECOREGION = "TOTAL",
  ni = sum(TablaECO$ni),
  hi = round(sum(TablaECO$hi), 0),
  P  = round(sum(TablaECO$P), 0)
)
TablaFinalEco <- rbind(TablaECO, Total_eco)

# Aplicación de gt
TablaFinalEco %>%
  gt() %>%
  tab_header(
    title = md("**Tabla Nº1. Distribución de probabilidad por Ecorregión 
                de los pozos de gas natural en Nuevo México**")
  ) %>%
  tab_style(
    style = list(cell_fill(color = "lightgray"), cell_text(weight = "bold")),
    locations = cells_body(rows = ECOREGION == "TOTAL")
  )
Tabla Nº1. Distribución de probabilidad por Ecorregión de los pozos de gas natural en Nuevo México
ECOREGION ni hi P
Chihuahuan Deserts 2150 0.1712 17.12
Colorado Plateaus 3792 0.3019 30.19
High Plains 946 0.0753 7.53
New Mexico Mountains 4 0.0003 0.03
New Mexico Plateau 3745 0.2981 29.81
Southern Rockies 1747 0.1391 13.91
Southwestern Tablelands 177 0.0141 1.41
TOTAL 12561 1.0000 100.00

3. GRÁFICA DE DISTRIBUCIÓN DE PROBABILIDAD

# 3. GRÁFICAS DE DISTRIBUCIÓN DE PROBABILIDAD
P_global_eco <- as.numeric(TablaFinalEco$P[1:(nrow(TablaFinalEco)-1)])
Nombres_Eco <- TablaFinalEco$ECOREGION[1:(nrow(TablaFinalEco)-1)]

color_barras_eco <- "#A9CCE3" 

par(mar = c(10, 4, 4, 2)) 

# 2. Generamos la gráfica sin el xlab dentro de barplot
barplot(
  P_global_eco,
  main = "Gráfica Nº1: Distribución de probabilidad de las ecorregiones 
          de gas natural en Nuevo México",
  cex.main = 1.3,
  ylab = "Probabilidad (%)",
  col = color_barras_eco,
  names.arg = Nombres_Eco,
  cex.names = 0.8,
  ylim = c(0, 100),
  las = 2
)
title(xlab = "Ecorregión", line = 8)

4. CÁLCULO DE PROBABILIDAD

# 4. CÁLCULO DE PROBABILIDAD
tabla_sin_total_eco <- TablaFinalEco[TablaFinalEco$ECOREGION != "TOTAL", ]
eco_mayor <- tabla_sin_total_eco$ECOREGION[which.max(tabla_sin_total_eco$P)]
prob_mayor_eco <- tabla_sin_total_eco$P[which.max(tabla_sin_total_eco$P)]

plot.new()
plot.window(xlim = c(0, 100), ylim = c(0, 1))
rect(10, 0.4, 90, 0.6, col = "#E5E7E9", border = NA)
ancho_barra_eco <- (prob_mayor_eco / 100) * 80
rect(10, 0.4, 10 + ancho_barra_eco, 0.6, col = "#A9CCE3", border = NA)
text(50, 0.85, "CÁLCULO DE PROBABILIDAD", cex = 1.5, font = 2, col = "#2A9D8F")
text(50, 0.75, "¿Qué ecorregión presenta la mayor probabilidad", cex = 1.4, font = 3)
text(50, 0.65, "de actividad de pozos de gas natural?", cex = 1.4, font = 3)
text(10 + ancho_barra_eco/2, 0.5, paste0(prob_mayor_eco, "%"), cex = 1.6, font = 2, col = "black")
text(50, 0.25, paste("R:", eco_mayor), cex = 1.4, font = 2, col = "#1F618D")
rect(10, 0.4, 90, 0.6, border = "#2A9D8F", lwd = 2)

5. CONCLUSIÓN

cat(paste0("Los resultados muestran que la ecorregión ", eco_mayor, 
           " presenta la mayor probabilidad de actividad de pozos con un ", 
           prob_mayor_eco, " %."))
## Los resultados muestran que la ecorregión Colorado Plateaus presenta la mayor probabilidad de actividad de pozos con un 30.19 %.