ESTADÍSTICA INFERENCIAL

1. CARGA DE LIBRERÍAS Y DATOS

                    #==============================ENCABEZADO================================
                    # TEMA: ESTADÍSTICA INFERENCIAL- ECORREGIÓN
                    # AUTOR: GRUPO 3
                    # FECHA: 03-2026
                    #========================================================================

# 1. CARGA DE LIBRERÍAS Y DATOS
library(gt)
library(dplyr)

setwd("C:/Users/HP/Documents/PROYECTO ESTADISTICA/RStudio")
datos <- read.csv("tablap.csv", header = TRUE, dec = ",", sep = ";")

2. TABLA DE DISTRIBUCIÓN DE PROBABILIDAD

Eco_Raw <- datos$Ecoregion
Eco_Limpia <- ifelse(
  is.na(Eco_Raw) | trimws(Eco_Raw) == "",
  "Sin Registro",
  trimws(Eco_Raw)
)
ECOREGION <- factor(Eco_Limpia)

# Generar frecuencias
TablaECO <- as.data.frame(table(ECOREGION))
colnames(TablaECO) <- c("ECOREGION", "ni")

# Cálculo de hi y P
TablaECO$hi <- round(TablaECO$ni / sum(TablaECO$ni), 4)
TablaECO$P  <- round(TablaECO$hi * 100, 2)

Total_eco <- data.frame(
  ECOREGION = "TOTAL",
  ni = sum(TablaECO$ni),
  hi = round(sum(TablaECO$hi), 0),
  P  = round(sum(TablaECO$P), 0)
)
TablaFinalEco <- rbind(TablaECO, Total_eco)
Tabla Nº1. Distribución de probabilidad por Ecorregión de los pozos de gas natural en Nuevo México
ECOREGION ni hi P
Chihuahuan Deserts 2150 0.1712 17.12
Colorado Plateaus 3792 0.3019 30.19
High Plains 946 0.0753 7.53
New Mexico Mountains 4 0.0003 0.03
New Mexico Plateau 3745 0.2981 29.81
Southern Rockies 1747 0.1391 13.91
Southwestern Tablelands 177 0.0141 1.41
TOTAL 12561 1.0000 100.00
Tabla 1 de 1

3. GRÁFICA DE DISTRIBUCIÓN DE PROBABILIDAD

par(oma = c(1, 1, 1, 1))
P_global_eco <- as.numeric(TablaFinalEco$P[1:(nrow(TablaFinalEco)-1)])
Nombres_Eco <- TablaFinalEco$ECOREGION[1:(nrow(TablaFinalEco)-1)]
color_barras_eco <- "#A9CCE3" 
par(mar = c(10, 4, 4, 2)) 

# 2. Generamos la gráfica
barplot(
  P_global_eco,
  main = "Gráfica Nº1: Distribución de probabilidad de las ecorregiones 
          de gas natural en Nuevo México",
  cex.main = 1.3,
  ylab = "Probabilidad (%)",
  col = color_barras_eco,
  names.arg = Nombres_Eco,
  cex.names = 0.8,
  ylim = c(0, 100),
  las = 2
)
title(xlab = "Ecorregión", line = 8)
box(which = "outer", col = "black")

4. CÁLCULO DE PROBABILIDAD

par(oma = c(1, 1, 1, 1))

tabla_sin_total_eco <- TablaFinalEco[TablaFinalEco$ECOREGION != "TOTAL", ]
eco_mayor <- tabla_sin_total_eco$ECOREGION[which.max(tabla_sin_total_eco$P)]
prob_mayor_eco <- tabla_sin_total_eco$P[which.max(tabla_sin_total_eco$P)]

5. CONCLUSIÓN

Los resultados muestran que la ecorregión Colorado Plateaus presenta la mayor probabilidad de actividad de pozos con un 30.19 %.