ESTADÍSTICA INFERENCIAL
1. CARGA DE LIBRERÍAS Y DATOS
#==============================ENCABEZADO================================
# TEMA: ESTADÍSTICA INFERENCIAL- ECORREGIÓN
# AUTOR: GRUPO 3
# FECHA: 03-2026
#========================================================================
# 1. CARGA DE LIBRERÍAS Y DATOS
library(gt)
library(dplyr)
setwd("C:/Users/HP/Documents/PROYECTO ESTADISTICA/RStudio")
datos <- read.csv("tablap.csv", header = TRUE, dec = ",", sep = ";")
2. TABLA DE DISTRIBUCIÓN DE PROBABILIDAD
# 2. TABLA DE DISTRIBUCIÓN DE PROBABILIDAD
Eco_Raw <- datos$Ecoregion
Eco_Limpia <- ifelse(
is.na(Eco_Raw) | trimws(Eco_Raw) == "",
"Sin Registro",
trimws(Eco_Raw)
)
ECOREGION <- factor(Eco_Limpia)
# Generar frecuencias
TablaECO <- as.data.frame(table(ECOREGION))
colnames(TablaECO) <- c("ECOREGION", "ni")
# Cálculo de hi y P
TablaECO$hi <- round(TablaECO$ni / sum(TablaECO$ni), 4)
TablaECO$P <- round(TablaECO$hi * 100, 2)
Total_eco <- data.frame(
ECOREGION = "TOTAL",
ni = sum(TablaECO$ni),
hi = round(sum(TablaECO$hi), 0),
P = round(sum(TablaECO$P), 0)
)
TablaFinalEco <- rbind(TablaECO, Total_eco)
# Aplicación de gt
TablaFinalEco %>%
gt() %>%
tab_header(
title = md("**Tabla Nº1. Distribución de probabilidad por Ecorregión
de los pozos de gas natural en Nuevo México**")
) %>%
tab_style(
style = list(cell_fill(color = "lightgray"), cell_text(weight = "bold")),
locations = cells_body(rows = ECOREGION == "TOTAL")
)
| Tabla Nº1. Distribución de probabilidad por Ecorregión
de los pozos de gas natural en Nuevo México |
| ECOREGION |
ni |
hi |
P |
| Chihuahuan Deserts |
2150 |
0.1712 |
17.12 |
| Colorado Plateaus |
3792 |
0.3019 |
30.19 |
| High Plains |
946 |
0.0753 |
7.53 |
| New Mexico Mountains |
4 |
0.0003 |
0.03 |
| New Mexico Plateau |
3745 |
0.2981 |
29.81 |
| Southern Rockies |
1747 |
0.1391 |
13.91 |
| Southwestern Tablelands |
177 |
0.0141 |
1.41 |
| TOTAL |
12561 |
1.0000 |
100.00 |
3. GRÁFICA DE DISTRIBUCIÓN DE PROBABILIDAD
# 3. GRÁFICAS DE DISTRIBUCIÓN DE PROBABILIDAD
P_global_eco <- as.numeric(TablaFinalEco$P[1:(nrow(TablaFinalEco)-1)])
Nombres_Eco <- TablaFinalEco$ECOREGION[1:(nrow(TablaFinalEco)-1)]
color_barras_eco <- "#A9CCE3"
par(mar = c(10, 4, 4, 2))
# 2. Generamos la gráfica sin el xlab dentro de barplot
barplot(
P_global_eco,
main = "Gráfica Nº1: Distribución de probabilidad de las ecorregiones
de gas natural en Nuevo México",
cex.main = 1.3,
ylab = "Probabilidad (%)",
col = color_barras_eco,
names.arg = Nombres_Eco,
cex.names = 0.8,
ylim = c(0, 100),
las = 2
)
title(xlab = "Ecorregión", line = 8)

4. CÁLCULO DE PROBABILIDAD
# 4. CÁLCULO DE PROBABILIDAD
tabla_sin_total_eco <- TablaFinalEco[TablaFinalEco$ECOREGION != "TOTAL", ]
eco_mayor <- tabla_sin_total_eco$ECOREGION[which.max(tabla_sin_total_eco$P)]
prob_mayor_eco <- tabla_sin_total_eco$P[which.max(tabla_sin_total_eco$P)]
plot.new()
plot.window(xlim = c(0, 100), ylim = c(0, 1))
rect(10, 0.4, 90, 0.6, col = "#E5E7E9", border = NA)
ancho_barra_eco <- (prob_mayor_eco / 100) * 80
rect(10, 0.4, 10 + ancho_barra_eco, 0.6, col = "#A9CCE3", border = NA)
text(50, 0.85, "CÁLCULO DE PROBABILIDAD", cex = 1.5, font = 2, col = "#2A9D8F")
text(50, 0.75, "¿Qué ecorregión presenta la mayor probabilidad", cex = 1.4, font = 3)
text(50, 0.65, "de actividad de pozos de gas natural?", cex = 1.4, font = 3)
text(10 + ancho_barra_eco/2, 0.5, paste0(prob_mayor_eco, "%"), cex = 1.6, font = 2, col = "black")
text(50, 0.25, paste("R:", eco_mayor), cex = 1.4, font = 2, col = "#1F618D")
rect(10, 0.4, 90, 0.6, border = "#2A9D8F", lwd = 2)

5. CONCLUSIÓN
cat(paste0("Los resultados muestran que la ecorregión ", eco_mayor,
" presenta la mayor probabilidad de actividad de pozos con un ",
prob_mayor_eco, " %."))
## Los resultados muestran que la ecorregión Colorado Plateaus presenta la mayor probabilidad de actividad de pozos con un 30.19 %.