ANÁLISIS ESTADÍSTICO

1. CARGA DE DATOS Y LIBRERÍAS

# 1. CARGA DE DATOS Y LIBRERÍAS
library(knitr)
library(dplyr)

setwd("C:/Users/HP/Documents/PROYECTO ESTADISTICA/RStudio")
datos <- read.csv("tablap.csv", header = TRUE, dec = ",", sep = ";")

2. TABLA DE DISTRIBUCION DE PROBABILIDAD

Eco_Raw <- datos$Ecoregion
Eco_Limpia <- ifelse(
  is.na(Eco_Raw) | trimws(Eco_Raw) == "",
  "Sin Registro",
  trimws(Eco_Raw)
)
ECOREGION <- factor(Eco_Limpia)

TablaECO <- as.data.frame(table(ECOREGION))
colnames(TablaECO) <- c("ECOREGION", "ni")
TablaECO$hi <- round(TablaECO$ni / sum(TablaECO$ni), 4)
TablaECO$P  <- round(TablaECO$hi * 100, 2)
Total_eco <- data.frame(
  ECOREGION = "TOTAL",
  ni = sum(TablaECO$ni),
  hi = sum(TablaECO$hi),
  P  = sum(TablaECO$P)
)

# Tabla final
TablaFinalEco <- rbind(TablaECO, Total_eco)
kable(TablaFinalEco, format = "markdown", 
      caption = "Tabla N° 1: Distribución de probabilidad por Ecorregión")
Tabla N° 1: Distribución de probabilidad por Ecorregión
ECOREGION ni hi P
Chihuahuan Deserts 2150 0.1712 17.12
Colorado Plateaus 3792 0.3019 30.19
High Plains 946 0.0753 7.53
New Mexico Mountains 4 0.0003 0.03
New Mexico Plateau 3745 0.2981 29.81
Southern Rockies 1747 0.1391 13.91
Southwestern Tablelands 177 0.0141 1.41
TOTAL 12561 1.0000 100.00

3. GRAFICO DE DISTRIBUCION DE PROBABILIDAD

P_global_eco <- as.numeric(TablaFinalEco$P[1:(nrow(TablaFinalEco)-1)])
Nombres_Eco <- TablaFinalEco$ECOREGION[1:(nrow(TablaFinalEco)-1)]

color_barras_eco <- "#A9CCE3" 

# Ajuste de márgenes para etiquetas verticales (las = 2)
par(mar = c(12, 4, 4, 2))

barplot(
  P_global_eco,
  main = "Gráfica Nº1: Distribución de probabilidad de las ecorregiones",
  cex.main = 0.9,
  xlab = "", 
  ylab = "Probabilidad (%)",
  col = color_barras_eco,
  names.arg = Nombres_Eco,
  cex.names = 0.7,
  ylim = c(0, 100),
  las = 2
)

4. CALCULO DE PROBABILIDA

5. CONCLUSION

## Los resultados muestran que la ecorregión Colorado Plateaus presenta la mayor probabilidad de actividad de pozos con un 30.19%.