ANÁLISIS ESTADÍSTICO

1. CARGA DE DATOS Y LIBRERÍAS

                    #==============================ENCABEZADO================================
                    # TEMA: ESTADÍSTICA DESCRIPTIVA - ECORREGIÓN
                    # AUTOR: GRUPO 3
                    # FECHA: 03-2026
                    #========================================================================
library(dplyr)
library(gt)
library(knitr)

setwd("C:/Users/HP/Documents/PROYECTO ESTADISTICA/RStudio")
datos <- read.csv("tablap.csv", header = TRUE, dec = ",", sep = ";")

2. TABLA DE DISTRIBUCIÓN DE CANTIDAD

eco_var <- datos$Ecoregion 
ni_eco <- table(eco_var)
hi_eco <- round(prop.table(ni_eco) * 100, 2) 

tabla_base_eco <- data.frame(Ecoregion = names(ni_eco), ni = as.numeric(ni_eco), hi = as.numeric(hi_eco))
fila_total_eco <- data.frame(Ecoregion = "TOTAL", ni = sum(tabla_base_eco$ni), hi = round(sum(tabla_base_eco$hi)))
tabla_final_eco <- rbind(tabla_base_eco, fila_total_eco)

# Visualizar la tabla con gt
tabla_eco_gt <- tabla_final_eco %>% 
  gt() %>%
  cols_label(
    Ecoregion = "Ecorregión",
    ni = "ni",
    hi = "hi (%)"
  ) %>%
  tab_header(
    title = md("Tabla N°1. Distribución por Ecorregión de los pozos de gas natural en Nuevo Mexico")
  ) %>%
  tab_style(
    style = list(
      cell_fill(color = "lightgray"),
      cell_text(weight = "bold")
    ),
    locations = list(
      cells_body(rows = Ecoregion == "TOTAL"),
      cells_title(groups = "title")
    )
  ) %>%
  cols_align(
    align = "center",
    columns = c(ni, hi)
  ) %>%
  tab_options(
    table.width = pct(80),
    heading.title.font.size = px(20),
    heading.title.font.weight = "bold",
    table.font.names = "Open Sans",
    column_labels.font.weight = "bold"
  )

tabla_eco_gt
Tabla N°1. Distribución por Ecorregión de los pozos de gas natural en Nuevo Mexico
Ecorregión ni hi (%)
Chihuahuan Deserts 2150 17.12
Colorado Plateaus 3792 30.19
High Plains 946 7.53
New Mexico Mountains 4 0.03
New Mexico Plateau 3745 29.81
Southern Rockies 1747 13.91
Southwestern Tablelands 177 1.41
TOTAL 12561 100.00

3. GRÁFICAS DE DISTRIBUCIÓN DE CANTIDAD

par(oma = c(1, 1, 1, 1))
color_abs <- "#A9CCE3" 
color_rel <- "#EDBB99" 
par(mar = c(10, 4, 4, 2)) 

# Gráfica Nro 1
barplot(ni_eco, 
        main = "Gráfica N°1: Distribución de cantidad por Ecorregión 
        de los pozos de gas natural en Nuevo Mexico",
        xlab = "", ylab = "Cantidad (ni)", 
        col = color_abs, border = "white",
        ylim = c(0, max(ni_eco)),
        las = 2, cex.names = 0.8)
box(which = "outer", col = "black")

# Gráfica Nro 2
barplot(ni_eco, 
        main = "Gráfica N°2: Distribución de cantidad por Ecorregión 
        de los pozos de gas natural en Nuevo Mexico",
        xlab = "", ylab = "Cantidad (ni)", 
        col = color_abs, border = "white",
        ylim = c(0, 12561),
        las = 2, cex.names = 0.8)
box(which = "outer", col = "black")

# Gráfica Nro 3
hi_local_eco <- as.numeric(tabla_final_eco$hi[1:(nrow(tabla_final_eco)-1)])
barplot(hi_local_eco, 
        main = "Gráfica N° 3: Distribución de cantidad en porcentaje 
        por Ecorregión de los pozos de gas natural en Nuevo Mexico",
        xlab = "", ylab = "Porcentaje (%)", 
        col = color_rel, border = "white",
        names.arg = tabla_final_eco$Ecoregion[1:(nrow(tabla_final_eco)-1)],
        las = 2, cex.names = 0.8)
box(which = "outer", col = "black")

# Gráfica Nro 4
barplot(hi_local_eco, 
        main = "Gráfica N° 4: Distribución de cantidad en porcentaje 
        por Ecorregión de los pozos de gas natural en Nuevo Mexico",
        xlab = "", ylab = "Porcentaje (%)", 
        col = color_rel, border = "white",
        names.arg = tabla_final_eco$Ecoregion[1:(nrow(tabla_final_eco)-1)],
        ylim = c(0, 100),
        las = 2, cex.names = 0.8)
box(which = "outer", col = "black")

# DIAGRAMA CIRCULAR
par(mar = c(1, 1, 2, 7), xpd=TRUE) 

hi_TD_eco <- as.numeric(tabla_final_eco$hi[1:(nrow(tabla_final_eco)-1)])
TD_eco <- tabla_final_eco$Ecoregion[1:(nrow(tabla_final_eco)-1)]

Colores <- colorRampPalette(c("#D7BDE2", "#A2D9CE", "#FAD7A0"))
etiquetas_eco <- paste0(round(hi_TD_eco,2), "%")

pie(
  hi_TD_eco,
  radius = 0.8,
  col = Colores(length(hi_TD_eco)),
  labels = etiquetas_eco,
  main = "Gráfica N°5: Distribución porcentual por Ecorregión 
  de los pozos de gas natural en Nuevo Mexico",
  cex.main = 1.0,
  border = "white"
)

legend(
  x = 1.1,           
  y = 0.5,           
  title = "Ecorregiones",
  legend = TD_eco,
  fill = Colores(length(hi_TD_eco)),
  cex = 0.8,         
  bty = "n"
)
box(which = "outer", col = "black")

4. INDICADORES ESTADÍSTICOS

#MODA

eco_limpia <- as.character(eco_var)
eco_limpia <- eco_limpia[!is.na(eco_limpia)]
tabla_eco <- table(eco_limpia)
moda_eco <- names(tabla_eco)[which.max(as.numeric(tabla_eco))]
moda_eco
## [1] "Colorado Plateaus"
Variable_eco <- c("Ecorregión")
TablaIndicadores_eco <- data.frame(Variable_eco, moda_eco)
colnames(TablaIndicadores_eco) <- c("Variable", "Moda")

# Tabla de Indicadores con gt
tabla_ind_eco_gt <- TablaIndicadores_eco %>%
  gt() %>%
  tab_header(
    title = md("Tabla N° 2. Indicadores estadísticos de la variable ecorregión")
  ) %>%
  tab_style(
    style = list(
      cell_fill(color = "lightgray"),
      cell_text(weight = "bold")
    ),
    locations = cells_title(groups = "title")
  ) %>%
  cols_align(
    align = "center",
    columns = everything()
  ) %>%
  tab_options(
    table.width = pct(60),
    column_labels.font.weight = "bold",
    table.font.names = "Open Sans"
  )

tabla_ind_eco_gt
Tabla N° 2. Indicadores estadísticos de la variable ecorregión
Variable Moda
Ecorregión Colorado Plateaus

5. CONCLUSIÓN

La variable Ecorregión tiene como valor más frecuente Colorado Plateaus.Lo cual resulta favorable para la gestión operativa, ya que permite estandarizar los protocolos de extracción y mitigación ambiental bajo las condiciones geológicas y climáticas específicas predominantes en dicha región.