1 Configuración y Carga de Datos

Para iniciar el procesamiento estadístico inferencial, se verifica la estructura global del conjunto de datos correspondientes a los bloques contractuales y arrendamientos de hidrocarburos en el estado de Kansas.

# Selección manual del archivo
datos <- read_csv(file.choose(), show_col_types = FALSE)
cat("Base de datos cargada correctamente.\n")
## Base de datos cargada correctamente.
cat("Total de registros evaluados (filas):", nrow(datos), "\n")
## Total de registros evaluados (filas): 47757

2 Extraer Variable

Se realiza el aislamiento de la variable cualitativa ordinal Etapa de Vida del Pozo (LIFE_STAGE), clasificada en tres niveles: Nuevo, Maduro y Viejo, según los valores registrados en la columna LIFE_STAGE.

Clasificación en tres categorías ordinales:

datos <- datos %>%
  mutate(
    ETAPA = case_when(
      LIFE_STAGE == "NEW"    ~ "Nuevo",
      LIFE_STAGE == "MATURE" ~ "Maduro",
      LIFE_STAGE == "OLD"    ~ "Viejo",
      TRUE                   ~ "No registrado"
    )
  ) %>%
  filter(ETAPA != "No registrado")

3 Tabla de Distribución de Frecuencias

Se calcula la distribución de frecuencias absolutas (\(n_i\)) y porcentuales (\(h_i\%\)) para las tres categorías de la variable cualitativa ordinal, respetando la estructura de tres columnas estipulada por la cátedra.

# 1. Frecuencias absolutas
frecuencias_base <- datos %>%
  mutate(ETAPA = factor(ETAPA, levels = c("Nuevo", "Maduro", "Viejo"))) %>%
  group_by(Etapa_Vida = ETAPA, .drop = FALSE) %>%
  summarise(Frecuencia_ni = n(), .groups = "drop") %>%
  arrange(Etapa_Vida)

# 2. Porcentaje
tabla_final <- frecuencias_base %>%
  mutate(Porcentaje_hi = (Frecuencia_ni / sum(Frecuencia_ni)) * 100)

# 3. Fila TOTAL
total_fila <- data.frame(
  Etapa_Vida    = "TOTAL",
  Frecuencia_ni = sum(tabla_final$Frecuencia_ni),
  Porcentaje_hi = sum(tabla_final$Porcentaje_hi)
)

# 4. Formateo
resultado <- bind_rows(
  tabla_final %>% mutate(Porcentaje_hi = sprintf("%.2f", Porcentaje_hi)),
  total_fila  %>% mutate(Porcentaje_hi = sprintf("%.2f", Porcentaje_hi))
)

# 5. Tabla final
kable(
  resultado,
  caption   = "Tabla N°1 de Distribución de Frecuencias de la Variable Cualitativa Ordinal: Etapa de Vida del Pozo",
  col.names = c("Etapa de Vida del Pozo", "Frecuencia (ni)", "Porcentaje (hi%)"),
  align     = c("l", "c", "c")
)
Tabla N°1 de Distribución de Frecuencias de la Variable Cualitativa Ordinal: Etapa de Vida del Pozo
Etapa de Vida del Pozo Frecuencia (ni) Porcentaje (hi%)
Nuevo 11615 24.32
Maduro 20939 43.84
Viejo 15203 31.83
TOTAL 47757 100.00

4 Representación Gráfica

Se presentan tres gráficas en escala de grises que permiten analizar visualmente la distribución de la variable cualitativa ordinal Etapa de Vida del Pozo.

4.1 Gráfica N°1 — Barras de frecuencia absoluta

par(mar = c(8, 6, 5, 2))
barplot(tabla_final$Frecuencia_ni,
        main      = "",
        xlab      = "",
        ylab      = "",
        col       = c("gray30", "gray60", "gray85"),
        ylim      = c(0, max(tabla_final$Frecuencia_ni) * 1.15),
        names.arg = as.character(tabla_final$Etapa_Vida),
        cex.names = 0.9,
        las       = 2)

mtext("Frecuencia (ni)", side = 2, line = 4.5, cex = 1, font = 1)
mtext("Etapa de Vida del Pozo", side = 1, line = 6, cex = 1)
mtext("Gráfica N°1: Distribución de Frecuencias Absolutas por Etapa de Vida del Pozo",
      side = 3, line = 2, adj = 0.5, cex = 0.9, font = 2)

4.2 Gráfica N°2 — Barras de porcentaje con etiquetas

par(mar = c(8, 6, 5, 2))
bp2 <- barplot(tabla_final$Porcentaje_hi,
               main      = "",
               xlab      = "",
               ylab      = "Porcentaje %",
               col       = c("gray30", "gray60", "gray85"),
               ylim      = c(0, max(tabla_final$Porcentaje_hi) * 1.2),
               names.arg = as.character(tabla_final$Etapa_Vida),
               cex.names = 0.9,
               las       = 2)

mtext("Etapa de Vida del Pozo", side = 1, line = 6, cex = 1)
mtext("Gráfica N°2: Distribución Porcentual por Etapa de Vida del Pozo",
      side = 3, line = 2, adj = 0.5, cex = 0.9, font = 2)

text(x      = bp2,
     y      = tabla_final$Porcentaje_hi,
     labels = paste0(round(tabla_final$Porcentaje_hi, 2), "%"),
     pos    = 3, cex = 0.9, col = "black")

4.3 Gráfica N°3 — Gráfico circular porcentual

par(mar = c(5, 2, 4, 10), xpd = TRUE)

colores_grises <- c("gray30", "gray60", "gray85")

pie(tabla_final$Porcentaje_hi,
    main   = "",
    radius = 1,
    labels = paste0(round(tabla_final$Porcentaje_hi, 2), "%"),
    col    = colores_grises,
    cex    = 0.9)

mtext("Gráfica N°3: Distribución Porcentual por Etapa de Vida del Pozo",
      side = 3, line = 2, adj = 0.5, cex = 0.9, font = 2)

legend(x      = 1.2,
       y      = 1,
       legend = as.character(tabla_final$Etapa_Vida),
       fill   = colores_grises,
       cex    = 0.85,
       title  = "Etapa de Vida del Pozo",
       bty    = "n")

5 Indicadores Estadísticos

Para la variable cualitativa ordinal Etapa de Vida del Pozo, el único indicador aplicable es la Moda (Mo); la Media (X̄), Mediana (Me), Varianza (V), Desviación Estándar (Sd), Coeficiente de Variación (CV%), Asimetría (As) y Curtosis (K) no aplican para este tipo de variable y se representan con (—).

# Moda: categoría con mayor frecuencia
moda_etapa <- as.character(tabla_final$Etapa_Vida[which.max(tabla_final$Frecuencia_ni)])

# Tabla de indicadores
tabla_indicadores <- data.frame(
  "Variable"        = "Etapa de Vida del Pozo",
  "Rango"           = "Nuevo, Maduro, Viejo",
  "Media (X)"       = "-",
  "Mediana (Me)"    = "-",
  "Moda (Mo)"       = moda_etapa,
  "Varianza (V)"    = "-",
  "Desv. Est. (Sd)" = "-",
  "C.V. (%)"        = "-",
  "Asimetría (As)"  = "-",
  "Curtosis (K)"    = "-",
  check.names = FALSE
)

# Tabla GT de indicadores
tabla_indicadores_gt <- tabla_indicadores %>%
  gt() %>%
  tab_header(
    title = md("**Tabla N°2 de Indicadores Estadísticos: Etapa de Vida del Pozo**")
  ) %>%
  tab_source_note(source_note = "Autor: Fernando Almeida") %>%
  tab_options(
    column_labels.background.color = "#F0F0F0",
    heading.title.font.size        = px(15)
  )

tabla_indicadores_gt
Tabla N°2 de Indicadores Estadísticos: Etapa de Vida del Pozo
Variable Rango Media (X) Mediana (Me) Moda (Mo) Varianza (V) Desv. Est. (Sd) C.V. (%) Asimetría (As) Curtosis (K)
Etapa de Vida del Pozo Nuevo, Maduro, Viejo - - Maduro - - - - -
Autor: Fernando Almeida

Autor: Fernando Almeida