title: “Análisis Estadístico de la Variable Tipo de Extracción” author: “Grupo – Carrera de Petróleos” date: “2026-06-04” output: html_document ———————

Análisis de la Variable Tipo de Extracción

Introducción

La variable Tipo de Extracción corresponde a una variable cualitativa nominal utilizada para clasificar el método empleado en la extracción de hidrocarburos en pozos de gas y petróleo no convencional. El presente análisis tiene como objetivo describir la distribución de frecuencias de los diferentes sistemas de extracción presentes en la base de datos estudiada.

1. Carga y preparación de los datos

datos <- read_delim("PRODUCCION_DE_POZOS.csv", delim = ";")
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
##   dat <- vroom(...)
##   problems(dat)
## Rows: 400759 Columns: 40
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr  (27): idempresa, prod_pet, prod_gas, prod_agua, tef, tipoextraccion, ti...
## dbl  (10): anio, mes, idpozo, iny_agua, iny_gas, iny_co2, iny_otro, vida_uti...
## lgl   (2): rectificado, habilitado
## dttm  (1): fechaingreso
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
tipoext_data <- datos$tipoextraccion[!is.na(datos$tipoextraccion)]

tipos_ext <- c(
  "Surgencia Natural",
  "Plunger Lift",
  "Bombeo Mecánico",
  "Sin Sistema de Extracción",
  "Gas Lift",
  "Bombeo Hidráulico",
  "Electrosumergible",
  "Jet Pump",
  "Otros Tipos de Extracción",
  "Pistoneo (Swabbing)",
  "Cavidad Progresiva"
)

2. Tabla de frecuencias

ni_te <- as.numeric(table(factor(tipoext_data, levels = tipos_ext)))
hi_te <- ni_te / sum(ni_te) * 100

tabla_tipoext <- data.frame(
  TipoExtraccion = tipos_ext,
  ni = ni_te,
  hi = hi_te
)

tabla_tipoext_r <- tabla_tipoext %>%
  add_row(
    TipoExtraccion = "Total",
    ni = sum(ni_te),
    hi = sum(hi_te)
  )

tabla_tipoext_r %>%
  mutate(hi = round(hi,4)) %>%
  gt() %>%
  tab_header(
    title = md("**Tabla Nro. 1**"),
    subtitle = md("Distribución por tipo de extracción de la frecuencia de producción en pozos de gas y petróleo no convencional")
  ) %>%
  cols_label(
    TipoExtraccion = "Tipo de Extracción",
    ni = "Frecuencia absoluta (ni)",
    hi = "Frecuencia relativa (%)"
  ) %>%
  tab_source_note(
    source_note = md("Elaborado por: Grupo – Carrera de Petróleos")
  ) %>%
  opt_all_caps() %>%
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(rows = TipoExtraccion == "Total")
  )
Tabla Nro. 1
Distribución por tipo de extracción de la frecuencia de producción en pozos de gas y petróleo no convencional
Tipo de Extracción Frecuencia absoluta (ni) Frecuencia relativa (%)
Surgencia Natural 258784 76.3683
Plunger Lift 66050 19.4917
Bombeo Mecánico 0 0.0000
Sin Sistema de Extracción 0 0.0000
Gas Lift 13666 4.0329
Bombeo Hidráulico 0 0.0000
Electrosumergible 247 0.0729
Jet Pump 98 0.0289
Otros Tipos de Extracción 0 0.0000
Pistoneo (Swabbing) 13 0.0038
Cavidad Progresiva 5 0.0015
Total 338863 100.0000
Elaborado por: Grupo – Carrera de Petróleos

3. Diagrama de barras de frecuencia absoluta

par(mar = c(11,5,4,2))

barplot(
  ni_te,
  names.arg = tipos_ext,
  las = 2,
  col = "gray80",
  main = "Gráfica 1: Distribución por tipo de extracción de la frecuencia absoluta de producción en pozos no convencionales",
  ylab = "Frecuencia absoluta (ni)",
  xlab = "",
  ylim = c(0, max(ni_te)*1.15)
)

4. Diagrama de barras de frecuencia relativa

par(mar = c(11,5,4,2))

barplot(
  hi_te,
  names.arg = tipos_ext,
  las = 2,
  col = "lightblue",
  main = "Gráfica 2: Distribución por tipo de extracción de la frecuencia relativa de producción en pozos no convencionales",
  ylab = "Frecuencia relativa (%)",
  xlab = "",
  ylim = c(0, max(hi_te)*1.15)
)

5. Diagrama circular

hi_te_red <- round(hi_te,4)

colores <- c(
  "#66c2a5","#fc8d62","#8da0cb","#e78ac3",
  "#a6d854","#ffd92f","#e5c494","#b3b3b3",
  "#1b9e77","#d95f02","#7570b3"
)

pie(
  hi_te_red,
  col = colores,
  labels = paste0(hi_te_red," %"),
  main = "Gráfica 3: Distribución porcentual por tipo de extracción de producción en pozos no convencionales"
)

legend(
  "topright",
  legend = tipos_ext,
  fill = colores,
  cex = 0.55,
  bty = "n"
)

6. Indicadores estadísticos

indice_moda <- which.max(ni_te)
moda_ext <- tipos_ext[indice_moda]
moda_valor <- ni_te[indice_moda]
moda_hi <- round(hi_te[indice_moda],4)

data.frame(
  Variable = "Tipo de Extracción",
  Indicador = "Moda",
  Resultado = paste0(
    moda_ext,
    " (",
    moda_valor,
    " registros, ",
    moda_hi,
    "%)"
  )
) %>%
  gt() %>%
  tab_header(
    title = md("**Tabla Nro. 2**"),
    subtitle = md("Indicadores estadísticos de la variable tipo de extracción en pozos no convencionales")
  ) %>%
  cols_label(
    Variable = "Variable analizada",
    Indicador = "Indicador estadístico",
    Resultado = "Resultado"
  ) %>%
  tab_source_note(
    source_note = md("Elaborado por: Grupo – Carrera de Petróleos")
  ) %>%
  opt_all_caps() %>%
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body()
  )
Tabla Nro. 2
Indicadores estadísticos de la variable tipo de extracción en pozos no convencionales
Variable analizada Indicador estadístico Resultado
Tipo de Extracción Moda Surgencia Natural (258784 registros, 76.3683%)
Elaborado por: Grupo – Carrera de Petróleos

7. Conclusión

La variable Tipo de Extracción corresponde a una variable cualitativa nominal empleada para clasificar el método utilizado para la extracción de hidrocarburos en pozos no convencionales. El análisis realizado permitió identificar que el tipo de extracción con mayor frecuencia de registros fue Surgencia Natural , con un total de 258784 registros equivalentes al 76.3683 % del total analizado.