title: “Análisis Estadístico de la Variable Tipo de Extracción” author: “Grupo – Carrera de Petróleos” date: “2026-06-04” output: html_document ———————
La variable Tipo de Extracción corresponde a una variable cualitativa nominal utilizada para clasificar el método empleado en la extracción de hidrocarburos en pozos de gas y petróleo no convencional. El presente análisis tiene como objetivo describir la distribución de frecuencias de los diferentes sistemas de extracción presentes en la base de datos estudiada.
datos <- read_delim("PRODUCCION_DE_POZOS.csv", delim = ";")
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
## dat <- vroom(...)
## problems(dat)
## Rows: 400759 Columns: 40
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (27): idempresa, prod_pet, prod_gas, prod_agua, tef, tipoextraccion, ti...
## dbl (10): anio, mes, idpozo, iny_agua, iny_gas, iny_co2, iny_otro, vida_uti...
## lgl (2): rectificado, habilitado
## dttm (1): fechaingreso
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
tipoext_data <- datos$tipoextraccion[!is.na(datos$tipoextraccion)]
tipos_ext <- c(
"Surgencia Natural",
"Plunger Lift",
"Bombeo Mecánico",
"Sin Sistema de Extracción",
"Gas Lift",
"Bombeo Hidráulico",
"Electrosumergible",
"Jet Pump",
"Otros Tipos de Extracción",
"Pistoneo (Swabbing)",
"Cavidad Progresiva"
)
ni_te <- as.numeric(table(factor(tipoext_data, levels = tipos_ext)))
hi_te <- ni_te / sum(ni_te) * 100
tabla_tipoext <- data.frame(
TipoExtraccion = tipos_ext,
ni = ni_te,
hi = hi_te
)
tabla_tipoext_r <- tabla_tipoext %>%
add_row(
TipoExtraccion = "Total",
ni = sum(ni_te),
hi = sum(hi_te)
)
tabla_tipoext_r %>%
mutate(hi = round(hi,4)) %>%
gt() %>%
tab_header(
title = md("**Tabla Nro. 1**"),
subtitle = md("Distribución por tipo de extracción de la frecuencia de producción en pozos de gas y petróleo no convencional")
) %>%
cols_label(
TipoExtraccion = "Tipo de Extracción",
ni = "Frecuencia absoluta (ni)",
hi = "Frecuencia relativa (%)"
) %>%
tab_source_note(
source_note = md("Elaborado por: Grupo – Carrera de Petróleos")
) %>%
opt_all_caps() %>%
tab_style(
style = cell_text(weight = "bold"),
locations = cells_body(rows = TipoExtraccion == "Total")
)
| Tabla Nro. 1 | ||
| Distribución por tipo de extracción de la frecuencia de producción en pozos de gas y petróleo no convencional | ||
| Tipo de Extracción | Frecuencia absoluta (ni) | Frecuencia relativa (%) |
|---|---|---|
| Surgencia Natural | 258784 | 76.3683 |
| Plunger Lift | 66050 | 19.4917 |
| Bombeo Mecánico | 0 | 0.0000 |
| Sin Sistema de Extracción | 0 | 0.0000 |
| Gas Lift | 13666 | 4.0329 |
| Bombeo Hidráulico | 0 | 0.0000 |
| Electrosumergible | 247 | 0.0729 |
| Jet Pump | 98 | 0.0289 |
| Otros Tipos de Extracción | 0 | 0.0000 |
| Pistoneo (Swabbing) | 13 | 0.0038 |
| Cavidad Progresiva | 5 | 0.0015 |
| Total | 338863 | 100.0000 |
| Elaborado por: Grupo – Carrera de Petróleos | ||
par(mar = c(11,5,4,2))
barplot(
ni_te,
names.arg = tipos_ext,
las = 2,
col = "gray80",
main = "Gráfica 1: Distribución por tipo de extracción de la frecuencia absoluta de producción en pozos no convencionales",
ylab = "Frecuencia absoluta (ni)",
xlab = "",
ylim = c(0, max(ni_te)*1.15)
)
par(mar = c(11,5,4,2))
barplot(
hi_te,
names.arg = tipos_ext,
las = 2,
col = "lightblue",
main = "Gráfica 2: Distribución por tipo de extracción de la frecuencia relativa de producción en pozos no convencionales",
ylab = "Frecuencia relativa (%)",
xlab = "",
ylim = c(0, max(hi_te)*1.15)
)
hi_te_red <- round(hi_te,4)
colores <- c(
"#66c2a5","#fc8d62","#8da0cb","#e78ac3",
"#a6d854","#ffd92f","#e5c494","#b3b3b3",
"#1b9e77","#d95f02","#7570b3"
)
pie(
hi_te_red,
col = colores,
labels = paste0(hi_te_red," %"),
main = "Gráfica 3: Distribución porcentual por tipo de extracción de producción en pozos no convencionales"
)
legend(
"topright",
legend = tipos_ext,
fill = colores,
cex = 0.55,
bty = "n"
)
indice_moda <- which.max(ni_te)
moda_ext <- tipos_ext[indice_moda]
moda_valor <- ni_te[indice_moda]
moda_hi <- round(hi_te[indice_moda],4)
data.frame(
Variable = "Tipo de Extracción",
Indicador = "Moda",
Resultado = paste0(
moda_ext,
" (",
moda_valor,
" registros, ",
moda_hi,
"%)"
)
) %>%
gt() %>%
tab_header(
title = md("**Tabla Nro. 2**"),
subtitle = md("Indicadores estadísticos de la variable tipo de extracción en pozos no convencionales")
) %>%
cols_label(
Variable = "Variable analizada",
Indicador = "Indicador estadístico",
Resultado = "Resultado"
) %>%
tab_source_note(
source_note = md("Elaborado por: Grupo – Carrera de Petróleos")
) %>%
opt_all_caps() %>%
tab_style(
style = cell_text(weight = "bold"),
locations = cells_body()
)
| Tabla Nro. 2 | ||
| Indicadores estadísticos de la variable tipo de extracción en pozos no convencionales | ||
| Variable analizada | Indicador estadístico | Resultado |
|---|---|---|
| Tipo de Extracción | Moda | Surgencia Natural (258784 registros, 76.3683%) |
| Elaborado por: Grupo – Carrera de Petróleos | ||
La variable Tipo de Extracción corresponde a una variable cualitativa nominal empleada para clasificar el método utilizado para la extracción de hidrocarburos en pozos no convencionales. El análisis realizado permitió identificar que el tipo de extracción con mayor frecuencia de registros fue Surgencia Natural , con un total de 258784 registros equivalentes al 76.3683 % del total analizado.