title: “Clasificacion” output: html_document date: “2026-06-04” ——————

Variable Cualitativa Nominal: Clasificacion

1. Carga y Preparacion de los Datos

datos <- read_delim("PRODUCCION_DE_POZOS.csv", delim = ";")
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
##   dat <- vroom(...)
##   problems(dat)
## Rows: 400759 Columns: 40
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr  (27): idempresa, prod_pet, prod_gas, prod_agua, tef, tipoextraccion, ti...
## dbl  (10): anio, mes, idpozo, iny_agua, iny_gas, iny_co2, iny_otro, vida_uti...
## lgl   (2): rectificado, habilitado
## dttm  (1): fechaingreso
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

2. Identificacion de las Clasificaciones

clasif_data <- datos$clasificacion[!is.na(datos$clasificacion)]

clasificaciones <- c(
  "EXPLOTACION",
  "EXPLORACION",
  "SERVICIO"
)

3. Tabla de Frecuencias

ni_cl <- as.numeric(
  table(
    factor(
      clasif_data,
      levels = clasificaciones
    )
  )
)

hi_cl <- ni_cl / sum(ni_cl) * 100

Tabla Nro. 1

tabla_clasif <- data.frame(
  Clasificacion = clasificaciones,
  ni = ni_cl,
  hi = hi_cl
)

tabla_clasif_r <- tabla_clasif %>%
  add_row(
    Clasificacion = "Total",
    ni = sum(ni_cl),
    hi = sum(hi_cl)
  )

tabla_clasif_r %>%
  mutate(hi = round(hi, 4)) %>%
  gt() %>%
  tab_header(
    title = md("**Tabla Nro. 1**"),
    subtitle = md(
      "Distribucion por clasificacion de la frecuencia de produccion en pozos de gas y petroleo no convencional"
    )
  ) %>%
  cols_label(
    Clasificacion = "Clasificacion",
    ni = "Frecuencia absoluta (ni)",
    hi = "Frecuencia relativa (%)"
  ) %>%
  tab_source_note(
    source_note = md(
      "Elaborado por: Grupo - Carrera de Petroleos"
    )
  ) %>%
  opt_all_caps() %>%
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(
      rows = Clasificacion == "Total"
    )
  )
Tabla Nro. 1
Distribucion por clasificacion de la frecuencia de produccion en pozos de gas y petroleo no convencional
Clasificacion Frecuencia absoluta (ni) Frecuencia relativa (%)
EXPLOTACION 362743 90.7252
EXPLORACION 36296 9.0779
SERVICIO 787 0.1968
Total 399826 100.0000
Elaborado por: Grupo - Carrera de Petroleos

4. Diagramas de Barras

Grafica 1. Frecuencia Absoluta

par(mar = c(6, 5, 4, 2))

barplot(
  ni_cl,
  names.arg = clasificaciones,
  las = 1,
  col = "gray80",
  main = "Grafica 1: Distribucion por clasificacion de la frecuencia absoluta de produccion en pozos no convencionales",
  ylab = "Frecuencia absoluta (ni)",
  xlab = "Clasificacion",
  ylim = c(0, max(ni_cl) * 1.15)
)

Grafica 2. Frecuencia Relativa

par(mar = c(6, 5, 4, 2))

barplot(
  hi_cl,
  names.arg = clasificaciones,
  las = 1,
  col = "lightblue",
  main = "Grafica 2: Distribucion por clasificacion de la frecuencia relativa de produccion en pozos no convencionales",
  ylab = "Frecuencia relativa (%)",
  xlab = "Clasificacion",
  ylim = c(0, max(hi_cl) * 1.15)
)

5. Diagrama Circular

Grafica 3. Distribucion Porcentual

hi_cl_red <- round(hi_cl, 4)

colores <- c(
  "#66c2a5",
  "#fc8d62",
  "#8da0cb"
)

pie(
  hi_cl_red,
  col = colores,
  labels = paste0(hi_cl_red, " %"),
  main = "Grafica 3: Distribucion porcentual por clasificacion de produccion en pozos no convencionales"
)

legend(
  "topright",
  legend = clasificaciones,
  fill = colores,
  cex = 0.8,
  bty = "n"
)

6. Indicadores Estadisticos

indice_moda <- which.max(ni_cl)

moda_clasif <- clasificaciones[indice_moda]
moda_valor <- ni_cl[indice_moda]
moda_hi <- round(hi_cl[indice_moda], 4)

data.frame(
  Variable = "Clasificacion",
  Indicador = "Moda",
  Resultado = paste0(
    moda_clasif,
    " (",
    moda_valor,
    " registros, ",
    moda_hi,
    "%)"
  )
) %>%
  gt() %>%
  tab_header(
    title = md("**Tabla Nro. 2**"),
    subtitle = md(
      "Indicadores estadisticos de la variable clasificacion en pozos no convencionales"
    )
  ) %>%
  cols_label(
    Variable = "Variable analizada",
    Indicador = "Indicador estadistico",
    Resultado = "Resultado"
  ) %>%
  tab_source_note(
    source_note = md(
      "Elaborado por: Grupo - Carrera de Petroleos"
    )
  ) %>%
  opt_all_caps() %>%
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body()
  )
Tabla Nro. 2
Indicadores estadisticos de la variable clasificacion en pozos no convencionales
Variable analizada Indicador estadistico Resultado
Clasificacion Moda EXPLOTACION (362743 registros, 90.7252%)
Elaborado por: Grupo - Carrera de Petroleos

7. Conclusion

cat(
  "La variable Clasificacion corresponde a una variable cualitativa nominal, empleada para identificar la etapa operativa de los pozos de gas y petroleo no convencional. El analisis realizado permitio identificar que la clasificacion con mayor frecuencia de registros fue ",
  moda_clasif,
  ", con un total de ",
  moda_valor,
  " registros equivalentes al ",
  moda_hi,
  "% del total analizado."
)
## La variable Clasificacion corresponde a una variable cualitativa nominal, empleada para identificar la etapa operativa de los pozos de gas y petroleo no convencional. El analisis realizado permitio identificar que la clasificacion con mayor frecuencia de registros fue  EXPLOTACION , con un total de  362743  registros equivalentes al  90.7252 % del total analizado.