title: “Produccion de Gas” output: html_document date: “2026-06-04” ——————

Variable Cuantitativa Continua: Produccion de Gas

1. Carga de Datos

datos <- read_delim("PRODUCCION_DE_POZOS.csv", delim = ";")
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
##   dat <- vroom(...)
##   problems(dat)
## Rows: 400759 Columns: 40
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr  (27): idempresa, prod_pet, prod_gas, prod_agua, tef, tipoextraccion, ti...
## dbl  (10): anio, mes, idpozo, iny_agua, iny_gas, iny_co2, iny_otro, vida_uti...
## lgl   (2): rectificado, habilitado
## dttm  (1): fechaingreso
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

2. Preparacion de la Variable

x <- as.numeric(gsub(",", ".", datos$prod_gas))
## Warning: NAs introducidos por coerción
x <- x[is.finite(x)]

if(length(x) < 10){
  stop("ERROR: muy pocos datos validos en prod_gas")
}

p01 <- quantile(x, 0.01, na.rm = TRUE)
p99 <- quantile(x, 0.99, na.rm = TRUE)

x_lim <- x[x >= p01 & x <= p99]

3. Tabla de Frecuencias (Sturges)

k <- round(1 + 3.322 * log10(length(x_lim)))

intervalos <- cut(x_lim, breaks = k, include.lowest = TRUE)

ni_pg <- as.numeric(table(intervalos))
hi_pg <- ni_pg / sum(ni_pg) * 100

Ni_pg <- cumsum(ni_pg)
Hi_pg <- cumsum(hi_pg)

niveles <- levels(intervalos)

Tabla Nro. 1

tabla_pg <- data.frame(
  Intervalo = niveles,
  ni = ni_pg,
  hi = round(hi_pg, 4),
  Ni = Ni_pg,
  Hi = round(Hi_pg, 4)
)

tabla_pg_r <- tabla_pg %>%
  add_row(
    Intervalo = "Total",
    ni = sum(ni_pg),
    hi = round(sum(hi_pg), 4),
    Ni = NA,
    Hi = NA
  )

tabla_pg_r %>%
  gt() %>%
  tab_header(
    title = md("**Tabla Nro. 1**"),
    subtitle = md("Distribucion de la produccion de gas en pozos no convencionales")
  ) %>%
  cols_label(
    Intervalo = "Intervalo (Mm3)",
    ni = "Frecuencia absoluta (ni)",
    hi = "Frecuencia relativa (%)",
    Ni = "Frecuencia acumulada",
    Hi = "Frecuencia relativa acumulada (%)"
  ) %>%
  tab_source_note(
    source_note = md("Elaborado por: Grupo - Carrera de Petroleos")
  ) %>%
  opt_all_caps() %>%
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(rows = Intervalo == "Total")
  )
Tabla Nro. 1
Distribucion de la produccion de gas en pozos no convencionales
Intervalo (Mm3) Frecuencia absoluta (ni) Frecuencia relativa (%) Frecuencia acumulada Frecuencia relativa acumulada (%)
[-7.2,379] 261143 79.9510 261143 79.9510
(379,758] 31905 9.7680 293048 89.7189
(758,1.14e+03] 12893 3.9473 305941 93.6662
(1.14e+03,1.52e+03] 5873 1.7981 311814 95.4643
(1.52e+03,1.9e+03] 3676 1.1254 315490 96.5897
(1.9e+03,2.27e+03] 2526 0.7734 318016 97.3631
(2.27e+03,2.65e+03] 1861 0.5698 319877 97.9328
(2.65e+03,3.03e+03] 1517 0.4644 321394 98.3973
(3.03e+03,3.41e+03] 1103 0.3377 322497 98.7350
(3.41e+03,3.79e+03] 834 0.2553 323331 98.9903
(3.79e+03,4.17e+03] 702 0.2149 324033 99.2052
(4.17e+03,4.55e+03] 559 0.1711 324592 99.3764
(4.55e+03,4.93e+03] 447 0.1369 325039 99.5132
(4.93e+03,5.31e+03] 391 0.1197 325430 99.6329
(5.31e+03,5.69e+03] 303 0.0928 325733 99.7257
(5.69e+03,6.07e+03] 302 0.0925 326035 99.8181
(6.07e+03,6.44e+03] 231 0.0707 326266 99.8889
(6.44e+03,6.82e+03] 190 0.0582 326456 99.9470
(6.82e+03,7.21e+03] 173 0.0530 326629 100.0000
Total 326629 100.0000 NA NA
Elaborado por: Grupo - Carrera de Petroleos

4. Graficas

Histograma

par(mar = c(6, 5, 4, 2))

hist(
  x_lim,
  breaks = k,
  col = "gray80",
  border = "white",
  main = "Histograma de la produccion de gas",
  xlab = "Produccion de gas (Mm3)",
  ylab = "Frecuencia absoluta"
)

Poligono de Frecuencias

h <- hist(x_lim, breaks = k, plot = FALSE)
mid <- h$mids

plot(
  mid,
  h$counts,
  type = "b",
  pch = 19,
  col = "steelblue",
  lwd = 2,
  main = "Poligono de frecuencias - Produccion de gas",
  xlab = "Produccion de gas (Mm3)",
  ylab = "Frecuencia absoluta"
)

grid()

Ojiva

plot(
  mid,
  cumsum(h$counts),
  type = "b",
  pch = 19,
  col = "darkorange",
  lwd = 2,
  main = "Ojiva - Produccion de gas acumulada",
  xlab = "Produccion de gas (Mm3)",
  ylab = "Frecuencia acumulada"
)

grid()

5. Boxplot

par(mar = c(4, 6, 4, 2))

boxplot(
  x_lim,
  horizontal = TRUE,
  col = "lightgreen",
  main = "Boxplot - Produccion de gas",
  xlab = "Produccion de gas (Mm3)"
)

6. Indicadores Estadisticos

media_pg <- mean(x_lim)
mediana_pg <- median(x_lim)
sd_pg <- sd(x_lim)

cv_pg <- ifelse(media_pg == 0, NA,
                (sd_pg / media_pg) * 100)

q1_pg <- quantile(x_lim, 0.25)
q3_pg <- quantile(x_lim, 0.75)

Tabla Nro. 2

data.frame(
  Variable = "Produccion de Gas",
  Media = round(media_pg, 4),
  Mediana = round(mediana_pg, 4),
  Desv_Est = round(sd_pg, 4),
  CV_pct = round(cv_pg, 4),
  Q1 = round(q1_pg, 4),
  Q3 = round(q3_pg, 4)
) %>%
  gt() %>%
  tab_header(
    title = md("**Tabla Nro. 2**"),
    subtitle = md("Indicadores estadisticos de la produccion de gas")
  ) %>%
  cols_label(
    Variable = "Variable",
    Media = "Media (Mm3)",
    Mediana = "Mediana (Mm3)",
    Desv_Est = "Desviacion Estandar",
    CV_pct = "Coeficiente de Variacion (%)",
    Q1 = "Q1",
    Q3 = "Q3"
  ) %>%
  tab_source_note(
    source_note = md("Elaborado por: Grupo - Carrera de Petroleos")
  )
Tabla Nro. 2
Indicadores estadisticos de la produccion de gas
Variable Media (Mm3) Mediana (Mm3) Desviacion Estandar Coeficiente de Variacion (%) Q1 Q3
Produccion de Gas 305.972 63.93 697.062 227.8189 0 281.64
Elaborado por: Grupo - Carrera de Petroleos

7. Conclusion

cat(
  "La variable Produccion de Gas es cuantitativa continua.",
  "Se analizaron",
  length(x_lim),
  "datos validos con media de",
  round(media_pg, 4),
  "Mm3 y mediana de",
  round(mediana_pg, 4),
  "Mm3.",
  "La desviacion estandar es",
  round(sd_pg, 4),
  "Mm3 y el coeficiente de variacion es",
  round(cv_pg, 4),
  "%, lo que indica variabilidad en la produccion de gas."
)
## La variable Produccion de Gas es cuantitativa continua. Se analizaron 326629 datos validos con media de 305.972 Mm3 y mediana de 63.93 Mm3. La desviacion estandar es 697.062 Mm3 y el coeficiente de variacion es 227.8189 %, lo que indica variabilidad en la produccion de gas.