Variable Cuantitativa Continua: Produccion de Gas
1. Carga de Datos
datos <- read_delim("PRODUCCION_DE_POZOS.csv", delim = ";")
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
## dat <- vroom(...)
## problems(dat)
## Rows: 400759 Columns: 40
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (27): idempresa, prod_pet, prod_gas, prod_agua, tef, tipoextraccion, ti...
## dbl (10): anio, mes, idpozo, iny_agua, iny_gas, iny_co2, iny_otro, vida_uti...
## lgl (2): rectificado, habilitado
## dttm (1): fechaingreso
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
2. Preparacion de la Variable
x <- as.numeric(gsub(",", ".", datos$prod_gas))
## Warning: NAs introducidos por coerción
x <- x[is.finite(x)]
if(length(x) < 10){
stop("ERROR: muy pocos datos validos en prod_gas")
}
p01 <- quantile(x, 0.01, na.rm = TRUE)
p99 <- quantile(x, 0.99, na.rm = TRUE)
x_lim <- x[x >= p01 & x <= p99]
3. Tabla de Frecuencias (Sturges)
k <- round(1 + 3.322 * log10(length(x_lim)))
intervalos <- cut(x_lim, breaks = k, include.lowest = TRUE)
ni_pg <- as.numeric(table(intervalos))
hi_pg <- ni_pg / sum(ni_pg) * 100
Ni_pg <- cumsum(ni_pg)
Hi_pg <- cumsum(hi_pg)
niveles <- levels(intervalos)
Tabla Nro. 1
tabla_pg <- data.frame(
Intervalo = niveles,
ni = ni_pg,
hi = round(hi_pg, 4),
Ni = Ni_pg,
Hi = round(Hi_pg, 4)
)
tabla_pg_r <- tabla_pg %>%
add_row(
Intervalo = "Total",
ni = sum(ni_pg),
hi = round(sum(hi_pg), 4),
Ni = NA,
Hi = NA
)
tabla_pg_r %>%
gt() %>%
tab_header(
title = md("**Tabla Nro. 1**"),
subtitle = md("Distribucion de la produccion de gas en pozos no convencionales")
) %>%
cols_label(
Intervalo = "Intervalo (Mm3)",
ni = "Frecuencia absoluta (ni)",
hi = "Frecuencia relativa (%)",
Ni = "Frecuencia acumulada",
Hi = "Frecuencia relativa acumulada (%)"
) %>%
tab_source_note(
source_note = md("Elaborado por: Grupo - Carrera de Petroleos")
) %>%
opt_all_caps() %>%
tab_style(
style = cell_text(weight = "bold"),
locations = cells_body(rows = Intervalo == "Total")
)
| Tabla Nro. 1 |
| Distribucion de la produccion de gas en pozos no convencionales |
| Intervalo (Mm3) |
Frecuencia absoluta (ni) |
Frecuencia relativa (%) |
Frecuencia acumulada |
Frecuencia relativa acumulada (%) |
| [-7.2,379] |
261143 |
79.9510 |
261143 |
79.9510 |
| (379,758] |
31905 |
9.7680 |
293048 |
89.7189 |
| (758,1.14e+03] |
12893 |
3.9473 |
305941 |
93.6662 |
| (1.14e+03,1.52e+03] |
5873 |
1.7981 |
311814 |
95.4643 |
| (1.52e+03,1.9e+03] |
3676 |
1.1254 |
315490 |
96.5897 |
| (1.9e+03,2.27e+03] |
2526 |
0.7734 |
318016 |
97.3631 |
| (2.27e+03,2.65e+03] |
1861 |
0.5698 |
319877 |
97.9328 |
| (2.65e+03,3.03e+03] |
1517 |
0.4644 |
321394 |
98.3973 |
| (3.03e+03,3.41e+03] |
1103 |
0.3377 |
322497 |
98.7350 |
| (3.41e+03,3.79e+03] |
834 |
0.2553 |
323331 |
98.9903 |
| (3.79e+03,4.17e+03] |
702 |
0.2149 |
324033 |
99.2052 |
| (4.17e+03,4.55e+03] |
559 |
0.1711 |
324592 |
99.3764 |
| (4.55e+03,4.93e+03] |
447 |
0.1369 |
325039 |
99.5132 |
| (4.93e+03,5.31e+03] |
391 |
0.1197 |
325430 |
99.6329 |
| (5.31e+03,5.69e+03] |
303 |
0.0928 |
325733 |
99.7257 |
| (5.69e+03,6.07e+03] |
302 |
0.0925 |
326035 |
99.8181 |
| (6.07e+03,6.44e+03] |
231 |
0.0707 |
326266 |
99.8889 |
| (6.44e+03,6.82e+03] |
190 |
0.0582 |
326456 |
99.9470 |
| (6.82e+03,7.21e+03] |
173 |
0.0530 |
326629 |
100.0000 |
| Total |
326629 |
100.0000 |
NA |
NA |
| Elaborado por: Grupo - Carrera de Petroleos |
4. Graficas
Histograma
par(mar = c(6, 5, 4, 2))
hist(
x_lim,
breaks = k,
col = "gray80",
border = "white",
main = "Histograma de la produccion de gas",
xlab = "Produccion de gas (Mm3)",
ylab = "Frecuencia absoluta"
)

Poligono de Frecuencias
h <- hist(x_lim, breaks = k, plot = FALSE)
mid <- h$mids
plot(
mid,
h$counts,
type = "b",
pch = 19,
col = "steelblue",
lwd = 2,
main = "Poligono de frecuencias - Produccion de gas",
xlab = "Produccion de gas (Mm3)",
ylab = "Frecuencia absoluta"
)
grid()

Ojiva
plot(
mid,
cumsum(h$counts),
type = "b",
pch = 19,
col = "darkorange",
lwd = 2,
main = "Ojiva - Produccion de gas acumulada",
xlab = "Produccion de gas (Mm3)",
ylab = "Frecuencia acumulada"
)
grid()

5. Boxplot
par(mar = c(4, 6, 4, 2))
boxplot(
x_lim,
horizontal = TRUE,
col = "lightgreen",
main = "Boxplot - Produccion de gas",
xlab = "Produccion de gas (Mm3)"
)

6. Indicadores Estadisticos
media_pg <- mean(x_lim)
mediana_pg <- median(x_lim)
sd_pg <- sd(x_lim)
cv_pg <- ifelse(media_pg == 0, NA,
(sd_pg / media_pg) * 100)
q1_pg <- quantile(x_lim, 0.25)
q3_pg <- quantile(x_lim, 0.75)
Tabla Nro. 2
data.frame(
Variable = "Produccion de Gas",
Media = round(media_pg, 4),
Mediana = round(mediana_pg, 4),
Desv_Est = round(sd_pg, 4),
CV_pct = round(cv_pg, 4),
Q1 = round(q1_pg, 4),
Q3 = round(q3_pg, 4)
) %>%
gt() %>%
tab_header(
title = md("**Tabla Nro. 2**"),
subtitle = md("Indicadores estadisticos de la produccion de gas")
) %>%
cols_label(
Variable = "Variable",
Media = "Media (Mm3)",
Mediana = "Mediana (Mm3)",
Desv_Est = "Desviacion Estandar",
CV_pct = "Coeficiente de Variacion (%)",
Q1 = "Q1",
Q3 = "Q3"
) %>%
tab_source_note(
source_note = md("Elaborado por: Grupo - Carrera de Petroleos")
)
| Tabla Nro. 2 |
| Indicadores estadisticos de la produccion de gas |
| Variable |
Media (Mm3) |
Mediana (Mm3) |
Desviacion Estandar |
Coeficiente de Variacion (%) |
Q1 |
Q3 |
| Produccion de Gas |
305.972 |
63.93 |
697.062 |
227.8189 |
0 |
281.64 |
| Elaborado por: Grupo - Carrera de Petroleos |
7. Conclusion
cat(
"La variable Produccion de Gas es cuantitativa continua.",
"Se analizaron",
length(x_lim),
"datos validos con media de",
round(media_pg, 4),
"Mm3 y mediana de",
round(mediana_pg, 4),
"Mm3.",
"La desviacion estandar es",
round(sd_pg, 4),
"Mm3 y el coeficiente de variacion es",
round(cv_pg, 4),
"%, lo que indica variabilidad en la produccion de gas."
)
## La variable Produccion de Gas es cuantitativa continua. Se analizaron 326629 datos validos con media de 305.972 Mm3 y mediana de 63.93 Mm3. La desviacion estandar es 697.062 Mm3 y el coeficiente de variacion es 227.8189 %, lo que indica variabilidad en la produccion de gas.