Análisis Estadístico de la Clasificación de Pozos Petroleros en Brasil
La industria petrolera representa una actividad estratégica para el desarrollo energético de varios países. En este trabajo se analiza la clasificación general de los pozos petroleros en Brasil mediante técnicas de estadística descriptiva. Para ello se utilizan tablas de frecuencia y representaciones gráficas que permiten interpretar la distribución de las distintas categorías de pozos.
Se carga la base de datos de los pozos petroleros en Brasil y se revisa su estructura para verificar las variables disponibles.
Se selecciona la variable de clasificación de los pozos y se construye una tabla de frecuencias inicial.
Clasificación_G <-Datos$CATEGORIA
TDFClasificación_G <- as.data.frame(table(Clasificación_G))
TDFClasificación_G## Clasificación_G Freq
## 1 Desenvolvimento 18276
## 2 Especial 1965
## 3 Estratigráfico 327
## 4 Extensão 2302
## 5 Injeção 1644
## 6 Jazida Mais Profunda 144
## 7 Jazida Mais Rasa 35
## 8 Pioneiro 4059
## 9 Pioneiro Adjacente 823
Se traducen las categorías originales del portugués al español para facilitar la interpretación del análisis.
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
TDFClasificación_G$Clasificación_G <- recode(TDFClasificación_G$Clasificación_G,
"Desenvolvimento" = "Desarrollo",
"Especial" = "Especial",
"Estratigráfico" = "Estratigráfico",
"Extensão" = "Extensión",
"Injeção" = "Inyección",
"Jazida Mais Profunda" = "Yacimiento más profundo",
"Jazida Mais Rasa" = "Yacimiento más somero",
"Pioneiro" = "Pionero",
"Pioneiro Adjacente" = "Pionero adyacente"
)
head(TDFClasificación_G)## Clasificación_G Freq
## 1 Desarrollo 18276
## 2 Especial 1965
## 3 Estratigráfico 327
## 4 Extensión 2302
## 5 Inyección 1644
## 6 Yacimiento más profundo 144
Las clasificaciones se agrupan en categorías más generales para simplificar el análisis estadístico.
TDFClasificación_G$Clasificación <- ifelse(TDFClasificación_G$Clasificación_G %in% c("Desarrollo","Extensión"),
"Desarrollo de Campo",
ifelse(TDFClasificación_G$Clasificación_G %in% c("Pionero","Pionero adyacente"),"Descubrimiento",
ifelse(TDFClasificación_G$Clasificación_G %in% c("Especial","Inyección"),"Operación",
ifelse(TDFClasificación_G$Clasificación_G %in% c("Estratigráfico", "Yacimiento más somero", "Yacimiento más profundo"), "Tipo de yacimiento","Otros"))))
head(TDFClasificación_G$Clasificación)## [1] "Desarrollo de Campo" "Operación" "Tipo de yacimiento"
## [4] "Desarrollo de Campo" "Operación" "Tipo de yacimiento"
Se calculan las frecuencias absolutas y relativas de cada categoría agrupada.
TDFClasificación_G$Freq <- as.numeric(as.character(TDFClasificación_G$Freq))
library(dplyr)
TDFClasificación_G1 <- TDFClasificación_G %>%
group_by(Clasificación) %>%
summarise(
ni = sum(Freq),
hi = round(sum(Freq) / sum(TDFClasificación_G$Freq)*100, 5))
TDFClasificación_G1 <- data.frame(TDFClasificación_G1)Se organiza la tabla final de frecuencias incorporando el total de observaciones.
TDFClasificación_G1 <- TDFClasificación_G1 [, c("Clasificación", "ni", "hi")]
total_ni <- sum(TDFClasificación_G1$ni)
total_hi <- sum(TDFClasificación_G1$hi)
TDFClasificación_G1.1 <- rbind(TDFClasificación_G1, data.frame( Clasificación = "Total",
ni = total_ni,
hi = total_hi))
print(TDFClasificación_G1.1)## Clasificación ni hi
## 1 Desarrollo de Campo 20578 69.57904
## 2 Descubrimiento 4882 16.50719
## 3 Operación 3609 12.20287
## 4 Tipo de yacimiento 506 1.71090
## 5 Total 29575 100.00000
Se presenta la tabla de frecuencias con formato visual utilizando la librería gt.
library(gt)
gt(TDFClasificación_G1.1) %>%
tab_header(
title = md("**DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL**"),
subtitle = "Distibución de pozos petroliferos en las regiones de Brasil") %>%
fmt_number(
columns = hi,
decimals = 2) %>%
cols_align(align = "center", columns = everything()) %>%
tab_style(
style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
locations = cells_title()
) %>%
tab_style(
style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
locations = cells_column_labels()
) %>%
tab_options(
table.border.top.color = "#2E4053",
table.border.bottom.color = "#2E4053",
column_labels.border.bottom.color = "#2E4053",
data_row.padding = px(6))| DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL | ||
| Distibución de pozos petroliferos en las regiones de Brasil | ||
| Clasificación | ni | hi |
|---|---|---|
| Desarrollo de Campo | 20578 | 69.58 |
| Descubrimiento | 4882 | 16.51 |
| Operación | 3609 | 12.20 |
| Tipo de yacimiento | 506 | 1.71 |
| Total | 29575 | 100.00 |
Muestra la cantidad de pozos en cada categoría.
TDFClasificación_G2 <- TDFClasificación_G1.1[TDFClasificación_G1.1$Clasificación != "Total", ]
barplot(TDFClasificación_G2$ni,
main = "Gráfica N°1: Distribución en Cantidad de la Clasificación General de los pozos petroliferos",
ylab = "Cantidad",
col = "#2E4053", names.arg = TDFClasificación_G2$Clasificación,
las = 2, cex.names = 0.7, cex.axis = 0.8, cex.main = 0.9)
mtext("Clasificación General", side = 1, line = 7, adj = 0.4, cex = 1)Permite comparar las cantidades entre categorías en una escala general.
par(mar = c(9, 4, 4, 2))
barplot(TDFClasificación_G2$ni,
main = "Gráfica N°2: Distribución en Cantidad de la Clasificación General de los pozos petroliferos",
ylab = "Cantidad",
col = "#2E4053", names.arg = TDFClasificación_G2$Clasificación,
las = 2, cex.names = 0.7, cex.axis = 0.8, cex.main = 0.9,
ylim = c(0,30000))
mtext("Clasificación General", side = 1, line = 7, adj = 0.4, cex = 1)Representa el porcentaje de cada categoría respecto al total.
par(mar = c(9, 4, 4, 2))
barplot(TDFClasificación_G2$hi,
main = "Gráfica N°3: Distribución en porcentaje de la Clasificación General de los pozos petrolíferos ",
ylab = "Porcentaje",
col = "#2E4053", names.arg = TDFClasificación_G2$Clasificación,
las = 2, cex.names = 0.7, cex.axis = 0.8, cex.main = 0.9)
mtext("Clasificación General", side = 1, line = 7, adj = 0.4, cex = 1)Muestra la distribución porcentual considerando el rango completo de 0 a 100%.
par(mar = c(9, 4, 4, 2))
barplot(TDFClasificación_G2$hi,
main = "Gráfica N°4: Distribución en porcentaje de la Clasificación General de los pozos petrolíferos",
ylab = "Porcentaje",
col = "#2E4053", names.arg = TDFClasificación_G2$Clasificación,
las = 2, cex.names = 0.7, cex.axis = 0.8, cex.main = 0.9,
ylim = c(0,100))
mtext("Clasificación General", side = 1, line = 7, adj = 0.4, cex = 1)Presenta la participación porcentual de cada categoría dentro del total de pozos.
par(mar = c(9, 4, 4, 2))
pie(TDFClasificación_G2$hi,
main = "Gráfica N°5: Distribución porcentual de la Clasificación General de los pozos petrolíferos",
radius = 0.9,
labels = paste0(round(TDFClasificación_G2$hi,2)),
col = c("#6C8A9B", "#E6E6E4", "#F9F5EF", "#FD6574"),
cex = 1, cex.main = 0.9,
init.angle = 90)
legend(x = -2.6099, y =1.06,
legend = TDFClasificación_G2$Clasificación,
fill = c("#6C8A9B", "#E6E6E4", "#F9F5EF", "#FD6574"),
cex = 0.9,
title = "Clasificación General")Conclusiones <- data.frame(
Variable = "Clasificación General de los Pozos",
`Rango [Min; Max]` = "N/A",
`Media (X̄)` = "N/A",
`Mediana (Me)` = "N/A",
`Moda (Mo)` = "Desarrollo de Campo",
`Varianza (S²)` = "N/A",
`Desv. Est. (S)` = "N/A",
`C.V. (%)` = "N/A",
`Asimetría (As)` = "N/A",
`Curtosis (K)` = "N/A",
`Valores Atípicos` = "N/A",
check.names = FALSE
)library(gt)
gt(Conclusiones) %>%
tab_header(
title = md("**CONCLUSIONES Y ESTADÍSTICOS**"),
subtitle = "Resumen de Indicadores de la Clasificación General de los Pozos Petrolíferos en Brasil") %>%
tab_source_note(source_note = "Autor: Anahi Macias") %>%
cols_align(align = "center", columns = everything()) %>%
tab_style(
style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
locations = cells_title()
) %>%
tab_style(
style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
locations = cells_column_labels()
) %>%
tab_options(
table.border.top.color = "#2E4053",
table.border.bottom.color = "#2E4053",
column_labels.border.bottom.color = "#2E4053",
data_row.padding = px(6))| CONCLUSIONES Y ESTADÍSTICOS | ||||||||||
| Resumen de Indicadores de la Clasificación General de los Pozos Petrolíferos en Brasil | ||||||||||
| Variable | Rango [Min; Max] | Media (X̄) | Mediana (Me) | Moda (Mo) | Varianza (S²) | Desv. Est. (S) | C.V. (%) | Asimetría (As) | Curtosis (K) | Valores Atípicos |
|---|---|---|---|---|---|---|---|---|---|---|
| Clasificación General de los Pozos | N/A | N/A | N/A | Desarrollo de Campo | N/A | N/A | N/A | N/A | N/A | N/A |
| Autor: Anahi Macias | ||||||||||
Los resultados muestran que la categoría Desarrollo de Campo concentra la mayor cantidad de pozos petroleros en Brasil. Esto sugiere que la actividad petrolera del país se encuentra principalmente en fases de explotación y desarrollo, mientras que las etapas exploratorias representan una proporción menor.