Análisis Estadístico de la Clasificación de Pozos Petroleros en Brasil

1 Introducción

La industria petrolera representa una actividad estratégica para el desarrollo energético de varios países. En este trabajo se analiza la clasificación general de los pozos petroleros en Brasil mediante técnicas de estadística descriptiva. Para ello se utilizan tablas de frecuencia y representaciones gráficas que permiten interpretar la distribución de las distintas categorías de pozos.

2 Carga y exploración de datos

Se carga la base de datos de los pozos petroleros en Brasil y se revisa su estructura para verificar las variables disponibles.

3 Asignación de Clasificaciones Generales

Se selecciona la variable de clasificación de los pozos y se construye una tabla de frecuencias inicial.

Clasificación_G <-Datos$CATEGORIA
TDFClasificación_G <- as.data.frame(table(Clasificación_G))
TDFClasificación_G
##        Clasificación_G  Freq
## 1      Desenvolvimento 18276
## 2             Especial  1965
## 3       Estratigráfico   327
## 4             Extensão  2302
## 5              Injeção  1644
## 6 Jazida Mais Profunda   144
## 7     Jazida Mais Rasa    35
## 8             Pioneiro  4059
## 9   Pioneiro Adjacente   823

3.1 Traducción y estandarización de categorías

Se traducen las categorías originales del portugués al español para facilitar la interpretación del análisis.

library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
TDFClasificación_G$Clasificación_G <- recode(TDFClasificación_G$Clasificación_G,
"Desenvolvimento"      = "Desarrollo",
"Especial"             = "Especial",
"Estratigráfico"       = "Estratigráfico",
"Extensão"             = "Extensión",
"Injeção"              = "Inyección",
"Jazida Mais Profunda" = "Yacimiento más profundo",
"Jazida Mais Rasa"     = "Yacimiento más somero",
"Pioneiro"             = "Pionero",
"Pioneiro Adjacente"   = "Pionero adyacente"
)
head(TDFClasificación_G)
##           Clasificación_G  Freq
## 1              Desarrollo 18276
## 2                Especial  1965
## 3          Estratigráfico   327
## 4               Extensión  2302
## 5               Inyección  1644
## 6 Yacimiento más profundo   144

3.2 Agrupación de categorías

Las clasificaciones se agrupan en categorías más generales para simplificar el análisis estadístico.

TDFClasificación_G$Clasificación <- ifelse(TDFClasificación_G$Clasificación_G %in% c("Desarrollo","Extensión"),
                                             "Desarrollo de Campo",
                                             ifelse(TDFClasificación_G$Clasificación_G %in% c("Pionero","Pionero adyacente"),"Descubrimiento",
                                                    ifelse(TDFClasificación_G$Clasificación_G %in% c("Especial","Inyección"),"Operación",
                                                           ifelse(TDFClasificación_G$Clasificación_G %in% c("Estratigráfico", "Yacimiento más somero", "Yacimiento más profundo"), "Tipo de yacimiento","Otros"))))
head(TDFClasificación_G$Clasificación)
## [1] "Desarrollo de Campo" "Operación"           "Tipo de yacimiento" 
## [4] "Desarrollo de Campo" "Operación"           "Tipo de yacimiento"

4 Cálculo de frecuencias

Se calculan las frecuencias absolutas y relativas de cada categoría agrupada.

TDFClasificación_G$Freq <- as.numeric(as.character(TDFClasificación_G$Freq))
library(dplyr)

TDFClasificación_G1 <- TDFClasificación_G %>%
group_by(Clasificación) %>%
summarise(
  ni = sum(Freq),
  hi = round(sum(Freq) / sum(TDFClasificación_G$Freq)*100, 5))

TDFClasificación_G1 <- data.frame(TDFClasificación_G1)

5 Construcción del cuadro con totales

Se organiza la tabla final de frecuencias incorporando el total de observaciones.

TDFClasificación_G1 <- TDFClasificación_G1 [, c("Clasificación", "ni", "hi")]
total_ni <- sum(TDFClasificación_G1$ni)
total_hi <- sum(TDFClasificación_G1$hi)
TDFClasificación_G1.1 <- rbind(TDFClasificación_G1, data.frame( Clasificación = "Total",
                                                                ni = total_ni,
                                                                hi = total_hi))
print(TDFClasificación_G1.1)
##         Clasificación    ni        hi
## 1 Desarrollo de Campo 20578  69.57904
## 2      Descubrimiento  4882  16.50719
## 3           Operación  3609  12.20287
## 4  Tipo de yacimiento   506   1.71090
## 5               Total 29575 100.00000

6 Presentación tabular con formato

Se presenta la tabla de frecuencias con formato visual utilizando la librería gt.

library(gt)
gt(TDFClasificación_G1.1) %>%
  tab_header( 
    title = md("**DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL**"), 
    subtitle = "Distibución de pozos petroliferos en las regiones de Brasil") %>% 
  fmt_number(
    columns = hi,
    decimals = 2) %>%
 cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL
Distibución de pozos petroliferos en las regiones de Brasil
Clasificación ni hi
Desarrollo de Campo 20578 69.58
Descubrimiento 4882 16.51
Operación 3609 12.20
Tipo de yacimiento 506 1.71
Total 29575 100.00

7 Gráficas

7.1 Histograma de frecuencia absoluta local

Muestra la cantidad de pozos en cada categoría.

TDFClasificación_G2 <- TDFClasificación_G1.1[TDFClasificación_G1.1$Clasificación != "Total", ]

barplot(TDFClasificación_G2$ni,
        main = "Gráfica N°1: Distribución en Cantidad de la Clasificación General de los pozos petroliferos",
        ylab = "Cantidad",
        col = "#2E4053", names.arg = TDFClasificación_G2$Clasificación,
        las = 2, cex.names = 0.7, cex.axis = 0.8, cex.main = 0.9)
mtext("Clasificación General", side = 1, line = 7, adj = 0.4, cex = 1)

7.2 Histograma de frecuencia absoluta global

Permite comparar las cantidades entre categorías en una escala general.

par(mar = c(9, 4, 4, 2))
barplot(TDFClasificación_G2$ni,
        main = "Gráfica N°2: Distribución en Cantidad de la Clasificación General de los pozos petroliferos",
        ylab = "Cantidad",
        col = "#2E4053", names.arg = TDFClasificación_G2$Clasificación,
        las = 2, cex.names = 0.7, cex.axis = 0.8, cex.main = 0.9,
        ylim = c(0,30000)) 
mtext("Clasificación General", side = 1, line = 7, adj = 0.4, cex = 1)

7.3 Histograma de frecuencia relativa local

Representa el porcentaje de cada categoría respecto al total.

par(mar = c(9, 4, 4, 2))
barplot(TDFClasificación_G2$hi,
        main = "Gráfica N°3: Distribución en porcentaje de la Clasificación General de los pozos petrolíferos ",
        ylab = "Porcentaje",
        col = "#2E4053", names.arg = TDFClasificación_G2$Clasificación,
        las = 2, cex.names = 0.7, cex.axis = 0.8, cex.main = 0.9)
mtext("Clasificación General", side = 1, line = 7, adj = 0.4, cex = 1)

7.4 Histograma de frecuencia relativa global

Muestra la distribución porcentual considerando el rango completo de 0 a 100%.

par(mar = c(9, 4, 4, 2))
barplot(TDFClasificación_G2$hi,
        main = "Gráfica N°4: Distribución en porcentaje de la Clasificación General de los pozos petrolíferos",
        ylab = "Porcentaje",
        col = "#2E4053", names.arg = TDFClasificación_G2$Clasificación,
        las = 2, cex.names = 0.7, cex.axis = 0.8, cex.main = 0.9, 
         ylim = c(0,100))
mtext("Clasificación General", side = 1, line = 7, adj = 0.4, cex = 1)

7.5 Diagrama Circular

Presenta la participación porcentual de cada categoría dentro del total de pozos.

par(mar = c(9, 4, 4, 2))
pie(TDFClasificación_G2$hi, 
    main = "Gráfica N°5: Distribución porcentual de la Clasificación General de los pozos petrolíferos", 
    radius = 0.9,
    labels = paste0(round(TDFClasificación_G2$hi,2)),
    col = c("#6C8A9B", "#E6E6E4", "#F9F5EF", "#FD6574"),
    cex = 1, cex.main = 0.9,
    init.angle = 90)

legend(x = -2.6099, y =1.06,
       legend = TDFClasificación_G2$Clasificación,
       fill = c("#6C8A9B", "#E6E6E4", "#F9F5EF", "#FD6574"),
       cex = 0.9,
       title = "Clasificación General")

8 Resumen Estadístico

Conclusiones <- data.frame(
Variable = "Clasificación General de los Pozos",
`Rango [Min; Max]` = "N/A",
`Media (X̄)` = "N/A",
`Mediana (Me)` = "N/A",
`Moda (Mo)` = "Desarrollo de Campo",
`Varianza (S²)` = "N/A",
`Desv. Est. (S)` = "N/A",
`C.V. (%)` = "N/A",
`Asimetría (As)` = "N/A",
`Curtosis (K)` = "N/A",
`Valores Atípicos` = "N/A",
check.names = FALSE
)
library(gt)

gt(Conclusiones) %>%
tab_header(
title = md("**CONCLUSIONES Y ESTADÍSTICOS**"),
subtitle = "Resumen de Indicadores de la Clasificación General de los Pozos Petrolíferos en Brasil") %>%
tab_source_note(source_note = "Autor: Anahi Macias") %>%
  cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
CONCLUSIONES Y ESTADÍSTICOS
Resumen de Indicadores de la Clasificación General de los Pozos Petrolíferos en Brasil
Variable Rango [Min; Max] Media (X̄) Mediana (Me) Moda (Mo) Varianza (S²) Desv. Est. (S) C.V. (%) Asimetría (As) Curtosis (K) Valores Atípicos
Clasificación General de los Pozos N/A N/A N/A Desarrollo de Campo N/A N/A N/A N/A N/A N/A
Autor: Anahi Macias

8.1 Conclusiones

8.1.1 Análisis Descriptivo

Los resultados muestran que la categoría Desarrollo de Campo concentra la mayor cantidad de pozos petroleros en Brasil. Esto sugiere que la actividad petrolera del país se encuentra principalmente en fases de explotación y desarrollo, mientras que las etapas exploratorias representan una proporción menor.