Tipos de pozos petroleros

1 Cargar datos

Se define el directorio de trabajo y se importan los datos de los pozos petroleros desde un archivo CSV.

setwd("C:/Users/Usuario/Desktop/TRABAJO DE ESTADISTICA/PDF-EXCEL-QGIS")
Datos <- read.csv("Pozos Brasil 2.csv", header = TRUE, sep = ";", dec = ".", fileEncoding = "Latin1")
str(Datos)
## 'data.frame':    29575 obs. of  59 variables:
##  $ POCO                      : chr  "7-RO-123HP-RJS" "1-BP-7-RJS" "7-ARGO-4H-ESS" "7-ARGO-5H-ESS" ...
##  $ CADASTRO                  : num  7.43e+10 7.43e+10 3.43e+10 3.43e+10 3.43e+10 ...
##  $ OPERADOR                  : chr  "Petrobras" "BP Energy" "Shell Brasil" "Shell Brasil" ...
##  $ POCO_OPERADOR             : chr  "7RO123HPRJS" "ANU" "7ARGO4HESS" "7ARGO5HESS" ...
##  $ ESTADO                    : chr  "RJ" "RJ" "ES" "ES" ...
##  $ BACIA                     : chr  "Campos" "Campos" "Campos" "Campos" ...
##  $ BLOCO                     : chr  "" "C-M-473" "" "" ...
##  $ SIG_CAMPO                 : chr  "RO   " "" "ARGO " "ARGO " ...
##  $ CAMPO                     : chr  "RONCADOR" "" "ARGONAUTA" "ARGONAUTA" ...
##  $ TERRA_MAR                 : chr  "M" "M" "M" "M" ...
##  $ POCO_POS_ANP              : chr  "S" "S" "S" "S" ...
##  $ TIPO                      : chr  "Explotatório" "Exploratório" "Explotatório" "Explotatório" ...
##  $ CATEGORIA                 : chr  "Desenvolvimento" "Pioneiro" "Desenvolvimento" "Desenvolvimento" ...
##  $ RECLASSIFICACAO           : chr  "PRODUTOR COMERCIAL DE PETRÓLEO" "PORTADOR DE PETRÓLEO" "ABANDONADO POR OUTRAS RAZÕES" "INDEFINIDO" ...
##  $ SITUACAO                  : chr  "PRODUTOR" "ABANDONADO POR LOGÍSTICA EXPLORATÓRIA" "ABANDONADO DEFINITIVAMENTE" "PRODUTOR" ...
##  $ INICIO                    : chr  "03/03/2012" "14/03/2012" "12/04/2012" "14/04/2012" ...
##  $ TERMINO                   : chr  "10/03/2013" "20/09/2012" "19/09/2012" "02/05/2013" ...
##  $ CONCLUSAO                 : chr  "10/03/2013" "19/10/2012" "28/09/2012" "13/05/2013" ...
##  $ TITULARIDADE              : chr  "Público" "Público" "Público" "Público" ...
##  $ LATITUDE_BASE_4C          : chr  "-21:57:45,630" "-23:06:09,622" "-21:08:06,801" "-21:08:12,535" ...
##  $ LONGITUDE_BASE_4C         : chr  "-39:44:01,130" "-40:00:41,295" "-39:46:53,226" "-39:46:49,296" ...
##  $ LATITUDE_BASE_DD          : chr  "-21,962675" "-23,1026727777" "-21,1352225" "-21,1368152777" ...
##  $ LONGITUDE_BASE_DD         : chr  "-39,7336472222" "-40,0114708333" "-39,7814516666" "-39,78036" ...
##  $ DATUM_HORIZONTAL          : chr  "SIRGAS2000" "SIRGAS2000" "SIRGAS2000" "SIRGAS2000" ...
##  $ TIPO_DE_COORDENADA_DE_BASE: chr  "Definitiva" "Definitiva" "Definitiva" "Definitiva" ...
##  $ DIRECAO                   : chr  "Horizontal" "Vertical" "Horizontal" "Horizontal" ...
##  $ PROFUNDIDADE_VERTICAL_M   : chr  "-3145,4" "6900" "2936,99" "2934,18" ...
##  $ PROFUNDIDADE_SONDADOR_M   : chr  "4050" "6925" "3809" "4575" ...
##  $ PROFUNDIDADE_MEDIDA_M     : chr  "4050" "6925" "3809" "4575" ...
##  $ REFERENCIA_DE_PROFUNDIDADE: chr  "MR" "MR" "MR" "MR" ...
##  $ MESA_ROTATIVA             : chr  "24" "25" "24,24" "24,24" ...
##  $ COTA_ALTIMETRICA_M        : chr  "0" "0" "0" "0" ...
##  $ LAMINA_D_AGUA_M           : chr  "1827" "2730" "1705,84" "1705,35" ...
##  $ DATUM_VERTICAL            : chr  "NM" "NM" "NM" "NM" ...
##  $ UNIDADE_ESTRATIGRAFICA    : chr  "" "" "" "" ...
##  $ GEOLOGIA_GRUPO_FINAL      : chr  "Campos" "Lagoa Feia" "Campos" "Campos" ...
##  $ GEOLOGIA_FORMACAO_FINAL   : chr  "Carapebus" "Macabu" "Ubatuba" "Ubatuba" ...
##  $ GEOLOGIA_MEMBRO_FINAL     : chr  "" "" "" "" ...
##  $ CDPE                      : chr  "Existe" "Existe" "Existe" "" ...
##  $ AGP                       : chr  "" "" "" "" ...
##  $ PC                        : chr  "" "Existe" "" "" ...
##  $ PAG                       : chr  "" "" "" "" ...
##  $ PERFIS_CONVENCIONAIS      : chr  "" "Existe" "" "" ...
##  $ DURANTE_PERFURACAO        : chr  "Existe" "Existe" "Existe" "Existe" ...
##  $ PERFIS_DIGITAIS           : chr  "" "" "" "" ...
##  $ PERFIS_PROCESSADOS        : chr  "" "" "" "" ...
##  $ PERFIS_ESPECIAIS          : chr  "" "" "" "" ...
##  $ AMOSTRA_LATERAL           : chr  "" "Existe" "" "" ...
##  $ SISMICA                   : chr  "" "Existe" "" "" ...
##  $ TABELA_TEMPO_PROFUNDIDADE : chr  "" "" "" "" ...
##  $ DADOS_DIRECIONAIS         : chr  "Existe" "Existe" "Existe" "Existe" ...
##  $ TESTE_A_CABO              : chr  "Existe" "Existe" "" "" ...
##  $ TESTE_DE_FORMACAO         : chr  "" "" "" "" ...
##  $ CANHONEIO                 : chr  "" "" "" "" ...
##  $ TESTEMUNHO                : chr  "" "" "" "" ...
##  $ GEOQUIMICA                : chr  "" "" "" "" ...
##  $ SIG_SONDA                 : chr  "SS-49" "DS4" "NB2" "NB2" ...
##  $ NOM_SONDA                 : chr  "SEDCO 707" "Deep Ocean Clarion" "Bully 2" "Bully 2" ...
##  $ DHA_ATUALIZACAO           : chr  "28/1/18 5:00" "28/1/18 5:00" "28/1/18 5:00" "28/1/18 5:00" ...

2 Tabla de distribución de frecuencia del tipo de pozo

Se construye la tabla de frecuencia de la variable Tipo de Pozo.

Tipo <- Datos$TIPO
TDFTipo_de_Pozo <- as.data.frame(table(Tipo))
TDFTipo_de_Pozo
##           Tipo  Freq
## 1 Exploratório  8334
## 2 Explotatório 21241

3 Cálculo de frecuencias absoluta y relativa

Se calculan la distribución en cantidad (ni) y la distribución porcentual (hi) según el tipo de pozo.

TDFTipo_de_Pozo$Freq <- as.numeric(as.character(TDFTipo_de_Pozo$Freq))
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
TDFTipo_de_Pozo1 <- Datos$TDFTipo_de_Pozo
TDFTipo_de_Pozo1  <- TDFTipo_de_Pozo %>%
  group_by(Tipo) %>%
  
  summarise( 
    ni = sum(Freq),
    hi = round(sum(Freq) / sum(TDFTipo_de_Pozo$Freq)*100, 2))

TDFTipo_de_Pozo1 <- data.frame(TDFTipo_de_Pozo1)

4 Incorporación de totales

Se añaden los totales generales de frecuencia absoluta y relativa a la tabla.

TDFTipo_de_Pozo1 <- TDFTipo_de_Pozo1 [, c("Tipo", "ni", "hi")]
total_ni <- sum(TDFTipo_de_Pozo1$ni) 
total_hi <- sum(TDFTipo_de_Pozo1$hi)
TDFTipo_de_Pozo_Completa <- rbind(TDFTipo_de_Pozo1, data.frame( Tipo = "Total",
                                                             ni = total_ni,
                                                             hi = total_hi))
print(TDFTipo_de_Pozo_Completa)
##           Tipo    ni     hi
## 1 Exploratório  8334  28.18
## 2 Explotatório 21241  71.82
## 3        Total 29575 100.00

5 Presentación tabular de resultados

Se presenta la tabla de distribución con formato adecuado para su interpretación.

library(gt)
gt(TDFTipo_de_Pozo_Completa) %>%
  tab_header( 
    title = md("**DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL**"), 
    subtitle = "Clasificación de los Pozos Según su Tipo") %>% 
 cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL
Clasificación de los Pozos Según su Tipo
Tipo ni hi
Exploratório 8334 28.18
Explotatório 21241 71.82
Total 29575 100.00

6 Gráficas

6.1 Histograma de frecuencia absoluta local

Se representa la distribución en cantidad según tipo de pozo, excluyendo el total general.

TDFTipo_de_Pozo_Completa_ <- TDFTipo_de_Pozo_Completa[TDFTipo_de_Pozo_Completa$Tipo!= "Total", ]

barplot(TDFTipo_de_Pozo_Completa_$ni,
        main = "Gráfica N°1: Distribución en cantidad según tipo de pozo",
        xlab = "Tipo de Pozo", ylab = "Cantidad",
        col = "#B0B8C1", names.arg = TDFTipo_de_Pozo_Completa_$Tipo,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)

6.2 Histograma de frecuencia absoluta global

Se muestra la distribución en cantidad según tipo de pozo considerando una escala global.

barplot(TDFTipo_de_Pozo_Completa_$ni,
        main = "Gráfica N°2: Distribución en cantidad según tipo de pozo",
        xlab = "Tipo de Pozo", ylab = "Cantidad",
        col = "#B0B8C1", names.arg = TDFTipo_de_Pozo_Completa_$Tipo,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1,
        ylim = c(0,30000))

6.3 Histograma de frecuencia relativa local

Se visualiza la distribución porcentual según tipo de pozo, excluyendo el total.

barplot(TDFTipo_de_Pozo_Completa_$hi,
        main = "Gráfica N°3: Distribución porcentual según tipo de pozo",
        xlab = "Tipo de Pozo", ylab = "Cantidad",
        col = "#B0B8C1", names.arg = TDFTipo_de_Pozo_Completa_$Tipo,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)

6.4 Histograma de frecuencia relativa global

Se representa la distribución porcentual según tipo de pozo en una escala de 0 a 100 %.

barplot(TDFTipo_de_Pozo_Completa_$hi,
        main = "Gráfica N°4: Distribución porcentual según tipo de pozo",
        xlab = "Tipo de Pozo", ylab = "Cantidad",
        col = "#B0B8C1", names.arg = TDFTipo_de_Pozo_Completa_$Tipo,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1,
        ylim = c(0,100))

6.5 Diagrama circular

Se ilustra la distribución porcentual de los pozos según su tipo mediante un diagrama circular.

pie(TDFTipo_de_Pozo_Completa_$hi, 
    main = "Gráfica N°5: Distribución porcentual según su tipo de pozo", 
    radius = 0.9,
    labels = paste0(round(TDFTipo_de_Pozo_Completa_$hi,2)),
    col = c("#D9E0E6", "#4C6BA7"),
    cex = 1, cex.main = 1,
    init.angle = 0)

legend(x = -1.95, y =1,
       legend = TDFTipo_de_Pozo_Completa_$Tipo,
       fill = c("#D9E0E6", "#4C6BA7"),
       cex = 1,
       title = "Tipo de Pozo")

7 Resumen Estadístico

El presente resumen sintetiza los indicadores descriptivos de la distribución de las cuencas petrolíferas por regiones de Brasil. Dado que la variable es cualitativa nominal, la única medida de tendencia central aplicable es la moda.

Conclusiones <- data.frame(
Variable = "Tipos de pozos",
`Rango [Min; Max]` = "N/A",
`Media (X̄)` = "N/A",
`Mediana (Me)` = "N/A",
`Moda (Mo)` = "Explotatorio",
`Varianza (S²)` = "N/A",
`Desv. Est. (S)` = "N/A",
`C.V. (%)` = "N/A",
`Asimetría (As)` = "N/A",
`Curtosis (K)` = "N/A",
`Valores Atípicos` = "N/A",
check.names = FALSE
)
library(gt)

gt(Conclusiones) %>%
tab_header(
title = md("**CONCLUSIONES Y ESTADÍSTICOS**"),
subtitle = "Resumen de Indicadores de los Tipos de Pozos Petrolíferos en Brasil") %>%
tab_source_note(source_note = "Autor: Anahi Macias") %>%
  cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
CONCLUSIONES Y ESTADÍSTICOS
Resumen de Indicadores de los Tipos de Pozos Petrolíferos en Brasil
Variable Rango [Min; Max] Media (X̄) Mediana (Me) Moda (Mo) Varianza (S²) Desv. Est. (S) C.V. (%) Asimetría (As) Curtosis (K) Valores Atípicos
Tipos de pozos N/A N/A N/A Explotatorio N/A N/A N/A N/A N/A N/A
Autor: Anahi Macias

7.1 Conclusiones

7.1.1 Análisis Descriptivo

La moda corresponde a los pozos de tipo Explotatorio, lo que indica que este tipo predomina en la estructura petrolera analizada, reflejando el énfasis operativo en la fase de extracción de hidrocarburos.