Titularidad de los pozos petroleros

1 Carga del entorno de trabajo y datos

Se establece el directorio de trabajo y se importan los datos de los pozos petroleros desde un archivo CSV para su análisis.

setwd("C:/Users/luna2/OneDrive/Datos Brasil")
Datos <- read.csv("Pozos Brasil 2.csv", header = TRUE, sep = ";", dec = ".", fileEncoding = "Latin1")
str(Datos)
## 'data.frame':    29575 obs. of  59 variables:
##  $ POCO                      : chr  "7-RO-123HP-RJS" "1-BP-7-RJS" "7-ARGO-4H-ESS" "7-ARGO-5H-ESS" ...
##  $ CADASTRO                  : num  7.43e+10 7.43e+10 3.43e+10 3.43e+10 3.43e+10 ...
##  $ OPERADOR                  : chr  "Petrobras" "BP Energy" "Shell Brasil" "Shell Brasil" ...
##  $ POCO_OPERADOR             : chr  "7RO123HPRJS" "ANU" "7ARGO4HESS" "7ARGO5HESS" ...
##  $ ESTADO                    : chr  "RJ" "RJ" "ES" "ES" ...
##  $ BACIA                     : chr  "Campos" "Campos" "Campos" "Campos" ...
##  $ BLOCO                     : chr  "" "C-M-473" "" "" ...
##  $ SIG_CAMPO                 : chr  "RO   " "" "ARGO " "ARGO " ...
##  $ CAMPO                     : chr  "RONCADOR" "" "ARGONAUTA" "ARGONAUTA" ...
##  $ TERRA_MAR                 : chr  "M" "M" "M" "M" ...
##  $ POCO_POS_ANP              : chr  "S" "S" "S" "S" ...
##  $ TIPO                      : chr  "Explotatório" "Exploratório" "Explotatório" "Explotatório" ...
##  $ CATEGORIA                 : chr  "Desenvolvimento" "Pioneiro" "Desenvolvimento" "Desenvolvimento" ...
##  $ RECLASSIFICACAO           : chr  "PRODUTOR COMERCIAL DE PETRÓLEO" "PORTADOR DE PETRÓLEO" "ABANDONADO POR OUTRAS RAZÕES" "INDEFINIDO" ...
##  $ SITUACAO                  : chr  "PRODUTOR" "ABANDONADO POR LOGÍSTICA EXPLORATÓRIA" "ABANDONADO DEFINITIVAMENTE" "PRODUTOR" ...
##  $ INICIO                    : chr  "03/03/2012" "14/03/2012" "12/04/2012" "14/04/2012" ...
##  $ TERMINO                   : chr  "10/03/2013" "20/09/2012" "19/09/2012" "02/05/2013" ...
##  $ CONCLUSAO                 : chr  "10/03/2013" "19/10/2012" "28/09/2012" "13/05/2013" ...
##  $ TITULARIDADE              : chr  "Público" "Público" "Público" "Público" ...
##  $ LATITUDE_BASE_4C          : chr  "-21:57:45,630" "-23:06:09,622" "-21:08:06,801" "-21:08:12,535" ...
##  $ LONGITUDE_BASE_4C         : chr  "-39:44:01,130" "-40:00:41,295" "-39:46:53,226" "-39:46:49,296" ...
##  $ LATITUDE_BASE_DD          : chr  "-21,962675" "-23,1026727777" "-21,1352225" "-21,1368152777" ...
##  $ LONGITUDE_BASE_DD         : chr  "-39,7336472222" "-40,0114708333" "-39,7814516666" "-39,78036" ...
##  $ DATUM_HORIZONTAL          : chr  "SIRGAS2000" "SIRGAS2000" "SIRGAS2000" "SIRGAS2000" ...
##  $ TIPO_DE_COORDENADA_DE_BASE: chr  "Definitiva" "Definitiva" "Definitiva" "Definitiva" ...
##  $ DIRECAO                   : chr  "Horizontal" "Vertical" "Horizontal" "Horizontal" ...
##  $ PROFUNDIDADE_VERTICAL_M   : chr  "-3145,4" "6900" "2936,99" "2934,18" ...
##  $ PROFUNDIDADE_SONDADOR_M   : chr  "4050" "6925" "3809" "4575" ...
##  $ PROFUNDIDADE_MEDIDA_M     : chr  "4050" "6925" "3809" "4575" ...
##  $ REFERENCIA_DE_PROFUNDIDADE: chr  "MR" "MR" "MR" "MR" ...
##  $ MESA_ROTATIVA             : chr  "24" "25" "24,24" "24,24" ...
##  $ COTA_ALTIMETRICA_M        : chr  "0" "0" "0" "0" ...
##  $ LAMINA_D_AGUA_M           : chr  "1827" "2730" "1705,84" "1705,35" ...
##  $ DATUM_VERTICAL            : chr  "NM" "NM" "NM" "NM" ...
##  $ UNIDADE_ESTRATIGRAFICA    : chr  "" "" "" "" ...
##  $ GEOLOGIA_GRUPO_FINAL      : chr  "Campos" "Lagoa Feia" "Campos" "Campos" ...
##  $ GEOLOGIA_FORMACAO_FINAL   : chr  "Carapebus" "Macabu" "Ubatuba" "Ubatuba" ...
##  $ GEOLOGIA_MEMBRO_FINAL     : chr  "" "" "" "" ...
##  $ CDPE                      : chr  "Existe" "Existe" "Existe" "" ...
##  $ AGP                       : chr  "" "" "" "" ...
##  $ PC                        : chr  "" "Existe" "" "" ...
##  $ PAG                       : chr  "" "" "" "" ...
##  $ PERFIS_CONVENCIONAIS      : chr  "" "Existe" "" "" ...
##  $ DURANTE_PERFURACAO        : chr  "Existe" "Existe" "Existe" "Existe" ...
##  $ PERFIS_DIGITAIS           : chr  "" "" "" "" ...
##  $ PERFIS_PROCESSADOS        : chr  "" "" "" "" ...
##  $ PERFIS_ESPECIAIS          : chr  "" "" "" "" ...
##  $ AMOSTRA_LATERAL           : chr  "" "Existe" "" "" ...
##  $ SISMICA                   : chr  "" "Existe" "" "" ...
##  $ TABELA_TEMPO_PROFUNDIDADE : chr  "" "" "" "" ...
##  $ DADOS_DIRECIONAIS         : chr  "Existe" "Existe" "Existe" "Existe" ...
##  $ TESTE_A_CABO              : chr  "Existe" "Existe" "" "" ...
##  $ TESTE_DE_FORMACAO         : chr  "" "" "" "" ...
##  $ CANHONEIO                 : chr  "" "" "" "" ...
##  $ TESTEMUNHO                : chr  "" "" "" "" ...
##  $ GEOQUIMICA                : chr  "" "" "" "" ...
##  $ SIG_SONDA                 : chr  "SS-49" "DS4" "NB2" "NB2" ...
##  $ NOM_SONDA                 : chr  "SEDCO 707" "Deep Ocean Clarion" "Bully 2" "Bully 2" ...
##  $ DHA_ATUALIZACAO           : chr  "28/1/18 5:00" "28/1/18 5:00" "28/1/18 5:00" "28/1/18 5:00" ...

2 Tabla de distribución de frecuencia

Se construye una tabla de frecuencia de la variable TITULARIDADE para identificar sus categorías.

Titularidad <- Datos$TITULARIDADE
TDFTitularidad <- as.data.frame(table(Titularidad))
TDFTitularidad
##    Titularidad  Freq
## 1 Confidencial   705
## 2      Público 28870

3 Cálculo de frecuencias absoluta y relativa

Se calculan la distribución en cantidad (ni) y la distribución porcentual (hi) según la titularidad de los pozos.

TDFTitularidad$Freq <- as.numeric(as.character(TDFTitularidad$Freq))
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
TDFTitularidad1 <- Datos$TDFTitularidad
TDFTitularidad1  <- TDFTitularidad %>%
  group_by(Titularidad) %>%
  
  summarise( 
    ni = sum(Freq),
    hi = round(sum(Freq) / sum(TDFTitularidad$Freq)*100, 2))

TDFTitularidad1 <- data.frame(TDFTitularidad1)

4 Incorporación de totales

Se añaden los totales generales de frecuencia absoluta y relativa.

TDFTitularidad1 <- TDFTitularidad1 [, c("Titularidad", "ni", "hi")]
total_ni <- sum(TDFTitularidad1$ni) 
total_hi <- 100
TDFTitularidadcompleta <- rbind(TDFTitularidad1, data.frame( Titularidad = "Total",
                                                          ni = total_ni,
                                                          hi = total_hi))
print(TDFTitularidadcompleta )
##    Titularidad    ni     hi
## 1 Confidencial   705   2.38
## 2      Público 28870  97.62
## 3        Total 29575 100.00

5 Presentación tabular de resultados

Se presenta la tabla de distribución con formato adecuado para su interpretación.

library(gt)
gt(TDFTitularidadcompleta ) %>%
  tab_header( 
    title = md("**Cuadro No.1**"), 
    subtitle = "Distribución de la titularidad de los pozos petroleros") %>% 
 cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
Cuadro No.1
Distribución de la titularidad de los pozos petroleros
Titularidad ni hi
Confidencial 705 2.38
Público 28870 97.62
Total 29575 100.00

6 Gráficas

6.1 Histograma de frecuencia absoluta local (ni)

Se representa la distribución en cantidad según titularidad, sin considerar el total.

TDFTitularidadcompleta_ <- TDFTitularidadcompleta[TDFTitularidadcompleta$Titularidad!= "Total", ]

barplot(TDFTitularidadcompleta_$ni,
        main = "Gráfica N°1: Distribución en cantidad según titularidad",
        xlab = "Titularidad", ylab = "Cantidad",
        col = "darkseagreen1", names.arg = TDFTitularidadcompleta_$Titularidad,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)

6.2 Histograma de frecuencia absoluta global (ni)

Se muestra la distribución en cantidad según titularidad en una escala ampliada.

barplot(TDFTitularidadcompleta_$ni,
        main = "Gráfica N°2: Distribución en cantidad según titularidad",
        xlab = "Titularidad", ylab = "Cantidad",
        col = "darkseagreen1", names.arg = TDFTitularidadcompleta_$Titularidad,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1,
        ylim = c(0,30000))

6.3 Histograma de frecuencia relativa local (hi)

Se visualiza la distribución porcentual según titularidad, sin considerar el total.

barplot(TDFTitularidadcompleta_$hi,
        main = "Gráfica N°3: Distribución porcentual según titularidad",
        xlab = "Titularidad", ylab = "Porcentaje",
        col = "darkseagreen1", names.arg = TDFTitularidadcompleta_$Titularidad,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)

6.4 Histograma de frecuencia relativa global (hi)

Se representa la distribución porcentual según titularidad en una escala de 0 a 100 %.

barplot(TDFTitularidadcompleta_$hi,
        main = "Gráfica N°4: Distribución porcentual según titularidad",
        xlab = "Titularidad", ylab = "Porcentaje",
        col = "darkseagreen1", names.arg = TDFTitularidadcompleta_$Titularidad,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1,
        ylim = c(0,100))

6.5 Diagrama circular

Se ilustra la distribución porcentual de los pozos según su titularidad.

pie(TDFTitularidadcompleta_$hi, 
    main = "Gráfica N°5: Distribución porcentual según titularidad", 
    radius = 0.9,
    labels = paste0(round(TDFTitularidadcompleta_$hi,2)),
    col = c("#F7FCB9", "#D9F0A3"),
    cex = 1, cex.main = 1,
    init.angle = 90)

legend(x = -1.95, y =1,
       legend = TDFTitularidadcompleta_$Titularidad,
       fill = c("#F7FCB9", "#D9F0A3"),
       cex = 1,
       title = "Titularidad")