Distribución Probabilística de Macrogrupos Geológicos en la Cuenca Brasileña

1 Carga de datos

setwd("C:/Users/Usuario/Desktop/TRABAJO DE ESTADISTICA/PDF-EXCEL-QGIS")
Datos <- read.csv("Pozos brasil 2.csv", header = TRUE, sep = ";", dec = ",", fileEncoding = "Latin1")
str(Datos)
## 'data.frame':    29575 obs. of  59 variables:
##  $ POCO                      : chr  "7-RO-123HP-RJS" "1-BP-7-RJS" "7-ARGO-4H-ESS" "7-ARGO-5H-ESS" ...
##  $ CADASTRO                  : num  7.43e+10 7.43e+10 3.43e+10 3.43e+10 3.43e+10 ...
##  $ OPERADOR                  : chr  "Petrobras" "BP Energy" "Shell Brasil" "Shell Brasil" ...
##  $ POCO_OPERADOR             : chr  "7RO123HPRJS" "ANU" "7ARGO4HESS" "7ARGO5HESS" ...
##  $ ESTADO                    : chr  "RJ" "RJ" "ES" "ES" ...
##  $ BACIA                     : chr  "Campos" "Campos" "Campos" "Campos" ...
##  $ BLOCO                     : chr  "" "C-M-473" "" "" ...
##  $ SIG_CAMPO                 : chr  "RO   " "" "ARGO " "ARGO " ...
##  $ CAMPO                     : chr  "RONCADOR" "" "ARGONAUTA" "ARGONAUTA" ...
##  $ TERRA_MAR                 : chr  "M" "M" "M" "M" ...
##  $ POCO_POS_ANP              : chr  "S" "S" "S" "S" ...
##  $ TIPO                      : chr  "Explotatório" "Exploratório" "Explotatório" "Explotatório" ...
##  $ CATEGORIA                 : chr  "Desenvolvimento" "Pioneiro" "Desenvolvimento" "Desenvolvimento" ...
##  $ RECLASSIFICACAO           : chr  "PRODUTOR COMERCIAL DE PETRÓLEO" "PORTADOR DE PETRÓLEO" "ABANDONADO POR OUTRAS RAZÕES" "INDEFINIDO" ...
##  $ SITUACAO                  : chr  "PRODUTOR" "ABANDONADO POR LOGÍSTICA EXPLORATÓRIA" "ABANDONADO DEFINITIVAMENTE" "PRODUTOR" ...
##  $ INICIO                    : chr  "03/03/2012" "14/03/2012" "12/04/2012" "14/04/2012" ...
##  $ TERMINO                   : chr  "10/03/2013" "20/09/2012" "19/09/2012" "02/05/2013" ...
##  $ CONCLUSAO                 : chr  "10/03/2013" "19/10/2012" "28/09/2012" "13/05/2013" ...
##  $ TITULARIDADE              : chr  "Público" "Público" "Público" "Público" ...
##  $ LATITUDE_BASE_4C          : chr  "-21:57:45,630" "-23:06:09,622" "-21:08:06,801" "-21:08:12,535" ...
##  $ LONGITUDE_BASE_4C         : chr  "-39:44:01,130" "-40:00:41,295" "-39:46:53,226" "-39:46:49,296" ...
##  $ LATITUDE_BASE_DD          : num  -22 -23.1 -21.1 -21.1 -21.1 ...
##  $ LONGITUDE_BASE_DD         : num  -39.7 -40 -39.8 -39.8 -39.8 ...
##  $ DATUM_HORIZONTAL          : chr  "SIRGAS2000" "SIRGAS2000" "SIRGAS2000" "SIRGAS2000" ...
##  $ TIPO_DE_COORDENADA_DE_BASE: chr  "Definitiva" "Definitiva" "Definitiva" "Definitiva" ...
##  $ DIRECAO                   : chr  "Horizontal" "Vertical" "Horizontal" "Horizontal" ...
##  $ PROFUNDIDADE_VERTICAL_M   : num  -3145 6900 2937 2934 2953 ...
##  $ PROFUNDIDADE_SONDADOR_M   : num  4050 6925 3809 4575 4570 ...
##  $ PROFUNDIDADE_MEDIDA_M     : num  4050 6925 3809 4575 4570 ...
##  $ REFERENCIA_DE_PROFUNDIDADE: chr  "MR" "MR" "MR" "MR" ...
##  $ MESA_ROTATIVA             : num  24 25 24.2 24.2 24.2 ...
##  $ COTA_ALTIMETRICA_M        : num  0 0 0 0 0 ...
##  $ LAMINA_D_AGUA_M           : num  1827 2730 1706 1705 1654 ...
##  $ DATUM_VERTICAL            : chr  "NM" "NM" "NM" "NM" ...
##  $ UNIDADE_ESTRATIGRAFICA    : chr  "" "" "" "" ...
##  $ GEOLOGIA_GRUPO_FINAL      : chr  "Campos" "Lagoa Feia" "Campos" "Campos" ...
##  $ GEOLOGIA_FORMACAO_FINAL   : chr  "Carapebus" "Macabu" "Ubatuba" "Ubatuba" ...
##  $ GEOLOGIA_MEMBRO_FINAL     : chr  "" "" "" "" ...
##  $ CDPE                      : chr  "Existe" "Existe" "Existe" "" ...
##  $ AGP                       : chr  "" "" "" "" ...
##  $ PC                        : chr  "" "Existe" "" "" ...
##  $ PAG                       : chr  "" "" "" "" ...
##  $ PERFIS_CONVENCIONAIS      : chr  "" "Existe" "" "" ...
##  $ DURANTE_PERFURACAO        : chr  "Existe" "Existe" "Existe" "Existe" ...
##  $ PERFIS_DIGITAIS           : chr  "" "" "" "" ...
##  $ PERFIS_PROCESSADOS        : chr  "" "" "" "" ...
##  $ PERFIS_ESPECIAIS          : chr  "" "" "" "" ...
##  $ AMOSTRA_LATERAL           : chr  "" "Existe" "" "" ...
##  $ SISMICA                   : chr  "" "Existe" "" "" ...
##  $ TABELA_TEMPO_PROFUNDIDADE : chr  "" "" "" "" ...
##  $ DADOS_DIRECIONAIS         : chr  "Existe" "Existe" "Existe" "Existe" ...
##  $ TESTE_A_CABO              : chr  "Existe" "Existe" "" "" ...
##  $ TESTE_DE_FORMACAO         : chr  "" "" "" "" ...
##  $ CANHONEIO                 : chr  "" "" "" "" ...
##  $ TESTEMUNHO                : chr  "" "" "" "" ...
##  $ GEOQUIMICA                : chr  "" "" "" "" ...
##  $ SIG_SONDA                 : chr  "SS-49" "DS4" "NB2" "NB2" ...
##  $ NOM_SONDA                 : chr  "SEDCO 707" "Deep Ocean Clarion" "Bully 2" "Bully 2" ...
##  $ DHA_ATUALIZACAO           : chr  "28/1/18 5:00" "28/1/18 5:00" "28/1/18 5:00" "28/1/18 5:00" ...

2 Tabla de distribución de frecuencia

Geología <- Datos$GEOLOGIA_MEMBRO_FINAL
TDFGeología <- as.data.frame(table(Geología))
names(TDFGeología) <- c("Miembro", "Freq")
TDFGeología
##            Miembro  Freq
## 1                  28958
## 2          Aracaju     1
## 3          Aracajú     1
## 4          Boipeba    11
## 5           Búzios     3
## 6   Canto do Amaro     1
## 7         Capianga    50
## 8       Carmópolis     9
## 9          Caruaçu    27
## 10            Catu    39
## 11         Cazumba    11
## 12       Coqueiros    12
## 13        Estância     1
## 14          Geribá    93
## 15        Germânia     1
## 16            Gomo    50
## 17         Grussaí     9
## 18           Ibura     7
## 19       Ilha Bela    26
## 20         Itaúnas     2
## 21        Maresias     9
## 22          Mucuri    58
## 23     Oiteirinhos     7
## 24         Outeiro    19
## 25          Pedrão     2
## 26         Pitanga    11
## 27 Porto do Mangue     1
## 28        Quissamã    22
## 29          Retiro    14
## 30        Santiago     7
## 31        São Tomé     3
## 32        Sapucari     1
## 33     Sequência 3     6
## 34            Siri     7
## 35         Tamoios    81
## 36         Taquari     2
## 37         Tinharé     2
## 38           Tombo     3
## 39          Trairi     1
## 40         Upanema     7

Se reclasifican los miembros geológicos en macrogrupos ambientales.

library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
TDFGeología$Grupo <- ifelse(
  TDFGeología$Miembro %in% c(
    "Aracaju", "Aracajú", "Carmópolis", "Estância", "Catu", 
    "Pedrão", "Ibura", "Retiro"
  ), "Continental",
  ifelse(
    TDFGeología$Miembro %in% c(
      "Búzios", "Geribá", "Maresias", "Itaúnas", 
      "Tombo", "Grussaí", "Siri", "Santiago"
    ), "Litoral marino",
    ifelse(
      TDFGeología$Miembro %in% c(
        "Ilha Bela", "Tinharé", "Boipeba", 
        "Tamoios", "Outeiro", "Coqueiros"
      ), "Insular–costero",
      ifelse(
        TDFGeología$Miembro %in% c(
          "Mucuri", "Quissamã", "Trairi", 
          "Porto do Mangue", "Upanema", "Oiteirinhos"
        ), "Fluvio–deltaico",
        ifelse(
          TDFGeología$Miembro %in% c(
            "Capianga", "Gomo", "Germânia", "Sapucari",
            "Caruaçu", "Pitanga", "Cazumba", 
            "Taquari", "São Tomé", "Sequência 3"
          ), "Mixto / local", "Otros")))))

head(TDFGeología$Grupo)
## [1] "Otros"           "Continental"     "Continental"     "Insular–costero"
## [5] "Litoral marino"  "Otros"

3 Cálculo de frecuencias por grupo

TDFGeología$Freq <- as.numeric(TDFGeología$Freq)

TDFGeología_ <- TDFGeología %>%
  group_by(Grupo) %>%
  summarise(
    ni = sum(Freq),
    hi = round(ni / sum(TDFGeología$Freq) * 100, 2))

TDFGeología_ <- as.data.frame(TDFGeología_)
TDFGeología_
##             Grupo    ni    hi
## 1     Continental    74  0.25
## 2 Fluvio–deltaico    96  0.32
## 3 Insular–costero   151  0.51
## 4  Litoral marino   133  0.45
## 5   Mixto / local   162  0.55
## 6           Otros 28959 97.92
TDFGeología_ <- TDFGeología_ [, c("Grupo", "ni", "hi")]
total_ni <- sum(TDFGeología_$ni) 
total_hi <- 100
TDFGeología_1 <- rbind(TDFGeología_, data.frame( Grupo = "Total",
                                                          ni = total_ni,
                                                          hi = total_hi))
print(TDFGeología_1)
##             Grupo    ni     hi
## 1     Continental    74   0.25
## 2 Fluvio–deltaico    96   0.32
## 3 Insular–costero   151   0.51
## 4  Litoral marino   133   0.45
## 5   Mixto / local   162   0.55
## 6           Otros 28959  97.92
## 7           Total 29575 100.00
library(gt)
gt(TDFGeología_1) %>%
  tab_header( 
    title = md("**Cuadro No.1**"), 
    subtitle = "Distibución de los mienbros geologícos finales de los pozos petrolíferos en  Brasil") %>% 
 cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
Cuadro No.1
Distibución de los mienbros geologícos finales de los pozos petrolíferos en Brasil
Grupo ni hi
Continental 74 0.25
Fluvio–deltaico 96 0.32
Insular–costero 151 0.51
Litoral marino 133 0.45
Mixto / local 162 0.55
Otros 28959 97.92
Total 29575 100.00

4 Gráficas

4.1 Histograma de frecuencia absoluta local

TDFGeología_2 <- TDFGeología_1[TDFGeología_1$Grupo != "Total", ]
par(mar = c(9, 4, 4, 2))
barplot(TDFGeología_2$ni,
        main = "Gráfica N°1: Distribución en cantidad de pozos según el miembro geológico final",
        ylab = "Cantidad",
        col = "#263238", names.arg = TDFGeología_2$Grupo,
        las = 2, cex.names = 0.8, cex.axis = 0.8, cex.main = 1)
mtext("Grupo", side = 1, line = 7)

4.2 Histograma de frecuencia relativa local

TDFGeología_2 <- TDFGeología_1[TDFGeología_1$Grupo != "Total", ]
par(mar = c(9, 4, 4, 2))
barplot(TDFGeología_2$hi,
        main = "Gráfica N°3: Distribución en porcentaje de pozos según el miembro geológico final",
        ylab = "Porcentaje",
        col = "#263238", names.arg = TDFGeología_2$Grupo,
        las = 2, cex.names = 0.8, cex.axis = 0.8, cex.main = 1)
mtext("Grupo", side = 1, line = 7)

5 Modelo de Probabilidad

P_GEO2 <- TDFGeología_2$ni / sum(TDFGeología_2$ni)

par(mar = c(9, 4, 4, 2))
barplot(P_GEO2,
        main = "Gráfica N°3: Distribución de Probabilidad según el miembro geológico final",
        ylab = "Probabilidad",
        col = "#2E4053", names.arg = TDFGeología_2$Grupo,
        las = 2, cex.names = 1, cex.axis = 0.9, cex.main = 1)
mtext("Grupo", side = 1, line = 8, adj = 0.5, cex = 1.2)

5.1 Probabilidad

¿Cuál es la probalidad de qué el Miembro Geológico Final sea Continental?

x <- round(
  (TDFGeología_2$ni[TDFGeología_2$Grupo == "Continental"] /
   sum(TDFGeología_2$ni)) * 100, 1)

print(paste("La probabilidad es de:", x, "%"))
## [1] "La probabilidad es de: 0.3 %"

¿Cuántos pozos petroleros pueden poseer un Miembro Geológico Final Continental?

p <- x / 100

n <- 1000

cantidad_esperada <- n * p
Operador_objetivo <- "Continental"

cat("Para n =", n, "pozos, la cantidad esperada de Miembro Geológico Final Continental es,", Operador_objetivo, "=", round(cantidad_esperada, 2), "\n")
## Para n = 1000 pozos, la cantidad esperada de Miembro Geológico Final Continental es, Continental = 3