Análisis Probabilístico de la Composición Geológica Final en la Cuenca Brasileña
Prepara las herramientas de trabajo y abre el archivo con la información de los pozos petroleros de Brasil.
setwd("C:/Users/Usuario/Desktop/TRABAJO DE ESTADISTICA/PDF-EXCEL-QGIS")
Datos <- read.csv("Pozos brasil 2.csv", header = TRUE, sep = ";", dec = ",", fileEncoding = "Latin1")
str(Datos)
## 'data.frame': 29575 obs. of 59 variables:
## $ POCO : chr "7-RO-123HP-RJS" "1-BP-7-RJS" "7-ARGO-4H-ESS" "7-ARGO-5H-ESS" ...
## $ CADASTRO : num 7.43e+10 7.43e+10 3.43e+10 3.43e+10 3.43e+10 ...
## $ OPERADOR : chr "Petrobras" "BP Energy" "Shell Brasil" "Shell Brasil" ...
## $ POCO_OPERADOR : chr "7RO123HPRJS" "ANU" "7ARGO4HESS" "7ARGO5HESS" ...
## $ ESTADO : chr "RJ" "RJ" "ES" "ES" ...
## $ BACIA : chr "Campos" "Campos" "Campos" "Campos" ...
## $ BLOCO : chr "" "C-M-473" "" "" ...
## $ SIG_CAMPO : chr "RO " "" "ARGO " "ARGO " ...
## $ CAMPO : chr "RONCADOR" "" "ARGONAUTA" "ARGONAUTA" ...
## $ TERRA_MAR : chr "M" "M" "M" "M" ...
## $ POCO_POS_ANP : chr "S" "S" "S" "S" ...
## $ TIPO : chr "Explotatório" "Exploratório" "Explotatório" "Explotatório" ...
## $ CATEGORIA : chr "Desenvolvimento" "Pioneiro" "Desenvolvimento" "Desenvolvimento" ...
## $ RECLASSIFICACAO : chr "PRODUTOR COMERCIAL DE PETRÓLEO" "PORTADOR DE PETRÓLEO" "ABANDONADO POR OUTRAS RAZÕES" "INDEFINIDO" ...
## $ SITUACAO : chr "PRODUTOR" "ABANDONADO POR LOGÍSTICA EXPLORATÓRIA" "ABANDONADO DEFINITIVAMENTE" "PRODUTOR" ...
## $ INICIO : chr "03/03/2012" "14/03/2012" "12/04/2012" "14/04/2012" ...
## $ TERMINO : chr "10/03/2013" "20/09/2012" "19/09/2012" "02/05/2013" ...
## $ CONCLUSAO : chr "10/03/2013" "19/10/2012" "28/09/2012" "13/05/2013" ...
## $ TITULARIDADE : chr "Público" "Público" "Público" "Público" ...
## $ LATITUDE_BASE_4C : chr "-21:57:45,630" "-23:06:09,622" "-21:08:06,801" "-21:08:12,535" ...
## $ LONGITUDE_BASE_4C : chr "-39:44:01,130" "-40:00:41,295" "-39:46:53,226" "-39:46:49,296" ...
## $ LATITUDE_BASE_DD : num -22 -23.1 -21.1 -21.1 -21.1 ...
## $ LONGITUDE_BASE_DD : num -39.7 -40 -39.8 -39.8 -39.8 ...
## $ DATUM_HORIZONTAL : chr "SIRGAS2000" "SIRGAS2000" "SIRGAS2000" "SIRGAS2000" ...
## $ TIPO_DE_COORDENADA_DE_BASE: chr "Definitiva" "Definitiva" "Definitiva" "Definitiva" ...
## $ DIRECAO : chr "Horizontal" "Vertical" "Horizontal" "Horizontal" ...
## $ PROFUNDIDADE_VERTICAL_M : num -3145 6900 2937 2934 2953 ...
## $ PROFUNDIDADE_SONDADOR_M : num 4050 6925 3809 4575 4570 ...
## $ PROFUNDIDADE_MEDIDA_M : num 4050 6925 3809 4575 4570 ...
## $ REFERENCIA_DE_PROFUNDIDADE: chr "MR" "MR" "MR" "MR" ...
## $ MESA_ROTATIVA : num 24 25 24.2 24.2 24.2 ...
## $ COTA_ALTIMETRICA_M : num 0 0 0 0 0 ...
## $ LAMINA_D_AGUA_M : num 1827 2730 1706 1705 1654 ...
## $ DATUM_VERTICAL : chr "NM" "NM" "NM" "NM" ...
## $ UNIDADE_ESTRATIGRAFICA : chr "" "" "" "" ...
## $ GEOLOGIA_GRUPO_FINAL : chr "Campos" "Lagoa Feia" "Campos" "Campos" ...
## $ GEOLOGIA_FORMACAO_FINAL : chr "Carapebus" "Macabu" "Ubatuba" "Ubatuba" ...
## $ GEOLOGIA_MEMBRO_FINAL : chr "" "" "" "" ...
## $ CDPE : chr "Existe" "Existe" "Existe" "" ...
## $ AGP : chr "" "" "" "" ...
## $ PC : chr "" "Existe" "" "" ...
## $ PAG : chr "" "" "" "" ...
## $ PERFIS_CONVENCIONAIS : chr "" "Existe" "" "" ...
## $ DURANTE_PERFURACAO : chr "Existe" "Existe" "Existe" "Existe" ...
## $ PERFIS_DIGITAIS : chr "" "" "" "" ...
## $ PERFIS_PROCESSADOS : chr "" "" "" "" ...
## $ PERFIS_ESPECIAIS : chr "" "" "" "" ...
## $ AMOSTRA_LATERAL : chr "" "Existe" "" "" ...
## $ SISMICA : chr "" "Existe" "" "" ...
## $ TABELA_TEMPO_PROFUNDIDADE : chr "" "" "" "" ...
## $ DADOS_DIRECIONAIS : chr "Existe" "Existe" "Existe" "Existe" ...
## $ TESTE_A_CABO : chr "Existe" "Existe" "" "" ...
## $ TESTE_DE_FORMACAO : chr "" "" "" "" ...
## $ CANHONEIO : chr "" "" "" "" ...
## $ TESTEMUNHO : chr "" "" "" "" ...
## $ GEOQUIMICA : chr "" "" "" "" ...
## $ SIG_SONDA : chr "SS-49" "DS4" "NB2" "NB2" ...
## $ NOM_SONDA : chr "SEDCO 707" "Deep Ocean Clarion" "Bully 2" "Bully 2" ...
## $ DHA_ATUALIZACAO : chr "28/1/18 5:00" "28/1/18 5:00" "28/1/18 5:00" "28/1/18 5:00" ...
Conteo general para ver cuántas formaciones distintas existen antes de organizarlas.
GEOFF <- Datos$GEOLOGIA_FORMACAO_FINAL
TDFGEOFF <- as.data.frame(table(GEOFF))
TDFGEOFF
## GEOFF Freq
## 1 24630
## 2 Abrolhos 1
## 3 Açu 1133
## 4 Afligidos 17
## 5 Água Grande 9
## 6 Alagamar 28
## 7 Algodões 1
## 8 Aliança 71
## 9 Alto Garças 1
## 10 Aracaré 3
## 11 Ariri 26
## 12 Atafona 13
## 13 Bananeiras 19
## 14 Barra de Itiuba 90
## 15 Barra Velha 82
## 16 Barreiras 22
## 17 Barreirinha 1
## 18 Cabeças 16
## 19 Cabiúnas 14
## 20 Calumbi 53
## 21 Camboriú 36
## 22 Campo Mourão 1
## 23 Candeias 78
## 24 Carapebus 250
## 25 Carauari 2
## 26 Caravelas 4
## 27 Carbonato Salto Magessi 1
## 28 Coqueiro Seco 31
## 29 Coqueiros 31
## 30 Córrego dos Borges 3
## 31 Cotinguiba 8
## 32 Cricaré 12
## 33 Curiri 2
## 34 Embasamento 748
## 35 Emboré 22
## 36 Estância 2
## 37 Gargau 1
## 38 Goitacás 1
## 39 Guaratiba 15
## 40 Guarujá 17
## 41 Imbé 1
## 42 Imbetiba 3
## 43 Ipu 3
## 44 Itabapoana 3
## 45 Itaim 2
## 46 Itajaí-Açu 68
## 47 Itanhaém 16
## 48 Itaparica 81
## 49 Itapema 36
## 50 Jaicós 2
## 51 Jandaíra 8
## 52 Jandiatuba 4
## 53 Juréia 10
## 54 Juruá 56
## 55 Lagoa Azul 1
## 56 Lagoa Feia 79
## 57 Limoeiro 1
## 58 Longá 17
## 59 Macabu 20
## 60 Macaé 77
## 61 Macau 1
## 62 Maceió 2
## 63 Maecuru 3
## 64 Manacapuru 1
## 65 Maracangalha 62
## 66 Marambaia 45
## 67 Marfim 44
## 68 Mariricu 89
## 69 Morro do Barro 6
## 70 Mosqueiro 1
## 71 Motuca 1
## 72 Mundaú 8
## 73 Muribeca 28
## 74 Namorado 3
## 75 Nhamundá 1
## 76 Orange 1
## 77 Oriximiná 3
## 78 Outeiro 14
## 79 Paracuru 2
## 80 Pedra de Fogo 2
## 81 Pendência 238
## 82 Penedo 34
## 83 Pescada 6
## 84 Piçarras 25
## 85 Pimenteiras 15
## 86 Pojuca 22
## 87 Ponta Grossa 1
## 88 Poti 45
## 89 Puga 1
## 90 Quebradas 2
## 91 Quissamã 38
## 92 Regência 16
## 93 Retiro 22
## 94 Riachuelo 10
## 95 Rio Doce 4
## 96 Rio Pitanga 25
## 97 Salvador 2
## 98 Santos 2
## 99 São Mateus 77
## 100 São Sebastião 8
## 101 Sergi 223
## 102 Serra de Santa Helena 1
## 103 Serraria 18
## 104 Soleira 1
## 105 Sousa 1
## 106 Taciba 5
## 107 Taipus - Mirim 3
## 108 Tianguá 1
## 109 Tibau 4
## 110 Travosas 5
## 111 Ubarana 1
## 112 Ubatuba 257
## 113 Uerê 5
## 114 Urucutuca 157
Agrupación y reasignación de nombres a la Formación al final del pozo Traduce los nombres técnicos, identifica los datos vacíos y agrupa
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(forcats)
TDF_Agrupada_F <- Datos %>%
mutate(GEOFF_Agrupado = ifelse(GEOLOGIA_FORMACAO_FINAL == "" | is.na(GEOLOGIA_FORMACAO_FINAL),
"Sin Información",
GEOLOGIA_FORMACAO_FINAL)) %>%
mutate(GEOFF_Agrupado = recode(GEOFF_Agrupado,
"Embasamento" = "Roca Base",
"Açu" = "Form. Açu",
"Pendência" = "Form. Pendencia",
"Ubatuba" = "Form. Ubatuba",
"Sergi" = "Form. Sergi",
"Urucutuca" = "Form. Urucutuca",
"Carapebus" = "Form. Carapebus",
"Barra de Itiuba" = "Barra de Itiúba",
"São Mateus" = "Form. San Mateo")) %>%
# Agrupamos en 4 principales + 1 "Otras" = 5 grupos en total
mutate(GEOFF_Agrupado = fct_lump_n(GEOFF_Agrupado, n = 4, other_level = "Otras Formaciones")) %>%
count(GEOFF_Agrupado, name = "Freq")
print(TDF_Agrupada_F)
## GEOFF_Agrupado Freq
## 1 Form. Açu 1133
## 2 Form. Ubatuba 257
## 3 Roca Base 748
## 4 Sin Información 24630
## 5 Otras Formaciones 2807
Calcula la cantidad exacta de pozos y el porcentaje que representa cada grupo sobre el total nacional.
TDF_Agrupada_F$GEOFF_Agrupado <- as.character(TDF_Agrupada_F$GEOFF_Agrupado)
TDF_Agrupada_F1<- TDF_Agrupada_F %>%
group_by(GEOFF_Agrupado) %>%
summarise(
ni = sum(Freq),
hi = round(ni / sum(TDF_Agrupada_F$Freq) * 100, 2)) %>%
arrange(desc(ni))
TDF_Agrupada_F1 <- as.data.frame(TDF_Agrupada_F1)
TDF_Agrupada_F1
## GEOFF_Agrupado ni hi
## 1 Sin Información 24630 83.28
## 2 Otras Formaciones 2807 9.49
## 3 Form. Açu 1133 3.83
## 4 Roca Base 748 2.53
## 5 Form. Ubatuba 257 0.87
colnames(TDF_Agrupada_F1)[colnames(TDF_Agrupada_F1) == "GEOFF_Agrupado"] <- "Forma_Geo_Final"
TDF_Agrupada_F1 <- TDF_Agrupada_F1[, c("Forma_Geo_Final", "ni", "hi")]
total_ni <- sum(TDF_Agrupada_F1$ni)
total_hi <- sum((TDF_Agrupada_F1$hi))
TDF_Agrupada_F1.1 <- rbind(TDF_Agrupada_F1, data.frame( Forma_Geo_Final = "Total",
ni = total_ni,
hi = total_hi))
print(TDF_Agrupada_F1.1)
## Forma_Geo_Final ni hi
## 1 Sin Información 24630 83.28
## 2 Otras Formaciones 2807 9.49
## 3 Form. Açu 1133 3.83
## 4 Roca Base 748 2.53
## 5 Form. Ubatuba 257 0.87
## 6 Total 29575 100.00
library(gt)
gt(TDF_Agrupada_F1.1) %>%
tab_header(
title = md("**Cuadro No.1**"),
subtitle = "Distibución de Formación al final del pozo de los pozos petrolíferos en Brasil") %>%
cols_align(align = "center", columns = everything()) %>%
tab_style(
style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
locations = cells_title()
) %>%
tab_style(
style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
locations = cells_column_labels()
) %>%
tab_options(
table.border.top.color = "#2E4053",
table.border.bottom.color = "#2E4053",
column_labels.border.bottom.color = "#2E4053",
data_row.padding = px(6))
| Cuadro No.1 | ||
| Distibución de Formación al final del pozo de los pozos petrolíferos en Brasil | ||
| Forma_Geo_Final | ni | hi |
|---|---|---|
| Sin Información | 24630 | 83.28 |
| Otras Formaciones | 2807 | 9.49 |
| Form. Açu | 1133 | 3.83 |
| Roca Base | 748 | 2.53 |
| Form. Ubatuba | 257 | 0.87 |
| Total | 29575 | 100.00 |
TDF_Agrupada_F_g <- TDF_Agrupada_F1[TDF_Agrupada_F1$Forma_Geo_Final != "Total", ]
par(mar = c(9, 4, 4, 2))
barplot(TDF_Agrupada_F_g$ni,
main = "Gráfica N°1: Distribución de pozos petrolíferos por Formación\nal final del pozo ",
ylab = "Cantidad",
col = "#263238", names.arg = TDF_Agrupada_F_g$Forma_Geo_Final,
las = 2, cex.names = 0.8, cex.axis = 0.8, cex.main = 1)
mtext("Formación al
final del Pozo", side = 1, line = 8, adj = 0.5, cex = 1.2)
par(mar = c(9, 4, 4, 2))
barplot(TDF_Agrupada_F_g$hi,
main = "Gráfica N°2: Distribución porcentual de pozos petrolíferos por\nFormación al final del pozo",
ylab = "Porcentaje",
col = "#263238", names.arg = TDF_Agrupada_F_g$Forma_Geo_Final,
las = 2, cex.names = 0.8, cex.axis = 0.8, cex.main = 1)
mtext("Formación al
final del Pozo", side = 1, line = 8, adj = 0.5, cex = 1.2)
P_GEOFINAL <- TDF_Agrupada_F_g$ni / sum(TDF_Agrupada_F_g$ni)
par(mar = c(9, 4, 4, 2))
barplot(P_GEOFINAL,
main = "Gráfica N°3: Distribución de Probabilidad según la Formación al final del Pozo",
ylab = "Probabilidad",
col = "#2E4053", names.arg = TDF_Agrupada_F_g$Forma_Geo_Final,
las = 2, cex.names = 1, cex.axis = 0.9, cex.main = 1)
mtext("Formación al
final del Pozo", side = 1, line = 8, adj = 0.5, cex = 1.2)
¿Cuál es la probalidad de qué la Formación al Final de un pozo sea Roca Base?
x <- round(
(TDF_Agrupada_F_g$ni[TDF_Agrupada_F_g$Forma_Geo_Final == "Roca Base"] /
sum(TDF_Agrupada_F_g$ni)) * 100, 1)
print(paste("La probabilidad es de:", x, "%"))
## [1] "La probabilidad es de: 2.5 %"
¿Cuántos pozos petroleros van a poseer una Formación al final del Pozo de Roca Madre?
p <- x / 100
n <- 1000
cantidad_esperada <- n * p
Operador_objetivo <- "Roca Madre"
cat("Para n =", n, "pozos, la cantidad esperada con Roca Madre al Final del Pozo es,", Operador_objetivo, "=", round(cantidad_esperada, 2), "\n")
## Para n = 1000 pozos, la cantidad esperada con Roca Madre al Final del Pozo es, Roca Madre = 25