Distribución de pozos petroleros marinos y terrestres en Brasil

1 Importación de datos

Se carga el archivo CSV y se verifica su estructura para confirmar el tipo de variables presentes.

setwd("C:/Users/Usuario/Desktop/TRABAJO DE ESTADISTICA/PDF-EXCEL-QGIS")
Datos <- read.csv("Pozos brasil 2.csv", header = TRUE, sep = ";", dec = ",")
str(Datos)
## 'data.frame':    29575 obs. of  59 variables:
##  $ POCO                      : chr  "7-RO-123HP-RJS" "1-BP-7-RJS" "7-ARGO-4H-ESS" "7-ARGO-5H-ESS" ...
##  $ CADASTRO                  : num  7.43e+10 7.43e+10 3.43e+10 3.43e+10 3.43e+10 ...
##  $ OPERADOR                  : chr  "Petrobras" "BP Energy" "Shell Brasil" "Shell Brasil" ...
##  $ POCO_OPERADOR             : chr  "7RO123HPRJS" "ANU" "7ARGO4HESS" "7ARGO5HESS" ...
##  $ ESTADO                    : chr  "RJ" "RJ" "ES" "ES" ...
##  $ BACIA                     : chr  "Campos" "Campos" "Campos" "Campos" ...
##  $ BLOCO                     : chr  "" "C-M-473" "" "" ...
##  $ SIG_CAMPO                 : chr  "RO   " "" "ARGO " "ARGO " ...
##  $ CAMPO                     : chr  "RONCADOR" "" "ARGONAUTA" "ARGONAUTA" ...
##  $ TERRA_MAR                 : chr  "M" "M" "M" "M" ...
##  $ POCO_POS_ANP              : chr  "S" "S" "S" "S" ...
##  $ TIPO                      : chr  "Explotat\xf3rio" "Explorat\xf3rio" "Explotat\xf3rio" "Explotat\xf3rio" ...
##  $ CATEGORIA                 : chr  "Desenvolvimento" "Pioneiro" "Desenvolvimento" "Desenvolvimento" ...
##  $ RECLASSIFICACAO           : chr  "PRODUTOR COMERCIAL DE PETR\xd3LEO" "PORTADOR DE PETR\xd3LEO" "ABANDONADO POR OUTRAS RAZ\xd5ES" "INDEFINIDO" ...
##  $ SITUACAO                  : chr  "PRODUTOR" "ABANDONADO POR LOG\xcdSTICA EXPLORAT\xd3RIA" "ABANDONADO DEFINITIVAMENTE" "PRODUTOR" ...
##  $ INICIO                    : chr  "03/03/2012" "14/03/2012" "12/04/2012" "14/04/2012" ...
##  $ TERMINO                   : chr  "10/03/2013" "20/09/2012" "19/09/2012" "02/05/2013" ...
##  $ CONCLUSAO                 : chr  "10/03/2013" "19/10/2012" "28/09/2012" "13/05/2013" ...
##  $ TITULARIDADE              : chr  "P\xfablico" "P\xfablico" "P\xfablico" "P\xfablico" ...
##  $ LATITUDE_BASE_4C          : chr  "-21:57:45,630" "-23:06:09,622" "-21:08:06,801" "-21:08:12,535" ...
##  $ LONGITUDE_BASE_4C         : chr  "-39:44:01,130" "-40:00:41,295" "-39:46:53,226" "-39:46:49,296" ...
##  $ LATITUDE_BASE_DD          : num  -22 -23.1 -21.1 -21.1 -21.1 ...
##  $ LONGITUDE_BASE_DD         : num  -39.7 -40 -39.8 -39.8 -39.8 ...
##  $ DATUM_HORIZONTAL          : chr  "SIRGAS2000" "SIRGAS2000" "SIRGAS2000" "SIRGAS2000" ...
##  $ TIPO_DE_COORDENADA_DE_BASE: chr  "Definitiva" "Definitiva" "Definitiva" "Definitiva" ...
##  $ DIRECAO                   : chr  "Horizontal" "Vertical" "Horizontal" "Horizontal" ...
##  $ PROFUNDIDADE_VERTICAL_M   : num  -3145 6900 2937 2934 2953 ...
##  $ PROFUNDIDADE_SONDADOR_M   : num  4050 6925 3809 4575 4570 ...
##  $ PROFUNDIDADE_MEDIDA_M     : num  4050 6925 3809 4575 4570 ...
##  $ REFERENCIA_DE_PROFUNDIDADE: chr  "MR" "MR" "MR" "MR" ...
##  $ MESA_ROTATIVA             : num  24 25 24.2 24.2 24.2 ...
##  $ COTA_ALTIMETRICA_M        : num  0 0 0 0 0 ...
##  $ LAMINA_D_AGUA_M           : num  1827 2730 1706 1705 1654 ...
##  $ DATUM_VERTICAL            : chr  "NM" "NM" "NM" "NM" ...
##  $ UNIDADE_ESTRATIGRAFICA    : chr  "" "" "" "" ...
##  $ GEOLOGIA_GRUPO_FINAL      : chr  "Campos" "Lagoa Feia" "Campos" "Campos" ...
##  $ GEOLOGIA_FORMACAO_FINAL   : chr  "Carapebus" "Macabu" "Ubatuba" "Ubatuba" ...
##  $ GEOLOGIA_MEMBRO_FINAL     : chr  "" "" "" "" ...
##  $ CDPE                      : chr  "Existe" "Existe" "Existe" "" ...
##  $ AGP                       : chr  "" "" "" "" ...
##  $ PC                        : chr  "" "Existe" "" "" ...
##  $ PAG                       : chr  "" "" "" "" ...
##  $ PERFIS_CONVENCIONAIS      : chr  "" "Existe" "" "" ...
##  $ DURANTE_PERFURACAO        : chr  "Existe" "Existe" "Existe" "Existe" ...
##  $ PERFIS_DIGITAIS           : chr  "" "" "" "" ...
##  $ PERFIS_PROCESSADOS        : chr  "" "" "" "" ...
##  $ PERFIS_ESPECIAIS          : chr  "" "" "" "" ...
##  $ AMOSTRA_LATERAL           : chr  "" "Existe" "" "" ...
##  $ SISMICA                   : chr  "" "Existe" "" "" ...
##  $ TABELA_TEMPO_PROFUNDIDADE : chr  "" "" "" "" ...
##  $ DADOS_DIRECIONAIS         : chr  "Existe" "Existe" "Existe" "Existe" ...
##  $ TESTE_A_CABO              : chr  "Existe" "Existe" "" "" ...
##  $ TESTE_DE_FORMACAO         : chr  "" "" "" "" ...
##  $ CANHONEIO                 : chr  "" "" "" "" ...
##  $ TESTEMUNHO                : chr  "" "" "" "" ...
##  $ GEOQUIMICA                : chr  "" "" "" "" ...
##  $ SIG_SONDA                 : chr  "SS-49" "DS4" "NB2" "NB2" ...
##  $ NOM_SONDA                 : chr  "SEDCO 707" "Deep Ocean Clarion" "Bully 2" "Bully 2" ...
##  $ DHA_ATUALIZACAO           : chr  "28/1/18 5:00" "28/1/18 5:00" "28/1/18 5:00" "28/1/18 5:00" ...

2 Construcción de la tabla de distribución inicial

Se obtiene la variable TERRA_MAR y se genera la tabla base de frecuencias.

Ubicación <- Datos$TERRA_MAR
TDFUbicación <- as.data.frame(table(Ubicación))
TDFUbicación
##   Ubicación  Freq
## 1         M  6649
## 2         T 22926

3 Creación de la clasificación Mar–Tierra

Se recodifican los valores “M” y “T” a sus descripciones correspondientes.

library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
TDFUbicación$Sitio <- ifelse(TDFUbicación$Ubicación %in% c("M"), "Mar", 
                             ifelse(TDFUbicación$Ubicación %in% c("T"), "Tierra", NA))
head(TDFUbicación$Sitio)
## [1] "Mar"    "Tierra"

4 Conversión de frecuencias y agrupación por categoría

Se convierte la frecuencia a numérica y se obtiene ni y hi por sitio.

TDFUbicación$Freq <- as.numeric(as.character(TDFUbicación$Freq))
library(dplyr)
TDFUbicación1 <- Datos$TDFUbicación
TDFUbicación1 <- TDFUbicación %>%
  group_by(Sitio) %>%
  summarise( 
    ni = sum(Freq),
    hi = round(sum(Freq) / sum(TDFUbicación$Freq)*100, 5))

TDFUbicación1 <- data.frame(TDFUbicación1)

5 Incorporación de fila de totales

Se agregan los totales de frecuencia absoluta y relativa.

library(dplyr)
TDFUbicación1 <- TDFUbicación1[, c("Sitio", "ni", "hi")]
orden_importancia <- c("Tierra", "Mar")
TDFUbicación1$Sitio <- factor(
TDFUbicación1$Sitio,
levels = orden_importancia)
TDFUbicación1 <- TDFUbicación1 %>%
arrange(Sitio)
fila_total <- data.frame(
Sitio = "Total",
ni = sum(TDFUbicación1$ni),
hi = sum(TDFUbicación1$hi))

TDFUbicacióncompleta <- rbind(
TDFUbicación1,
fila_total)

print(TDFUbicacióncompleta)
##    Sitio    ni        hi
## 1 Tierra 22926  77.51817
## 2    Mar  6649  22.48183
## 3  Total 29575 100.00000

6 Construcción del cuadro final mediante gt

Se genera la tabla final con título y subtítulo formales.

library(gt)
gt(TDFUbicacióncompleta) %>%
  tab_header( 
    title = md("**DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL**"), 
    subtitle = "Clasificación de los pozos petrolíferos según ubicación (mar y tierra)") %>% 
   fmt_number(
    columns = hi,
    decimals = 2) %>%
   cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL
Clasificación de los pozos petrolíferos según ubicación (mar y tierra)
Sitio ni hi
Tierra 22926 77.52
Mar 6649 22.48
Total 29575 100.00

7 Gráficas

7.1 Histograma de frecuencia absoluta local (ni)

Representa la cantidad interna de pozos según sitio.

TDFUbicaciónfinal <- TDFUbicacióncompleta[TDFUbicacióncompleta$Sitio != "Total", ]
par(mar = c(9, 4, 4, 2))
barplot(TDFUbicaciónfinal$ni,
        main = "Gráfico No. 1. Distribución de cantidad local de la ubicación de los pozos",
        xlab = "Sitio" , ylab = "Cantidad",
        col = "#5D6D7E", names.arg = TDFUbicaciónfinal$Sitio,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)

7.2 Histograma de frecuencia absoluta global (ni)

Presenta la cantidad de pozos a escala ampliada.

par(mar = c(9, 4, 4, 2))
barplot(TDFUbicaciónfinal$ni,
        main = "Gráfico No. 2. Distribución de cantidad global de la ubicación de los pozos", 
        xlab = "Sitio", ylab = "Cantidad",
        col = "#5D6D7E", names.arg = TDFUbicaciónfinal$Sitio,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 0.99,
        ylim = c(0,30000)) 

7.3 Histograma de frecuencia porcentual local (hi)

Representa la proporción interna por sitio.

par(mar = c(9, 4, 4, 2))
barplot(TDFUbicaciónfinal$hi,
        main = "Gráfico No. 3. Distribución porcentual local de la ubicación de los pozos",
        xlab = "Sitio", ylab = "Porcentaje",
        col = "#5D6D7E", names.arg = TDFUbicaciónfinal$Sitio,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)

7.4 Histograma de frecuencia porcentual global (hi)

Representa las proporciones a escala global.

par(mar = c(9, 4, 4, 2))
barplot(TDFUbicaciónfinal$hi,
        main = "Gráfico No. 4. Distribución porcentual global de la ubicación de los pozos",
        xlab = "Sitio", ylab = "Porcentaje", ylim = c(0,100),
        col = "#5D6D7E", names.arg = TDFUbicaciónfinal$Sitio,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)

7.5 Diagrama circular de frecuencias relativas

Muestra la composición porcentual de cada sitio.

par(mar = c(6, 4, 8, 4))
pie(TDFUbicaciónfinal$hi, 
    main = "Gráfico No. 5. Distribución porcentual de la ubicación de los pozos", 
    radius = 0.9,
    labels = paste0(round(TDFUbicaciónfinal$hi,2)),
    col = c("#FFFFE5", "#ADDD8E"),
    cex.main = 0.95,
    init.angle = 90)

legend(x = -2, y =1,
       legend = TDFUbicaciónfinal$Sitio,
       fill = c("#FFFFE5", "#ADDD8E"),
       cex = 1,
       title = "Sitio")

8 Resumen Estadístico

8.1 Ordenamiento de la ubicación de los pozos según facilidad operativa

Las categorías se ordenan según la facilidad técnica y logística de explotación, priorizando los pozos terrestres frente a los marinos, debido a menores costos operativos y mayor accesibilidad.

Conclusiones <- data.frame(
Variable = "Ubicación de pozos M-T",
`Rango [Min; Max]` = "N/A",
`Media (X̄)` = "N/A",
`Mediana (Me)` = "N/A",
`Moda (Mo)` = "Definitiva",
`Varianza (S²)` = "N/A",
`Desv. Est. (S)` = "N/A",
`C.V. (%)` = "N/A",
`Asimetría (As)` = "N/A",
`Curtosis (K)` = "N/A",
`Valores Atípicos` = "N/A",
check.names = FALSE
)
library(gt)

gt(Conclusiones) %>%
tab_header(
title = md("**CONCLUSIONES Y ESTADÍSTICOS**"),
subtitle = "Resumen de indicadores de las ubicaciones de los pozos Marinos y Terrestres") %>%
tab_source_note(source_note = "Autor: Anahi Macias") %>%
  cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
CONCLUSIONES Y ESTADÍSTICOS
Resumen de indicadores de las ubicaciones de los pozos Marinos y Terrestres
Variable Rango [Min; Max] Media (X̄) Mediana (Me) Moda (Mo) Varianza (S²) Desv. Est. (S) C.V. (%) Asimetría (As) Curtosis (K) Valores Atípicos
Ubicación de pozos M-T N/A N/A N/A Definitiva N/A N/A N/A N/A N/A N/A
Autor: Anahi Macias

8.2 Conclusiones

8.2.1 Análisis Descriptivo

La moda corresponde a la categoría Tierra, lo que evidencia que la mayoría de los pozos petrolíferos en Brasil se localizan en zonas terrestres, asociadas a una mayor facilidad de explotación y menor complejidad operativa.