Modelo de Probabilidad del Estado de los pozos petrolíferos

1 Carga de datos

Se importan los datos de los pozos petrolíferos y se verifica su estructura.

setwd("C:/Users/majke/Downloads/Proyecto Estadistica/RMARKDOWN")
Datos <- read.csv("Pozos brasil 2.csv", header = TRUE, sep = ";", dec = ",", fileEncoding = "Latin1")
str(Datos)
## 'data.frame':    29575 obs. of  59 variables:
##  $ POCO                      : chr  "7-RO-123HP-RJS" "1-BP-7-RJS" "7-ARGO-4H-ESS" "7-ARGO-5H-ESS" ...
##  $ CADASTRO                  : num  7.43e+10 7.43e+10 3.43e+10 3.43e+10 3.43e+10 ...
##  $ OPERADOR                  : chr  "Petrobras" "BP Energy" "Shell Brasil" "Shell Brasil" ...
##  $ POCO_OPERADOR             : chr  "7RO123HPRJS" "ANU" "7ARGO4HESS" "7ARGO5HESS" ...
##  $ ESTADO                    : chr  "RJ" "RJ" "ES" "ES" ...
##  $ BACIA                     : chr  "Campos" "Campos" "Campos" "Campos" ...
##  $ BLOCO                     : chr  "" "C-M-473" "" "" ...
##  $ SIG_CAMPO                 : chr  "RO   " "" "ARGO " "ARGO " ...
##  $ CAMPO                     : chr  "RONCADOR" "" "ARGONAUTA" "ARGONAUTA" ...
##  $ TERRA_MAR                 : chr  "M" "M" "M" "M" ...
##  $ POCO_POS_ANP              : chr  "S" "S" "S" "S" ...
##  $ TIPO                      : chr  "Explotatório" "Exploratório" "Explotatório" "Explotatório" ...
##  $ CATEGORIA                 : chr  "Desenvolvimento" "Pioneiro" "Desenvolvimento" "Desenvolvimento" ...
##  $ RECLASSIFICACAO           : chr  "PRODUTOR COMERCIAL DE PETRÓLEO" "PORTADOR DE PETRÓLEO" "ABANDONADO POR OUTRAS RAZÕES" "INDEFINIDO" ...
##  $ SITUACAO                  : chr  "PRODUTOR" "ABANDONADO POR LOGÍSTICA EXPLORATÓRIA" "ABANDONADO DEFINITIVAMENTE" "PRODUTOR" ...
##  $ INICIO                    : chr  "03/03/2012" "14/03/2012" "12/04/2012" "14/04/2012" ...
##  $ TERMINO                   : chr  "10/03/2013" "20/09/2012" "19/09/2012" "02/05/2013" ...
##  $ CONCLUSAO                 : chr  "10/03/2013" "19/10/2012" "28/09/2012" "13/05/2013" ...
##  $ TITULARIDADE              : chr  "Público" "Público" "Público" "Público" ...
##  $ LATITUDE_BASE_4C          : chr  "-21:57:45,630" "-23:06:09,622" "-21:08:06,801" "-21:08:12,535" ...
##  $ LONGITUDE_BASE_4C         : chr  "-39:44:01,130" "-40:00:41,295" "-39:46:53,226" "-39:46:49,296" ...
##  $ LATITUDE_BASE_DD          : num  -22 -23.1 -21.1 -21.1 -21.1 ...
##  $ LONGITUDE_BASE_DD         : num  -39.7 -40 -39.8 -39.8 -39.8 ...
##  $ DATUM_HORIZONTAL          : chr  "SIRGAS2000" "SIRGAS2000" "SIRGAS2000" "SIRGAS2000" ...
##  $ TIPO_DE_COORDENADA_DE_BASE: chr  "Definitiva" "Definitiva" "Definitiva" "Definitiva" ...
##  $ DIRECAO                   : chr  "Horizontal" "Vertical" "Horizontal" "Horizontal" ...
##  $ PROFUNDIDADE_VERTICAL_M   : num  -3145 6900 2937 2934 2953 ...
##  $ PROFUNDIDADE_SONDADOR_M   : num  4050 6925 3809 4575 4570 ...
##  $ PROFUNDIDADE_MEDIDA_M     : num  4050 6925 3809 4575 4570 ...
##  $ REFERENCIA_DE_PROFUNDIDADE: chr  "MR" "MR" "MR" "MR" ...
##  $ MESA_ROTATIVA             : num  24 25 24.2 24.2 24.2 ...
##  $ COTA_ALTIMETRICA_M        : num  0 0 0 0 0 ...
##  $ LAMINA_D_AGUA_M           : num  1827 2730 1706 1705 1654 ...
##  $ DATUM_VERTICAL            : chr  "NM" "NM" "NM" "NM" ...
##  $ UNIDADE_ESTRATIGRAFICA    : chr  "" "" "" "" ...
##  $ GEOLOGIA_GRUPO_FINAL      : chr  "Campos" "Lagoa Feia" "Campos" "Campos" ...
##  $ GEOLOGIA_FORMACAO_FINAL   : chr  "Carapebus" "Macabu" "Ubatuba" "Ubatuba" ...
##  $ GEOLOGIA_MEMBRO_FINAL     : chr  "" "" "" "" ...
##  $ CDPE                      : chr  "Existe" "Existe" "Existe" "" ...
##  $ AGP                       : chr  "" "" "" "" ...
##  $ PC                        : chr  "" "Existe" "" "" ...
##  $ PAG                       : chr  "" "" "" "" ...
##  $ PERFIS_CONVENCIONAIS      : chr  "" "Existe" "" "" ...
##  $ DURANTE_PERFURACAO        : chr  "Existe" "Existe" "Existe" "Existe" ...
##  $ PERFIS_DIGITAIS           : chr  "" "" "" "" ...
##  $ PERFIS_PROCESSADOS        : chr  "" "" "" "" ...
##  $ PERFIS_ESPECIAIS          : chr  "" "" "" "" ...
##  $ AMOSTRA_LATERAL           : chr  "" "Existe" "" "" ...
##  $ SISMICA                   : chr  "" "Existe" "" "" ...
##  $ TABELA_TEMPO_PROFUNDIDADE : chr  "" "" "" "" ...
##  $ DADOS_DIRECIONAIS         : chr  "Existe" "Existe" "Existe" "Existe" ...
##  $ TESTE_A_CABO              : chr  "Existe" "Existe" "" "" ...
##  $ TESTE_DE_FORMACAO         : chr  "" "" "" "" ...
##  $ CANHONEIO                 : chr  "" "" "" "" ...
##  $ TESTEMUNHO                : chr  "" "" "" "" ...
##  $ GEOQUIMICA                : chr  "" "" "" "" ...
##  $ SIG_SONDA                 : chr  "SS-49" "DS4" "NB2" "NB2" ...
##  $ NOM_SONDA                 : chr  "SEDCO 707" "Deep Ocean Clarion" "Bully 2" "Bully 2" ...
##  $ DHA_ATUALIZACAO           : chr  "28/1/18 5:00" "28/1/18 5:00" "28/1/18 5:00" "28/1/18 5:00" ...

2 Extraer Variable

Situación <- Datos$SITUACAO
TDFSituación <- as.data.frame(table(Situación))
TDFSituación
##                                                                              Situación
## 1                                                                                     
## 2                                ABANDONADO AGUARDANDO ABANDONO DEFINITIVO/ARRASAMENTO
## 3                                         ABANDONADO AGUARDANDO REINÍCIO DE PERFURAÇÃO
## 4                                                           ABANDONADO DEFINITIVAMENTE
## 5                                                ABANDONADO POR LOGÍSTICA EXPLORATÓRIA
## 6  ABANDONADO/PARADO AGUARDANDO INTERVENÇÃO PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO
## 7                                                                             ARRASADO
## 8                                                         CEDIDO PARA PRODUÇÃO DE ÁGUA
## 9                                                                          DE DESCARTE
## 10                                                                           DEVOLVIDO
## 11                                                                         EM ABANDONO
## 12                           EM INTERVENÇÃO PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO
## 13                                                                       EM PERFURAÇÃO
## 14                                               EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO
## 15                                              EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO
## 16                                                                             INJETOR
## 17                                                                               OUTRO
## 18                                                       PRODUÇÃO DE AGUA PARA INJEÇÃO
## 19                                                                            PRODUTOR
##    Freq
## 1   824
## 2  3120
## 3     2
## 4  5074
## 5   719
## 6   253
## 7  2193
## 8   262
## 9    40
## 10 1446
## 11    8
## 12 2711
## 13    6
## 14    9
## 15   60
## 16 2653
## 17   96
## 18  187
## 19 9912
#Agrupación
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
TDFSituación$Condición <- ifelse(TDFSituación$Situación %in% c("ABANDONADO AGUARDANDO ABANDONO DEFINITIVO/ARRASAMENTO", "ABANDONADO AGUARDANDO REINÍCIO DE PERFURAÇÃO", "ABANDONADO DEFINITIVAMENTE", "ABANDONADO POR LOGÍSTICA EXPLORATÓRIA", "ABANDONADO/PARADO AGUARDANDO INTERVENÇÃO PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO", "EM ABANDONO"), "Abandonados",
                                 ifelse(TDFSituación$Situación %in% c("EM PERFURAÇÃO"), "Intervención", 
                                        ifelse(TDFSituación$Situación %in% c("EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO0", "EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO"), "Equipado en espera", 
                                               ifelse(TDFSituación$Situación %in% c("INJETOR", "PRODUTOR"), "En funcionamiento", 
                                                      ifelse(TDFSituación$Situación %in% c("CEDIDO PARA PRODUÇÃO DE ÁGUA", "PRODUÇÃO DE AGUA PARA INJEÇÃO"), "Producción de agua",
                                                             ifelse(TDFSituación$Situación %in% c("DEVOLVIDO", "DE DESCARTE"), "Descartado",
                                                                    ifelse(TDFSituación$Situación %in% c("ARRASADO"), "Devastado","Otros")))))))
head(TDFSituación$Condición)
## [1] "Otros"       "Abandonados" "Abandonados" "Abandonados" "Abandonados"
## [6] "Abandonados"
orden_niveles <- c("En funcionamiento", 
                   "Equipado en espera", 
                   "Producción de agua", 
                   "Intervención", 
                   "Abandonados", 
                   "Descartado", 
                   "Devastado", 
                   "Otros", 
                   "Total")

TDFSituación$Condición <- factor(TDFSituación$Condición, 
                                        levels = orden_niveles, 
                                        ordered = TRUE)
TDFSituación <- TDFSituación[order(TDFSituación$Condición), ]

3 Tabla de Distribución de Frecuencias

TDFSituación$Freq <- as.numeric(as.character(TDFSituación$Freq))
library(dplyr)
TDFSituación1 <- Datos$TDFSituación
TDFSituación1 <- TDFSituación %>%
  group_by(Condición) %>%
  summarise( 
    ni = sum(Freq),
    hi = round(sum(Freq) / sum(TDFSituación$Freq)*100, 5))

TDFSituación1 <- data.frame(TDFSituación1)

TDFSituación1 <- TDFSituación1 [, c("Condición", "ni", "hi")]
total_ni <- sum(TDFSituación1$ni) 
total_hi <- sum(TDFSituación1$hi)
TDFSituacióncompleta <- rbind(TDFSituación1, data.frame( Condición = "Total",
                                                          ni = total_ni,
                                                          hi = total_hi))
print(TDFSituacióncompleta)
##            Condición    ni        hi
## 1  En funcionamiento 12565  42.48521
## 2 Equipado en espera     9   0.03043
## 3 Producción de agua   449   1.51817
## 4       Intervención     6   0.02029
## 5        Abandonados  9176  31.02620
## 6         Descartado  1486   5.02451
## 7          Devastado  2193   7.41505
## 8              Otros  3691  12.48014
## 9              Total 29575 100.00000
library(gt)
gt(TDFSituacióncompleta) %>%
  tab_header( 
    title = md("**Tabla N°1: DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL**"), 
    subtitle = "Situación de los pozos petrolíferos en Brasil") %>% 
  fmt_number(
    columns = hi,
    decimals = 2) %>%
 cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
Tabla N°1: DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL
Situación de los pozos petrolíferos en Brasil
Condición ni hi
En funcionamiento 12565 42.49
Equipado en espera 9 0.03
Producción de agua 449 1.52
Intervención 6 0.02
Abandonados 9176 31.03
Descartado 1486 5.02
Devastado 2193 7.42
Otros 3691 12.48
Total 29575 100.00

4 Análisis Gráfico

4.1 Diagramas de Barras de Cantidad

TDFSituaciónfinal <- TDFSituacióncompleta[TDFSituacióncompleta$Condición != "Total", ]
par(mar = c(9, 4, 4, 2))
barplot(TDFSituaciónfinal$hi,
        main = "Gráfica N°1: Porcentaje de la condición de los pozos en Brasil",
        ylab = "Porcentaje",
        col = "#263238", names.arg = TDFSituaciónfinal$Condición,
        las = 2, cex.names = 0.8, cex.axis = 0.8, cex.main = 1)
mtext("Condición", side = 1, line = 7)

5 Agrupación 1 - Opcion A BINOMIAL

niveles_Bin <- c("Equipado en espera", 
                 "En funcionamiento", 
                 "Producción de agua")

TDF_G1_Bin <- TDFSituaciónfinal %>%
  filter(Condición %in% niveles_Bin) %>%
  mutate(
    X = 0:(n() - 1),
    hi = ni / sum(ni)
  )


TDF_G1_Bin %>% 
  select(Condición, X, ni, hi) %>%
  gt() %>% 
  tab_header(
    title = md("**Tabla N°2 de Distribución de Frecuencias del Estado Operativo de los Pozos Petrolíferos – Modelo Binomial**")
  ) %>%
  tab_source_note(source_note = "Autor: Anahi Macias") %>%
cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  cols_label(
    Condición = "Estado Operativo",
    X = "Valor Asignado",
    ni = "Frecuencia (ni)",
    hi = "Proporción (hi)"
  ) %>%
  fmt_number(columns = hi, decimals = 2)%>%

  tab_options(
    heading.title.font.size = px(16),
    heading.subtitle.font.size = px(14),
    column_labels.background.color = "#2E4053"
  )
Tabla N°2 de Distribución de Frecuencias del Estado Operativo de los Pozos Petrolíferos – Modelo Binomial
Estado Operativo Valor Asignado Frecuencia (ni) Proporción (hi)
En funcionamiento 0 12565 0.96
Equipado en espera 1 9 0.00
Producción de agua 2 449 0.03
Autor: Anahi Macias

5.1 Conjetura del Modelo

n_total_Bin <- sum(TDF_G1_Bin$ni)


size_binom_A <- nrow(TDF_G1_Bin) - 1            
media_obs_A <- sum(TDF_G1_Bin$X * TDF_G1_Bin$ni) / n_total_Bin # Suma de X * ni
prob_p_A <- media_obs_A / size_binom_A


P_Binomial_A <- dbinom(TDF_G1_Bin$X, size = size_binom_A, prob = prob_p_A)


par(mar = c(9, 4, 4, 2))
barplot(rbind(TDF_G1_Bin$hi, P_Binomial_A), 
        beside = TRUE,
        main = "Gráfica N°2: Comparado de lo Observado frente a lo Esperado del Estado Operativo de los Pozos Petrolíferos",
        ylab = "Porcentaje (%)",
        names.arg = TDF_G1_Bin$Condición, 
        col = c("#2E4053", "#F2F3F4"),
        legend.text = c("Observado", "Esperado"), 
        args.legend = list(x = "topright"),
        las = 1, 
        cex.names = 0.8,
        cex.main = 0.78)
mtext("Estado Operativo", side = 1, line = 6)

5.2 Test de Pearson

Fo_A <- TDF_G1_Bin$hi
Fe_A <- P_Binomial_A

par(mar = c(9, 4, 4, 2))
plot(Fo_A, Fe_A, 
     main = "Gráfica N°3: Correlación del Modelo Observado y Esperado del Estado Operativo de los Pozos Petrolíferos",
     cex.main = 0.78,
     xlab = "Frecuencia Observada", 
     ylab = "Frecuencia Esperada", 
     pch = 19, col = "#2E4053")
abline(lm(Fe_A ~ Fo_A), col = "red", lwd = 2)

Correlacion_A <- cor(Fo_A, Fe_A) * 100
Correlacion_A
## [1] 99.55384

5.3 Test de Chi-cuadrado

x2_A <- sum(((Fo_A - Fe_A)^2) / Fe_A)

gl_A <- length(Fo_A) - 1

vc_A <- qchisq(0.95, gl_A)

x2_A
## [1] 0.979544
vc_A
## [1] 5.991465
x2_A < vc_A
## [1] TRUE

5.4 Tabla Resumen del Test

tabla_resumen_A <- data.frame(
  Variable = "Estado Operativo",
  Pearson = round(Correlacion_A, 2),
  Chi2    = round(x2_A, 4),
  Umbral  = round(vc_A, 2)
)

tabla_resumen_A %>% 
  gt() %>% 
  cols_label(
    Variable = ("Variable"),       
    Pearson  = "Test Pearson (%)",
    Chi2     = ("Chi Cuadrado"), 
    Umbral   = "Umbral de Aceptación"
  ) %>%
  tab_header(
    title = md("**Tabla N°3 Resumen del Test de Bondad al Modelo de Probabilidad**")) %>%
  tab_source_note(
    source_note = "Autor: Anahi Macias") %>%
  cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
Tabla N°3 Resumen del Test de Bondad al Modelo de Probabilidad
Variable Test Pearson (%) Chi Cuadrado Umbral de Aceptación
Estado Operativo 99.55 0.9795 5.99
Autor: Anahi Macias

¿Cuál es la probabilidad de que un pozo petrolero seleccionado al azar esté En funcionamiento dentro de la fase activa?

# Probabilidad de "En funcionamiento"
prob_funcionamiento <- TDF_G1_Bin$hi[TDF_G1_Bin$Condición == "En funcionamiento"]

prob_funcionamiento * 100
## [1] 96.48315

La probabilidad de que un pozo activo esté en funcionamiento es 96.48%*, lo que evidencia que la gran mayoría de los pozos dentro de la fase activa se encuentran produciendo, confirmando el predominio operativo del sistema petrolero analizado.

¿Cuántos pozos petroleros activos NO están en funcionamiento?

# Cantidad de pozos activos que NO están en funcionamiento
pozos_no_funcionan <- sum(
  TDF_G1_Bin$ni[TDF_G1_Bin$Condición != "En funcionamiento"]
)

pozos_no_funcionan
## [1] 458

Se identificaron 458 pozos activos que no están en funcionamiento, lo que representa una fracción pequeña del total activo y sugiere la existencia de pozos en etapa de preparación o destinados a procesos auxiliares como la inyección de agua.

6 Agrupación 2 - Opcion GEOMÉTRICO

niveles_finales <- c("Abandonados", "Descartado", "Devastado")

TDF_G1_Geo <- TDFSituaciónfinal %>%
  filter(Condición %in% niveles_finales) %>%
  mutate(Condición = factor(Condición, levels = niveles_finales)) %>%
  arrange(Condición) %>%
  mutate(
    X  = 0:(n() - 1),
    hi = ni / sum(ni)
  )

7 Conjetura del Modelo

n_total_geo   <- sum(TDF_G1_Geo$ni)
media_obs_geo <- sum(TDF_G1_Geo$X * TDF_G1_Geo$ni) / n_total_geo


prob_p_geo <- 1 / (media_obs_geo + 1)

P_Geometrica <- dgeom(TDF_G1_Geo$X, prob = prob_p_geo)


P_Geometrica <- P_Geometrica / sum(P_Geometrica)

par(mar = c(8, 4, 4, 2))
barplot(rbind(TDF_G1_Geo$hi, P_Geometrica),
        beside = TRUE,
        main = "Gráfica N°4: Observado vs Esperado – Modelo Geométrico",
        ylab = "Proporción",
        names.arg = TDF_G1_Geo$Condición,
        col = c("#2E4053", "#F2F3F4"),
        legend.text = c("Observado", "Esperado"),
        args.legend = list(x = "topright"),
        las = 1, cex.names = 0.9, cex.main = 0.9)
mtext("Condición", side = 1, line = 6)

7.1 Test de Pearson

Fo_Geo <- TDF_G1_Geo$hi
Fe_Geo <- P_Geometrica

correlacion_geo <- cor(Fo_Geo, Fe_Geo) * 100
correlacion_geo
## [1] 95.11567
plot(Fo_Geo, Fe_Geo,
     main = "Gráfica N°5: Correlación del Modelo Observado y Esperado del Estado Operativo de los Pozos Petrolífero",
     cex.main = 0.78,
     xlab = "Frecuencia Observada (hi)",
     ylab = "Frecuencia Esperada",
     pch = 19, col = "#2E4053")
abline(lm(Fe_Geo ~ Fo_Geo), col = "red", lwd = 2)

x2_geo <- sum(((Fo_Geo - Fe_Geo)^2) / Fe_Geo)
gl_geo <- length(Fo_Geo) - 1
vc_geo <- qchisq(0.95, gl_geo)

7.2 Tabla Resumen del Test

tabla_resumen_C <- data.frame(
  Variable = "Estado Operativo",
  Pearson = round(correlacion_geo, 2),
  Chi2 = round(x2_geo, 4),
  Umbral = round(vc_geo, 2)
)

tabla_resumen_C %>% 
  gt() %>% 
  cols_label(
    Variable = ("Variable"),       
    Pearson  = "Test Pearson (%)",
    Chi2     = ("Chi Cuadrado"), 
    Umbral   = "Umbral de Aceptación"
  ) %>%
  tab_header(
    title = md("**Tabla N°4: Resumen del Test de Bondad al Modelo de Probabilidad**")) %>%
  tab_source_note(
    source_note = "Autor: Anahi Macias") %>%
  cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
Tabla N°4: Resumen del Test de Bondad al Modelo de Probabilidad
Variable Test Pearson (%) Chi Cuadrado Umbral de Aceptación
Estado Operativo 95.12 0.1975 5.99
Autor: Anahi Macias

¿Cuál es la probabilidad de que un pozo petrolero se encuentre en estado Abandonado según el modelo geométrico ajustado?

prob_abandonado <- P_Geometrica[1] * 100
prob_abandonado
## [1] 70.82772

La probabilidad estimada por el modelo geométrico indica que aproximadamente 70.83% de los pozos se encuentran en estado abandonado, lo que representa el estado inicial más probable dentro del proceso de deterioro operativo.

¿Cuántos pozos se espera que estén en estado Devastado según el modelo geométrico?

# Cantidad esperada en Devastado (X = 2)
cantidad_devastado <- P_Geometrica[3] * n_total_geo
cantidad_devastado
## [1] 895.1813

El modelo geométrico estima que aproximadamente 895 pozos deberían encontrarse en estado devastado, lo que refleja la frecuencia esperada del estado más crítico dentro del ciclo operativo.

8 Conclusiones

El análisis probabilístico permitió modelar el ciclo de vida de los pozos petrolíferos mediante un modelo binomial para la fase activa y un modelo geométrico para la fase final. Los resultados muestran que la mayoría de los pozos activos se encuentran en funcionamiento, mientras que en la etapa final predomina el estado de abandono.

Las pruebas de bondad de ajuste confirman que ambos modelos representan adecuadamente los datos observados, evidenciando una descripción estadística coherente del comportamiento operativo y del proceso de deterioro de los pozos petrolíferos.