Modelo de Probabilidad de la Dirección de los Pozos Petroleros en Brasil
setwd("C:/Users/Usuario/Desktop/Nueva carpeta")
library(readxl)
library(dplyr)
library(gt)
datos <- read_excel("tabela_de_pocos_janeiro_2018.xlsx")
Se importa la base de datos de pozos petrolíferos de Brasil y se verifica la estructura de las variables para asegurar su correcta lectura.
Se calcula la frecuencia absoluta de los pozos según su dirección de perforación.
Direccion <- Datos$DIRECAO
TDFDireccion <- as.data.frame(table(Direccion))
TDFDireccion
## Direccion Freq
## 1 Direcional 5560
## 2 Horizontal 1232
## 3 Vertical 22783
Se obtienen las frecuencias absolutas (ni) y relativas (hi) de los pozos petrolíferos según su dirección.
TDFDireccion$Freq <- as.numeric(as.character(TDFDireccion$Freq))
library(dplyr)
TDFDireccion1 <- Datos$TDFDireccion
TDFDireccion1 <- TDFDireccion %>%
group_by(Direccion) %>%
summarise(
ni = sum(Freq),
hi = round(sum(Freq) / sum(TDFDireccion$Freq)*100, 5))
TDFDireccion1 <- data.frame(TDFDireccion1)
Se añaden los totales generales de frecuencia absoluta y relativa.
TDFDireccion1$fi <- TDFDireccion1$ni / sum(TDFDireccion1$ni)
TDFDireccion1 <- TDFDireccion1 [, c("Direccion", "ni", "hi", "fi")]
total_ni <- sum(TDFDireccion1$ni)
total_hi <- sum(TDFDireccion1$hi)
total_fi <- sum(TDFDireccion1$fi)
TDFDireccion1.1 <- rbind(TDFDireccion1, data.frame( Direccion = "Total",
ni = total_ni,
hi = total_hi,
fi = total_fi))
print(TDFDireccion1.1 )
## Direccion ni hi fi
## 1 Direcional 5560 18.79966 0.1879966
## 2 Horizontal 1232 4.16568 0.0416568
## 3 Vertical 22783 77.03466 0.7703466
## 4 Total 29575 100.00000 1.0000000
Se formatea la tabla final para su presentación en formato gt.
library(gt)
gt(TDFDireccion1.1 ) %>%
tab_header(
title = md("**Tabla N°1: DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL**"),
subtitle = "Dirección de los pozos petroleros") %>%
tab_spanner(
label = md("**Frecuencia Relativa**"),
columns = c(hi, fi)
) %>%
cols_label(
ni = md("**ni**"),
hi = md("Porcentual (%)"),
fi = md("Fracción")
) %>%
fmt_number(columns = hi, decimals = 2) %>%
fmt_number(columns = fi, decimals = 4) %>%
cols_align(align = "center", columns = everything()) %>%
tab_style(
style = list(cell_fill(color = "#2E4053"),
cell_text(color = "white", weight = "bold")),
locations = cells_title()
) %>%
tab_style(
style = list(cell_fill(color = "#F2F3F4"),
cell_text(weight = "bold", color = "#2E4053")),
locations = cells_column_labels()
) %>%
tab_style(
style = list(cell_fill(color = "#2E4053"),
cell_text(color = "white", weight = "bold")),
locations = cells_column_spanners()
) %>%
tab_style(
style = list(cell_fill(color = "#D5D8DC"),
cell_text(weight = "bold", color = "#2E4053")),
locations = cells_body(rows = nrow(TDFDireccion1.1 ))
) %>%
tab_options(
table.border.top.color = "#2E4053",
table.border.bottom.color = "#2E4053",
column_labels.border.bottom.color = "#2E4053",
data_row.padding = px(6),
table.font.size = px(13)
)
| Tabla N°1: DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL | |||
| Dirección de los pozos petroleros | |||
| Direccion | ni |
Frecuencia Relativa
|
|
|---|---|---|---|
| Porcentual (%) | Fracción | ||
| Direcional | 5560 | 18.80 | 0.1880 |
| Horizontal | 1232 | 4.17 | 0.0417 |
| Vertical | 22783 | 77.03 | 0.7703 |
| Total | 29575 | 100.00 | 1.0000 |
Muestra la cantidad de pozos según su dirección de perforación, excluyendo el total general.
TDFDireccion2 <- TDFDireccion1.1[TDFDireccion1.1$Direccion!= "Total", ]
barplot(TDFDireccion2$ni,
main = "Grafica N.1: Distribucion en cantidad segun la direccion de los pozos",
xlab = "Direccion", ylab = "Cantidad",
col = "#263238", names.arg = TDFDireccion2$Direccion,
las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)
Presenta el porcentaje de pozos por dirección, permitiendo una interpretación probabilística.
TDFDireccion2 <- TDFDireccion1.1[TDFDireccion1.1$Direccion!= "Total", ]
barplot(TDFDireccion2$hi,
main = "Grafica N.2: Distribucion en cantidad segun la direccion de los pozos",
xlab = "Direccion", ylab = "Porcentaje",
col = "#263238", names.arg = TDFDireccion2$Direccion,
las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)
Se construye un modelo empírico de probabilidad a partir de las frecuencias relativas de la dirección de los pozos.
P_Dirección <- TDFDireccion2$ni / sum(TDFDireccion2$ni)
par(mar = c(9, 4, 4, 2))
barplot(P_Dirección,
main = "Gráfica N°3: Distribución de Probabilidad según la dirección de los pozo",
xlab = "Dirección", ylab = "Probabilidad",
col = "#2E4053", names.arg = TDFDireccion2$Direccion,
las = 1, cex.names = 1, cex.axis = 0.9, cex.main = 1)
¿Cuál es la probabilidad de que un pozo petrolero tenga dirección horizontal?
x <- round(
(TDFDireccion2$ni[TDFDireccion2$Direccion == "Horizontal"] /
sum(TDFDireccion2$ni)) * 100, 1)
print(paste("La probabilidad es de:", x, "%"))
## [1] "La probabilidad es de: 4.2 %"
La probabilidad obtenida indica que aproximadamente el 4.2% de los pozos petrolíferos en Brasil tienen dirección horizontal.
¿Cuántos pozos petroleros pueden tener dirección horizontal??.
p <- x / 100
n <- 1000
cantidad_esperada <- n * p
direccion_objetivo <- "Horizontal"
cat("Para n =", n, "pozos, cantidad esperada de la dirección de los pozos", direccion_objetivo, "=", round(cantidad_esperada, 2), "\n")
## Para n = 1000 pozos, cantidad esperada de la dirección de los pozos Horizontal = 42
Se espera que aproximadamente 42 pozos petroleros tengan dirección horizontal, por cada 1000 pozos considerados