Análisis Probabilístico de los Operadores de Pozos Petrolíferos en Brasil
setwd("C:/Users/Usuario/Desktop/Nueva carpeta")
library(readxl)
library(dplyr)
library(gt)
datos <- read_excel("tabela_de_pocos_janeiro_2018.xlsx")
Se define la ruta del archivo y se procede a importar la base de datos desde Excel.
Se determina la frecuencia absoluta de las empresas operadoras.
Operador <- datos$OPERADOR
TDFOperador <- as.data.frame(table(Operador))
colnames(TDFOperador) <- c("Operador","Freq")
Se realiza la clasificación de los operadores según su tipo de empresa.
TDFOperador$Operadores <- ifelse(TDFOperador$Operador %in% c("Petrobras"), "Empresa Nacional Estatal",
ifelse(TDFOperador$Operador %in% c("PetroRio O&G","Recôncavo E&P","Dommo Energia","Parnaíba Gás Natural","Petra Energia","Petrosynergy","Petroil","Queiroz Galvão","SHB","Santana","Imetame","Panergy","OP Energia","Vipetro","Guto & Cacal","Espigão","Oeste de Canoas","Nova Petróleo Rec","Norteoleum","Nord","Newo","Máxima 07","Marítima","Alvopetro","Allpetro","Alcom","Aurizônia Petróleo","Arclima","Central Resources","Cemes","Perícia"),
"Empresas Nacionales Privadas",
ifelse(TDFOperador$Operador %in% c("Shell","Shell Brasil","BP","BP Brasil","BP Energy","Total E&P do Brasil","Chevron Brasil","Chevron Frade","ExxonMobil Brasil","Equinor","Statoil Brasil","Statoil Brasil O&G","Repsol Sinopec","Eni Oil","BG Brasil","Petrogal Brasil","Rosneft"),
"Empresas Extranjeras Mayores",
ifelse(TDFOperador$Operador %in% c("Wintershall BM-S-14","Unocal","Texaco BM-C-5","Devon Brasil","Amerada Hess","Anadarko","Cowan Petróleo e Gás","ONGC Campos","Partex Brasil","Perenco Brasil","Karoon","Maha Energy","Geopark Brasil","Great Oil","Silver Marlin","Sipet","Tek","Tecpetrol Brasil","Leros","Phoenix","Cisco","EPG Brasil","Esso Expl Offshore","Esso Explor e Des","IPI","Integral"),
"Empresas Extranjeras Independientes","Otros"))))
head(TDFOperador)
## Operador Freq Operadores
## 1 Alcom 11 Empresas Nacionales Privadas
## 2 Allpetro 1 Empresas Nacionales Privadas
## 3 Alvopetro 16 Empresas Nacionales Privadas
## 4 Amerada Hess 3 Empresas Extranjeras Independientes
## 5 Anadarko 15 Empresas Extranjeras Independientes
## 6 Arclima 1 Empresas Nacionales Privadas
Se calcula la distribución de frecuencias absoluta (ni) y relativa (hi) para cada grupo.
TDFOperador$Freq <- as.numeric(TDFOperador$Freq)
TDFOperador1 <- TDFOperador %>%
group_by(Operadores) %>%
summarise(
ni = sum(Freq),
hi = round(sum(Freq)/sum(TDFOperador$Freq)*100,3)
)
TDFOperador1
## # A tibble: 5 × 3
## Operadores ni hi
## <chr> <dbl> <dbl>
## 1 Empresa Nacional Estatal 25142 94.4
## 2 Empresas Extranjeras Independientes 164 0.616
## 3 Empresas Extranjeras Mayores 414 1.55
## 4 Empresas Nacionales Privadas 894 3.36
## 5 Otros 29 0.109
Se incorpora la fila de totales para las frecuencias absoluta y relativa.
TDFOperador1$fi <- TDFOperador1$ni / sum(TDFOperador1$ni)
TDFOperador1 <- TDFOperador1[, c("Operadores", "ni", "hi", "fi")]
total_ni <- sum(TDFOperador1$ni)
total_hi <- sum(TDFOperador1$hi)
total_fi <- sum(TDFOperador1$fi)
TDFOperadorFinal <- rbind(TDFOperador1, data.frame(
Operadores = "Total",
ni = total_ni,
hi = total_hi,
fi = total_fi
))
print(TDFOperadorFinal)
## # A tibble: 6 × 4
## Operadores ni hi fi
## <chr> <dbl> <dbl> <dbl>
## 1 Empresa Nacional Estatal 25142 94.4 0.944
## 2 Empresas Extranjeras Independientes 164 0.616 0.00616
## 3 Empresas Extranjeras Mayores 414 1.55 0.0155
## 4 Empresas Nacionales Privadas 894 3.36 0.0336
## 5 Otros 29 0.109 0.00109
## 6 Total 26643 100 1
Se presenta la tabla con formato claro y profesional.
library(gt)
gt(TDFOperadorFinal) %>%
tab_header(
title = md("**Cuadro No.1**"),
subtitle = " Operadores de los pozos petroliferos en Brasil"
) %>%
tab_spanner(
label = md("**Frecuencia Relativa**"),
columns = c(hi, fi)
) %>%
cols_label(
ni = md("**ni**"),
hi = md("Porcentual (%)"),
fi = md("Fracción")
) %>%
fmt_number(columns = hi, decimals = 2) %>%
fmt_number(columns = fi, decimals = 4) %>%
cols_align(align = "center", columns = everything()) %>%
tab_style(
style = list(cell_fill(color = "#2E4053"),
cell_text(color = "white", weight = "bold")),
locations = cells_title()
) %>%
tab_style(
style = list(cell_fill(color = "#F2F3F4"),
cell_text(weight = "bold", color = "#2E4053")),
locations = cells_column_labels()
) %>%
tab_style(
style = list(cell_fill(color = "#2E4053"),
cell_text(color = "white", weight = "bold")),
locations = cells_column_spanners()
) %>%
tab_style(
style = list(cell_fill(color = "#D5D8DC"),
cell_text(weight = "bold", color = "#2E4053")),
locations = cells_body(rows = nrow(TDFOperadorFinal))
) %>%
tab_options(
table.border.top.color = "#2E4053",
table.border.bottom.color = "#2E4053",
column_labels.border.bottom.color = "#2E4053",
data_row.padding = px(6),
table.font.size = px(13)
)
| Cuadro No.1 | |||
| Operadores de los pozos petroliferos en Brasil | |||
| Operadores | ni |
Frecuencia Relativa
|
|
|---|---|---|---|
| Porcentual (%) | Fracción | ||
| Empresa Nacional Estatal | 25142 | 94.37 | 0.9437 |
| Empresas Extranjeras Independientes | 164 | 0.62 | 0.0062 |
| Empresas Extranjeras Mayores | 414 | 1.55 | 0.0155 |
| Empresas Nacionales Privadas | 894 | 3.35 | 0.0336 |
| Otros | 29 | 0.11 | 0.0011 |
| Total | 26643 | 100.00 | 1.0000 |
Se grafica la frecuencia absoluta por grupo.
TDFOperadorFinal <- TDFOperadorFinal[TDFOperadorFinal$Operadores != "Total", ]
par(mar = c(12, 4, 4, 2))
barplot(TDFOperadorFinal$ni,
main = "Gráfica N°1: Distribución en cantidad de operadores",
ylab = "Cantidad",
col = "#2E4053", names.arg = TDFOperadorFinal$Operadores,
las = 2, cex.names = 0.6, cex.axis = 0.8, cex.main = 1)
mtext("Operadores", side = 1, line = 9, adj = 0.5)
Se presenta la distribución porcentual de cada categoría.
par(mar = c(12, 4, 4, 2))
barplot(TDFOperadorFinal$hi,
main = "Gráfica N°3: Distribución en porcentaje de participación de operadores",
ylab = "Porcentaje",
col = "#2E4053", names.arg = TDFOperadorFinal$Operadores,
las = 2, cex.names = 0.6, cex.axis = 0.8, cex.main = 1)
mtext("Operadores", side = 1, line = 9, adj = 0.5)
Se construye un modelo empírico de probabilidad a partir de las frecuencias relativas de la dirección de los pozos.
TDFOperadorFinal_ <- TDFOperadorFinal[
TDFOperadorFinal$Operadores != "Total", ]
P_Operador <- TDFOperadorFinal_$ni /
sum(TDFOperadorFinal_$ni)
par(mar = c(14, 4, 4, 2))
barplot(
P_Operador,
main = "Gráfica N°3: Distribución de Probabilidad según el Operador de los pozos",
ylab = "Probabilidad",
col = "#2E4053",
names.arg = TDFOperadorFinal_$Operadores,
las = 2,
cex.names = 0.6,
cex.axis = 0.8,
cex.main = 1
)
mtext("Operadores", side = 1, line = 12, adj = 0.5)
¿Cuál es la probalidad de qué el operador de un pozo tenga un operador de tipo Empresas Nacionales Privadas?
x <- round(
(TDFOperadorFinal$ni[TDFOperadorFinal$Operadores == "Empresas Nacionales Privadas"] /
sum(TDFOperadorFinal$ni)) * 100, 1)
print(paste("La probabilidad es de:", x, "%"))
## [1] "La probabilidad es de: 3.4 %"
¿Cuántos pozos petroleros pueden tener un operador de tipo Empresas Nacionales Privadas?
p <- x / 100
n <- 100
cantidad_esperada <- n * p
Operador_objetivo <- "Empresas Nacionales Privadas"
cat("Para n =", n, "pozos, la cantidad esperada de Operador de ´pozo de tipo", Operador_objetivo, "=", round(cantidad_esperada, 2), "\n")
## Para n = 100 pozos, la cantidad esperada de Operador de ´pozo de tipo Empresas Nacionales Privadas = 3.4