En esta sección se importa la base original de pozos y se verifica la estructura de los datos.
Se presenta la tabla de frecuencias de la variable Tipo de Pozo.
Tipo <- Datos$TIPO
TDFTipo_de_Pozo <- as.data.frame(table(Tipo))
TDFTipo_de_Pozo
## Tipo Freq
## 1 Exploratório 8334
## 2 Explotatório 21241
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
TDFTipo_de_Pozo$Tipo <- recode(TDFTipo_de_Pozo$Tipo,
"Exploratório" = "Exploración",
"Explotatório" = "Producción")
Se calcula la distribución de frecuencias absolutas (ni) y su respectiva proporción porcentual (hi) en función del tipo de pozo.
TDFTipo_de_Pozo$Freq <- as.numeric(as.character(TDFTipo_de_Pozo$Freq))
library(dplyr)
TDFTipo_de_Pozo1 <- Datos$TDFTipo_de_Pozo
TDFTipo_de_Pozo1 <- TDFTipo_de_Pozo %>%
group_by(Tipo) %>%
summarise(
ni = sum(Freq),
hi = round(sum(Freq) / sum(TDFTipo_de_Pozo$Freq)*100, 2))
TDFTipo_de_Pozo1 <- data.frame(TDFTipo_de_Pozo1)
Se incorporan las sumatorias totales de las frecuencias absolutas y relativas porcentuales para validar la integridad de la distribución de los datos.
DFTipo_de_Pozo1 <- TDFTipo_de_Pozo1 [, c("Tipo", "ni", "hi")]
total_ni <- sum(TDFTipo_de_Pozo1$ni)
total_hi <- sum(TDFTipo_de_Pozo1$hi)
TDFTipo_de_Pozo_Completa <- rbind(TDFTipo_de_Pozo1, data.frame( Tipo = "Total",
ni = total_ni,
hi = total_hi))
print(TDFTipo_de_Pozo_Completa)
## Tipo ni hi
## 1 Exploración 8334 28.18
## 2 Producción 21241 71.82
## 3 Total 29575 100.00
La siguiente tabla detalla la distribución de frecuencias, tabulada para su respectivo análisis e interpretación.
library(gt)
gt(TDFTipo_de_Pozo_Completa) %>%
tab_header(
title = md("**DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL**"),
subtitle = "Clasificación de los Pozos Según su Tipo") %>%
cols_align(align = "center", columns = everything()) %>%
tab_style(
style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
locations = cells_title()
) %>%
tab_style(
style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
locations = cells_column_labels()
) %>%
tab_options(
table.border.top.color = "#2E4053",
table.border.bottom.color = "#2E4053",
column_labels.border.bottom.color = "#2E4053",
data_row.padding = px(6))
| DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL | ||
| Clasificación de los Pozos Según su Tipo | ||
| Tipo | ni | hi |
|---|---|---|
| Exploración | 8334 | 28.18 |
| Producción | 21241 | 71.82 |
| Total | 29575 | 100.00 |
Se muestra la distribución de cantidades por tipo de pozo, sin considerar el total generl.
TDFTipo_de_Pozo_Completa_ <- TDFTipo_de_Pozo_Completa[TDFTipo_de_Pozo_Completa$Tipo!= "Total", ]
barplot(TDFTipo_de_Pozo_Completa_$ni,
main = "Gráfica N°1: Distribución en cantidad según tipo de pozo",
xlab = "Tipo de Pozo", ylab = "Cantidad",
col = "#B0B8C1", names.arg = TDFTipo_de_Pozo_Completa_$Tipo,
las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)
Se representa la distribución en cantidad por tipo de pozo empleando una escala global.
barplot(TDFTipo_de_Pozo_Completa_$ni,
main = "Gráfica N°2: Distribución en cantidad según tipo de pozo",
xlab = "Tipo de Pozo", ylab = "Cantidad",
col = "#B0B8C1", names.arg = TDFTipo_de_Pozo_Completa_$Tipo,
las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1,
ylim = c(0,30000))
Se visualiza la distribución porcentual según tipo de pozo, excluyendo el total.
barplot(TDFTipo_de_Pozo_Completa_$hi,
main = "Gráfica N°3: Distribución porcentual según tipo de pozo",
xlab = "Tipo de Pozo", ylab = "Cantidad",
col = "#B0B8C1", names.arg = TDFTipo_de_Pozo_Completa_$Tipo,
las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)
Se muestra la distribución porcentual de los tipos de pozo utilizando una escala de 0 a 100 %
barplot(TDFTipo_de_Pozo_Completa_$hi,
main = "Gráfica N°4: Distribución porcentual según tipo de pozo",
xlab = "Tipo de Pozo", ylab = "Cantidad",
col = "#B0B8C1", names.arg = TDFTipo_de_Pozo_Completa_$Tipo,
las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1,
ylim = c(0,100))
Se representa la distribución porcentual de los pozos según su tipo mediante un diagrama circular.
pie(TDFTipo_de_Pozo_Completa_$hi,
main = "Gráfica N°5: Distribución porcentual según su tipo de pozo",
radius = 0.9,
labels = paste0(round(TDFTipo_de_Pozo_Completa_$hi,2)),
col = c("#D9E0E6", "#4C6BA7"),
cex = 1, cex.main = 1,
init.angle = 0)
legend(x = -1.95, y =1,
legend = TDFTipo_de_Pozo_Completa_$Tipo,
fill = c("#D9E0E6", "#4C6BA7"),
cex = 1,
title = "Tipo de Pozo")
Este resumen presenta los indicadores descriptivos de la distribución de las cuencas petrolíferas por regiones de Brasil. Debido a que la variable es cualitativa de tipo nominal, la única medida de tendencia central que resulta aplicable es la moda.
Conclusiones <- data.frame(
Variable = "Tipos de pozos",
`Rango [Min; Max]` = "N/A",
`Media (X̄)` = "N/A",
`Mediana (Me)` = "N/A",
`Moda (Mo)` = "Explotatorio",
`Varianza (S²)` = "N/A",
`Desv. Est. (S)` = "N/A",
`C.V. (%)` = "N/A",
`Asimetría (As)` = "N/A",
`Curtosis (K)` = "N/A",
`Valores Atípicos` = "N/A",
check.names = FALSE
)
library(gt)
gt(Conclusiones) %>%
tab_header(
title = md("**CONCLUSIONES Y ESTADÍSTICOS**"),
subtitle = "Resumen de Indicadores de los Tipos de Pozos Petrolíferos en Brasil") %>%
tab_source_note(source_note = "Autor: Caleb Yanez") %>%
cols_align(align = "center", columns = everything()) %>%
tab_style(
style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
locations = cells_title()
) %>%
tab_style(
style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
locations = cells_column_labels()
) %>%
tab_options(
table.border.top.color = "#2E4053",
table.border.bottom.color = "#2E4053",
column_labels.border.bottom.color = "#2E4053",
data_row.padding = px(6))
| CONCLUSIONES Y ESTADÍSTICOS | ||||||||||
| Resumen de Indicadores de los Tipos de Pozos Petrolíferos en Brasil | ||||||||||
| Variable | Rango [Min; Max] | Media (X̄) | Mediana (Me) | Moda (Mo) | Varianza (S²) | Desv. Est. (S) | C.V. (%) | Asimetría (As) | Curtosis (K) | Valores Atípicos |
|---|---|---|---|---|---|---|---|---|---|---|
| Tipos de pozos | N/A | N/A | N/A | Explotatorio | N/A | N/A | N/A | N/A | N/A | N/A |
| Autor: Caleb Yanez | ||||||||||
El análisis de tendencia central revela que la moda corresponde a los pozos de categoría Exploratorio Este resultado evidencia la prevalencia de dicha clasificación dentro de la muestra, lo cual refleja una clara priorización operativa hacia la fase de desarrollo y extracción de hidrocarburos en el área de estudio.