1 Cargar datos

En esta sección se importa la base original de pozos y se verifica la estructura de los datos.

2 Tabla de distribución de frecuencia del tipo de pozo

Se presenta la tabla de frecuencias de la variable Tipo de Pozo.

Tipo <- Datos$TIPO
TDFTipo_de_Pozo <- as.data.frame(table(Tipo))
TDFTipo_de_Pozo
##           Tipo  Freq
## 1 Exploratório  8334
## 2 Explotatório 21241
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
TDFTipo_de_Pozo$Tipo <- recode(TDFTipo_de_Pozo$Tipo,
"Exploratório" =  "Exploración",
"Explotatório" = "Producción")

3 Cálculo de frecuencias absoluta y relativa

Se calcula la distribución de frecuencias absolutas (ni) y su respectiva proporción porcentual (hi) en función del tipo de pozo.

TDFTipo_de_Pozo$Freq <- as.numeric(as.character(TDFTipo_de_Pozo$Freq))
library(dplyr)
TDFTipo_de_Pozo1 <- Datos$TDFTipo_de_Pozo
TDFTipo_de_Pozo1  <- TDFTipo_de_Pozo %>%
  group_by(Tipo) %>%
  
  summarise( 
    ni = sum(Freq),
    hi = round(sum(Freq) / sum(TDFTipo_de_Pozo$Freq)*100, 2))

TDFTipo_de_Pozo1 <- data.frame(TDFTipo_de_Pozo1)

4 Incorporación de totales

Se incorporan las sumatorias totales de las frecuencias absolutas y relativas porcentuales para validar la integridad de la distribución de los datos.

DFTipo_de_Pozo1 <- TDFTipo_de_Pozo1 [, c("Tipo", "ni", "hi")]
total_ni <- sum(TDFTipo_de_Pozo1$ni) 
total_hi <- sum(TDFTipo_de_Pozo1$hi)
TDFTipo_de_Pozo_Completa <- rbind(TDFTipo_de_Pozo1, data.frame( Tipo = "Total",
                                                             ni = total_ni,
                                                             hi = total_hi))
print(TDFTipo_de_Pozo_Completa)
##          Tipo    ni     hi
## 1 Exploración  8334  28.18
## 2  Producción 21241  71.82
## 3       Total 29575 100.00

5 Presentación tabular de resultados

La siguiente tabla detalla la distribución de frecuencias, tabulada para su respectivo análisis e interpretación.

library(gt)
gt(TDFTipo_de_Pozo_Completa) %>%
  tab_header( 
    title = md("**DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL**"), 
    subtitle = "Clasificación de los Pozos Según su Tipo") %>% 
 cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
DISTRIBUCIÓN DE FRECUENCIAS DE POZOS PETROLEROS DE BRASIL
Clasificación de los Pozos Según su Tipo
Tipo ni hi
Exploración 8334 28.18
Producción 21241 71.82
Total 29575 100.00

6 Gráficas

6.1 Histograma de frecuencia absoluta local

Se muestra la distribución de cantidades por tipo de pozo, sin considerar el total generl.

TDFTipo_de_Pozo_Completa_ <- TDFTipo_de_Pozo_Completa[TDFTipo_de_Pozo_Completa$Tipo!= "Total", ]

barplot(TDFTipo_de_Pozo_Completa_$ni,
        main = "Gráfica N°1: Distribución en cantidad según tipo de pozo",
        xlab = "Tipo de Pozo", ylab = "Cantidad",
        col = "#2E4053", names.arg = TDFTipo_de_Pozo_Completa_$Tipo,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)

6.2 Histograma de frecuencia absoluta global

Se representa la distribución en cantidad por tipo de pozo empleando una escala global.

barplot(TDFTipo_de_Pozo_Completa_$ni,
        main = "Gráfica N°2: Distribución en cantidad según tipo de pozo",
        xlab = "Tipo de Pozo", ylab = "Cantidad",
        col = "#2E4053", names.arg = TDFTipo_de_Pozo_Completa_$Tipo,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1,
        ylim = c(0,30000))

6.3 Histograma de frecuencia relativa local

Se visualiza la distribución porcentual según tipo de pozo, excluyendo el total.

barplot(TDFTipo_de_Pozo_Completa_$hi,
        main = "Gráfica N°3: Distribución porcentual según tipo de pozo",
        xlab = "Tipo de Pozo", ylab = "Cantidad",
        col = "#2E4053", names.arg = TDFTipo_de_Pozo_Completa_$Tipo,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1)

6.4 Histograma de frecuencia relativa global

Se muestra la distribución porcentual de los tipos de pozo utilizando una escala de 0 a 100 %

barplot(TDFTipo_de_Pozo_Completa_$hi,
        main = "Gráfica N°4: Distribución porcentual según tipo de pozo",
        xlab = "Tipo de Pozo", ylab = "Cantidad",
        col = "#2E4053", names.arg = TDFTipo_de_Pozo_Completa_$Tipo,
        las = 1, cex.names = 1, cex.axis = 0.8, cex.main = 1,
        ylim = c(0,100))

6.5 Diagrama circular

Se representa la distribución porcentual de los pozos según su tipo mediante un diagrama circular.

pie(TDFTipo_de_Pozo_Completa_$hi, 
    main = "Gráfica N°5: Distribución porcentual según su tipo de pozo", 
    radius = 0.9,
    labels = paste0(round(TDFTipo_de_Pozo_Completa_$hi,2)),
    col = c("#D9E0E6", "#4C6BA7"),
    cex = 1, cex.main = 1,
    init.angle = 0)

legend(x = -1.95, y =1,
       legend = TDFTipo_de_Pozo_Completa_$Tipo,
       fill = c("#D9E0E6", "#4C6BA7"),
       cex = 1,
       title = "Tipo de Pozo")

7 Resumen Estadístico

Este resumen presenta los indicadores descriptivos de la distribución de las cuencas petrolíferas por regiones de Brasil. Debido a que la variable es cualitativa de tipo nominal, la única medida de tendencia central que resulta aplicable es la moda.

Conclusiones <- data.frame(
Variable = "Tipos de pozos",
`Rango [Min; Max]` = "N/A",
`Media (X̄)` = "N/A",
`Mediana (Me)` = "N/A",
`Moda (Mo)` = "Explotatorio",
`Varianza (S²)` = "N/A",
`Desv. Est. (S)` = "N/A",
`C.V. (%)` = "N/A",
`Asimetría (As)` = "N/A",
`Curtosis (K)` = "N/A",
`Valores Atípicos` = "N/A",
check.names = FALSE
)
library(gt)

gt(Conclusiones) %>%
tab_header(
title = md("**CONCLUSIONES Y ESTADÍSTICOS**"),
subtitle = "Resumen de Indicadores de los Tipos de Pozos Petrolíferos en Brasil") %>%
tab_source_note(source_note = "Autor: Caleb Yanez") %>%
  cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = list(cell_fill(color = "#2E4053"), cell_text(color = "white", weight = "bold")),
    locations = cells_title()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#F2F3F4"), cell_text(weight = "bold", color = "#2E4053")),
    locations = cells_column_labels()
  ) %>%
  tab_options(
    table.border.top.color = "#2E4053",
    table.border.bottom.color = "#2E4053",
    column_labels.border.bottom.color = "#2E4053",
    data_row.padding = px(6))
CONCLUSIONES Y ESTADÍSTICOS
Resumen de Indicadores de los Tipos de Pozos Petrolíferos en Brasil
Variable Rango [Min; Max] Media (X̄) Mediana (Me) Moda (Mo) Varianza (S²) Desv. Est. (S) C.V. (%) Asimetría (As) Curtosis (K) Valores Atípicos
Tipos de pozos N/A N/A N/A Explotatorio N/A N/A N/A N/A N/A N/A
Autor: Caleb Yanez

7.1 Conclusiones

7.2 Análisis Descriptivo

El análisis de tendencia central revela que la moda corresponde a los pozos de categoría Exploratorio Este resultado evidencia la prevalencia de dicha clasificación dentro de la muestra, lo cual refleja una clara priorización operativa hacia la fase de desarrollo y extracción de hidrocarburos en el área de estudio.