library(dplyr)
library(readxl)
library(gt)
datos    <- read_excel("dataset_mundial_petro.xlsx")
Variable <- datos$`Unit type`

1 Configuración y Carga de Datos

str(datos)
## tibble [8,334 × 23] (S3: tbl_df/tbl/data.frame)
##  $ Unit ID                           : chr [1:8334] "OG0000001" "OG0000002" "OG0000006" "OG0000007" ...
##  $ Unit Name                         : chr [1:8334] "Matzen" "Abalone" "Aguilhada" "Agulha" ...
##  $ Unit name local script            : chr [1:8334] NA "Abalone" "Aguilhada" "Agulha" ...
##  $ Fuel type                         : chr [1:8334] "oil and gas" "oil and gas" "oil and gas" "oil and gas" ...
##  $ Unit type                         : chr [1:8334] "field" "field" "field" "field" ...
##  $ Country                           : chr [1:8334] "Austria" "Brazil" "Brazil" "Brazil" ...
##  $ Subnational unit (province, state): chr [1:8334] NA "Espírito Santo" "Sergipe" "Rio Grande do Norte" ...
##  $ Latitude                          : num [1:8334] 48.4 -21.4 -10.7 -4.9 -22.1 ...
##  $ Longitude                         : num [1:8334] 16.7 -39.6 -36.9 -36.3 -40 ...
##  $ Location accuracy                 : chr [1:8334] "approximate" "exact" "exact" "exact" ...
##  $ Status                            : chr [1:8334] "operating" "operating" "operating" "operating" ...
##  $ Status year                       : num [1:8334] 2023 2022 2022 2022 2022 ...
##  $ Discovery year                    : num [1:8334] 1949 2001 1966 1975 1984 ...
##  $ FID Year                          : chr [1:8334] NA NA NA NA ...
##  $ Production start year             : chr [1:8334] "1951" "2009" "1969" "1979" ...
##  $ Operator                          : chr [1:8334] "OMV" "Shell Brasil Petróleo Ltda." NA NA ...
##  $ Owner                             : chr [1:8334] "OMV (100%)" "Shell Brasil (50%);ONGC Campos (27%);Qatarenergy (23%)" "Petrobras (100%)" "Petrobras (100%)" ...
##  $ Parent                            : chr [1:8334] "OMV Aktiengesellschaft (100%)" "Shell plc (50%);Oil and Natural Gas Corporation (ONGC) (27%)" "Petróleo Brasileiro S.A. (100%)" "Petróleo Brasileiro S.A. (100%)" ...
##  $ Basin                             : chr [1:8334] NA NA NA NA ...
##  $ Concession / block                : chr [1:8334] NA NA NA NA ...
##  $ Project or complex                : chr [1:8334] "Matzen" NA NA NA ...
##  $ Government unit ID                : chr [1:8334] NA NA NA NA ...
##  $ Wiki URL                          : chr [1:8334] "https://www.gem.wiki/Matzen_Oil_and_Gas_Field_(Austria)" "https://www.gem.wiki/Abalone_Oil_and_Gas_Field_%28Esp%C3%ADrito_Santo%2C_Brazil%29" "https://www.gem.wiki/Aguilhada_Oil_and_Gas_Field_%28Sergipe%2C_Brazil%29" "https://www.gem.wiki/Agulha_Oil_and_Gas_Field_%28Rio_Grande_do_Norte%2C_Brazil%29" ...

2 Extraer Variable

Se extrajo la variable Unit type del dataset, la cual clasifica cada registro según el tipo de unidad de explotación. Se identificaron categorías como field, asset, pool, project, block y complex, entre otras, sobre un total de 8,334 observaciones.

Variable <- datos$`Unit type`

3 Tabla de Distribución de Frecuencias

Se calculó la distribución de frecuencias absolutas (\(n_i\)) y relativas (\(h_i\)). Los resultados indican que la categoría field es la predominante con el 52.03% de los registros, seguida de asset con el 37.49%, concentrando entre ambas casi el 90% del total de unidades registradas.

Tabla <- as.data.frame(table(Variable))
colnames(Tabla) <- c("Tipo de Unidad", "ni")
Tabla$"Tipo de Unidad" <- as.character(Tabla$"Tipo de Unidad")
Tabla$`hi (%)` <- round((Tabla$ni / sum(Tabla$ni)) * 100, 2)

fila_total <- tibble(
  `Tipo de Unidad` = "TOTAL",
  ni         = sum(Tabla$ni),
  `hi (%)`   = 100.00
)

tabla_Final <- bind_rows(Tabla, fila_total)

tabla_gt <- tabla_Final %>%
  gt() %>%
  tab_header(
    title = md("**Tabla N°7.4 de Distribución de Frecuencias por Tipo de Unidad de los Yacimientos de Petróleo y Gas**")
  ) %>%
  tab_source_note(
    source_note = "Autor: Grupo 5"
  ) %>%
  cols_label(
    `Tipo de Unidad` = "Tipo de Unidad",
    ni       = "Frecuencia (ni)",
    `hi (%)` = "Porcentaje (hi%)"
  ) %>%
  fmt_number(
    columns  = `hi (%)`,
    decimals = 2
  ) %>%
  tab_options(
    heading.title.font.size        = px(16),
    column_labels.background.color = "#F0F0F0"
  )

tabla_gt
Tabla N°7.4 de Distribución de Frecuencias por Tipo de Unidad de los Yacimientos de Petróleo y Gas
Tipo de Unidad Frecuencia (ni) Porcentaje (hi%)
area 14 0.17
asset 3124 37.49
basin 3 0.04
block 111 1.33
complex 73 0.88
concession 16 0.19
field 4336 52.03
phase 11 0.13
pool 461 5.53
project 183 2.20
sub-basin 2 0.02
TOTAL 8334 100.00
Autor: Grupo 5