library(dplyr)
library(readxl)
library(gt)
datos    <- read_excel("dataset_mundial_petro.xlsx")
Variable <- datos$`Fuel type`

1 Configuración y Carga de Datos

str(datos)
## tibble [8,334 × 23] (S3: tbl_df/tbl/data.frame)
##  $ Unit ID                           : chr [1:8334] "OG0000001" "OG0000002" "OG0000006" "OG0000007" ...
##  $ Unit Name                         : chr [1:8334] "Matzen" "Abalone" "Aguilhada" "Agulha" ...
##  $ Unit name local script            : chr [1:8334] NA "Abalone" "Aguilhada" "Agulha" ...
##  $ Fuel type                         : chr [1:8334] "oil and gas" "oil and gas" "oil and gas" "oil and gas" ...
##  $ Unit type                         : chr [1:8334] "field" "field" "field" "field" ...
##  $ Country                           : chr [1:8334] "Austria" "Brazil" "Brazil" "Brazil" ...
##  $ Subnational unit (province, state): chr [1:8334] NA "Espírito Santo" "Sergipe" "Rio Grande do Norte" ...
##  $ Latitude                          : num [1:8334] 48.4 -21.4 -10.7 -4.9 -22.1 ...
##  $ Longitude                         : num [1:8334] 16.7 -39.6 -36.9 -36.3 -40 ...
##  $ Location accuracy                 : chr [1:8334] "approximate" "exact" "exact" "exact" ...
##  $ Status                            : chr [1:8334] "operating" "operating" "operating" "operating" ...
##  $ Status year                       : num [1:8334] 2023 2022 2022 2022 2022 ...
##  $ Discovery year                    : num [1:8334] 1949 2001 1966 1975 1984 ...
##  $ FID Year                          : chr [1:8334] NA NA NA NA ...
##  $ Production start year             : chr [1:8334] "1951" "2009" "1969" "1979" ...
##  $ Operator                          : chr [1:8334] "OMV" "Shell Brasil Petróleo Ltda." NA NA ...
##  $ Owner                             : chr [1:8334] "OMV (100%)" "Shell Brasil (50%);ONGC Campos (27%);Qatarenergy (23%)" "Petrobras (100%)" "Petrobras (100%)" ...
##  $ Parent                            : chr [1:8334] "OMV Aktiengesellschaft (100%)" "Shell plc (50%);Oil and Natural Gas Corporation (ONGC) (27%)" "Petróleo Brasileiro S.A. (100%)" "Petróleo Brasileiro S.A. (100%)" ...
##  $ Basin                             : chr [1:8334] NA NA NA NA ...
##  $ Concession / block                : chr [1:8334] NA NA NA NA ...
##  $ Project or complex                : chr [1:8334] "Matzen" NA NA NA ...
##  $ Government unit ID                : chr [1:8334] NA NA NA NA ...
##  $ Wiki URL                          : chr [1:8334] "https://www.gem.wiki/Matzen_Oil_and_Gas_Field_(Austria)" "https://www.gem.wiki/Abalone_Oil_and_Gas_Field_%28Esp%C3%ADrito_Santo%2C_Brazil%29" "https://www.gem.wiki/Aguilhada_Oil_and_Gas_Field_%28Sergipe%2C_Brazil%29" "https://www.gem.wiki/Agulha_Oil_and_Gas_Field_%28Rio_Grande_do_Norte%2C_Brazil%29" ...

2 Extraer Variable

Se extrajo la variable Fuel type del dataset, la cual clasifica cada yacimiento según el tipo de hidrocarburo que extrae. Se identificaron 4 categorías: oil and gas, gas, oil, y gas and condensate, sobre un total de 8,334 observaciones.

Variable <- datos$`Fuel type`

3 Tabla de Distribución de Frecuencias

Se calculó la distribución de frecuencias absolutas (\(n_i\)) y relativas (\(h_i\)). Los resultados indican que la categoría oil and gas predomina ampliamente con el 69.99% de los yacimientos, seguida de gas con 14.84% y oil con 14.80%.

Tabla <- as.data.frame(table(Variable))
colnames(Tabla) <- c("Tipo de Combustible", "ni")
Tabla$"Tipo de Combustible" <- as.character(Tabla$"Tipo de Combustible")
Tabla$`hi (%)` <- round((Tabla$ni / sum(Tabla$ni)) * 100, 2)

fila_total <- tibble(
  `Tipo de Combustible` = "TOTAL",
  ni         = sum(Tabla$ni),
  `hi (%)`   = 100.00
)

tabla_Final <- bind_rows(Tabla, fila_total)

tabla_gt <- tabla_Final %>%
  gt() %>%
  tab_header(
    title = md("**Tabla N°7.3 de Distribución de Frecuencias por Tipo de Combustible de los Yacimientos de Petróleo y Gas**")
  ) %>%
  tab_source_note(
    source_note = "Autor: Grupo 5"
  ) %>%
  cols_label(
    `Tipo de Combustible` = "Tipo de Combustible",
    ni       = "Frecuencia (ni)",
    `hi (%)` = "Porcentaje (hi%)"
  ) %>%
  fmt_number(
    columns  = `hi (%)`,
    decimals = 2
  ) %>%
  tab_options(
    heading.title.font.size        = px(16),
    column_labels.background.color = "#F0F0F0"
  )

tabla_gt
Tabla N°7.3 de Distribución de Frecuencias por Tipo de Combustible de los Yacimientos de Petróleo y Gas
Tipo de Combustible Frecuencia (ni) Porcentaje (hi%)
gas 1237 14.84
gas and condensate 31 0.37
oil 1233 14.79
oil and gas 5833 69.99
TOTAL 8334 100.00
Autor: Grupo 5