1. Configuración y Carga de Datos

Para iniciar el procesamiento estadístico, se verifica la estructura global del conjunto de datos correspondientes a los bloques contractuales y arrendamientos de hidrocarburos en el estado de Kansas.

ruta_csv <- "C:/Users/luisq/OneDrive/Desktop/ESTADISTICA/kansas.csv"
datos <- read_delim(ruta_csv, delim = ";", show_col_types = FALSE)
cat("Data set cargada correctamente.\n")
## Data set cargada correctamente.
cat("Total de registros (filas):", nrow(datos), "\n")
## Total de registros (filas): 104173

2. Extraer Variable

Se realiza el aislamiento de la variable cuantitativa discreta STATE_CODE, que representa el identificador numérico asignado a cada estado dentro del sistema de registro administrativo de arrendamientos de hidrocarburos. Según la definición del dominio, el código 15 corresponde al estado de Kansas. Se filtran únicamente los valores válidos presentes en el dataset.

x_raw <- datos %>%
  mutate(SC = suppressWarnings(as.integer(STATE_CODE))) %>%
  filter(!is.na(SC)) %>%
  pull(SC)

n_unique <- length(unique(x_raw))
cat("Observaciones válidas:", length(x_raw), "\n")
## Observaciones válidas: 95979
cat("Valores únicos:", n_unique, "\n")
## Valores únicos: 7
cat("Valores presentes:", paste(sort(unique(x_raw)), collapse = ", "), "\n")
## Valores presentes: 15, 35, 2019, 2026, 4831, 1027711132, 1027711172

3. Determinación del Tratamiento

La variable STATE_CODE presenta únicamente 7 valor único en este dataset (código 15, 35, 1027711132, 1027711172, 4831, 2026, 2019 = Kansas). Al contar con un solo valor, no se aplica agrupación en intervalos ni distribución de frecuencias con múltiples clases: todos los registros pertenecen al mismo estado, por lo que la variable no presenta variabilidad en este conjunto de datos. El análisis se limita a una tabla de frecuencia simple y la descripción del valor constante observado.

4. Tabla de Distribución de Frecuencias

Se presenta la tabla de frecuencias de la variable Código de Estado para los arrendamientos de hidrocarburos registrados en Kansas, EE.UU.

x   <- x_raw
n   <- length(x)
tab <- as.data.frame(table(x), stringsAsFactors = FALSE)
colnames(tab) <- c("STATE_CODE", "ni")
tab$hi_pct  <- round(tab$ni / n * 100, 2)
tab$hi_real <- round(tab$ni / n, 4)
tab$Estado  <- ifelse(tab$STATE_CODE == "15", "Kansas", "Otro")

total_row <- data.frame(
  STATE_CODE = "TOTAL",
  ni         = n,
  hi_pct     = 100.00,
  hi_real    = 1.0000,
  Estado     = "",
  stringsAsFactors = FALSE
)

tabla_final <- bind_rows(tab[, c("STATE_CODE", "Estado", "ni", "hi_pct", "hi_real")],
                         total_row[, c("STATE_CODE", "Estado", "ni", "hi_pct", "hi_real")])

tabla_final %>%
  gt() %>%
  tab_header(
    title    = md("**Tabla N°1: Distribución de Frecuencias**"),
    subtitle = md(paste0(
      "*Variable Cuantitativa Discreta: Código de Estado (STATE_CODE), ",
      "arrendamientos de hidrocarburos, Kansas, EE.UU. (n = ",
      format(n, big.mark = ","), " registros válidos)*"
    ))
  ) %>%
  cols_label(
    STATE_CODE = md("**Código**"),
    Estado     = md("**Estado**"),
    ni         = md("**ni (FA)**"),
    hi_pct     = md("**hi %**"),
    hi_real    = md("**hi (decimal)**")
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#2C2C2C"), cell_text(color = "white", weight = "bold")),
    locations = cells_column_labels()
  ) %>%
  tab_style(
    style = list(cell_fill(color = "#D6D6D6"), cell_text(weight = "bold")),
    locations = cells_body(rows = STATE_CODE == "TOTAL", columns = everything())
  ) %>%
  tab_source_note(source_note = md("*Autor: Leslye Quinchiguango*")) %>%
  tab_options(
    table.width = pct(60), heading.title.font.size = px(16),
    heading.subtitle.font.size = px(12), table.font.size = px(13),
    data_row.padding = px(6),
    table.border.top.style = "hidden", table.border.bottom.style = "hidden"
  )
Tabla N°1: Distribución de Frecuencias
Variable Cuantitativa Discreta: Código de Estado (STATE_CODE), arrendamientos de hidrocarburos, Kansas, EE.UU. (n = 95,979 registros válidos)
Código Estado ni (FA) hi % hi (decimal)
15 Kansas 94548 98.51 0.9851
35 Otro 1426 1.49 0.0149
2019 Otro 1 0.00 0.0000
2026 Otro 1 0.00 0.0000
4831 Otro 1 0.00 0.0000
1027711132 Otro 1 0.00 0.0000
1027711172 Otro 1 0.00 0.0000
TOTAL 95979 100.00 1.0000
Autor: Leslye Quinchiguango

5. Indicadores Estadísticos

Dado que la variable STATE_CODE presenta un único valor en el dataset, los indicadores de dispersión y forma no son aplicables. Se reportan únicamente los estadísticos básicos descriptivos.

data.frame(
  Indicador = c(
    "Tamaño muestral (n)",
    "Valor(es) único(s) observado(s)",
    "Estado(s) correspondiente(s)",
    "Frecuencia absoluta total (ni)",
    "Frecuencia relativa total (hi)",
    "Variabilidad",
    "Valores atípicos (Outliers)"
  ),
  Valor = c(
    format(n, big.mark = ","),
    paste(sort(unique(x_raw)), collapse = ", "),
    paste0("Kansas (código FIPS: ", paste(sort(unique(x_raw)), collapse = ", "), ")"),
    format(n, big.mark = ","),
    "1.0000 (100%)",
    ifelse(n_unique == 1,
           "No aplica — variable constante en este dataset",
           paste0(n_unique, " valores únicos — variable con variabilidad")),
    "No aplica — variable constante en este dataset"
  ),
  stringsAsFactors = FALSE
) %>%
  gt() %>%
  tab_header(
    title    = md("**Tabla N°2: Indicadores Estadísticos**"),
    subtitle = md("*Variable Cuantitativa Discreta: Código de Estado (STATE_CODE)*")
  ) %>%
  cols_label(Indicador = md("**Indicador**"), Valor = md("**Valor**")) %>%
  cols_align(align = "left",  columns = Indicador) %>%
  cols_align(align = "left",  columns = Valor) %>%
  tab_style(
    style = list(cell_fill(color = "#2C2C2C"), cell_text(color = "white", weight = "bold")),
    locations = cells_column_labels()
  ) %>%
  tab_style(
    style = cell_borders(sides = "bottom", color = "#E0E0E0", weight = px(1)),
    locations = cells_body(rows = everything())
  ) %>%
  tab_source_note(source_note = md("*Autor: Leslye Quinchiguango*")) %>%
  tab_options(
    table.width = pct(70), heading.title.font.size = px(15),
    heading.subtitle.font.size = px(11), table.font.size = px(12),
    data_row.padding = px(4),
    table.border.top.style = "hidden", table.border.bottom.style = "hidden"
  )
Tabla N°2: Indicadores Estadísticos
Variable Cuantitativa Discreta: Código de Estado (STATE_CODE)
Indicador Valor
Tamaño muestral (n) 95,979
Valor(es) único(s) observado(s) 15, 35, 2019, 2026, 4831, 1027711132, 1027711172
Estado(s) correspondiente(s) Kansas (código FIPS: 15, 35, 2019, 2026, 4831, 1027711132, 1027711172)
Frecuencia absoluta total (ni) 95,979
Frecuencia relativa total (hi) 1.0000 (100%)
Variabilidad 7 valores únicos — variable con variabilidad
Valores atípicos (Outliers) No aplica — variable constante en este dataset
Autor: Leslye Quinchiguango

6. Conclusiones

La variable Código de Estado presenta 7 valor(es) único(s) en el dataset (código(s): 15, 35, 2019, 2026, 4831, 1027711132, 1027711172 = Kansas), lo que indica que el 100% de los 95,979 arrendamientos registrados pertenecen al estado de Kansas. Al ser una variable constante, no presenta variabilidad, dispersión ni forma de distribución analizables en este conjunto de datos. Por lo tanto, el comportamiento es favorable para los fines del análisis, ya que confirma la homogeneidad geográfica del dataset y garantiza que todos los registros corresponden a un único contexto administrativo y regulatorio, lo que facilita la comparabilidad entre variables.


Autor: Leslye Quinchiguango — Análisis Estadístico, Kansas Hydrocarbon Leases Dataset