Para iniciar el procesamiento estadístico, se verifica la estructura global del conjunto de datos correspondientes a los bloques contractuales y arrendamientos de hidrocarburos en el estado de Kansas.
ruta_csv <- "C:/Users/luisq/OneDrive/Desktop/ESTADISTICA/kansas.csv"
datos <- read_delim(ruta_csv, delim = ";", show_col_types = FALSE)
cat("Data set cargada correctamente.\n")
## Data set cargada correctamente.
cat("Total de registros (filas):", nrow(datos), "\n")
## Total de registros (filas): 104173
Se realiza el aislamiento de la variable cuantitativa discreta STATE_CODE, que representa el identificador numérico asignado a cada estado dentro del sistema de registro administrativo de arrendamientos de hidrocarburos. Según la definición del dominio, el código 15 corresponde al estado de Kansas. Se filtran únicamente los valores válidos presentes en el dataset.
x_raw <- datos %>%
mutate(SC = suppressWarnings(as.integer(STATE_CODE))) %>%
filter(!is.na(SC)) %>%
pull(SC)
n_unique <- length(unique(x_raw))
cat("Observaciones válidas:", length(x_raw), "\n")
## Observaciones válidas: 95979
cat("Valores únicos:", n_unique, "\n")
## Valores únicos: 7
cat("Valores presentes:", paste(sort(unique(x_raw)), collapse = ", "), "\n")
## Valores presentes: 15, 35, 2019, 2026, 4831, 1027711132, 1027711172
La variable STATE_CODE presenta únicamente 7 valor único en este dataset (código 15, 35, 1027711132, 1027711172, 4831, 2026, 2019 = Kansas). Al contar con un solo valor, no se aplica agrupación en intervalos ni distribución de frecuencias con múltiples clases: todos los registros pertenecen al mismo estado, por lo que la variable no presenta variabilidad en este conjunto de datos. El análisis se limita a una tabla de frecuencia simple y la descripción del valor constante observado.
Se presenta la tabla de frecuencias de la variable Código de Estado para los arrendamientos de hidrocarburos registrados en Kansas, EE.UU.
x <- x_raw
n <- length(x)
tab <- as.data.frame(table(x), stringsAsFactors = FALSE)
colnames(tab) <- c("STATE_CODE", "ni")
tab$hi_pct <- round(tab$ni / n * 100, 2)
tab$hi_real <- round(tab$ni / n, 4)
tab$Estado <- ifelse(tab$STATE_CODE == "15", "Kansas", "Otro")
total_row <- data.frame(
STATE_CODE = "TOTAL",
ni = n,
hi_pct = 100.00,
hi_real = 1.0000,
Estado = "",
stringsAsFactors = FALSE
)
tabla_final <- bind_rows(tab[, c("STATE_CODE", "Estado", "ni", "hi_pct", "hi_real")],
total_row[, c("STATE_CODE", "Estado", "ni", "hi_pct", "hi_real")])
tabla_final %>%
gt() %>%
tab_header(
title = md("**Tabla N°1: Distribución de Frecuencias**"),
subtitle = md(paste0(
"*Variable Cuantitativa Discreta: Código de Estado (STATE_CODE), ",
"arrendamientos de hidrocarburos, Kansas, EE.UU. (n = ",
format(n, big.mark = ","), " registros válidos)*"
))
) %>%
cols_label(
STATE_CODE = md("**Código**"),
Estado = md("**Estado**"),
ni = md("**ni (FA)**"),
hi_pct = md("**hi %**"),
hi_real = md("**hi (decimal)**")
) %>%
tab_style(
style = list(cell_fill(color = "#2C2C2C"), cell_text(color = "white", weight = "bold")),
locations = cells_column_labels()
) %>%
tab_style(
style = list(cell_fill(color = "#D6D6D6"), cell_text(weight = "bold")),
locations = cells_body(rows = STATE_CODE == "TOTAL", columns = everything())
) %>%
tab_source_note(source_note = md("*Autor: Leslye Quinchiguango*")) %>%
tab_options(
table.width = pct(60), heading.title.font.size = px(16),
heading.subtitle.font.size = px(12), table.font.size = px(13),
data_row.padding = px(6),
table.border.top.style = "hidden", table.border.bottom.style = "hidden"
)
| Tabla N°1: Distribución de Frecuencias | ||||
| Variable Cuantitativa Discreta: Código de Estado (STATE_CODE), arrendamientos de hidrocarburos, Kansas, EE.UU. (n = 95,979 registros válidos) | ||||
| Código | Estado | ni (FA) | hi % | hi (decimal) |
|---|---|---|---|---|
| 15 | Kansas | 94548 | 98.51 | 0.9851 |
| 35 | Otro | 1426 | 1.49 | 0.0149 |
| 2019 | Otro | 1 | 0.00 | 0.0000 |
| 2026 | Otro | 1 | 0.00 | 0.0000 |
| 4831 | Otro | 1 | 0.00 | 0.0000 |
| 1027711132 | Otro | 1 | 0.00 | 0.0000 |
| 1027711172 | Otro | 1 | 0.00 | 0.0000 |
| TOTAL | 95979 | 100.00 | 1.0000 | |
| Autor: Leslye Quinchiguango | ||||
Dado que la variable STATE_CODE presenta un único valor en el dataset, los indicadores de dispersión y forma no son aplicables. Se reportan únicamente los estadísticos básicos descriptivos.
data.frame(
Indicador = c(
"Tamaño muestral (n)",
"Valor(es) único(s) observado(s)",
"Estado(s) correspondiente(s)",
"Frecuencia absoluta total (ni)",
"Frecuencia relativa total (hi)",
"Variabilidad",
"Valores atípicos (Outliers)"
),
Valor = c(
format(n, big.mark = ","),
paste(sort(unique(x_raw)), collapse = ", "),
paste0("Kansas (código FIPS: ", paste(sort(unique(x_raw)), collapse = ", "), ")"),
format(n, big.mark = ","),
"1.0000 (100%)",
ifelse(n_unique == 1,
"No aplica — variable constante en este dataset",
paste0(n_unique, " valores únicos — variable con variabilidad")),
"No aplica — variable constante en este dataset"
),
stringsAsFactors = FALSE
) %>%
gt() %>%
tab_header(
title = md("**Tabla N°2: Indicadores Estadísticos**"),
subtitle = md("*Variable Cuantitativa Discreta: Código de Estado (STATE_CODE)*")
) %>%
cols_label(Indicador = md("**Indicador**"), Valor = md("**Valor**")) %>%
cols_align(align = "left", columns = Indicador) %>%
cols_align(align = "left", columns = Valor) %>%
tab_style(
style = list(cell_fill(color = "#2C2C2C"), cell_text(color = "white", weight = "bold")),
locations = cells_column_labels()
) %>%
tab_style(
style = cell_borders(sides = "bottom", color = "#E0E0E0", weight = px(1)),
locations = cells_body(rows = everything())
) %>%
tab_source_note(source_note = md("*Autor: Leslye Quinchiguango*")) %>%
tab_options(
table.width = pct(70), heading.title.font.size = px(15),
heading.subtitle.font.size = px(11), table.font.size = px(12),
data_row.padding = px(4),
table.border.top.style = "hidden", table.border.bottom.style = "hidden"
)
| Tabla N°2: Indicadores Estadísticos | |
| Variable Cuantitativa Discreta: Código de Estado (STATE_CODE) | |
| Indicador | Valor |
|---|---|
| Tamaño muestral (n) | 95,979 |
| Valor(es) único(s) observado(s) | 15, 35, 2019, 2026, 4831, 1027711132, 1027711172 |
| Estado(s) correspondiente(s) | Kansas (código FIPS: 15, 35, 2019, 2026, 4831, 1027711132, 1027711172) |
| Frecuencia absoluta total (ni) | 95,979 |
| Frecuencia relativa total (hi) | 1.0000 (100%) |
| Variabilidad | 7 valores únicos — variable con variabilidad |
| Valores atípicos (Outliers) | No aplica — variable constante en este dataset |
| Autor: Leslye Quinchiguango | |
La variable Código de Estado presenta 7 valor(es) único(s) en el dataset (código(s): 15, 35, 2019, 2026, 4831, 1027711132, 1027711172 = Kansas), lo que indica que el 100% de los 95,979 arrendamientos registrados pertenecen al estado de Kansas. Al ser una variable constante, no presenta variabilidad, dispersión ni forma de distribución analizables en este conjunto de datos. Por lo tanto, el comportamiento es favorable para los fines del análisis, ya que confirma la homogeneidad geográfica del dataset y garantiza que todos los registros corresponden a un único contexto administrativo y regulatorio, lo que facilita la comparabilidad entre variables.
Autor: Leslye Quinchiguango — Análisis Estadístico, Kansas Hydrocarbon Leases Dataset