1 Configuración y Carga de Datos

Para iniciar el procesamiento estadístico inferencial, se verifica la estructura global del conjunto de datos correspondientes a los bloques contractuales y arrendamientos de hidrocarburos en el estado de Kansas.

datos <- read_csv(file.choose(), show_col_types = FALSE)
cat("Total de registros:", nrow(datos), "\n")
## Total de registros: 47757
cat("Valores únicos de LONGITUDE_LATITUDE_SOURCE:\n")
## Valores únicos de LONGITUDE_LATITUDE_SOURCE:
print(unique(datos$LONGITUDE_LATITUDE_SOURCE))
## [1] "CENTER_OF_SECTION" "QUARTER_CALLS"

2 Extraer Variable

Se realiza el aislamiento de la variable cualitativa nominal Fuente de Coordenadas (LONGITUDE_LATITUDE_SOURCE), la cual indica el método utilizado para determinar la ubicación geográfica del pozo, registrando CENTER_OF_SECTION para pozos ubicados por centro de sección y QUARTER_CALLS para pozos ubicados por llamadas de cuarto.

datos <- datos %>%
  mutate(
    FUENTE = case_when(
      LONGITUDE_LATITUDE_SOURCE == "CENTER_OF_SECTION" ~ "Center of Section",
      LONGITUDE_LATITUDE_SOURCE == "QUARTER_CALLS"     ~ "Quarter Calls",
      TRUE                                             ~ "No registrado"
    )
  ) %>%
  filter(FUENTE != "No registrado")

3 Tabla de Distribución de Frecuencias

Se calcula la distribución de frecuencias absolutas (\(n_i\)) y porcentuales (\(h_i\%\)) para las categorías de la variable cualitativa nominal, respetando la estructura de tres columnas estipulada por la cátedra.

frecuencias_base <- datos %>%
  mutate(FUENTE = factor(FUENTE, levels = c("Center of Section", "Quarter Calls"))) %>%
  group_by(Fuente_de_Coordenadas = FUENTE, .drop = FALSE) %>%
  summarise(Frecuencia_ni = n(), .groups = "drop") %>%
  arrange(Fuente_de_Coordenadas)

tabla_final <- frecuencias_base %>%
  mutate(Porcentaje_hi = (Frecuencia_ni / sum(Frecuencia_ni)) * 100)

total_fila <- data.frame(
  Fuente_de_Coordenadas = "TOTAL",
  Frecuencia_ni         = sum(tabla_final$Frecuencia_ni),
  Porcentaje_hi         = sum(tabla_final$Porcentaje_hi)
)

resultado <- bind_rows(
  tabla_final %>% mutate(Porcentaje_hi = sprintf("%.2f", Porcentaje_hi)),
  total_fila  %>% mutate(Porcentaje_hi = sprintf("%.2f", Porcentaje_hi))
)

kable(
  resultado,
  caption   = "Tabla de Distribución de Frecuencias de la Variable Cualitativa Nominal: Fuente de Coordenadas",
  col.names = c("Fuente de Coordenadas", "Frecuencia (ni)", "Porcentaje (hi%)"),
  align     = c("l", "c", "c")
)
Tabla de Distribución de Frecuencias de la Variable Cualitativa Nominal: Fuente de Coordenadas
Fuente de Coordenadas Frecuencia (ni) Porcentaje (hi%)
Center of Section 26553 55.60
Quarter Calls 21204 44.40
TOTAL 47757 100.00

Autor: Grupo 6