Variable Cualitativa Nominal: Clasificacion
1. Carga y Preparacion de los Datos
datos <- read_delim("PRODUCCION_DE_POZOS.csv", delim = ";")
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
## dat <- vroom(...)
## problems(dat)
## Rows: 400759 Columns: 40
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (27): idempresa, prod_pet, prod_gas, prod_agua, tef, tipoextraccion, ti...
## dbl (10): anio, mes, idpozo, iny_agua, iny_gas, iny_co2, iny_otro, vida_uti...
## lgl (2): rectificado, habilitado
## dttm (1): fechaingreso
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
2. Identificacion de las Clasificaciones
clasif_data <- datos$clasificacion[!is.na(datos$clasificacion)]
clasificaciones <- c(
"EXPLOTACION",
"EXPLORACION",
"SERVICIO"
)
3. Tabla de Frecuencias
ni_cl <- as.numeric(
table(
factor(
clasif_data,
levels = clasificaciones
)
)
)
hi_cl <- ni_cl / sum(ni_cl) * 100
Tabla Nro. 1
tabla_clasif <- data.frame(
Clasificacion = clasificaciones,
ni = ni_cl,
hi = hi_cl
)
tabla_clasif_r <- tabla_clasif %>%
add_row(
Clasificacion = "Total",
ni = sum(ni_cl),
hi = sum(hi_cl)
)
tabla_clasif_r %>%
mutate(hi = round(hi, 4)) %>%
gt() %>%
tab_header(
title = md("**Tabla Nro. 1**"),
subtitle = md(
"Distribucion por clasificacion de la frecuencia de produccion en pozos de gas y petroleo no convencional"
)
) %>%
cols_label(
Clasificacion = "Clasificacion",
ni = "Frecuencia absoluta (ni)",
hi = "Frecuencia relativa (%)"
) %>%
tab_source_note(
source_note = md(
"Elaborado por: Grupo - Carrera de Petroleos"
)
) %>%
opt_all_caps() %>%
tab_style(
style = cell_text(weight = "bold"),
locations = cells_body(
rows = Clasificacion == "Total"
)
)
| Tabla Nro. 1 |
| Distribucion por clasificacion de la frecuencia de produccion en pozos de gas y petroleo no convencional |
| Clasificacion |
Frecuencia absoluta (ni) |
Frecuencia relativa (%) |
| EXPLOTACION |
362743 |
90.7252 |
| EXPLORACION |
36296 |
9.0779 |
| SERVICIO |
787 |
0.1968 |
| Total |
399826 |
100.0000 |
| Elaborado por: Grupo - Carrera de Petroleos |
4. Diagramas de Barras
Grafica 1. Frecuencia Absoluta
par(mar = c(6, 5, 4, 2))
barplot(
ni_cl,
names.arg = clasificaciones,
las = 1,
col = "gray80",
main = "Grafica 1: Distribucion por clasificacion de la frecuencia absoluta de produccion en pozos no convencionales",
ylab = "Frecuencia absoluta (ni)",
xlab = "Clasificacion",
ylim = c(0, max(ni_cl) * 1.15)
)

Grafica 2. Frecuencia Relativa
par(mar = c(6, 5, 4, 2))
barplot(
hi_cl,
names.arg = clasificaciones,
las = 1,
col = "lightblue",
main = "Grafica 2: Distribucion por clasificacion de la frecuencia relativa de produccion en pozos no convencionales",
ylab = "Frecuencia relativa (%)",
xlab = "Clasificacion",
ylim = c(0, max(hi_cl) * 1.15)
)

5. Diagrama Circular
Grafica 3. Distribucion Porcentual
hi_cl_red <- round(hi_cl, 4)
colores <- c(
"#66c2a5",
"#fc8d62",
"#8da0cb"
)
pie(
hi_cl_red,
col = colores,
labels = paste0(hi_cl_red, " %"),
main = "Grafica 3: Distribucion porcentual por clasificacion de produccion en pozos no convencionales"
)
legend(
"topright",
legend = clasificaciones,
fill = colores,
cex = 0.8,
bty = "n"
)

6. Indicadores Estadisticos
indice_moda <- which.max(ni_cl)
moda_clasif <- clasificaciones[indice_moda]
moda_valor <- ni_cl[indice_moda]
moda_hi <- round(hi_cl[indice_moda], 4)
data.frame(
Variable = "Clasificacion",
Indicador = "Moda",
Resultado = paste0(
moda_clasif,
" (",
moda_valor,
" registros, ",
moda_hi,
"%)"
)
) %>%
gt() %>%
tab_header(
title = md("**Tabla Nro. 2**"),
subtitle = md(
"Indicadores estadisticos de la variable clasificacion en pozos no convencionales"
)
) %>%
cols_label(
Variable = "Variable analizada",
Indicador = "Indicador estadistico",
Resultado = "Resultado"
) %>%
tab_source_note(
source_note = md(
"Elaborado por: Grupo - Carrera de Petroleos"
)
) %>%
opt_all_caps() %>%
tab_style(
style = cell_text(weight = "bold"),
locations = cells_body()
)
| Tabla Nro. 2 |
| Indicadores estadisticos de la variable clasificacion en pozos no convencionales |
| Variable analizada |
Indicador estadistico |
Resultado |
| Clasificacion |
Moda |
EXPLOTACION (362743 registros, 90.7252%) |
| Elaborado por: Grupo - Carrera de Petroleos |
7. Conclusion
cat(
"La variable Clasificacion corresponde a una variable cualitativa nominal, empleada para identificar la etapa operativa de los pozos de gas y petroleo no convencional. El analisis realizado permitio identificar que la clasificacion con mayor frecuencia de registros fue ",
moda_clasif,
", con un total de ",
moda_valor,
" registros equivalentes al ",
moda_hi,
"% del total analizado."
)
## La variable Clasificacion corresponde a una variable cualitativa nominal, empleada para identificar la etapa operativa de los pozos de gas y petroleo no convencional. El analisis realizado permitio identificar que la clasificacion con mayor frecuencia de registros fue EXPLOTACION , con un total de 362743 registros equivalentes al 90.7252 % del total analizado.