# CARGAR LOS DATOS
setwd("/cloud/project/proyecto")
datos <- read.csv("archivo depurado nuevo 12.csv",
header = TRUE, dec =".",sep=";")
# --- VARIABLE: SITUACAO (ESTADO DEL POZO) ---
c_situacion_limpia <- na.omit(datos$SITUACAO)
orden_productividad <- c(
"PRODUTOR",
"INJETOR",
"EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO",
"E EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO",
"PRODUÇÃO DE AGUA PARA INJEÇÃO",
"EM PERFURAÇÃO",
"EM INTERVENCIÓN PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO*",
"CEDIDO PARA PRODUCCIÓN DE ÁGUA",
"ABANDONADO AGUARDANDO REINICIO DE PERFURAÇÃO",
"ABANDONADO/PARADO AGUARDANDO INTERVENCIÓN PARA AVALIACIÓN, COMPLETAÇÃO O RESTAURACIÓN",
"EM ABANDONO",
"ABANDONADO AGUARDANDO ABANDONO DEFINITIVO/ARRASAMENTO",
"DEVOLVIDO",
"OUTRO",
"NA",
"ABANDONADO DEFINITIVAMENTE",
"ARRASADO",
"ABANDONADO POR LOGÍSTICA EXPLORATÓRIA",
"DE DESCARTE"
)
c_situacion_ordenado <- factor(c_situacion_limpia, levels = orden_productividad, ordered = TRUE)
freq_situacion_ordenado <- table(c_situacion_ordenado)
print(freq_situacion_ordenado)
## c_situacion_ordenado
## PRODUTOR
## 9912
## INJETOR
## 2653
## EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO
## 60
## E EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO
## 0
## PRODUÇÃO DE AGUA PARA INJEÇÃO
## 187
## EM PERFURAÇÃO
## 6
## EM INTERVENCIÓN PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO*
## 0
## CEDIDO PARA PRODUCCIÓN DE ÁGUA
## 0
## ABANDONADO AGUARDANDO REINICIO DE PERFURAÇÃO
## 0
## ABANDONADO/PARADO AGUARDANDO INTERVENCIÓN PARA AVALIACIÓN, COMPLETAÇÃO O RESTAURACIÓN
## 0
## EM ABANDONO
## 8
## ABANDONADO AGUARDANDO ABANDONO DEFINITIVO/ARRASAMENTO
## 3120
## DEVOLVIDO
## 1446
## OUTRO
## 96
## NA
## 0
## ABANDONADO DEFINITIVAMENTE
## 5074
## ARRASADO
## 2193
## ABANDONADO POR LOGÍSTICA EXPLORATÓRIA
## 719
## DE DESCARTE
## 40
cumsum_freq <- cumsum(freq_situacion_ordenado)
total_count <- sum(freq_situacion_ordenado)
print(paste("Total de pozos (sin NA):", total_count))
## [1] "Total de pozos (sin NA): 25514"
print(cumsum_freq)
## PRODUTOR
## 9912
## INJETOR
## 12565
## EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO
## 12625
## E EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO
## 12625
## PRODUÇÃO DE AGUA PARA INJEÇÃO
## 12812
## EM PERFURAÇÃO
## 12818
## EM INTERVENCIÓN PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO*
## 12818
## CEDIDO PARA PRODUCCIÓN DE ÁGUA
## 12818
## ABANDONADO AGUARDANDO REINICIO DE PERFURAÇÃO
## 12818
## ABANDONADO/PARADO AGUARDANDO INTERVENCIÓN PARA AVALIACIÓN, COMPLETAÇÃO O RESTAURACIÓN
## 12818
## EM ABANDONO
## 12826
## ABANDONADO AGUARDANDO ABANDONO DEFINITIVO/ARRASAMENTO
## 15946
## DEVOLVIDO
## 17392
## OUTRO
## 17488
## NA
## 17488
## ABANDONADO DEFINITIVAMENTE
## 22562
## ARRASADO
## 24755
## ABANDONADO POR LOGÍSTICA EXPLORATÓRIA
## 25474
## DE DESCARTE
## 25514
categorias_grupo1 <- c(
"PRODUTOR",
"INJETOR",
"EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO",
"E EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO",
"PRODUCCIÓN DE AGUA PARA INJEÇÃO",
"EM PERFURAÇÃO",
"EM INTERVENCIÓN PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO*",
"CEDIDO PARA PRODUCCIÓN DE ÁGUA",
"ABANDONADO AGUARDANDO REINICIO DE PERFURAÇÃO",
"ABANDONADO/PARADO AGUARDANDO INTERVENCIÓN PARA AVALIACIÓN, COMPLETAÇÃO O RESTAURACIÓN"
)
c_situacion_2grupos <- ifelse(c_situacion_ordenado %in% categorias_grupo1,
"Pozos Activos/Potenciales",
"Pozos Inactivos/Abandonados")
c_situacion_2grupos_ordenado <- factor(c_situacion_2grupos,
levels = c("Pozos Activos/Potenciales", "Pozos Inactivos/Abandonados"),
ordered = TRUE)
TDFc_situacion_2grupos <- table(c_situacion_2grupos_ordenado)
TDFc_situacion_2grupos
## c_situacion_2grupos_ordenado
## Pozos Activos/Potenciales Pozos Inactivos/Abandonados
## 12631 16120
# --- TABLA NO.05: Frecuencias de Situación Agrupada ---
Tabla_situacion <- as.data.frame(TDFc_situacion_2grupos)
Tabla_situacion$hi <- Tabla_situacion$Freq / sum(Tabla_situacion$Freq)
Tabla_situacion$hi_porc <- Tabla_situacion$hi * 100
total_situacion <- data.frame(
Var1 = "Total",
Freq = sum(Tabla_situacion$Freq),
hi = 1,
hi_porc = 100
)
colnames(Tabla_situacion)[1] <- "Var1"
Tabla_situacion_final <- rbind(Tabla_situacion, total_situacion)
colnames(Tabla_situacion_final) <- c("Situacion_Agrupada", "ni", "hi", "hi_porc")
# --- GRÁFICAS LOCALES PARA SITUACION AGRUPADA ---
barplot(Tabla_situacion_final$ni[-nrow(Tabla_situacion_final)],
names.arg = Tabla_situacion_final$Situacion_Agrupada[-nrow(Tabla_situacion_final)],
main = "Gráfica No. 05.1: Cantidad de Pozos por Situación ",
xlab = "Situación",
ylab = "Cantidad de Pozos (ni)",
col = c("darkgreen", "darkred"),
las = 1,
cex.names = 0.8,
cex.axis = 0.8,
ylim = c(0, max(Tabla_situacion_final$ni[-nrow(Tabla_situacion_final)]) * 1.1)
)

barplot(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)],
names.arg = Tabla_situacion_final$Situacion_Agrupada[-nrow(Tabla_situacion_final)],
main = "Gráfica No. 05.2: Porcentaje de Pozos por Situación ",
xlab = "Situación",
ylab = "Porcentaje (hi %)",
col = c("darkgreen", "darkred"),
las = 1,
cex.names = 0.8,
cex.axis = 0.8,
ylim = c(0, max(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)]) * 1.1)
)

# --- GRÁFICA GLOBAL PARA SITUACION AGRUPADA ---
colores_pie_situacion <- c("darkgreen", "darkred")
etiquetas_pastel_situacion <- paste0(round(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)], 1), "%")
pie(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)],
labels = etiquetas_pastel_situacion,
col = colores_pie_situacion,
radius = 1,
cex = 0.8
)
# Leyenda
legend("bottomright",
legend = paste0(Tabla_situacion_final$Situacion_Agrupada[-nrow(Tabla_situacion_final)],
" (", round(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)], 1), "%)"),
fill = colores_pie_situacion,
title = "Situación",
cex = 0.5,
y.intersp = 0.6,
bty = "n"
)

# Definir la conclusión en una variable
conclusion <- "En un total de 25.514 pozos analizados, se determinó que el 43,9% se encuentran en condición activa o con potencial de producción, mientras que el 56,1% están inactivos o abandonados. Esta distribución evidencia una mayoría de pozos fuera de operación, lo cual representa un patrón importante dentro del conjunto de datos.\n\n
Estos resultados permiten identificar una tendencia significativa hacia la inactividad, lo que podría estar relacionado con factores técnicos, económicos o de ubicación. Este hallazgo resulta clave para futuras decisiones sobre mantenimiento, reactivación o abandono definitivo de pozos en determinadas regiones."
# Imprimir la conclusión en la consola
cat(conclusion)
## En un total de 25.514 pozos analizados, se determinó que el 43,9% se encuentran en condición activa o con potencial de producción, mientras que el 56,1% están inactivos o abandonados. Esta distribución evidencia una mayoría de pozos fuera de operación, lo cual representa un patrón importante dentro del conjunto de datos.
##
##
## Estos resultados permiten identificar una tendencia significativa hacia la inactividad, lo que podría estar relacionado con factores técnicos, económicos o de ubicación. Este hallazgo resulta clave para futuras decisiones sobre mantenimiento, reactivación o abandono definitivo de pozos en determinadas regiones.