# CARGAR LOS DATOS
setwd("/cloud/project/proyecto")
datos <- read.csv("archivo depurado nuevo 12.csv",
header = TRUE, dec =".",sep=";")
# --- VARIABLE: SITUACAO (ESTADO DEL POZO) ---
c_situacion_limpia <- na.omit(datos$SITUACAO)
orden_productividad <- c(
"PRODUTOR",
"INJETOR",
"EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO",
"E EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO",
"PRODUÇÃO DE AGUA PARA INJEÇÃO",
"EM PERFURAÇÃO",
"EM INTERVENCIÓN PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO*",
"CEDIDO PARA PRODUCCIÓN DE ÁGUA",
"ABANDONADO AGUARDANDO REINICIO DE PERFURAÇÃO",
"ABANDONADO/PARADO AGUARDANDO INTERVENCIÓN PARA AVALIACIÓN, COMPLETAÇÃO O RESTAURACIÓN",
"EM ABANDONO",
"ABANDONADO AGUARDANDO ABANDONO DEFINITIVO/ARRASAMENTO",
"DEVOLVIDO",
"OUTRO",
"NA",
"ABANDONADO DEFINITIVAMENTE",
"ARRASADO",
"ABANDONADO POR LOGÍSTICA EXPLORATÓRIA",
"DE DESCARTE"
)
c_situacion_ordenado <- factor(c_situacion_limpia, levels = orden_productividad, ordered = TRUE)
freq_situacion_ordenado <- table(c_situacion_ordenado)
print(freq_situacion_ordenado)
## c_situacion_ordenado
## PRODUTOR
## 9912
## INJETOR
## 2653
## EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO
## 60
## E EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO
## 0
## PRODUÇÃO DE AGUA PARA INJEÇÃO
## 187
## EM PERFURAÇÃO
## 6
## EM INTERVENCIÓN PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO*
## 0
## CEDIDO PARA PRODUCCIÓN DE ÁGUA
## 0
## ABANDONADO AGUARDANDO REINICIO DE PERFURAÇÃO
## 0
## ABANDONADO/PARADO AGUARDANDO INTERVENCIÓN PARA AVALIACIÓN, COMPLETAÇÃO O RESTAURACIÓN
## 0
## EM ABANDONO
## 8
## ABANDONADO AGUARDANDO ABANDONO DEFINITIVO/ARRASAMENTO
## 3120
## DEVOLVIDO
## 1446
## OUTRO
## 96
## NA
## 0
## ABANDONADO DEFINITIVAMENTE
## 5074
## ARRASADO
## 2193
## ABANDONADO POR LOGÍSTICA EXPLORATÓRIA
## 719
## DE DESCARTE
## 40
cumsum_freq <- cumsum(freq_situacion_ordenado)
total_count <- sum(freq_situacion_ordenado)
print(paste("Total de pozos (sin NA):", total_count))
## [1] "Total de pozos (sin NA): 25514"
print(cumsum_freq)
## PRODUTOR
## 9912
## INJETOR
## 12565
## EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO
## 12625
## E EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO
## 12625
## PRODUÇÃO DE AGUA PARA INJEÇÃO
## 12812
## EM PERFURAÇÃO
## 12818
## EM INTERVENCIÓN PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO*
## 12818
## CEDIDO PARA PRODUCCIÓN DE ÁGUA
## 12818
## ABANDONADO AGUARDANDO REINICIO DE PERFURAÇÃO
## 12818
## ABANDONADO/PARADO AGUARDANDO INTERVENCIÓN PARA AVALIACIÓN, COMPLETAÇÃO O RESTAURACIÓN
## 12818
## EM ABANDONO
## 12826
## ABANDONADO AGUARDANDO ABANDONO DEFINITIVO/ARRASAMENTO
## 15946
## DEVOLVIDO
## 17392
## OUTRO
## 17488
## NA
## 17488
## ABANDONADO DEFINITIVAMENTE
## 22562
## ARRASADO
## 24755
## ABANDONADO POR LOGÍSTICA EXPLORATÓRIA
## 25474
## DE DESCARTE
## 25514
categorias_grupo1 <- c(
"PRODUTOR",
"INJETOR",
"EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO",
"E EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO",
"PRODUCCIÓN DE AGUA PARA INJEÇÃO",
"EM PERFURAÇÃO",
"EM INTERVENCIÓN PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO*",
"CEDIDO PARA PRODUCCIÓN DE ÁGUA",
"ABANDONADO AGUARDANDO REINICIO DE PERFURAÇÃO",
"ABANDONADO/PARADO AGUARDANDO INTERVENCIÓN PARA AVALIACIÓN, COMPLETAÇÃO O RESTAURACIÓN"
)
c_situacion_2grupos <- ifelse(c_situacion_ordenado %in% categorias_grupo1,
"Pozos Activos/Potenciales",
"Pozos Inactivos/Abandonados")
c_situacion_2grupos_ordenado <- factor(c_situacion_2grupos,
levels = c("Pozos Activos/Potenciales", "Pozos Inactivos/Abandonados"),
ordered = TRUE)
TDFc_situacion_2grupos <- table(c_situacion_2grupos_ordenado)
TDFc_situacion_2grupos
## c_situacion_2grupos_ordenado
## Pozos Activos/Potenciales Pozos Inactivos/Abandonados
## 12631 16120
# --- TABLA NO.05: Frecuencias de Situación Agrupada ---
Tabla_situacion <- as.data.frame(TDFc_situacion_2grupos)
Tabla_situacion$hi <- Tabla_situacion$Freq / sum(Tabla_situacion$Freq)
Tabla_situacion$hi_porc <- Tabla_situacion$hi * 100
total_situacion <- data.frame(
Var1 = "Total",
Freq = sum(Tabla_situacion$Freq),
hi = 1,
hi_porc = 100
)
colnames(Tabla_situacion)[1] <- "Var1"
Tabla_situacion_final <- rbind(Tabla_situacion, total_situacion)
colnames(Tabla_situacion_final) <- c("Situacion_Agrupada", "ni", "hi", "hi_porc")
# --- GRÁFICAS LOCALES PARA SITUACION AGRUPADA ---
barplot(Tabla_situacion_final$ni[-nrow(Tabla_situacion_final)],
names.arg = Tabla_situacion_final$Situacion_Agrupada[-nrow(Tabla_situacion_final)],
main = "Gráfica No. 05.1: Cantidad de Pozos por Situación ",
xlab = "Situación",
ylab = "Cantidad de Pozos (ni)",
col = c("darkgreen", "darkred"),
las = 1,
cex.names = 0.8,
cex.axis = 0.8,
ylim = c(0, max(Tabla_situacion_final$ni[-nrow(Tabla_situacion_final)]) * 1.1)
)

barplot(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)],
names.arg = Tabla_situacion_final$Situacion_Agrupada[-nrow(Tabla_situacion_final)],
main = "Gráfica No. 05.2: Porcentaje de Pozos por Situación ",
xlab = "Situación",
ylab = "Porcentaje (hi %)",
col = c("darkgreen", "darkred"),
las = 1,
cex.names = 0.8,
cex.axis = 0.8,
ylim = c(0, max(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)]) * 1.1)
)

# --- GRÁFICA GLOBAL PARA SITUACION AGRUPADA ---
colores_pie_situacion <- c("darkgreen", "darkred")
etiquetas_pastel_situacion <- paste0(round(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)], 1), "%")
pie(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)],
labels = etiquetas_pastel_situacion,
col = colores_pie_situacion,
radius = 1,
cex = 0.8
)
# Leyenda
legend("bottomright",
legend = paste0(Tabla_situacion_final$Situacion_Agrupada[-nrow(Tabla_situacion_final)],
" (", round(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)], 1), "%)"),
fill = colores_pie_situacion,
title = "Situación",
cex = 0.5,
y.intersp = 0.6,
bty = "n"
)

# Conclusion
conclusion <- "En un total de 25.514 pozos analizados, se determinó que el 43,9% se encuentran en condición activa o con potencial de producción, mientras que el 56,1% están inactivos o abandonados. Esta distribución evidencia una mayoría de pozos fuera de operación.\n\n
Estos resultados permiten identificar una tendencia significativa hacia la inactividad."