# CARGAR LOS DATOS
setwd("/cloud/project/proyecto")
datos <- read.csv("archivo depurado nuevo 12.csv",
                  header = TRUE, dec =".",sep=";")

# --- VARIABLE: SITUACAO (ESTADO DEL POZO) ---
c_situacion_limpia <- na.omit(datos$SITUACAO)

orden_productividad <- c(
  "PRODUTOR",
  "INJETOR",
  "EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO",
  "E EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO",
  "PRODUÇÃO DE AGUA PARA INJEÇÃO",
  "EM PERFURAÇÃO",
  "EM INTERVENCIÓN PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO*",
  "CEDIDO PARA PRODUCCIÓN DE ÁGUA",
  "ABANDONADO AGUARDANDO REINICIO DE PERFURAÇÃO",
  "ABANDONADO/PARADO AGUARDANDO INTERVENCIÓN PARA AVALIACIÓN, COMPLETAÇÃO O RESTAURACIÓN",
  "EM ABANDONO",
  "ABANDONADO AGUARDANDO ABANDONO DEFINITIVO/ARRASAMENTO",
  "DEVOLVIDO",
  "OUTRO",
  "NA",
  "ABANDONADO DEFINITIVAMENTE",
  "ARRASADO",
  "ABANDONADO POR LOGÍSTICA EXPLORATÓRIA",
  "DE DESCARTE"
)

c_situacion_ordenado <- factor(c_situacion_limpia, levels = orden_productividad, ordered = TRUE)

freq_situacion_ordenado <- table(c_situacion_ordenado)
print(freq_situacion_ordenado)
## c_situacion_ordenado
##                                                                              PRODUTOR 
##                                                                                  9912 
##                                                                               INJETOR 
##                                                                                  2653 
##                                                EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO 
##                                                                                    60 
##                                               E EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO 
##                                                                                     0 
##                                                         PRODUÇÃO DE AGUA PARA INJEÇÃO 
##                                                                                   187 
##                                                                         EM PERFURAÇÃO 
##                                                                                     6 
##                           EM INTERVENCIÓN PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO* 
##                                                                                     0 
##                                                        CEDIDO PARA PRODUCCIÓN DE ÁGUA 
##                                                                                     0 
##                                          ABANDONADO AGUARDANDO REINICIO DE PERFURAÇÃO 
##                                                                                     0 
## ABANDONADO/PARADO AGUARDANDO INTERVENCIÓN PARA AVALIACIÓN, COMPLETAÇÃO O RESTAURACIÓN 
##                                                                                     0 
##                                                                           EM ABANDONO 
##                                                                                     8 
##                                 ABANDONADO AGUARDANDO ABANDONO DEFINITIVO/ARRASAMENTO 
##                                                                                  3120 
##                                                                             DEVOLVIDO 
##                                                                                  1446 
##                                                                                 OUTRO 
##                                                                                    96 
##                                                                                    NA 
##                                                                                     0 
##                                                            ABANDONADO DEFINITIVAMENTE 
##                                                                                  5074 
##                                                                              ARRASADO 
##                                                                                  2193 
##                                                 ABANDONADO POR LOGÍSTICA EXPLORATÓRIA 
##                                                                                   719 
##                                                                           DE DESCARTE 
##                                                                                    40
cumsum_freq <- cumsum(freq_situacion_ordenado)
total_count <- sum(freq_situacion_ordenado)
print(paste("Total de pozos (sin NA):", total_count))
## [1] "Total de pozos (sin NA): 25514"
print(cumsum_freq)
##                                                                              PRODUTOR 
##                                                                                  9912 
##                                                                               INJETOR 
##                                                                                 12565 
##                                                EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO 
##                                                                                 12625 
##                                               E EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO 
##                                                                                 12625 
##                                                         PRODUÇÃO DE AGUA PARA INJEÇÃO 
##                                                                                 12812 
##                                                                         EM PERFURAÇÃO 
##                                                                                 12818 
##                           EM INTERVENCIÓN PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO* 
##                                                                                 12818 
##                                                        CEDIDO PARA PRODUCCIÓN DE ÁGUA 
##                                                                                 12818 
##                                          ABANDONADO AGUARDANDO REINICIO DE PERFURAÇÃO 
##                                                                                 12818 
## ABANDONADO/PARADO AGUARDANDO INTERVENCIÓN PARA AVALIACIÓN, COMPLETAÇÃO O RESTAURACIÓN 
##                                                                                 12818 
##                                                                           EM ABANDONO 
##                                                                                 12826 
##                                 ABANDONADO AGUARDANDO ABANDONO DEFINITIVO/ARRASAMENTO 
##                                                                                 15946 
##                                                                             DEVOLVIDO 
##                                                                                 17392 
##                                                                                 OUTRO 
##                                                                                 17488 
##                                                                                    NA 
##                                                                                 17488 
##                                                            ABANDONADO DEFINITIVAMENTE 
##                                                                                 22562 
##                                                                              ARRASADO 
##                                                                                 24755 
##                                                 ABANDONADO POR LOGÍSTICA EXPLORATÓRIA 
##                                                                                 25474 
##                                                                           DE DESCARTE 
##                                                                                 25514
categorias_grupo1 <- c(
  "PRODUTOR",
  "INJETOR",
  "EQUIPADO AGUARDANDO INÍCIO DE PRODUÇÃO",
  "E EQUIPADO AGUARDANDO INÍCIO DE INJEÇÃO",
  "PRODUCCIÓN DE AGUA PARA INJEÇÃO",
  "EM PERFURAÇÃO",
  "EM INTERVENCIÓN PARA AVALIAÇÃO, COMPLETAÇÃO OU RESTAURAÇÃO*",
  "CEDIDO PARA PRODUCCIÓN DE ÁGUA",
  "ABANDONADO AGUARDANDO REINICIO DE PERFURAÇÃO",
  "ABANDONADO/PARADO AGUARDANDO INTERVENCIÓN PARA AVALIACIÓN, COMPLETAÇÃO O RESTAURACIÓN"
)

c_situacion_2grupos <- ifelse(c_situacion_ordenado %in% categorias_grupo1,
                              "Pozos Activos/Potenciales",
                              "Pozos Inactivos/Abandonados")

c_situacion_2grupos_ordenado <- factor(c_situacion_2grupos,
                                       levels = c("Pozos Activos/Potenciales", "Pozos Inactivos/Abandonados"),
                                       ordered = TRUE)

TDFc_situacion_2grupos <- table(c_situacion_2grupos_ordenado)
TDFc_situacion_2grupos
## c_situacion_2grupos_ordenado
##   Pozos Activos/Potenciales Pozos Inactivos/Abandonados 
##                       12631                       16120
# --- TABLA NO.05: Frecuencias de Situación Agrupada ---
Tabla_situacion <- as.data.frame(TDFc_situacion_2grupos)
Tabla_situacion$hi <- Tabla_situacion$Freq / sum(Tabla_situacion$Freq)
Tabla_situacion$hi_porc <- Tabla_situacion$hi * 100

total_situacion <- data.frame(
  Var1 = "Total",
  Freq = sum(Tabla_situacion$Freq),
  hi = 1,
  hi_porc = 100
)

colnames(Tabla_situacion)[1] <- "Var1"

Tabla_situacion_final <- rbind(Tabla_situacion, total_situacion)

colnames(Tabla_situacion_final) <- c("Situacion_Agrupada", "ni", "hi", "hi_porc")

# --- GRÁFICAS LOCALES PARA SITUACION AGRUPADA ---

barplot(Tabla_situacion_final$ni[-nrow(Tabla_situacion_final)],
        names.arg = Tabla_situacion_final$Situacion_Agrupada[-nrow(Tabla_situacion_final)],
        main = "Gráfica No. 05.1: Cantidad de Pozos por Situación ",
        xlab = "Situación",
        ylab = "Cantidad de Pozos (ni)",
        col = c("darkgreen", "darkred"),
        las = 1,
        cex.names = 0.8,
        cex.axis = 0.8,
        ylim = c(0, max(Tabla_situacion_final$ni[-nrow(Tabla_situacion_final)]) * 1.1)
)

barplot(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)],
        names.arg = Tabla_situacion_final$Situacion_Agrupada[-nrow(Tabla_situacion_final)],
        main = "Gráfica No. 05.2: Porcentaje de Pozos por Situación ",
        xlab = "Situación",
        ylab = "Porcentaje (hi %)",
        col = c("darkgreen", "darkred"),
        las = 1,
        cex.names = 0.8,
        cex.axis = 0.8,
        ylim = c(0, max(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)]) * 1.1)
)

# --- GRÁFICA GLOBAL PARA SITUACION AGRUPADA ---

colores_pie_situacion <- c("darkgreen", "darkred")


etiquetas_pastel_situacion <- paste0(round(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)], 1), "%")

pie(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)],
    labels = etiquetas_pastel_situacion,
    col = colores_pie_situacion,
    radius = 1,
    cex = 0.8
)

# Leyenda 


legend("bottomright", 
       legend = paste0(Tabla_situacion_final$Situacion_Agrupada[-nrow(Tabla_situacion_final)], 
                       " (", round(Tabla_situacion_final$hi_porc[-nrow(Tabla_situacion_final)], 1), "%)"),
       fill = colores_pie_situacion,
       title = "Situación",
       cex = 0.5,         
       y.intersp = 0.6,   
       bty = "n"        
)

# Conclusion

conclusion <- "En un total de 25.514 pozos analizados, se determinó que el 43,9% se encuentran en condición activa o con potencial de producción, mientras que el 56,1% están inactivos o abandonados. Esta distribución evidencia una mayoría de pozos fuera de operación.\n\n
Estos resultados permiten identificar una tendencia significativa hacia la inactividad."