# 1. Configurar directorio y cargar datos
setwd("/cloud/project/proyecto")

datos <- read.csv("archivo depurado nuevo 12.csv",
                  header = TRUE, sep = ";", dec = ".")


# Variable Posicion del Pozo



poco_pos <- datos$POCO_POS_ANP
tabla_cruda_poco_pos <- sort(table(poco_pos), decreasing = TRUE)

top_n_poco_pos <- 3

top_n_valores_poco_pos <- names(tabla_cruda_poco_pos)[1:top_n_poco_pos]

poco_pos_agrupado <- ifelse(poco_pos %in% top_n_valores_poco_pos, poco_pos, "OTROS")

tabla_agrupada_poco_pos <- table(poco_pos_agrupado)

# TABLA DE FRECUENCIAS

Tabla_Poco_Pos <- data.frame(
  POCO_POS = names(tabla_agrupada_poco_pos),
  ni = as.numeric(tabla_agrupada_poco_pos)
)

# Cálculo del porcentaje
Tabla_Poco_Pos$hi_porcentaje <- round((Tabla_Poco_Pos$ni / sum(Tabla_Poco_Pos$ni)) * 100, 2)

# Agregar fila TOTAL
Tabla_Poco_Pos <- rbind(
  Tabla_Poco_Pos,
  data.frame(POCO_POS = "TOTAL",
             ni = sum(Tabla_Poco_Pos$ni),
             hi_porcentaje = 100)
)

print(Tabla_Poco_Pos)
##   POCO_POS    ni hi_porcentaje
## 1        N 19297         65.25
## 2        S 10278         34.75
## 3    TOTAL 29575        100.00
#----------------------------------------------------
# COLORES
#----------------------------------------------------
library(RColorBrewer)
colores_poco_pos <- brewer.pal(n = length(tabla_agrupada_poco_pos), name = "Set2")
## Warning in brewer.pal(n = length(tabla_agrupada_poco_pos), name = "Set2"): minimal value for n is 3, returning requested palette with 3 different levels
# GRÁFICOS DE BARRAS

# Frecuencia absoluta
barplot(tabla_agrupada_poco_pos,
        main = "Gráfica No 11: Distribución de Posicion del Pozo",
        col = colores_poco_pos,
        las = 1,
        cex.names = 0.6,
        cex.axis = 0.6,
        xlab = "Poco Pos", ylab = "Cantidad")

# Frecuencia absoluta con límite Y
barplot(tabla_agrupada_poco_pos,
        main = "Gráfica No 11.1: Distribución de la frecuencia de Posicion del pozo ",
        col = colores_poco_pos,
        las = 1,
        cex.names = 0.6,
        cex.axis = 0.6,
        ylim = c(0, max(tabla_agrupada_poco_pos) + 5),
        xlab = "Poco Pos", ylab = "Cantidad")

# Frecuencia relativa (%)
barplot(Tabla_Poco_Pos$hi_porcentaje[Tabla_Poco_Pos$POCO_POS != "TOTAL"],
        main = "Gráfica No 11.2: Distribución de la frecuencia relativa de Posicion del pozo (local)",
        names.arg = Tabla_Poco_Pos$POCO_POS[Tabla_Poco_Pos$POCO_POS != "TOTAL"],
        col = colores_poco_pos,
        las = 1,
        cex.names = 0.6,
        cex.axis = 0.6,
        xlab = "Poco Pos", ylab = "Porcentaje")

# Frecuencia relativa con límite Y
barplot(Tabla_Poco_Pos$hi_porcentaje[Tabla_Poco_Pos$POCO_POS != "TOTAL"],
        main = "Gráfica No 11.3: Distribución de la frecuencia relativa de Posicion del pozo (global)",
        names.arg = Tabla_Poco_Pos$POCO_POS[Tabla_Poco_Pos$POCO_POS != "TOTAL"],
        col = colores_poco_pos,
        las = 1,
        cex.names = 0.6,
        cex.axis = 0.6,
        ylim = c(0, 100),
        xlab = "Poco Pos", ylab = "Porcentaje")

# DIAGRAMA CIRCULAR

pie_data_poco_pos <- Tabla_Poco_Pos$ni[Tabla_Poco_Pos$POCO_POS != "TOTAL"]
pie_percent_poco_pos <- Tabla_Poco_Pos$hi_porcentaje[Tabla_Poco_Pos$POCO_POS != "TOTAL"]

etiquetas_pie_poco_pos <- paste0(pie_percent_poco_pos, "%")

n_colores_pie <- max(3, length(pie_data_poco_pos))

pie(pie_data_poco_pos,
    labels = etiquetas_pie_poco_pos,
    main = "Gráfica No 11.4: Distribución Porcentual de Posicion del Pozo",
    col = brewer.pal(n = n_colores_pie, name = "Set3"),
    radius = 0.7,
    cex = 0.8)

# Leyenda 
legend(x = 1.2, y = -0.3,
       legend = Tabla_Poco_Pos$POCO_POS[Tabla_Poco_Pos$POCO_POS != "TOTAL"],
       fill = brewer.pal(n = n_colores_pie, name = "Set3"),
       title = "Posicion del Pozo",
       cex = 0.5)

# Conclusion

conclusion <- " 65.25% de los pozos están ubicados en la región Norte (N), mientras que solo el 34.75% se encuentra en el Sur (S). Esto indica que la mayor parte de la actividad petrolera en Brasil está concentrada en el norte, lo que podría reflejar mayores reservas"