# 1. Configurar directorio y cargar datos
setwd("/cloud/project/proyecto")

datos <- read.csv("archivo depurado nuevo 12.csv",
                  header = TRUE, sep = ";", dec = ".")

# Variable Tierra o Mar


terra_mar <- datos$TERRA_MAR
tabla_cruda_terra_mar <- sort(table(terra_mar), decreasing = TRUE)

top_n_terra_mar <- 3

top_n_valores_terra_mar <- names(tabla_cruda_terra_mar)[1:top_n_terra_mar]

terra_mar_agrupado <- ifelse(terra_mar %in% top_n_valores_terra_mar, terra_mar, "OTROS")

tabla_agrupada_terra_mar <- table(terra_mar_agrupado)

# TABLA DE FRECUENCIAS

Tabla_Terra_Mar <- data.frame(
  TERRA_MAR = names(tabla_agrupada_terra_mar),
  ni = as.numeric(tabla_agrupada_terra_mar)
)

# Cálculo del porcentaje
Tabla_Terra_Mar$hi_porcentaje <- round((Tabla_Terra_Mar$ni / sum(Tabla_Terra_Mar$ni)) * 100, 2)

# Agregar fila TOTAL
Tabla_Terra_Mar <- rbind(
  Tabla_Terra_Mar,
  data.frame(TERRA_MAR = "TOTAL",
             ni = sum(Tabla_Terra_Mar$ni),
             hi_porcentaje = 100)
)

print(Tabla_Terra_Mar)
##   TERRA_MAR    ni hi_porcentaje
## 1         M  6649         22.48
## 2         T 22926         77.52
## 3     TOTAL 29575        100.00
#----------------------------------------------------
# COLORES
#----------------------------------------------------
library(RColorBrewer)
colores_terra_mar <- brewer.pal(n = length(tabla_agrupada_terra_mar), name = "Set2")
## Warning in brewer.pal(n = length(tabla_agrupada_terra_mar), name = "Set2"): minimal value for n is 3, returning requested palette with 3 different levels
# GRÁFICOS DE BARRAS

# Frecuencia absoluta
barplot(tabla_agrupada_terra_mar,
        main = "Gráfica No 10: Distribución de Tierra o Mar",
        col = colores_terra_mar,
        las = 1,
        cex.names = 0.6,
        cex.axis = 0.6,
        xlab = "Terra Mar", ylab = "Cantidad")

# Frecuencia absoluta con límite Y
barplot(tabla_agrupada_terra_mar,
        main = "Gráfica No 10.1: Distribución de la frecuencia de Tierra o Mar",
        col = colores_terra_mar,
        las = 1,
        cex.names = 0.6,
        cex.axis = 0.6,
        ylim = c(0, max(tabla_agrupada_terra_mar) + 5),
        xlab = "Terra Mar", ylab = "Cantidad")

# Frecuencia relativa (%)
barplot(Tabla_Terra_Mar$hi_porcentaje[Tabla_Terra_Mar$TERRA_MAR != "TOTAL"],
        main = "Gráfica No 10.2: Distribución de la frecuencia relativa de Tierra o Mar (local)",
        names.arg = Tabla_Terra_Mar$TERRA_MAR[Tabla_Terra_Mar$TERRA_MAR != "TOTAL"],
        col = colores_terra_mar,
        las = 1,
        cex.names = 0.6,
        cex.axis = 0.6,
        xlab = "Terra Mar", ylab = "Porcentaje")

# Frecuencia relativa con límite Y
barplot(Tabla_Terra_Mar$hi_porcentaje[Tabla_Terra_Mar$TERRA_MAR != "TOTAL"],
        main = "Gráfica No 10.3: Distribución de la frecuencia relativa de Tierra o Mar (global)",
        names.arg = Tabla_Terra_Mar$TERRA_MAR[Tabla_Terra_Mar$TERRA_MAR != "TOTAL"],
        col = colores_terra_mar,
        las = 1,
        cex.names = 0.6,
        cex.axis = 0.6,
        ylim = c(0, 100),
        xlab = "Terra Mar", ylab = "Porcentaje")

# DIAGRAMA CIRCULAR

pie_data_terra_mar <- Tabla_Terra_Mar$ni[Tabla_Terra_Mar$TERRA_MAR != "TOTAL"]
pie_percent_terra_mar <- Tabla_Terra_Mar$hi_porcentaje[Tabla_Terra_Mar$TERRA_MAR != "TOTAL"]

etiquetas_pie_terra_mar <- paste0(pie_percent_terra_mar, "%")

n_colores_pie <- max(3, length(pie_data_terra_mar))

pie(pie_data_terra_mar,
    labels = etiquetas_pie_terra_mar,
    main = "Gráfica No 10.4: Distribución Porcentual de Tierra o Mar",
    col = brewer.pal(n = n_colores_pie, name = "Set3"),
    radius = 0.7,
    cex = 0.8)

# Leyenda 
legend(x = 1.2, y = -0.3,
       legend = Tabla_Terra_Mar$TERRA_MAR[Tabla_Terra_Mar$TERRA_MAR != "TOTAL"],
       fill = brewer.pal(n = n_colores_pie, name = "Set3"),
       title = "Tierra o Mar",
       cex = 0.5)

# Conclusion

conclusion <- "La variable Tierra o Mar muestra una distribución , con 77.52% de las observaciones correspondientes a Tierra (T) y 22.48% a Mar (M). Esto indica que la mayoría de los yacimientos petroleros se encuentran en la parte terrestre, con un mayor indice de explotación"