#Variable continua discreta cierre de pozo
# --- CARGAR DATOS ---
datos <- read.csv("C:/Users/nicol/Downloads/brasil depurada 12.csv",
                  header = TRUE, dec = ".", sep = ";")

# --- VARIABLE: CONCLUSAO ---
conclusao <- na.omit(datos$CONCLUSAO)

# Convertir a fecha y extraer años
fechas_conclusao <- as.Date(conclusao, tryFormats = c("%d/%m/%Y", "%Y-%m-%d"))
anios_conclusao <- as.numeric(format(fechas_conclusao, "%Y"))

# Agrupar por décadas
decadas_conclusao <- floor(anios_conclusao / 10) * 10

# Calcular frecuencias
frecuencia <- table(decadas_conclusao)
frecuencia_relativa <- prop.table(frecuencia) * 100
frecuencia_acum <- cumsum(frecuencia)
frecuencia_acum_desc <- rev(cumsum(rev(frecuencia)))
frecuencia_relativa_acum <- cumsum(frecuencia_relativa)

# Crear tabla resumen
tabla_frecuencias_conclusao <- data.frame(
  Decada = as.numeric(names(frecuencia)),
  Frecuencia = as.vector(frecuencia),
  Frecuencia_Relativa = round(as.vector(frecuencia_relativa), 2),
  Frecuencia_Acum = as.vector(frecuencia_acum),
  Frecuencia_Acum_Desc = as.vector(frecuencia_acum_desc),
  Frecuencia_Relativa_Acum = round(frecuencia_relativa_acum, 2)
)

# Mostrar tabla
print("Tabla de Frecuencias por Década (CONCLUSAO):")
## [1] "Tabla de Frecuencias por Década (CONCLUSAO):"
print(tabla_frecuencias_conclusao)
##      Decada Frecuencia Frecuencia_Relativa Frecuencia_Acum Frecuencia_Acum_Desc
## 1920   1920          2                0.01               2                29311
## 1930   1930          4                0.01               6                29309
## 1940   1940        189                0.64             195                29305
## 1950   1950        818                2.79            1013                29116
## 1960   1960       2427                8.28            3440                28298
## 1970   1970       2523                8.61            5963                25871
## 1980   1980       9533               32.52           15496                23348
## 1990   1990       3662               12.49           19158                13815
## 2000   2000       5480               18.70           24638                10153
## 2010   2010       4673               15.94           29311                 4673
##      Frecuencia_Relativa_Acum
## 1920                     0.01
## 1930                     0.02
## 1940                     0.67
## 1950                     3.46
## 1960                    11.74
## 1970                    20.34
## 1980                    52.87
## 1990                    65.36
## 2000                    84.06
## 2010                   100.00
# Calcular mediana
mediana_conclusao <- median(anios_conclusao)

# GRÁFICO DE BARRAS
barplot(frecuencia,
        main = "Frecuencia de Cierre de pozo por Década",
        col = "steelblue",
        xlab = "Década",
        ylab = "Cantidad")

# OJIVA ASCENDENTE
plot(as.numeric(names(frecuencia_acum)), frecuencia_acum,
     type = "b", pch = 19, col = "darkgreen",
     main = "Ojiva Ascendente - Cierre de pozo",
     xlab = "Década",
     ylab = "Frecuencia Acumulada")

# OJIVA DESCENDENTE
plot(as.numeric(names(frecuencia_acum_desc)), frecuencia_acum_desc,
     type = "b", pch = 19, col = "firebrick",
     main = "Ojiva Descendente - Cierre de pozo",
     xlab = "Década",
     ylab = "Frecuencia Acumulada Descendente")

# OJIVAS COMBINADAS CON MEDIANA
plot(as.numeric(names(frecuencia_acum)), frecuencia_acum,
     type = "b", pch = 19, col = "darkgreen",
     main = "Ojivas Ascendente y Descendente - Cierre de pozo",
     xlab = "Década",
     ylab = "Frecuencia Acumulada",
     ylim = c(0, max(frecuencia_acum)),
     xlim = range(as.numeric(names(frecuencia))))

lines(as.numeric(names(frecuencia_acum_desc)), frecuencia_acum_desc,
      type = "b", pch = 19, col = "firebrick")

abline(v = mediana_conclusao, col = "blue", lty = 2, lwd = 2)
text(mediana_conclusao, max(frecuencia_acum) * 0.95,
     labels = paste("Mediana:", mediana_conclusao),
     col = "blue", pos = 4)

# Boxplot
boxplot(anios_conclusao,
        horizontal = TRUE,
        col = "darkorange",
        main = "Distribución de Fechas de Cierre de pozo",
        xlab = "Año de Conclusión",
        border = "darkred")

# CONCLUSIÓN


conclusion <- "Del análisis de un total de 29311 registros correspondientes al año de Cierre de pozo, se observó una mayor concentración durante la década de 1980 lo que indica un posible periodo importante en la variable de cierre.
  Posteriormente, se percibe una tendencia de variación temporal que puede reflejar condiciones o procesos históricos asociados."