setwd("/cloud/project/datos")
datos <- read.csv("Petroleo_Ontaro.csv", header=T, dec=".", sep=";")



plug_date_raw <- datos$PLUGGING_END_DATE

plug_date_raw <- trimws(gsub("\\+00", "", plug_date_raw))

fechas_convertidas <- as.POSIXct(plug_date_raw, format = "%Y/%m/%d %H:%M:%S", tz = "UTC")

años <- as.numeric(format(fechas_convertidas, "%Y"))

años <- años[!is.na(años) & años > 1800 & años <= as.numeric(format(Sys.Date(), "%Y"))]

decadas <- floor(años / 10) * 10

# --- CALCULAR FRECUENCIAS ---
frecuencia <- table(decadas)
frecuencia_relativa <- prop.table(frecuencia) * 100
frecuencia_acum <- cumsum(frecuencia)
frecuencia_relativa_acum <- cumsum(frecuencia_relativa)

# --- TABLA DE FRECUENCIAS ---
tabla_frecuencias_decadas <- data.frame(
  Decada = as.numeric(names(frecuencia)),
  Frecuencia = as.vector(frecuencia),
  Frecuencia_Relativa = round(as.vector(frecuencia_relativa), 2),
  Frecuencia_Acum = as.vector(frecuencia_acum),
  Frecuencia_Relativa_Acum = round(frecuencia_relativa_acum, 2)
)

# --- MOSTRAR TABLA ---
print("Tabla de Frecuencias por Décadas:")
## [1] "Tabla de Frecuencias por Décadas:"
print(tabla_frecuencias_decadas)
##      Decada Frecuencia Frecuencia_Relativa Frecuencia_Acum
## 1900   1900         23                0.09              23
## 1910   1910         63                0.24              86
## 1920   1920        420                1.58             506
## 1930   1930        922                3.46            1428
## 1940   1940       1525                5.73            2953
## 1950   1950       2497                9.38            5450
## 1960   1960       2549                9.57            7999
## 1970   1970      14130               53.05           22129
## 1980   1980       1341                5.04           23470
## 1990   1990        877                3.29           24347
## 2000   2000       1382                5.19           25729
## 2010   2010        896                3.36           26625
## 2020   2020          8                0.03           26633
##      Frecuencia_Relativa_Acum
## 1900                     0.09
## 1910                     0.32
## 1920                     1.90
## 1930                     5.36
## 1940                    11.09
## 1950                    20.46
## 1960                    30.03
## 1970                    83.09
## 1980                    88.12
## 1990                    91.42
## 2000                    96.61
## 2010                    99.97
## 2020                   100.00
# --- GRÁFICA DE BARRAS ---
barplot(frecuencia,
        main = "Frecuencia de Pozos por Década - Año de finalización de taponamiento",
        col = "steelblue",
        xlab = "Década",
        ylab = "Cantidad de Pozos")

# --- OJIVA ASCENDENTE ---
plot(as.numeric(names(frecuencia_acum)), frecuencia_acum,
     type = "b", pch = 19, col = "darkgreen",
     main = "Ojiva Ascendente - Año de finalización de taponamiento",
     xlab = "Década", ylab = "Frecuencia Acumulada")

# --- OJIVA DESCENDENTE ---
frecuencia_acum_desc <- rev(cumsum(rev(frecuencia)))
plot(as.numeric(names(frecuencia_acum_desc)), frecuencia_acum_desc,
     type = "b", pch = 19, col = "firebrick",
     main = "Ojiva Descendente - Año de finalización de taponamiento",
     xlab = "Década", ylab = "Frecuencia Acumulada Descendente")

# --- OJIVAS COMBINADAS + MEDIANA ---
mediana <- median(años, na.rm = TRUE)
plot(as.numeric(names(frecuencia_acum)), frecuencia_acum,
     type = "b", pch = 19, col = "darkgreen",
     main = "Ojivas Ascendente y Descendente Año de finalización del taponamiento",
     xlab = "Década", ylab = "Frecuencia Acumulada",
     ylim = c(0, max(frecuencia_acum)))

lines(as.numeric(names(frecuencia_acum_desc)), frecuencia_acum_desc,
      type = "b", pch = 19, col = "firebrick")

abline(v = mediana, col = "blue", lty = 2, lwd = 2)
text(mediana, max(frecuencia_acum) * 0.95, labels = paste("Mediana:", mediana),
     col = "blue", pos = 4)

# --- BOXPLOT ---
boxplot(años, horizontal = TRUE, col = "orange",
        main = "Distribución de Años - Año de finalización de taponamiento",
        xlab = "Año")

# Conclusion

conclusion <- "El análisis del Año de finalización de taponamiento evidencia que las actividades de cierre de pozos aumentan de forma notable a partir de la década de 1970, coincidiendo con la disminución en la perforación de nuevos pozos.Esto refleja una etapa de declive y cierre progresivo de operaciones, asociada al agotamiento de yacimientos y a la madurez de la industria petrolera en Ontario"