setwd("/cloud/project/datos")
datos <- read.csv("Petroleo_Ontaro.csv", header=T, dec=".", sep=";")
plug_date_raw <- datos$PLUGGING_END_DATE
plug_date_raw <- trimws(gsub("\\+00", "", plug_date_raw))
fechas_convertidas <- as.POSIXct(plug_date_raw, format = "%Y/%m/%d %H:%M:%S", tz = "UTC")
años <- as.numeric(format(fechas_convertidas, "%Y"))
años <- años[!is.na(años) & años > 1800 & años <= as.numeric(format(Sys.Date(), "%Y"))]
decadas <- floor(años / 10) * 10
# --- CALCULAR FRECUENCIAS ---
frecuencia <- table(decadas)
frecuencia_relativa <- prop.table(frecuencia) * 100
frecuencia_acum <- cumsum(frecuencia)
frecuencia_relativa_acum <- cumsum(frecuencia_relativa)
# --- TABLA DE FRECUENCIAS ---
tabla_frecuencias_decadas <- data.frame(
Decada = as.numeric(names(frecuencia)),
Frecuencia = as.vector(frecuencia),
Frecuencia_Relativa = round(as.vector(frecuencia_relativa), 2),
Frecuencia_Acum = as.vector(frecuencia_acum),
Frecuencia_Relativa_Acum = round(frecuencia_relativa_acum, 2)
)
# --- MOSTRAR TABLA ---
print("Tabla de Frecuencias por Décadas:")
## [1] "Tabla de Frecuencias por Décadas:"
print(tabla_frecuencias_decadas)
## Decada Frecuencia Frecuencia_Relativa Frecuencia_Acum
## 1900 1900 23 0.09 23
## 1910 1910 63 0.24 86
## 1920 1920 420 1.58 506
## 1930 1930 922 3.46 1428
## 1940 1940 1525 5.73 2953
## 1950 1950 2497 9.38 5450
## 1960 1960 2549 9.57 7999
## 1970 1970 14130 53.05 22129
## 1980 1980 1341 5.04 23470
## 1990 1990 877 3.29 24347
## 2000 2000 1382 5.19 25729
## 2010 2010 896 3.36 26625
## 2020 2020 8 0.03 26633
## Frecuencia_Relativa_Acum
## 1900 0.09
## 1910 0.32
## 1920 1.90
## 1930 5.36
## 1940 11.09
## 1950 20.46
## 1960 30.03
## 1970 83.09
## 1980 88.12
## 1990 91.42
## 2000 96.61
## 2010 99.97
## 2020 100.00
# --- GRÁFICA DE BARRAS ---
barplot(frecuencia,
main = "Frecuencia de Pozos por Década - Año de finalización de taponamiento",
col = "steelblue",
xlab = "Década",
ylab = "Cantidad de Pozos")

# --- OJIVA ASCENDENTE ---
plot(as.numeric(names(frecuencia_acum)), frecuencia_acum,
type = "b", pch = 19, col = "darkgreen",
main = "Ojiva Ascendente - Año de finalización de taponamiento",
xlab = "Década", ylab = "Frecuencia Acumulada")

# --- OJIVA DESCENDENTE ---
frecuencia_acum_desc <- rev(cumsum(rev(frecuencia)))
plot(as.numeric(names(frecuencia_acum_desc)), frecuencia_acum_desc,
type = "b", pch = 19, col = "firebrick",
main = "Ojiva Descendente - Año de finalización de taponamiento",
xlab = "Década", ylab = "Frecuencia Acumulada Descendente")

# --- OJIVAS COMBINADAS + MEDIANA ---
mediana <- median(años, na.rm = TRUE)
plot(as.numeric(names(frecuencia_acum)), frecuencia_acum,
type = "b", pch = 19, col = "darkgreen",
main = "Ojivas Ascendente y Descendente Año de finalización del taponamiento",
xlab = "Década", ylab = "Frecuencia Acumulada",
ylim = c(0, max(frecuencia_acum)))
lines(as.numeric(names(frecuencia_acum_desc)), frecuencia_acum_desc,
type = "b", pch = 19, col = "firebrick")
abline(v = mediana, col = "blue", lty = 2, lwd = 2)
text(mediana, max(frecuencia_acum) * 0.95, labels = paste("Mediana:", mediana),
col = "blue", pos = 4)

# --- BOXPLOT ---
boxplot(años, horizontal = TRUE, col = "orange",
main = "Distribución de Años - Año de finalización de taponamiento",
xlab = "Año")

# Conclusion
conclusion <- "El análisis del Año de finalización de taponamiento evidencia que las actividades de cierre de pozos aumentan de forma notable a partir de la década de 1970, coincidiendo con la disminución en la perforación de nuevos pozos.Esto refleja una etapa de declive y cierre progresivo de operaciones, asociada al agotamiento de yacimientos y a la madurez de la industria petrolera en Ontario"