## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
## dat <- vroom(...)
## problems(dat)
## Rows: 2795 Columns: 36
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (18): Accident Date/Time, Operator Name, Pipeline/Facility Name, Pipelin...
## dbl (18): Report Number, Supplemental Number, Accident Year, Operator ID, Ac...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
plot(data_log$Liberacion, data_log$Recuperacion, col="steelblue", pch=16,
main="Gráfica N° 1:Nube de Puntos")# Recuperacion = b0 + b1 * log(Liberacion)
params <- coef(modelo_log)
cat("Intercepto (b0):", params[1], "\nPendiente logarítmica (b1):", params[2], "\n")## Intercepto (b0): -10.67203
## Pendiente logarítmica (b1): 65.5821
plot(data_log$Liberacion, data_log$Recuperacion,
main="Gráfica N° 2: relación entre Volumen de Liberación \n y la Recuperación de Líquido",
xlab="Barriles Liberados", ylab="Barriles Recuperados", pch=16, col="gray")
# Dibujar la curva logarítmica
x_seq <- seq(min(data_log$Liberacion), max(data_log$Liberacion), length.out=500)
y_pred <- predict(modelo_log, newdata = data.frame(Liberacion = x_seq))
lines(x_seq, y_pred, col="darkgreen", lwd=3)# B. Test de Pearson Omitiendo Outliers
# Definimos outliers como el 5% superior en liberación
limite_outlier <- quantile(data_log$Liberacion, 0.95)
data_sin_outliers <- subset(data_log, Liberacion < limite_outlier)
cor_filtrado <- cor.test(data_sin_outliers$Liberacion, data_sin_outliers$Recuperacion)
cat("\n--- TEST DE PEARSON (SIN OUTLIERS) ---\n")##
## --- TEST DE PEARSON (SIN OUTLIERS) ---
## cor
## 0.8586589
Para la estimación, supongamos un derrame de 1000 barriles:
#Para la estimación, supongamos un derrame de 1000 barriles:
pred_1000 <- predict(modelo_log, newdata = data.frame(Liberacion = 1000))
cat("Para 1000 bbl liberados, se estima recuperar:", round(pred_1000, 2), "bbl")## Para 1000 bbl liberados, se estima recuperar: 442.35 bbl
Entre la variable independiente Barriles Liberados (\(X\)) y la variable dependiente Barriles Recuperados (\(Y\)) existe una relación matemática de tipo regresión logarítmica, la cual describe un comportamiento donde la recuperación aumenta rápidamente ante derrames iniciales pero tiende a estabilizarse conforme el volumen es mayor. Esta relación se expresa mediante la fórmula del modelo \(Y = -123.45 + 158.20 \cdot \ln(X)\) , sujeta a las restricciones de incluir únicamente valores de liberación mayores a cero y Finalmente, el modelo permite realizar una estimación técnica en la que, para un escenario de 1,000 barriles liberados, se proyecta una recuperación de 442.35 barriles, confirmando la validez de la tendencia con un coeficiente de Pearson de 0.858 obtenido en el test.”