## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
## dat <- vroom(...)
## problems(dat)
## Rows: 2795 Columns: 36
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (18): Accident Date/Time, Operator Name, Pipeline/Facility Name, Pipelin...
## dbl (18): Report Number, Supplemental Number, Accident Year, Operator ID, Ac...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## --- TABLA DE VALORES (MUESTRA) ---
plot(df_lin$X, df_lin$Y,
main="Gráfica N° 2:Nube de Puntos",
xlab="Barriles Liberados (Unintentional Release)",
ylab="Barriles Perdidos Netos (Net Loss)",
pch=16, col=rgb(0.2, 0.4, 0.8, 0.5))Se define como un Modelo de Regresión Lineal Simple bajo la fórmula Y = b0 + b1*X
coeficientes <- coef(modelo_lineal)
beta_0 <- coeficientes[1] # Intercepto
beta_1 <- coeficientes[2] # Pendiente (Slope)
cat("\n--- PARÁMETROS DE LA ECUACIÓN LINEAL ---\n")##
## --- PARÁMETROS DE LA ECUACIÓN LINEAL ---
## Intersección (Beta 0): -15.7686
## Pendiente (Beta 1): 0.7338
# Formulación de la ecuación
cat("\nLa ecuación del modelo es: Y =", round(beta_0, 4), "+", round(beta_1, 4), "* X\n")##
## La ecuación del modelo es: Y = -15.7686 + 0.7338 * X
# Interpretación técnica de la pendiente
porcentaje_perdida <- round(beta_1 * 100, 2)
cat("Interpretación: Por cada barril liberado, se pierde definitivamente el",
porcentaje_perdida, "% del volumen.\n")## Interpretación: Por cada barril liberado, se pierde definitivamente el 73.38 % del volumen.
plot(df_lin$X, df_lin$Y,
main="Gráfica N° 2: relación entre Volumen Liberado y Pérdida Neta",
xlab="Barriles Liberados (Unintentional Release)",
ylab="Barriles Perdidos Netos (Net Loss)",
pch=16, col=rgb(0.2, 0.4, 0.8, 0.5))
# Dibujamos la línea de tendencia central (Recta)
abline(modelo_lineal, col="red", lwd=3)# Al ser variables proporcionales, el coeficiente será naturalmente alto.
pearson_val <- cor(df_lin$X, df_lin$Y)
r2_val <- summary(modelo_lineal)$r.squared
cat("\n--- RESULTADOS DEL TEST --- \n")##
## --- RESULTADOS DEL TEST ---
## Coeficiente de Pearson (R): 0.8948
## R-Squared (Precisión del modelo): 0.8006
Supongamos un incidente donde se liberan 2,500 barriles,se estima una pérdida neta de?
# Supongamos un incidente donde se liberan 2,500 barriles
val_x <- 2500
prediccion_y <- predict(modelo_lineal, newdata = data.frame(X = val_x))
cat("\n--- ESTIMACIÓN ---\n")##
## --- ESTIMACIÓN ---
cat("Para un derrame de", val_x, "barriles, se estima una pérdida neta de:",
round(prediccion_y, 2), "barriles.\n")## Para un derrame de 2500 barriles, se estima una pérdida neta de: 1818.78 barriles.
Entre la variable independiente Barriles Liberados (\(X\)) y la variable dependiente Barriles Perdidos Netos (\(Y\)) existe una relación matemática de tipo regresión lineal simple, la cual indica un comportamiento directamente proporcional entre el derrame y el material no recuperado. Esta relación se expresa mediante la fórmula del modelo \(Y = 32.5517 + 0.81X\) (donde el coeficiente de la pendiente indica que por cada barril liberado se pierde definitivamente el 81% del volumen), sujeta a las restricciones de aplicarse a incidentes dentro de un rango de 0 a 5,000 barriles y tras haber filtrado los valores nulos para garantizar la integridad de la tendencia. Finalmente, el modelo permite realizar una estimación técnica donde, para un incidente con una liberación de 2,500 barriles, se proyecta una pérdida neta de 1,818.78 barriles, confirmando una correlación sólida con un coeficiente de Pearson de 0.8948.