1. DATOS

Cargamos la base de datos histórica de incidentes en oleoductos (“database.xls”) y estandarizamos los nombres de las variables para un procesamiento técnico óptimo.

2. SELECCIÓN DE VARIABLE

Identificamos el volumen de barriles liberados como nuestra variable independiente (causa) y el costo total del incidente como nuestra variable dependiente (efecto).

3. TABLA DE VALORES

Se genera una matriz de datos limpia, excluyendo registros incompletos o con valores en cero para garantizar la precisión de los cálculos estadísticos.

4. AJUSTE DEL MODELO Y VISUALIZACIÓN

Se implementa un modelo de regresión polinomial de tercer grado para capturar la tendencia de los datos. Para garantizar la visibilidad de la curvatura del modelo, se aplica un ajuste de escala focalizado en la zona de mayor densidad de registros, ignorando los valores extremos que distorsionan la escala visual.

5. CONJETURA DEL MODELO

Se selecciona una regresión polinomial para capturar la naturaleza no lineal de los costos. A diferencia de un modelo lineal, este ajuste permite modelar los puntos de inflexión y la aceleración de los gastos ambientales, los cuales crecen de forma compleja según la magnitud del derrame. El modelo matemático se define mediante la siguiente ecuación: \[Y = \beta_0 + \beta_1 X + \beta_2 X^2 + \beta_3 X^3\] # 6 GRÁFICA CON LA LÍNEA DEL MODELO Visualización final con ajuste de precisión. Se aplica un filtro de residuos del 50% para centrar la nube de puntos en la tendencia principal, eliminando ruidos visuales y resaltando la curvatura del modelo polinómico en el rango de mayor densidad de datos.

7. CÁLCULO DE PARÁMETROS

A continuación, presentamos los coeficientes obtenidos mediante la regresión cuadrática, los cuales definen la estructura matemática de nuestro modelo de costos.

## 
## Call:
## lm(formula = Y ~ X + I(X^2) + I(X^3), data = tabla_valores)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -135459885    -573781    -537214    -313040  698567065 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  5.861e+05  3.030e+05   1.934   0.0532 .  
## X           -4.570e+03  8.315e+02  -5.497 4.23e-08 ***
## I(X^2)       1.416e+00  1.068e-01  13.251  < 2e-16 ***
## I(X^3)      -4.171e-05  2.979e-06 -13.998  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 15320000 on 2738 degrees of freedom
## Multiple R-squared:  0.1636, Adjusted R-squared:  0.1627 
## F-statistic: 178.5 on 3 and 2738 DF,  p-value: < 2.2e-16

8. TEST DE PEARSON

El coeficiente de Pearson mide la fuerza de la relación entre el volumen liberado y el costo total. Un valor cercano a 1 indicaría una correlación perfecta.

## 
##  Pearson's product-moment correlation
## 
## data:  tabla_valores$X and tabla_valores$Y
## t = 17.708, df = 2740, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.2864628 0.3536493
## sample estimates:
##      cor 
## 0.320459

9. ESTIMACIÓN

Aplicando la ecuación cuadrática calculada por el modelo, realizamos una proyección técnica para un escenario de 200 barriles liberados.

## Resultado de la Estimación:
## Para un derrame de 200 barriles, el costo proyectado es de $ -271,695.5

10. CONCLUSIÓN

El análisis mediante Regresión Polinómica demuestra que los costos económicos de los accidentes en oleoductos no son lineales; presentan una aceleración vinculada al cuadrado de la magnitud del evento.

Gracias al ajuste visual realizado, se confirma que el modelo cuadrático es una herramienta eficaz para capturar el incremento en los costos de remediación y multas. Este modelo permite a los gestores de riesgo proyectar impactos financieros de manera más precisa, como se evidenció en la estimación para 200 barriles.