2024-06-01

Introducción

Contexto

El proceso de ablandamiento de agua es esencial en las operaciones de producción de hidrocarburos, especialmente en campos que utilizan la inyección cíclica de vapor para la recuperación mejorada de crudo. Antes de evaluar y validar los datos asociados al desempeño del proceso, es importante establecer las expectativas y las hipótesis fundamentales que guiarán nuestro análisis. Estas expectativas se basan en la comprensión del proceso subyacente y en sus objetivos operacionales.

La dureza del agua se puede dividir en varios componentes, siendo los más comunes la dureza total, la dureza temporal y la dureza permanente. Estos términos se utilizan para describir diferentes aspectos de la composición química del agua en relación con su capacidad para formar incrustaciones o reaccionar con jabones y detergentes.

Propósito del análisis

El análisis de los datos asociados al proceso de ablandamiento de agua tiene como objetivo principal evaluar el cumplimiento de las expectativas y requerimientos de calidad establecidos. Este análisis proporcionará una línea base para identificar áreas de mejora en la medición, recolección, análisis de información y eficiencias operativas, con el fin de optimizar el rendimiento y la confiabilidad del proceso.

Exploración y Preparación de Datos

Descripción del Dataset

  • Objetivo: Proporcionar una visión general del dataset tras las transformaciones y limpiezas iniciales.

  • Descripción: El dataset “OUT SUAVIZADA” contiene 2410 registros y 16 variables, filtrado a partir de un dataset original de 27258 observaciones y 16 variables.

## tibble [2,410 × 15] (S3: tbl_df/tbl/data.frame)
##  $ id           : chr [1:2410] NA NA NA NA ...
##  $ fecha        : Date[1:2410], format: "2022-02-10" "2022-02-10" ...
##  $ datetime     : POSIXct[1:2410], format: "2022-02-10 03:00:00" "2022-02-10 09:00:00" ...
##  $ muestra      : Factor w/ 69 levels "101-A (ABARCO)",..: 31 31 31 31 31 31 31 31 31 31 ...
##  $ o.w          : num [1:2410] NA NA NA NA NA NA NA NA NA NA ...
##  $ tss          : num [1:2410] NA NA NA NA NA NA NA NA NA NA ...
##  $ ph           : num [1:2410] 8.71 8.35 8.62 8.58 8.14 8.17 8.29 7.79 8.05 8.15 ...
##  $ Cl           : num [1:2410] 109 106 130 121 118 120 116 106 124 102 ...
##  $ conductance  : num [1:2410] NA NA NA NA NA NA NA NA NA NA ...
##  $ CaCO3        : num [1:2410] NA NA NA NA NA NA NA NA NA NA ...
##  $ Fe           : num [1:2410] NA NA NA NA NA NA NA NA NA NA ...
##  $ Ba           : num [1:2410] NA NA NA NA NA NA NA NA NA NA ...
##  $ SO4          : num [1:2410] NA NA NA NA NA NA NA NA NA NA ...
##  $ analista     : chr [1:2410] "J. OSORIO" "MERLY" "A. PIÑA" "J. OSORIO" ...
##  $ observaciones: chr [1:2410] NA NA NA NA ...

Variables de interés

Con base en el conteo de NA’s se infiere que O.W, TSS, Fe, Ba, SO4, y conductance no son variables de interés para el proceso de suavizado. Estas variables se omiten del análisis y pH, Cl y CaCO3 se definen como variables del dominio del proceso.

## # A tibble: 1 × 9
##      Cl    pH    ow   tss CaCO3    Fe    Ba   SO4 Condunctance
##   <int> <int> <int> <int> <int> <int> <int> <int>        <int>
## 1    52    69  2408  2406    46  2305  2310  2309         2405

Preparación del Dataset

  • Objetivo: Transformar y limpiar el dataset de trabajo para análisis posterior.

  • Resultados:

## # A tibble: 3 × 4
## # Rowwise: 
##   fecha         ph    Cl CaCO3
##   <date>     <dbl> <dbl> <dbl>
## 1 2022-02-10  8.71   109    NA
## 2 2022-02-10  8.35   106    NA
## 3 2022-02-10  8.62   130    NA
##      fecha                  ph              Cl              CaCO3        
##  Min.   :2022-02-10   Min.   : 3.48   Min.   :   1.51   Min.   : 0.0000  
##  1st Qu.:2022-09-23   1st Qu.: 8.34   1st Qu.: 138.00   1st Qu.: 0.3000  
##  Median :2023-04-20   Median : 8.76   Median : 168.00   Median : 0.5000  
##  Mean   :2023-04-16   Mean   : 8.82   Mean   : 167.48   Mean   : 0.8633  
##  3rd Qu.:2023-11-05   3rd Qu.: 9.21   3rd Qu.: 201.00   3rd Qu.: 0.9000  
##  Max.   :2024-05-28   Max.   :11.20   Max.   :1780.00   Max.   :92.0000  
##  NA's   :60           NA's   :69      NA's   :52        NA's   :46

—- {# Fin de Sección 1}

Pruebas de Calidad

Completitud

Se identificaron 167 valores faltantes en el conjunto de datos de trabajo. Los valores atípicos -outliers- se detectaron utilizando el algoritmo de Isolation Forest y se convirtieron en NA para evitar la reducción del conjunto de datos y permitir un análisis fluido de las series de tiempo.

## # A tibble: 1 × 3
##      Cl    pH CaCO3
##   <int> <int> <int>
## 1    52    69    46
## [1] 167

Dispersión

Se visualiza la presencia de outliers en la variable ‘pH’ y ‘Cl’ y ‘CaCO3’. Evidencia necesidad de gestionar outliers.

Distribución

Los histogramas revelan que las variables ‘pH’, ‘Cl’ y ‘CaCO3’ tienen distribuciones asimétricas sesgadas a la derecha, con la mayoría de los valores concentrados en rangos bajos y presencia de outliers.

—- {# Fin de Sección 2}

Dataset de Trabajo

Limpieza de Outliers e Imputación de NA’s

  • Objetivo: Identificar y manejar outliers e imputar valores faltantes.

  • Pasos:

    • Identificación de outliers: Usar Isolation Forest para detectar outliers.
    • Asignación de NA’s: Marcar outliers como NA.
    • Imputación de NA’s: Usar el paquete mice para imputar valores faltantes.
  • Resultados: Los datos limpios, imputados y con gestión de outliers tienen la siguiente estructura:

##      fecha                  ph               Cl          CaCO3       
##  Min.   :2022-02-10   Min.   : 7.730   Min.   : 62   Min.   :0.0000  
##  1st Qu.:2022-09-06   1st Qu.: 8.360   1st Qu.:142   1st Qu.:0.3000  
##  Median :2023-04-10   Median : 8.820   Median :166   Median :0.5000  
##  Mean   :2023-04-06   Mean   : 8.826   Mean   :166   Mean   :0.6927  
##  3rd Qu.:2023-10-31   3rd Qu.: 9.180   3rd Qu.:198   3rd Qu.:0.8000  
##  Max.   :2024-05-28   Max.   :10.420   Max.   :272   Max.   :6.0000

Dispersión

Se visualiza la presencia de una cola larga en la variable ‘CaCO3’ y en ‘pH’ y ‘Cl’ ausencia de outliers.

Distribución

Ya sin la presencia de outliers las variables pH y Cl adquieren una distribución central, y CaCO3 adquiere una distribución consistente con el proceso.

Matriz de dispersión

  • Propósito: Evaluar las correlaciones y relaciones entre los diferentes parámetros (pH, Cl, CaCO3) para entender cómo interactúan entre sí.
  • Resultados:

Matriz de dispersión: Análisis contextual

  • pH vs Cl: Correlación: 0.170 (significativa pero débil). Existe una ligera relación positiva entre pH y Cl. A medida que aumenta el pH, también tiende a aumentar ligeramente el nivel de Cl, y viceversa. Esto podría indicar que ciertos tratamientos químicos que afectan el pH también influyen en los niveles de Cl, o que ambos están vinculados a cambios en la química del agua de entrada.

  • pH vs CaCO3: Correlación: -0.029 (prácticamente nula). No hay una relación lineal discernible entre pH y CaCO3. Esto sugiere que el proceso de suavizado que elimina CaCO3 (dureza) opera independientemente del control de pH. Es una señal positiva, ya que indica que ajustar uno no afecta inadvertidamente al otro.

  • Cl vs CaCO3: Correlación: 0.2 (débil a moderada, significativa). Existe una relación positiva moderada entre Cl y CaCO3. Esto es interesante y podría tener varias explicaciones:

    • Fuente de agua compartida: Algunas fuentes de agua duras también pueden ser ricas en cloruros.
    • Interacción en el proceso de suavizado: Los iones de Cl podrían competir con los iones de Ca y Mg por los sitios activos en las resinas de intercambio iónico, afectando la eficiencia del suavizado.
    • Indicador de eficiencia: Altos niveles de Cl podrían ser un indicador temprano de que las resinas están perdiendo su eficacia, antes de que se observe un aumento significativo en CaCO3.

—- {# Fin de Sección 3}

Análisis

Descripción

Las series de tiempos para análisis comprenden el periodo del 10-02-2022 hasta 28-05-2024, para registros (observaciones) cada 8 horas.

Multiple seasonal decomposition (MSTL)

  • Propósito: Descomponer cada serie de tiempo en sus componentes fundamentales: datos observados, tendencia, estacionalidad (múltiples ciclos) y componente residual. Esto permite identificar patrones subyacentes y anomalías que no son evidentes en la serie original.

  • Componentes Analizados: Datos (Serie original sin descomponer), Tendencia (Dirección general a largo plazo), Estacionalidad Patrones( cíclicos repetitivos), Residuos (Variaciones irregulares después de quitar la tendencia y estacionalidad)

pH (ph_ts)

  • Tendencia: Muestra una curva pronunciada, indicando cambios sistemáticos a largo plazo. Esto podría reflejar el envejecimiento gradual del equipo de tratamiento o cambios en la química del agua de entrada.

  • Estacionalidad: Patrones cíclicos evidentes, posiblemente ligados a cambios estacionales en la fuente de agua o en los procesos industriales.

  • Residuos: Relativamente pequeños y bien distribuidos, lo que indica que el modelo MSTL captura bien la dinámica.

Cloruros (Cl_ts)

  • Tendencia: Sutil pero presente, sugiriendo un aumento o disminución gradual a largo plazo de los niveles de cloruros.

  • Estacionalidad: Muestra patrones cíclicos prominentes, consistentes con la alta predictibilidad observada en ARIMA. Esto refuerza la idea de que los niveles de Cl están fuertemente influenciados por ciclos externos predecibles.

  • Residuos: Un patrón más estructurado que en pH, indicando que pueden existir ciclos estacionales adicionales no capturados.

Dureza total (CaCO3_ts)

  • Tendencia: Muestra una tendencia descendente significativa, posiblemente indicando una mejora gradual en la eficacia del sistema de suavizado o cambios en la dureza del agua de entrada.

  • Estacionalidad: La magnitud de los componentes estacionales es extremadamente grande en comparación con los otros dos parámetros, lo que sugiere que la dureza del agua está fuertemente influenciada por ciclos estacionales.

  • Residuos: Extremadamente grandes y con una estructura aparente, lo que indica que hay variaciones irregulares sustanciales que no son capturadas por el modelo MSTL.

—- {# Fin de Sección 4}

Pruebas de Estabilidad y Estacionariedad

Dickey-Fuller Aumentada (ADF)

  • Propósito: Evaluar si una serie temporal es estacionaria. En este contexto, evalúa si los niveles de pH, Cl y CaCO3 fluctúan alrededor de un valor medio a lo largo del tiempo.

  • Criterio de Aceptación: Si el p-valor < 0.05, se rechaza la hipótesis nula de que la serie tiene una raíz unitaria (no estacionaria).

  • Resultado:

##     Series Dickey_Fuller    P_Value Lag_Order     Stationary
## 1    ph_ts     -3.637959 0.02900848        13     stationary
## 2    Cl_ts     -3.192349 0.08921704        13 non-stationary
## 3 CaCO3_ts     -8.106192 0.01000000        13     stationary
  • Análisis: El pH y CaCO3 son estacionarios, lo que sugiere que el proceso de suavizado mantiene estos parámetros alrededor de valores medios consistentes. Sin embargo, los niveles de Cl no son estacionarios, lo que indica variaciones más amplias que podrían requerir ajustes más frecuentes en el tratamiento químico para mantener la calidad del agua de alimentación.

Kwiatkowski-Phillips-Schmidt-Shin (KPSS)

  • Propósito: Verificar si una serie temporal es estacionaria en torno a un nivel (media o tendencia constante). En este caso, verifica si los niveles de los parámetros fluctúan alrededor de una media constante o siguen una tendencia.

  • Criterio de Aceptación: Si el p-valor > 0.05, se acepta la hipótesis nula de que la serie es estacionaria.

  • Resultado:

##     Series Test_Statistic    P_Value Lag_Order           Stationary
## 1    ph_ts      6.3842687 0.01000000         8 trend non-stationary
## 2    Cl_ts      3.6483893 0.01000000         8 trend non-stationary
## 3 CaCO3_ts      0.6393559 0.01905856         8 trend non-stationary
  • Análisis: Sorprendentemente, todos los parámetros muestran una tendencia no estacionaria. Esto sugiere que hay factores externos que están influyendo gradualmente en el proceso de suavizado a lo largo del tiempo. Podría ser debido a cambios estacionales en la fuente de agua, desgaste de los equipos de tratamiento, o cambios en la demanda de vapor que afectan la carga del sistema.

Breusch-Pagan

  • Propósito: Evaluar si las lecturas de un modelo de regresión tienen varianza constante (homocedasticidad). En este contexto, evalúa si la variabilidad de los parámetros es constante o cambia con el tiempo.

  • Criterio de Aceptación: Si el p-valor > 0.05, se acepta la hipótesis nula de homocedasticidad.

  • Resultado:

##     Series Test_Statistic       P_Value              Stationary
## 1    ph_ts       7.105044  7.686734e-03 variance non-stationary
## 2    Cl_ts     797.004586 2.417239e-175 variance non-stationary
## 3 CaCO3_ts      31.623380  1.871626e-08 variance non-stationary
  • Análisis: El pH, Cl y CaCO3 muestran varianzas no estacionarias, especialmente Cl con un p-valor extremadamente bajo. Esto sugiere que la efectividad del proceso de suavizado en la eliminación de estos iones varía significativamente, posiblemente debido a fluctuaciones en la composición del agua de entrada o a la degradación de las resinas de intercambio iónico.

—- {# Fin de Sección 5}

Pruebas de Consistencia

Coeficiente de variación (CV)

  • Propósito: Evaluar la consistencia relativa de las mediciones. En este contexto permite determinar qué tan consistentes son las mediciones en relación con su media.

  • Criterio de Aceptación: Un CV < 0.10 (10%) generalmente indica una alta consistencia de las mediciones. En procesos industriales críticos, se pueden usar criterios más estrictos, como CV < 0.05 (5%) para parámetros clave.

  • Resultado:

## [1] 0.06013818
## [1] 0.2425046
## [1] 1.00554
  • Análisis: El pH muestra una alta consistencia (CV = 6.01%), lo que es crucial para prevenir la corrosión en los sistemas de vapor. Sin embargo, Cl (CV = 24.25%) y especialmente CaCO3 (CV = 100.55%) muestran una variabilidad alarmante. Esta inconsistencia en la dureza total (CaCO3) podría llevar a incrustaciones impredecibles en las tuberías y calderas, lo que requiere una revisión urgente del proceso de suavizado.

Canova-Hansen

  • Propósito: Detectar estacionalidad en las series de tiempo.

  • Criterio de Aceptación: Si el p-valor < 0.05, se rechaza la hipótesis nula de no estacionalidad.

##          statistics pvalues NW.order   lag1 pvlabels     Seasonal
## ph_ts        2.1055  0.0985   6.0000 3.0000        . Non-seasonal
## Cl_ts        1.7765  0.2318   6.0000 3.0000          Non-seasonal
## CaCO3_ts     1.7278  0.2529   6.0000 3.0000          Non-seasonal
  • Análisis: Sorprendentemente, ninguna de las series muestra estacionalidad significativa. Esto sugiere que, a pesar de las expectativas de variaciones estacionales en la fuente de agua, el proceso de suavizado está compensando efectivamente estas fluctuaciones. Es un hallazgo positivo que indica la robustez del sistema frente a cambios estacionales.

—- {# Fin de Sección 6}

Ruido y Anomalías

Extracción de residuos

Shapiro-Wilk

  • Propósito: Verificar si los datos (residuos) siguen una distribución normal. En este contexto, si las variaciones en los parámetros siguen un patrón normal, sugeriría fluctuaciones naturales.

  • Criterio de Aceptación: Si el p-valor > 0.05, se acepta la hipótesis nula de que los residuos de los datos siguen una distribución normal.

  • Resultados:

##            Series Shapiro_p_value   Seasonal
## ph_ts       ph_ts    7.638919e-01     Normal
## Cl_ts       Cl_ts    6.334429e-06 Non-normal
## CaCO3_ts CaCO3_ts    3.423693e-76 Non-normal
  • Análisis: Solo el pH sigue una distribución normal. Cl y CaCO3 no lo hacen, sugiriendo que sus variaciones no son puramente aleatorias.

Kolmogorov-Smirnov

  • Propósito: Comparar la distribución de los datos con una distribución normal.

  • Criterio de Aceptación: Si el p-valor > 0.05, los datos no difieren significativamente de una distribución normal.

  • Resultados:

##            Series Kolmogorov_p_value  Normality
## ph_ts       ph_ts         0.90177661     Normal
## Cl_ts       Cl_ts         0.08786014     Normal
## CaCO3_ts CaCO3_ts         0.00000000 Non-normal
  • Análisis: pH y Cl no difieren significativamente de una distribución normal, mientras que CaCO3 sí. La discrepancia en los resultados de CaCO3 entre ambas pruebas (Shapiro-Wilk y Kolmogorov-Smirnov) sugiere una distribución compleja. Esto podría indicar que la dureza total está siendo influenciada por múltiples factores, como diferentes fuentes de agua o eventos operacionales específicos (mantenimiento, cambios de resina) que afectan la eficacia del suavizado.

Ljung-Box

  • Propósito: Verificar si los registros de una serie temporal son independientes (no autocorrelacionados). En este contexto, verifica si los cambios en los parámetros son independientes o si están influenciados por sus valores anteriores.

  • Criterio de Aceptación: Si el p-valor > 0.05, se acepta la hipótesis nula de no autocorrelación en los residuos.

  • Resultados:

##            Series LjungBox_p_value Autocorrelation
## ph_ts       ph_ts                0  Autocorrelated
## Cl_ts       Cl_ts                0  Autocorrelated
## CaCO3_ts CaCO3_ts                0  Autocorrelated
  • Análisis: Todos los parámetros muestran autocorrelación en sus residuos. Esto es crítico:

    • Para el pH, sugiere que los ajustes químicos no se están realizando de manera independiente, sino que se basan en lecturas anteriores, lo que podría llevar a sobre o sub correcciones.

    • Para Cl y CaCO3, indica que la eficacia del suavizado en un momento dado depende de su rendimiento anterior. Esto podría señalar un problema de agotamiento gradual de las resinas, donde su capacidad de intercambio iónico se reduce progresivamente, afectando cada vez más la calidad del agua.

—- {# Fin de Sección 7}

Modelado y Pronóstico

Modelado ARIMA

  • Propósito: Modelar y predecir series de tiempo mediante la captura de patrones dinámicos complejos, incluyendo: Autorregresión (AR) o dependencia de valores pasados; Integración (I) o diferenciación para lograr estacionariedad y Media Móvil (MA) o influencia de errores pasados. En este contexto, el objetivo es determinar si los parámetros clave del proceso de suavizado (pH, Cl, CaCO3) siguen patrones predecibles, lo que permitiría un control más anticipativo y preciso.

  • Resultados:

## [1] "Correlación para ph_ts : 0.850649950829875"
## [1] "Correlación para Cl_ts : 0.895183299523795"
## [1] "Correlación para CaCO3_ts : 0.470762561237123"

—- {# Fin de Sección 8}

Validación del Modelo

Residuos ARIMA

  • Proposito: Validar la calidad y adecuación de los modelos ARIMA aplicados a los parámetros clave del proceso de suavizado (pH, Cl, CaCO3). Esto se realiza mediante el examen de los residuos del modelo, que son las diferencias entre los valores reales y los predichos. El objetivo es verificar si estos residuos cumplen con dos supuestos fundamentales:

    • No Autocorrelación: Los errores deben ser independientes entre sí. La presencia de autocorrelación indicaría que hay patrones en los datos que el modelo no ha capturado.
    • Normalidad: Los errores deben seguir una distribución normal. Esto valida que el modelo pueda manejar adecuadamente la variabilidad inherente del proceso.
  • Criterios:

    • Prueba de Ljung-Box para Autocorrelación:

    • H₀: No hay autocorrelación en los residuos.

    • H₁: Existe autocorrelación en los residuos.

    • p-valor < 0.05, se rechaza H₀, indicando presencia de autocorrelación.

    • Prueba de Shapiro-Wilk para Normalidad:

    • H₀: Los residuos siguen una distribución normal.

    • H₁: Los residuos no siguen una distribución normal.

    • p-valor < 0.05, se rechaza H₀, indicando que los residuos no son normales.

Resultados

  • Autocorrelación (Prueba de Ljung-Box):

    • p-valor < 0.05 → Rechaza H₀. Existe autocorrelación.
##            Series LjungBox_p_value    Autocorrelation
## ph_ts       ph_ts     0.0002263002     Autocorrelated
## Cl_ts       Cl_ts     0.3448332250 Not Autocorrelated
## CaCO3_ts CaCO3_ts     0.1952676419 Not Autocorrelated
  • Normalidad (Prueba de Shapiro-Wilk):

    • p-valor < 0.05 → Rechaza H₀. No normal.
##            Series Shapiro_p_value   Seasonal
## ph_ts       ph_ts    1.335139e-28 Non-normal
## Cl_ts       Cl_ts    8.348870e-36 Non-normal
## CaCO3_ts CaCO3_ts    6.690162e-49 Non-normal

Interpretación

  • Autocorrelación: únicamente el pH presenta autocorrelación significativa en sus residuos, mientras que los modelos ARIMA para Cl y CaCO₃ logran capturar adecuadamente la estructura temporal de estos parámetros:

    • pH: Muestra autocorrelación, sugiriendo dinámicas no capturadas.

    • Cl y CaCO₃: No muestran autocorrelación, indicando que ARIMA captura bien su estructura temporal.

  • Normalidad: Todos los residuos muestran una fuerte desviación de la normalidad, con p-valores extremadamente bajos. Esto indica la presencia de eventos atípicos o “colas pesadas” en las distribuciones:

    • pH: Posibles excursiones de pH debido a fallos puntuales de equipos o cambios bruscos en el agua de entrada.
    • Cl: Confirma nuestra hipótesis de eventos externos puntuales (p.ej., bache masivo que introduce sal).
    • CaCO₃: Valida la idea de eventos geológicos puntuales y “escalones” en la degradación de resinas.

Implicaciones

Para pH, explorar modelos no lineales como ARCH/GARCH para capturar dinámicas de control complejas.

  • Para Cl y CaCO₃, ARIMA es adecuado, pero considerar SARIMA para posibles estacionalidades sutiles.
  • Mantener el enfoque de aprendizaje automático adaptativo para CaCO₃, útil para su alta variabilidad.

La falta de normalidad sugiere que el sistema está sujeto a eventos extremos:

  • Implementar detección robusta de outliers en tiempo real.
  • Establecer alarmas predictivas basadas en la magnitud de los residuos para todos los parámetros.
  • Usar técnicas de SPC con límites dinámicos, especialmente en pH donde los residuos indican más complejidad.

—- {# Fin de Sección 9}

Conclusiones

pH

pH (ph_ts):

  • Correlación: 0.8506

  • Análisis: El modelo ARIMA captura muy bien la dinámica del pH, con una alta correlación entre valores reales y predicciones. Esto sugiere que el pH sigue un patrón temporal consistente y predecible. Sin embargo, la autocorrelación en los residuos indica la presencia de dinámicas no lineales en el sistema de control, posiblemente ciclos de retroalimentación complejos. La no normalidad de los residuos también sugiere la ocurrencia de eventos atípicos, como fallos puntuales de equipos o cambios bruscos en el agua de entrada.

Cl

Cloruros (Cl_ts):

  • Correlación: 0.8951

  • Análisis: Sorprendentemente, a pesar de ser no estacionario según la prueba ADF, el modelo ARIMA para Cl_ts muestra la correlación más alta. Esto sugiere que, aunque los niveles de cloruros fluctúan significativamente, lo hacen de una manera altamente predecible. Más aún, la ausencia de autocorrelación en los residuos confirma que el modelo ARIMA captura excepcionalmente bien la estructura temporal de Cl. Esto apunta a que los cambios en los niveles de Cl están fuertemente influenciados por factores externos predecibles, como ciclos industriales o patrones de uso del agua.

Dureza Total

(CaCO3_ts):

  • Correlación: 0.4707

  • Análisis: El modelo ARIMA tiene un rendimiento significativamente peor al predecir CaCO₃, con una correlación mucho más baja. Sin embargo, la ausencia de autocorrelación en los residuos sugiere que el modelo, a pesar de su baja predictibilidad, captura la estructura temporal básica. La baja correlación se explica por:

    • Alta variabilidad (CV de 93.67%) que dificulta la captura de patrones.
    • No estacionariedad en varianza (Breusch-Pagan) que indica variabilidad cambiante.
    • No normalidad en residuos que confirma eventos anómalos como ciclos geológicos o “escalones” en la degradación de resinas.

Modelo

El análisis de residuos ARIMA revela una capa más profunda de complejidad en nuestro proceso de suavizado. A pesar de las impresionantes capacidades predictivas, especialmente para Cl y pH, los residuos cuentan una historia matizada.

  • Autocorrelación: Solo pH muestra patrones no capturados, posiblemente ciclos de retroalimentación no lineales. Esto nos impulsa a explorar modelos ARCH/GARCH específicamente para pH. En contraste, ARIMA captura bien la estructura temporal de Cl y CaCO₃, validando su adecuación.

  • No Normalidad: Consistentemente presente, revela que todos los parámetros están más expuestos a eventos extremos de lo pensado. Esto no invalida nuestros modelos ARIMA, que siguen siendo valiosos, pero sí demanda una capa adicional de robustez:

    • Detección de outliers en tiempo real.
    • Alarmas predictivas basadas en residuos.
    • Control estadístico de procesos con límites adaptativos.

Implicaciones operacionales

  • pH: Alta predictibilidad, pero con dinámicas no lineales. Usar modelos ARCH/GARCH para un dosaje químico más preciso. Implementar un sistema de detección temprana para eventos atípicos (fallos de equipos, cambios bruscos en el agua).

  • Cloruros (Cl): Predictibilidad sorprendentemente alta. ARIMA captura su estructura temporal excepcionalmente bien. Desarrollar modelos que incorporen datos externos (ciclos industriales, datos meteorológicos) para predecir eventos puntuales como deshielos masivos, permitiendo ajustes proactivos.

  • Dureza Total (CaCO₃): Baja predictibilidad, pero ARIMA captura su estructura básica. La complejidad proviene de eventos externos. Estrategia:

    • Usar ARIMA para control base.
    • Implementar un sistema de aprendizaje automático para adaptarse a eventos geológicos y degradación no lineal de resinas.
    • Monitoreo multiparamétrico para correlacionar picos con eventos externos.

Este análisis ARIMA revela un panorama fascinante: pH necesita modelos no lineales, Cl es sorprendentemente predecible, y CaCO₃ requiere un enfoque híbrido. Un camino claro hacia un control del agua más inteligente y resiliente.

Recomendaciones

  • Implementar modelos ARCH/GARCH para el pH, capturando dinámicas no lineales para una dosificación más precisa. Instalar sensores adicionales para detectar eventos atípicos.

  • Para Cl, aprovechar su alta predictibilidad con ARIMA. Desarrollar un sistema que integre datos externos (industriales, meteorológicos) para anticipar eventos puntuales, permitiendo ajustes proactivos.

  • En cuanto a CaCO₃:

    • Usar ARIMA como base, complementado con aprendizaje automático para adaptarse a eventos geológicos y degradación de resinas.
    • Instalar sensores multiparamétricos para correlacionar picos con eventos externos.
    • Diseñar un sistema de resinas de intercambio iónico adaptativo, con etapas que se ajusten según las predicciones.

Siguiente nivel

  • Implementar detección robusta de outliers y control estadístico de procesos (SPC) con límites adaptativos para todos los parámetros, especialmente crítico para pH y CaCO₃.

  • Desarrollar un sistema de alarmas predictivas basado en la magnitud de los residuos, aprovechando la información de eventos extremos.

  • Crear un “panel de control inteligente” que combine todos estos modelos, ofreciendo no solo predicciones sino también interpretaciones y recomendaciones en tiempo real.

Este enfoque multinivel no solo optimiza cada parámetro individualmente sino que también crea un sistema de agua de alimentación más inteligente y resiliente, capaz de anticipar, interpretar y adaptarse a la complejidad revelada por nuestro análisis ARIMA.

—- {# Fin de Sección 10}