Resumen

Este informe analiza la confiabilidad de los datos de la serie de tiempo Cl_ts, correspondiente a las mediciones diarias del nivel de cloruro en el proceso de suavizado de agua del Campo Moriche. Se realizaron diversas pruebas estadísticas y análisis de descomposición, complementados con una revisión del contexto industrial. Si bien los resultados sugieren que los datos representan mediciones reales, se identificó un patrón inusual en los residuos que requiere una investigación exhaustiva. Se discuten las implicaciones de la falta de confiabilidad de los datos y se proporcionan recomendaciones para validar y mejorar la integridad de los datos.

Palabras clave: confiabilidad de datos, suavizado de agua, series de tiempo, análisis de residuos, inyección de vapor, Campo Moriche.

1. Introducción

En el Campo Moriche, el proceso de suavizado de agua desempeña un papel crucial en las operaciones de recuperación mejorada de petróleo (EOR, por sus siglas en inglés) mediante la inyección cíclica de vapor. El agua suavizada se utiliza para generar vapor, el cual se inyecta directamente en la formación productora para reducir la viscosidad del crudo y aumentar la producción de los pozos.

Este informe presenta un análisis detallado de la confiabilidad de los datos de la serie de tiempo Cl_ts, que corresponde a mediciones diarias del nivel de cloruro en el proceso de suavizado de agua del Campo Moriche. El objetivo es determinar si los datos representan mediciones reales o si existen indicios de posibles problemas o manipulaciones, ya que la confiabilidad de estos datos es fundamental para garantizar un monitoreo preciso del proceso, cumplir con los requisitos normativos y respaldar la toma de decisiones operativas y de optimización.

Se realizaron diversas pruebas estadísticas y análisis de descomposición, complementados con una revisión del contexto industrial y el conocimiento previo sobre este tipo de procesos. Además, se consideraron las implicaciones de la falta de confiabilidad de los datos en aspectos clave como la protección del equipo, la eficiencia operativa y la confianza de las partes interesadas.

2. Análisis

2.1 Inspección Visual

2.1.1 Serie de tiempo

La inspección visual de la serie de tiempo proporciona una visión inicial de su comportamiento y tendencias. La Figura 1 muestra la evolución de los niveles de cloruro a lo largo del tiempo.

:Figura 1: Serie de tiempo para mediciones de concentraciones de cloruros en el proceso de suavizado de agua.

2.1.2 Forma de la distribución

El histograma revela la distribución de los niveles de cloruro en el proceso de suavizado de agua. Muestra una distribución bimodal o con dos picos principales. Esto podría indicar la presencia de dos regímenes o estados distintos en el proceso de suavizado de agua.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00   15.00   37.00   48.73   76.00  289.00
##  Time-Series [1:2213] from 2022 to 2024: 71 35 62 58 14 17 29 79 5 15 ...

Valores atípicos: Se observan algunos valores atípicos por encima de 200 ppm, con un valor máximo de 289 ppm de cloruro.

Rango de valores: Los valores de cloruro se extienden desde un mínimo de 1 ppm hasta un máximo de 289 ppm.

Valores centrales: La mediana se ubica en 37 ppm, mientras que el promedio (mean) es ligeramente más alto, en 48.73 ppm. Esto sugiere una distribución levemente sesgada hacia valores más altos.

Cuartiles: El 25% de los valores se encuentran por debajo de 15 ppm, y el 75% de los valores están por debajo de 76 ppm.

2.2 Descomposición

Las descomposiciones de series de tiempo son técnicas útiles para separar los componentes subyacentes de una señal, como la tendencia, la estacionalidad y los componentes residuales o irregulares. En este análisis, se aplicaron tres métodos de descomposición a la serie de tiempo Cl_ts: STL, MSTL y Movil Average.

2.2.1 Descripción de la descomposición

En una serie de tiempo real, se espera que:

  • El componente de tendencia capture los patrones suaves de crecimiento o decrecimiento a largo plazo.

  • El componente estacional capture los patrones periódicos o cíclicos recurrentes.

  • El componente residual o irregular capture las fluctuaciones aleatorias y los eventos puntuales no explicados por la tendencia y la estacionalidad.

2.2.2 Descomposición STL

La descomposición STL utiliza el método Loess (regresión local ponderada) para estimar los componentes de tendencia y estacionalidad de una serie de tiempo.

2.2.3 Descomposición MSTL

La descomposición MSTL (Imagen 1) es una variante de STL que utiliza una ventana móvil para estimar los componentes de tendencia y estacionalidad. Esta técnica es útil cuando los patrones de tendencia y estacionalidad cambian gradualmente a lo largo del tiempo. En una serie de tiempo real, se espera que:

2.2.4 Descomposición Moving Averages

La descomposición mediante promedios móviles destaca las fluctuaciones irregulares de la serie temporal, proporcionando una visión más clara de los datos residuales.

2.3 Pruebas de Estacionariedad

2.3.1 Prueba de Dickey-Fuller Aumentada

## 
##  Augmented Dickey-Fuller Test
## 
## data:  Cl_ts
## Dickey-Fuller = -8.0229, Lag order = 13, p-value = 0.01
## alternative hypothesis: stationary

El resultado de esta prueba (p-value = 0.01) rechaza la hipótesis nula de raíz unitaria, lo que indica que la serie es estacionaria después de aplicar primera diferencia. Esto es consistente con una serie de tiempo real.

2.3.2 Prueba de KPSS

## 
##  KPSS Test for Level Stationarity
## 
## data:  Cl_ts
## KPSS Level = 2.0245, Truncation lag parameter = 8, p-value = 0.01

El resultado de esta prueba (p-value = 0.01) sugiere que la serie es estacionaria, lo cual es coherente con una serie de tiempo real.

2.4 Análisis de Autocorrelación

2.4.1 Función de Autocorrelación (ACF)

## 
## Autocorrelations of series 'Cl_ts', by lag
## 
## 0.000000 0.000913 0.001826 0.002740 0.003653 0.004566 0.005479 0.006393 
##    1.000    0.187    0.156    0.377    0.156    0.142    0.259    0.134 
## 0.007306 0.008219 0.009132 0.010046 0.010959 0.011872 0.012785 0.013699 
##    0.122    0.193    0.136    0.117    0.154    0.148    0.104    0.127 
## 0.014612 0.015525 0.016438 0.017352 0.018265 0.019178 0.020091 0.021005 
##    0.165    0.109    0.081    0.152    0.110    0.084    0.122    0.150 
## 0.021918 0.022831 0.023744 0.024658 0.025571 0.026484 0.027397 0.028311 
##    0.112    0.122    0.150    0.100    0.110    0.143    0.071    0.094 
## 0.029224 0.030137 
##    0.136    0.108

2.4.2 Función de Autocorrelación Parcial (PACF)

## 
## Partial autocorrelations of series 'Cl_ts', by lag
## 
## 0.000913 0.001826 0.002740 0.003653 0.004566 0.005479 0.006393 0.007306 
##    0.187    0.125    0.346    0.042    0.048    0.114    0.020    0.020 
## 0.008219 0.009132 0.010046 0.010959 0.011872 0.012785 0.013699 0.014612 
##    0.052    0.037    0.021    0.028    0.051    0.005    0.014    0.063 
## 0.015525 0.016438 0.017352 0.018265 0.019178 0.020091 0.021005 0.021918 
##    0.015   -0.029    0.040    0.019    0.005    0.005    0.073    0.035 
## 0.022831 0.023744 0.024658 0.025571 0.026484 0.027397 0.028311 0.029224 
##    0.013    0.038    0.002    0.006    0.023   -0.027    0.003    0.023 
## 0.030137 
##    0.040

Las funciones de autocorrelación y autocorrelación parcial muestran patrones característicos de series de tiempo reales, con decaimiento gradual y picos significativos en ciertos rezagos.

2.5 Pruebas de Normalidad

2.5.1 Prueba de Shapiro-Wilk

## 
##  Shapiro-Wilk normality test
## 
## data:  Cl_ts
## W = 0.86417, p-value < 2.2e-16

2.5.2 Prueba de Jarque-Bera

## 
##  Jarque Bera Test
## 
## data:  Cl_ts
## X-squared = 1937.5, df = 2, p-value < 2.2e-16

Aunque ambas pruebas rechazan la hipótesis de normalidad, esto es común en series de tiempo reales, especialmente cuando hay presencia de valores atípicos o comportamientos estacionales marcados.

3. Resultados

3.1 Descripción de los resultados

El resultado del analisis de distribución y descomposiciones son consistentes, encontrandose lo siguiente:

  • Límite aparente en 100 ppm: Se observa una caída abrupta en los valores de la serie de tiempo (componente “Data”) después de alcanzar aproximadamente 100 ppm de cloruro. Este comportamiento sugiere la posible existencia de un límite artificial o un techo impuesto en los datos, lo que podría indicar un problema en la medición, registro o procesamiento de los datos.

  • Componente de Datos (Data): Se aprecian patrones estacionales marcados y picos recurrentes consistentes con mediciones diarias de niveles de cloruro.

  • Componente de Tendencia (Trend): La tendencia muestra un patrón ascendente durante el primer período (2022), seguido de un descenso durante el segundo período (2023). El punto de inflexión, donde la tendencia cambia de ascendente a descendente, ocurre ligeramente antes que en la descomposición MSTL, y es de forma escalonada en la AV.

  • Componentes Estacionales (Seasonal) y Residual (Remainder): El componente estacional exhibe patrones periódicos, como se espera en una serie de tiempo con estacionalidad diaria. El componente residual muestra un comportamiento de oposición entre períodos, similar en todas las descomposiciones.

3.2 Interpretación de los resultados

Se plantea la posibilidad de que los límites observados en la serie temporal sean el resultado de límites artificiales establecidos en el equipo de medición o en el proceso de registro de datos. Algunas hipótesis sobre las posibles causas de este comportamiento podrían ser:

  • Límite de saturación o rango máximo en el equipo de medición.
  • Truncamiento o recorte artificial de los datos por encima de un umbral específico.
  • Problema en el proceso de registro o digitalización de los datos.
  • Manipulación intencional de los datos.

Es posible que los datos no representen fielmente las mediciones reales del proceso, lo que podría conducir a conclusiones erróneas y decisiones operativas inapropiadas.

El componente de tendencia ascendente durante el primer período (2022) podría estar relacionado con un aumento gradual en los niveles de cloruro en el agua de alimentación o un desgaste progresivo de la resina de intercambio iónico, lo que resulta en una menor eficiencia en la remoción de iones.

El punto de inflexión y el cambio a una tendencia descendente en el segundo período (2023) podrían indicar la regeneración o reemplazo de la resina de intercambio iónico, lo que mejoró la eficiencia del proceso y redujo los niveles de cloruro en el efluente.

Los picos estacionales observados en el componente de datos podrían estar relacionados con los ciclos operacionales diarios, como los períodos de producción máxima o los cambios en la calidad del agua de alimentación.

El comportamiento inusual de oposición en los residuos podría sugerir un evento operativo significativo o un cambio en las condiciones del proceso entre los dos períodos principales, como una interrupción en el suministro de agua de alimentación, un mantenimiento mayor, un cambio en los procedimientos operativos o un problema de confiabilidad de los datos. Se realizará un análisis más detallado en la sección siguiente.

3.3 Análisis de Inconsistencias

Se observó un patrón inusual en los residuos o “remainders” de las descomposiciones, donde el segundo período principal exhibe un comportamiento aproximadamente opuesto (valores negativos) al primer período. Este hallazgo merece un análisis más profundo.

3.3.1 Hipótesis

Evento o cambio operacional real: Es posible que haya ocurrido algún evento significativo, cambio de condiciones o intervención en el proceso entre esos dos períodos que causó un cambio abrupto en el comportamiento de los datos, reflejado en esos residuos opuestos.

Problema de medición o registro de datos: Existe la posibilidad de que haya habido algún error sistemático en la medición o registro de los datos por parte de los operarios u otro personal involucrado, introduciendo artificialmente ese patrón inverso en los residuos.

Manipulación intencional de datos: No se puede descartar completamente la opción de que los datos hayan sido manipulados intencionalmente de alguna manera para generar ese comportamiento inusual en los residuos, aunque no es la hipótesis más probable.

3.3.2 Estrategia de Validación

Para determinar si ese comportamiento inusual en los residuos es real o producto de algún problema, se recomienda implementar la siguiente estrategia de validación:

  • Revisar registros y bitácoras de operación, mantenimiento y eventos relevantes ocurridos durante esos períodos. Realizar una auditoría exhaustiva del proceso de medición, incluyendo calibración de equipos, procedimientos de muestreo y registro de datos.

  • Entrevistar a operarios y personal clave involucrado en la toma y registro de mediciones. Acceder a los datos fuente originales (antes de cualquier procesamiento) para identificar si ese comportamiento ya estaba presente.

  • Buscar otras fuentes de datos relacionados (mediciones, registros de producción, variables de proceso, etc.) que puedan corroborar o contradecir ese comportamiento.

  • Realizar pruebas estadísticas más específicas para detectar cambios abruptos, puntos de quiebre o anomalías en la serie de tiempo.

  • Explorar modelos y simulaciones que puedan reproducir ese comportamiento bajo ciertas condiciones o supuestos.

4. Implicaciones y Conclusiones

4.1 Implicaciones

En el contexto del proceso de suavizado de agua del Campo Moriche, la falta de confianza en los datos de parámetros críticos como el nivel de cloruro puede tener implicaciones significativas:

  • Riesgo de formación de incrustaciones y corrosión en equipos críticos: Si los datos de calidad del agua no son confiables, podría haber una falla en el control adecuado de la dureza y otros parámetros clave. Esto puede provocar la formación de incrustaciones y corrosión en los generadores de vapor y otros equipos aguas abajo, comprometiendo su eficiencia y vida útil.

  • Dificultad para optimizar la operación de la inyección de vapor: Los datos de calidad del agua son cruciales para ajustar y optimizar los parámetros de inyección de vapor, como la temperatura y la presión. Datos inexactos pueden llevar a condiciones subóptimas que afecten negativamente la eficiencia de la recuperación de petróleo.

  • Incumplimiento de requisitos regulatorios y normas ambientales: Existen regulaciones y normas ambientales estrictas que rigen la calidad del agua utilizada en operaciones de inyección de vapor. Datos no confiables pueden resultar en incumplimientos y posibles sanciones o penalizaciones por parte de las autoridades reguladoras.

  • Pérdida de confianza de las partes interesadas: La credibilidad del proceso de suavizado de agua y de las operaciones de inyección de vapor en general puede verse comprometida si existe incertidumbre sobre la integridad de los datos. Esto puede afectar negativamente la reputación y la confianza de las partes interesadas, como clientes, inversionistas y comunidades locales.

  • Dificultad para implementar mejoras continuas: Los esfuerzos de mejora continua y optimización de los procesos se basan en el análisis preciso de los datos y la identificación de oportunidades de mejora. Datos no confiables obstaculizan estos esfuerzos y pueden llevar a la organización por caminos equivocados.

4.2 Conclusiones

La evidencia en conjunto sugiere que los datos de la serie de tiempo Cl_ts representan mediciones con baja confiabilidad del nivel de cloruro en la planta de suavizado de agua.

Tanto el probable techo artificial como el patrón inusual observado en los residuos de las descomposiciones, donde el segundo período principal exhibe un comportamiento aproximadamente opuesto al primer período, es preocupante y merece una investigación exhaustiva.

Es fundamental realizar la estrategia de validación propuesta, que incluye revisar registros, auditar procesos, entrevistar personal, analizar datos fuente, comparar con otras fuentes de datos, aplicar pruebas estadísticas adicionales y explorar modelos y simulaciones.

Solo después de una investigación rigurosa y exhaustiva se podrá determinar si ese comportamiento inusual en los residuos es real y comprender sus causas, lo cual permitirá llegar a una conclusión definitiva sobre la confiabilidad de los datos.

Tabla 1: Resumen de resultados de pruebas estadísticas
Prueba Resultado Interpretación
Dickey-Fuller Aumentada p-value = 0.01 Serie estacionaria después de primera diferencia|
KPSS p-value = 0.01 Serie estacionaria
Shapiro-Wilk (Normalidad) p-value < 2.2e-16 Se rechaza hipótesis de normalidad
Jarque-Bera (Normalidad) p-value < 2.2e-16 Se rechaza hipótesis de normalidad

5. Recomendaciones

Referencias

Glosario

Anexos

Tabla A1: Límites de agua para calderas industriales de tubos de agua
Parámetro

Presión de la Caldera

(psig)

0-300 301-450 451-600 601-750 751-900 901-1000 1001-1500 1501-2000
Agua de Caldera
pH (a 25°C) 8.3-10.0 8.3-10.0 8.3-10.0 8.3-10.0 8.3-10.0 8.3-9.6 8.3-9.6 8.3-9.6
Sílice (como SiO2) ppm ≤ 150 ≤ 90 ≤ 40 ≤ 30 ≤ 20 ≤ 8 ≤ 2 ≤ 1
Alcalinidad Total ppm < 350 < 300 < 250 < 200 < 150 < 100 NS NS
Conductividad (a 25°C) μΩ/cm 5400-1100 4600-900 3800-800 1500-300 1200-200 1000-200 ≤ 150 ≤ 80
SDT (máximo) ppm 1.0-0.2 1.0-0.2 1.0-0.2 0.5-0.1 0.5-0.1 0.5-0.1 0.1 0.1
Oxígeno Disuelto (como O2) ppm < 0.007 < 0.007 < 0.007 < 0.007 < 0.007 < 0.007 < 0.007 < 0.007
Hierro Total (como Fe) ppm ≤ 0.1 ≤ 0.05 ≤ 0.03 ≤ 0.025 ≤ 0.02 ≤ 0.02 ≤ 0.01 ≤ 0.01
Cobre Total (como Cu) ppm ≤ 0.05 ≤ 0.025 ≤ 0.02 ≤ 0.02 ≤ 0.015 ≤ 0.01 ≤ 0.001 ≤ 0.001
Dureza (como CaCO3) ppm ≤ 0.03 ≤ 0.03 ≤ 0.02 ≤ 0.02 ≤ 0.1 ≤ 0.05 ND ND
Químicos para sistema previo a caldera - - - - - MAV MAV MAV
TOC No Volátil (como O2) ppm < 1 < 1 < 0.5 < 0.5 < 0.5 < 0.2 < 0.2 < 0.2
Materia Oleosa ppm < 1 < 1 < 0.5 < 0.5 < 0.5 < 0.2 < 0.2 < 0.2

Notas:

1. Porcentaje de agua de reposición: Hasta 100% del agua de alimentación.

2. Asume la existencia de un desaireador.

3. Condiciones: Incluye sobrecalentador, dispositivos de turbina o restricciones de proceso en la pureza del vapor.

4. Objetivo de pureza de vapor saturado como se muestra.

5. NS = No especificado.

6. ND = No detectable.

7. MAV = Usar solo materiales alcalinos volátiles antes de una fuente de agua temporal.

SDT = Sólidos Disueltos Totales

TOC = Carbono Orgánico Total

MAV = Materiales Alcalinos Volátiles