Paquetes necesarios

library(metRology)
library(ggplot2)

1. Introducción

La caracterización y determinación de los valores o atributos de propiedad de un material de referencia (MR) son pasos cruciales en el proceso de producción de estos materiales. Los MR desempeñan un papel fundamental en la garantía de calidad y precisión en diversos campos, incluyendo la analítica química y la metrología.

La asignación del valor es el proceso mediante el cual los valores o atributos de propiedad obtenidos por la caracterización se combinan y expresan en la documentación del MR adjunta. Estos valores de propiedad representan propiedades físicas, químicas o biológicas específicas del MR y son esenciales para su uso confiable en la calibración de instrumentos y la validación de métodos analíticos.

En este tutorial, exploraremos en detalle el proceso de asignación del valor para la caracterización de materiales de referencia. Nos centraremos en el uso de dos o más métodos. Para este caso en partícular asumiremos que la estabilidad y la homogeneidad tienen un aporte del 1 % cada una ( incertidumbre estándar relativa).

2. Descripción de los datos.

En la producción de un material de referencia de Sodio (Na) y Calcio (Ca) en agua potable, se caracterizó un material de referencia mediante varios métodos independientes. Para esto, se emplearon las siguientes técnicas:

  • ICPMS
  • Absorción Atómica (AA)
  • Emisión Atómica (EA)
  • Cromatografía Iónica (CI)

Para cada técnica analítica se seleccionó una botella al azar, y se realizaron 10 réplicas de medición en condiciones de repetibilidad. Posteriormente, este proceso se repitió durante dos jornadas adicionales (condiciones de precisión intermedia), hasta obtener el valor por cada una de las 4 técnicas. A continuación se presentan los resultados obtenidos.

Resultados

Elemento: Na

Técnica

Concentración

(mg/kg)

Incertidumbre estándar

(mg/kg)

AA 15.81 0.19566
ICPMS 18.78 0.52772
CI 18.84 0.341

Elemento: Ca

Tabla 1. Resultados obtenidos en la caracterización de MR
Técnica

Concentración

(mg/kg)

Incertidumbre estándar

(mg/kg)

AA 23.27 0.51194
ICPMS 23.35 0.67949
CI 23.18 0.44274

Primero creamos los respectivos vectores para cada una de las técnicas y elementos.

# Valores de Sodio (Na)
AANa <- c(15.81, 0.19566)
ICPMSNa <- c(18.78, 0.52772)
CINa <- c(18.84, 0.341)

# Valores de Calcio (Ca)
AACa <- c(23.27, 0.51194)
ICPMSCa <- c(23.35, 0.67949)
CICa <- c(23.18, 0.44274)

3. Combinación de dos o más métodos: aproximación de Levenson

La certificación de un material de referencia a menudo se basa en datos de más de un método de medición (o de más de un laboratorio). Esta situación surge cuando ningún método individual puede proporcionar el nivel necesario de precisión y/o cuando no existe un solo método cuyas fuentes de incertidumbre estén bien comprendidas y cuantificadas. El objetivo de utilizar múltiples métodos es abordar los efectos sistemáticos (sesgos) de los métodos individuales a medida que se reflejan en la variación entre los resultados de los distintos métodos. La selección de múltiples métodos debe realizarse con el propósito de evitar fuentes comunes de sesgo que invalidarían el uso de la variación en la estimación de la incertidumbre de los efectos sistemáticos.

Si los sesgos son estadísticamente independientes y están centrados alrededor de cero, entonces el valor certificado y la incertidumbre expandida pueden basarse en un intervalo t [1]. Supongamos que 𝑋 y s son la media y la desviación estándar de la muestra de los resultados de n métodos. El intervalo 𝑋±𝑡𝑛−1,95𝑠/𝑛√ es un intervalo de confianza del 95 % en la media de la población de los métodos. Aquí, 𝑡𝑛−1,95 es el punto de percentil del 95 % de una distribución t con n - 1 grados de libertad.

Existen dos problemas con el uso del intervalo t. En primer lugar, se basa en la suposición de que existe una población de métodos cuyos sesgos están centrados alrededor de cero y que los métodos elegidos son una muestra aleatoria de la población. En segundo lugar, cuando el número de métodos es pequeño, el factor 𝑡𝑛−1,95 puede ser muy grande. Por ejemplo, si n = 2, entonces 𝑡𝑛−1,95 = 12.7 y si n = 3, entonces 𝑡𝑛−1,95 = 4.3. En comparación, si n es grande, el valor se acerca a 2.

En este contexto, nos enfrentamos a dos escenarios: el sesgo entre los métodos es significativo o no lo es. En el caso en que el sesgo no sea significativo, la incertidumbre \(u_{carac}\) se calcula mediante la expresión 1:

\[ u_{car} = \frac{1}{n} \sqrt{\sum_{i=1}^{n} u_{n}^{2}} \]

Donde \(n\) corresponde al número de métodos independientes.

Por otro lado, en el caso en que el sesgo sea significativo, se debe agregar un componente asociado a la diferencia entre los valores (\(u_{bias}\)):

\[ u_{car} = \frac{1}{n} \sqrt{\sum_{i=1}^{n} u_{n}^{2} + u_{bias}^{2}} \]

Donde \(u_{bias}\) viene dado por la siguiente expresión general:

\[ u_{bias} = \frac{|x_{max} - x_{min}|}{2 \sqrt{3}} \]

3 Combinación de dos métodos.

Para este ejemplo, realizaremos la combinación de sólo las técnicas de ICPMS y AA. Ene ste sentido, de acuerdo a Levenson, y considerando que los métodos idealmente deben tener un sesgo de cero, evaluamos si estos valores presentan diferencias mediante la inspeción de la gráfica de los valores con sus incertidumbres. En el caso en que el sesgo sea significativo los intervalos de las gráficas no se superpondrán.

Nota: notese que este método es más riguroso que realizar una prueba t student o un error normalizado

Inicialmente, vamos a realizar esto para sólo dos técnicas analíticas.

Por otro lado, para evaluar si el sesgo entre las técnicas de Absorción Atómica (AA) e ICPMS es significativo, se va a utilizar adicionalmente este criterio:

\[ | \ AA - ICPMS\ | < \sqrt{\text{uAA)}^2 + \text{u(ICPMS)}^2} \]

Si el valor absoluto de la diferencia es menor que esta suma cuadrada, se concluye que el sesgo no es significativo; de lo contrario, se considera significativo. Al realizar esto, se obtiene:

# Valores de las dos técnicas para Sodio

  valorAA <- AANa[1]
  valorICPMS <- ICPMSNa[1]
  valorCI <- CINa[1]
  incertidumbreAA <- AANa[2]
  incertidumbreICPMS <- ICPMSNa[2]
  incertidumbreCI <- CINa[2]


# Diferencia absoluta entre los valores de las dos técnicas
  diferenciaAbsoluta <- abs(valorAA - valorICPMS)

# Suma cuadrada de las incertidumbres
  sumaCuadradaIncertidumbres <- sqrt(incertidumbreAA^2 + incertidumbreICPMS^2)

# Comprobación de si el sesgo es significativo
  sesgoSignificativo <- diferenciaAbsoluta < sumaCuadradaIncertidumbres

# Valores de las dos técnicas para Calcio
  valorAACa <- AACa[1]
  valorICPMSCa <- ICPMSCa[1]
  valorCICa <- CICa[1]
  incertidumbreAACa <- AACa[2]
  incertidumbreICPMSCa <- ICPMSCa[2]
  incertidumbreCICa <- CICa[2]

# Diferencia absoluta entre los valores de las dos técnicas
  diferenciaAbsolutaCa <- abs(valorAACa - valorICPMSCa)

# Suma cuadrada de las incertidumbres
  sumaCuadradaIncertidumbresCa <- sqrt(incertidumbreAACa^2 + incertidumbreICPMSCa^2)

# Comprobación de si el sesgo es significativo
  sesgoSignificativoCa <- diferenciaAbsolutaCa < sumaCuadradaIncertidumbresCa

# Impresión de resultados
  if (sesgoSignificativo) {
    cat("El sesgo entre las técnicas AA e ICPMS NO es significativo para Na.\n")
  } else {
    cat("El sesgo entre las técnicas AA e ICPMS es significativo para Na.\n")
  }
## El sesgo entre las técnicas AA e ICPMS es significativo para Na.
  if (sesgoSignificativoCa) {
    cat("El sesgo entre las técnicas AA e ICPMS NO es significativo para Ca.\n")
  } else {
    cat("El sesgo entre las técnicas AA e ICPMS es significativo para Ca.\n")
  }
## El sesgo entre las técnicas AA e ICPMS NO es significativo para Ca.

Posteriormente, procedemos a estimar la incertidumbre con cada una de las ecuaciones presentadas en la sección 3.

## Incertidumbre para Calcio:  0.425379  mg/kg
## Incertidumbre para Sodio:  0.9023679  mg/kg

5. Combinación del valor para tres métodos.

Procederemos a estimar el valor con tres métodos: CI, ICPMS y AA. Para ello, primero revisamos los resultados obtenidos:

Posteriormente, estimamos la incertidumbre, considerando el sesgo significativo de Na. Para esto, se hace uso de las mismas ecuaciones que se presentan en la sección 3.

##  Incertidumbre para Calcio:  0.3196887  mg/kg
##  Incertidumbre para Sodio:  0.9017715  mg/kg

Notése en este punto que la incertidumbre de medición se reduce respecto al empleo de un sólo método.

6. Combinación del valor: casos especiales …. o ¿casos normales?

El siguiente diagrama presenta un esquema general para la selección de los métodos de combinación del valor.

Estrategia para la selección del método de combinación ( Morado indica respuesta negativa)
Estrategia para la selección del método de combinación ( Morado indica respuesta negativa)

Nota 1: considere que este es sólo una guía.

Nota 2: considere que no se está considerando si los datos siguen una distribución normal o no.

A continuación se disponen algunos códigos de ejemplo que muestran la combinación del valor de diferentes resultados empleando diferentes aproximaciones.

6.1 Combinación de Valores con DerSimonian Laird (DSL)

El proceso de combinación DSL implica el cálculo de un valor combinado y una incertidumbre combinada que refleja la contribución relativa de cada fuente de medición. La ponderación de los datos se realiza teniendo en cuenta las incertidumbres, de manera que las fuentes de medición con menor incertidumbre tienen un mayor peso en el resultado final.

Este método es particularmente útil en situaciones en las que se desea aprovechar la información de múltiples mediciones independientes para obtener una estimación más exacta y confiable del valor de una magnitud, y se ha convertido en una herramienta esencial en especial para datos de tipo heterocedastico.

El algoritmo DSL se basa en un modelo estadístico que asume una relación lineal entre las mediciones y las fuentes de variabilidad. Este modelo se expresa de la siguiente manera:

\[x_i = \mu + b_i + e_i\]

Donde: - \(x_i\) es la medición de interés. - \(\mu\) es el valor verdadero de la magnitud que estamos midiendo. - \(b_i\) representa la variabilidad entre los métodos de medición y sigue una distribución normal con una media de cero y una varianza \(\tau^2\). - \(e_i\) es la variabilidad dentro de cada método de medición y sigue una distribución normal con una media de cero y una varianza \(\sigma_i^2\).

Proceso de Estimación

El algoritmo DSL calcula directamente el parámetro \(\tau\) que representa la varianza entre los métodos. Utiliza esta estimación para ajustar las varianzas revisadas \(\sigma_i^2 + \tau^2\) en las mediciones. Luego, calcula los pesos como el inverso de estas varianzas revisadas y obtiene una media ponderada. Esto permite tomar en cuenta cualquier exceso de varianza calculado \(\tau^2\) en la combinación de los datos.

Formas de Input

El algoritmo DSL es flexible en cuanto a las formas de entrada de datos: - Puede recibir medias \(x\) y errores estándar \(s\), sin necesidad de proporcionar \(n\) ni grupos. - También acepta medias \(x\), desviaciones estándar \(s\), y tamaños de grupo \(n\), calculando los errores estándar como \(s/\sqrt{n}\). - Finalmente, puede manejar observaciones individuales \(x\) con un factor de agrupación \(groups\), calculando los errores estándar a partir de los grupos utilizando “tapply”.

A continuación se presenta el código y un ejemplo para la combinación del valor.

# Cargar el paquete "metrology" si no está cargado
  library(metRology)


# Crear un dataframe con los resultados y sus incertidumbres. Los valores del objeto x representan los valores medidos por cada técnica y el objeto s su respectiva incertidumbre
Resultados <- data.frame(x = c(973.639, 976.2193, 979.4903),
                         s = c(9.1545, 12.05086, 11.80469))

# Calcular la combinación de métodos vía DerSimonian Laird
combinacion_dsl <- with(Resultados, dsl(x, s))

# Imprimir el resultado de la combinación
cat(" Resultado de la combinación de métodos (DerSimonian Laird):", combinacion_dsl$x, "\n","Incertidumbre estándar combinada (DerSimonian Laird):", combinacion_dsl$u, "\n")
##  Resultado de la combinación de métodos (DerSimonian Laird): 975.9378 
##  Incertidumbre estándar combinada (DerSimonian Laird): 6.202384

Nota: Notése que para este ejercicio, se asume que los datos son consistentes… ¿ Será esto así?

6.2 Combinación de Valores con Paule-Mandel

El algoritmo Mandel-Paule se utiliza para encontrar la varianza entre métodos al resolver iterativamente la ecuación que relaciona la media ponderada con el factor de ponderación aplicado. Este factor de ponderación es el inverso de la suma del error estándar en x y la varianza entre grupos.

Si el procedimiento iterativo produce una estimación negativa para la varianza entre grupos, esta varianza se establece en cero.

Para el método predeterminado en R, si “u” está presente y “n” es NULL, “u” se interpreta como un vector de incertidumbres estándar o errores estándar. Si “n” no es NULL, “u” se interpreta como un vector de desviaciones estándar y los errores estándar se calculan como “u/sqrt(n)”. Si “groups” no es NULL, “x” se interpreta como un vector de observaciones individuales agrupadas por “groups”, y el algoritmo se aplica a las medias y errores estándar del grupo correspondientes.

Si “maxiter” se establece en menos de 1, no se realizan iteraciones y la media del consenso se devuelve como NA.

# Ejemplo Paule-Mandel 
x2 <- c(201.533, 216.55)
s2 <- c(0.154, 0.25)
n2 <- c(6, 2)

resultado2 <- mpaule(x2, s2 / sqrt(n2))
resultado2
## 
## Location estimate: Method=Mandel-Paule
## 
##             Value      u
## estimate 209.0406 7.5085
cat("Resultado del ejemplo 2 (Paule-Mandel): Valor Combinado =", resultado2$x, ", Incertidumbre Combinada =", resultado2$u, "\n")
## Resultado del ejemplo 2 (Paule-Mandel): Valor Combinado = 209.0406 , Incertidumbre Combinada = 7.5085