Verification of Conditional Mean, Variance, and Kriging Weights

Problem Statement

We are given the joint normal distribution:

\[ \begin{pmatrix} Y_1 \\ Y_2 \end{pmatrix} = \begin{pmatrix} Y(\mathbf{s}_0) \\ \mathbf{y} \end{pmatrix} \sim N\left( \begin{pmatrix} \mu_1 \\ \mu_2 \end{pmatrix}, \begin{pmatrix} \Omega_{11} & \Omega_{12} \\ \Omega_{21} & \Omega_{22} \end{pmatrix} \right) \]

with:

\(\mu_1 = E[Y(\mathbf{s}_0)] = \mathbf{x}_0^T \boldsymbol{\beta}\)
\(\mu_2 = E[\mathbf{y}] = \mathbf{X} \boldsymbol{\beta}\)
\(\Omega_{11} = \text{Var}(Y(\mathbf{s}_0)) = \sigma^2 + \tau^2\)
\(\Omega_{12} = \text{Cov}(Y(\mathbf{s}_0), \mathbf{y}) = \boldsymbol{\gamma}^T\)
\(\Omega_{21} = \text{Cov}(\mathbf{y}, Y(\mathbf{s}_0)) = \boldsymbol{\gamma}\)
\(\Omega_{22} = \text{Var}(\mathbf{y}) = \boldsymbol{\Sigma} = \sigma^2 \mathbf{H}(\phi) + \tau^2 \mathbf{I}\)

We need to verify expressions (2.22), (2.23), and (2.24).

Step 1: Verify Expression (2.22) - Conditional Mean

For a joint normal distribution, the conditional mean is:

\[ E[Y_1 | Y_2 = \mathbf{y}] = \mu_1 + \Omega_{12} \Omega_{22}^{-1} (\mathbf{y} - \mu_2) \]

Substituting the given values:

\[ E[Y(\mathbf{s}_0) | \mathbf{y}] = \mathbf{x}_0^T \boldsymbol{\beta} + \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} (\mathbf{y} - \mathbf{X} \boldsymbol{\beta}) \]

Therefore:

\[ \boxed{E[Y(\mathbf{s}_0) | \mathbf{y}] = \mathbf{x}_0^T \boldsymbol{\beta} + \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} (\mathbf{y} - \mathbf{X} \boldsymbol{\beta})} \]

This matches (2.22) exactly. ✓

Step 2: Verify Expression (2.23) - Conditional Variance

For a joint normal distribution, the conditional variance is:

\[ \text{Var}[Y_1 | Y_2 = \mathbf{y}] = \Omega_{11} - \Omega_{12} \Omega_{22}^{-1} \Omega_{21} \]

Substituting the given values:

\[ \text{Var}[Y(\mathbf{s}_0) | \mathbf{y}] = \sigma^2 + \tau^2 - \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \boldsymbol{\gamma} \]

Therefore:

\[ \boxed{\text{Var}[Y(\mathbf{s}_0) | \mathbf{y}] = \sigma^2 + \tau^2 - \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \boldsymbol{\gamma}} \]

This matches (2.23) exactly. ✓

Step 3: Verify Expression (2.24) - Kriging Weights \(\lambda\)

We want to express the conditional mean as a linear combination of \(\mathbf{y}\):

\[ E[Y(\mathbf{s}_0) | \mathbf{y}] = \lambda^T \mathbf{y} \]

Step 3.1: Use the GLS Estimator

The Generalized Least Squares (GLS) estimator of \(\boldsymbol{\beta}\) is:

\[ \hat{\boldsymbol{\beta}}_{\text{GLS}} = \left( \mathbf{X}^T \boldsymbol{\Sigma}^{-1} \mathbf{X} \right)^{-1} \mathbf{X}^T \boldsymbol{\Sigma}^{-1} \mathbf{y} \]

Step 3.2: Rewrite the Conditional Mean

Starting from (2.22):

\[ E[Y(\mathbf{s}_0) | \mathbf{y}] = \mathbf{x}_0^T \boldsymbol{\beta} + \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} (\mathbf{y} - \mathbf{X} \boldsymbol{\beta}) \]

Replace \(\boldsymbol{\beta}\) with \(\hat{\boldsymbol{\beta}}_{\text{GLS}}\):

\[ E[Y(\mathbf{s}_0) | \mathbf{y}] = \mathbf{x}_0^T \hat{\boldsymbol{\beta}}_{\text{GLS}} + \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \left( \mathbf{y} - \mathbf{X} \hat{\boldsymbol{\beta}}_{\text{GLS}} \right) \]

Step 3.3: Expand and Group Terms

Expanding the second term:

\[ E[Y(\mathbf{s}_0) | \mathbf{y}] = \mathbf{x}_0^T \hat{\boldsymbol{\beta}}_{\text{GLS}} + \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \mathbf{y} - \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \mathbf{X} \hat{\boldsymbol{\beta}}_{\text{GLS}} \]

Grouping terms involving \(\hat{\boldsymbol{\beta}}_{\text{GLS}}\):

\[ E[Y(\mathbf{s}_0) | \mathbf{y}] = \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \mathbf{y} + \left( \mathbf{x}_0^T - \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \mathbf{X} \right) \hat{\boldsymbol{\beta}}_{\text{GLS}} \]

This gives us:

\[ \boxed{E[Y(\mathbf{s}_0) | \mathbf{y}] = \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \mathbf{y} + \left( \mathbf{x}_0^T - \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \mathbf{X} \right) \hat{\boldsymbol{\beta}}_{\text{GLS}}} \]

Note: The key step is factoring out \(\hat{\boldsymbol{\beta}}_{\text{GLS}}\) from \(\mathbf{x}_0^T \hat{\boldsymbol{\beta}}_{\text{GLS}} - \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \mathbf{X} \hat{\boldsymbol{\beta}}_{\text{GLS}}\) to get \((\mathbf{x}_0^T - \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \mathbf{X}) \hat{\boldsymbol{\beta}}_{\text{GLS}}\).

Step 3.4: Substitute \(\hat{\boldsymbol{\beta}}_{\text{GLS}}\)

Substitute the GLS estimator into the expression:

Step 3.5: Factor Out \(\mathbf{y}\)

Factor \(\mathbf{y}\) from both terms:

\[ E[Y(\mathbf{s}_0) | \mathbf{y}] = \left[ \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} + \left( \mathbf{x}_0^T - \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \mathbf{X} \right) \left( \mathbf{X}^T \boldsymbol{\Sigma}^{-1} \mathbf{X} \right)^{-1} \mathbf{X}^T \boldsymbol{\Sigma}^{-1} \right] \mathbf{y} \]

Step 3.6: Identify \(\lambda^T\)

Since \(E[Y(\mathbf{s}_0) | \mathbf{y}] = \lambda^T \mathbf{y}\), we have:

\[ \lambda^T = \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} + \left( \mathbf{x}_0^T - \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \mathbf{X} \right) \left( \mathbf{X}^T \boldsymbol{\Sigma}^{-1} \mathbf{X} \right)^{-1} \mathbf{X}^T \boldsymbol{\Sigma}^{-1} \]

Step 3.7: Take the Transpose

Taking the transpose of both sides:

\[ \lambda = \boldsymbol{\Sigma}^{-1} \boldsymbol{\gamma} + \boldsymbol{\Sigma}^{-1} \mathbf{X} \left( \mathbf{X}^T \boldsymbol{\Sigma}^{-1} \mathbf{X} \right)^{-1} \left( \mathbf{x}_0 - \mathbf{X}^T \boldsymbol{\Sigma}^{-1} \boldsymbol{\gamma} \right) \]

Therefore:

\[ \boxed{\lambda = \boldsymbol{\Sigma}^{-1} \boldsymbol{\gamma} + \boldsymbol{\Sigma}^{-1} \mathbf{X} \left( \mathbf{X}^T \boldsymbol{\Sigma}^{-1} \mathbf{X} \right)^{-1} \left( \mathbf{x}_0 - \mathbf{X}^T \boldsymbol{\Sigma}^{-1} \boldsymbol{\gamma} \right)} \]

This matches (2.24) exactly. ✓

Summary of Verification

Expression	Result	Status
(2.22)	\(E[Y(\mathbf{s}_0) \\| \mathbf{y}] = \mathbf{x}_0^T \boldsymbol{\beta} + \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} (\mathbf{y} - \mathbf{X} \boldsymbol{\beta})\)	✓ Verified
(2.23)	\(\text{Var}[Y(\mathbf{s}_0) \\| \mathbf{y}] = \sigma^2 + \tau^2 - \boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} \boldsymbol{\gamma}\)	✓ Verified
(2.24)	\(\lambda = \boldsymbol{\Sigma}^{-1} \boldsymbol{\gamma} + \boldsymbol{\Sigma}^{-1} \mathbf{X} (\mathbf{X}^T \boldsymbol{\Sigma}^{-1} \mathbf{X})^{-1} (\mathbf{x}_0 - \mathbf{X}^T \boldsymbol{\Sigma}^{-1} \boldsymbol{\gamma})\)	✓ Verified

Key Insights

Conditional Mean: The conditional mean of \(Y(\mathbf{s}_0)\) given observed data \(\mathbf{y}\) consists of:
- A trend component: \(\mathbf{x}_0^T \boldsymbol{\beta}\)
- A correction term: \(\boldsymbol{\gamma}^T \boldsymbol{\Sigma}^{-1} (\mathbf{y} - \mathbf{X} \boldsymbol{\beta})\)
Conditional Variance: The conditional variance is the unconditional variance minus the variance explained by the observed data.
Kriging Weights: The weight vector \(\lambda\) accounts for both:
- Spatial correlation: \(\boldsymbol{\Sigma}^{-1} \boldsymbol{\gamma}\)
- Trend adjustment: \(\boldsymbol{\Sigma}^{-1} \mathbf{X} (\mathbf{X}^T \boldsymbol{\Sigma}^{-1} \mathbf{X})^{-1} (\mathbf{x}_0 - \mathbf{X}^T \boldsymbol{\Sigma}^{-1} \boldsymbol{\gamma})\)

These results form the foundation of universal kriging with measurement error.