Да се покаже дека \(\boldsymbol{z}=(\boldsymbol{T'})^{-1}(\boldsymbol{y}-\boldsymbol{\mu}) \implies E(\boldsymbol{z})=\boldsymbol{0},cov(\boldsymbol{z})=\boldsymbol{I}\)
\[ E(\boldsymbol{z})=E((\boldsymbol{T'})^{-1}(\boldsymbol{y}-\boldsymbol{\mu}))=(\boldsymbol{T'})^{-1}E(\boldsymbol{y}-\boldsymbol{\mu})=(\boldsymbol{T'})^{-1}(E(\boldsymbol{y})-\boldsymbol{\mu})=(\boldsymbol{T'})^{-1}(\boldsymbol{\mu}-\boldsymbol{\mu})=\boldsymbol{0}\\ cov(\boldsymbol{z})=cov((\boldsymbol{T'})^{-1}(\boldsymbol{y}-\boldsymbol{\mu}))= (\boldsymbol{T}')^{-1}cov(\boldsymbol{y})[(\boldsymbol{T}')^{-1}]'= (\boldsymbol{T}')^{-1}\boldsymbol{T}'\boldsymbol{T}\boldsymbol{T}^{-1}=\boldsymbol{I} \]
Да се покаже дека \[\frac{1}{2}\sum_{i=1}^{n}(\boldsymbol{y}_i-\bar{\boldsymbol{y}}+\bar{\boldsymbol{y}}-\boldsymbol{\mu})'\boldsymbol{\Sigma}^{-1}(\boldsymbol{y}_i-\bar{\boldsymbol{y}}+\bar{\boldsymbol{y}}-\boldsymbol{\mu})=\frac{1}{2}\sum_{i=1}^{n}(\boldsymbol{y}_i-\bar{\boldsymbol{y}})'\boldsymbol{\Sigma}^{-1}(\boldsymbol{y}_i-\bar{\boldsymbol{y}})+\frac{n}{2}(\bar{\boldsymbol{y}}-\boldsymbol{\mu})'\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{y}}-\boldsymbol{\mu})\]
\[ \frac{1}{2}\sum_{i=1}^{n}(\boldsymbol{y}_i-\bar{\boldsymbol{y}}+\bar{\boldsymbol{y}}-\boldsymbol{\mu})'\boldsymbol{\Sigma}^{-1}(\boldsymbol{y}_i-\bar{\boldsymbol{y}}+\bar{\boldsymbol{y}}-\boldsymbol{\mu})=\\ \frac{1}{2}\sum_{i=1}^{n}(\boldsymbol{y}_i-\bar{\boldsymbol{y}})'\boldsymbol{\Sigma}^{-1}(\boldsymbol{y}_i-\bar{\boldsymbol{y}})+ \frac{1}{2}\sum_{i=1}^{n}(\boldsymbol{y}_i-\bar{\boldsymbol{y}})'\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{y}}-\boldsymbol{\mu})+ \frac{1}{2}\sum_{i=1}^{n}(\bar{\boldsymbol{y}}-\boldsymbol{\mu})'\boldsymbol{\Sigma}^{-1}(\boldsymbol{y}_i-\bar{\boldsymbol{y}})+ \frac{1}{2}\sum_{i=1}^{n}(\bar{\boldsymbol{y}}-\boldsymbol{\mu})'\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{y}}-\boldsymbol{\mu})=\\ \frac{1}{2}\sum_{i=1}^{n}(\boldsymbol{y}_i-\bar{\boldsymbol{y}})'\boldsymbol{\Sigma}^{-1}(\boldsymbol{y}_i-\bar{\boldsymbol{y}})+ \frac{1}{2}(n\bar{\boldsymbol{y}}-n\bar{\boldsymbol{y}})'\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{y}}-\boldsymbol{\mu})+ \frac{1}{2}(\bar{\boldsymbol{y}}-\boldsymbol{\mu})'\boldsymbol{\Sigma}^{-1} (n\bar{\boldsymbol{y}}-n\bar{\boldsymbol{y}})+ \frac{n}{2}(\bar{\boldsymbol{y}}-\boldsymbol{\mu})'\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{y}}-\boldsymbol{\mu})= \\ \frac{1}{2}\sum_{i=1}^{n}(\boldsymbol{y}_i-\bar{\boldsymbol{y}})'\boldsymbol{\Sigma}^{-1}(\boldsymbol{y}_i-\bar{\boldsymbol{y}})+\frac{n}{2}(\bar{\boldsymbol{y}}-\boldsymbol{\mu})'\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{y}}-\boldsymbol{\mu}) \]
Да се покаже дека \(F_n=\frac{n-p-1}{p}(\frac{1}{w}-1)\)
\[ w=1-\frac{nD_n^2}{(n-1)^2} \implies F_n=\frac{n-p-1}{p}(\frac{1}{1-\frac{nD_n^2}{(n-1)^2}}-1)=\frac{n-p-1}{p}(\frac{1}{w}-1) \]
\[ \boldsymbol{y} \sim N_3(\boldsymbol{\mu}, \boldsymbol{\Sigma}); \boldsymbol{\mu}=\begin{pmatrix}3\\1\\4\end{pmatrix}; \boldsymbol{\Sigma}=\begin{pmatrix}6 & 1 & -2\\1 & 13 & 4\\-2 & 4 & 4\end{pmatrix} \]
Да се најде \(\boldsymbol{z}=(\boldsymbol{T}')^{-1}(\boldsymbol{y}-\boldsymbol{\mu}) \sim N_3(\boldsymbol{0},\boldsymbol{I})\)
Чолески декомпозиција:
cholesky <- function(a) {
d = dim(a)[1]
t = matrix(rep(0, d * d), nrow=d, ncol=d)
t[1, 1] = sqrt(a[1, 1])
for (j in 2:d) {
t[1, j] = a[1, j] / t[1, 1]
}
for (i in 2:d) {
for (j in 2:d) {
s = 0
if (i == j) {
for (k in 1:(i-1)) {
s = s + t[k, i] ^ 2
}
t[i, i] = sqrt(a[i, i] - s)
} else if (i < j) {
for (k in 1:(i-1)) {
s = s + t[k, i] * t[k, j]
}
t[i, j] = (a[i, j] - s) / t[i, i]
}
}
}
return(t)
}
Sigma = matrix(
c(6, 1, -2,
1, 13, 4,
-2, 4, 4
),
nrow=3,
ncol=3
)
T = cholesky(Sigma)
T
[,1] [,2] [,3]
[1,] 2.44949 0.4082483 -0.8164966
[2,] 0.00000 3.5823642 1.2096295
[3,] 0.00000 0.0000000 1.3675269
Векторот \(\boldsymbol{z}\):
\[ \boldsymbol{z} = \begin{pmatrix} 2.45 & 00 & 0\\ 0.41 & 3.58 & 0\\ -0.82 & 1.21 & 1.37\end{pmatrix}^{-1}(\boldsymbol{y}-\boldsymbol{\mu}) \]
Да се најде \(\boldsymbol{z}=(\boldsymbol{\Sigma}^{\frac{1}{2}})^{-1}(\boldsymbol{y}-\boldsymbol{\mu}) \sim N_3(\boldsymbol{0},\boldsymbol{I})\)
Прво правиме спектрална декомпозиција на \(\boldsymbol{\Sigma}\). Матрицата е симетрична, затоа има 3 сопствени вредности. Карактеристичната равенка изгледа вака:
\[ |\boldsymbol{\Sigma}-\lambda\boldsymbol{I}|=\begin{vmatrix}6-\lambda & 1 & -2\\1 & 13-\lambda & 4\\-2 & 4 & 4-\lambda\end{vmatrix}=\\ (6-\lambda)\begin{vmatrix}13-\lambda & 4\\4 & 4-\lambda\end{vmatrix} -\begin{vmatrix}1 & 4\\-2 & 4-\lambda\end{vmatrix} -2\begin{vmatrix}1 & 13-\lambda\\-2 & 4\end{vmatrix}=\\ (6-\lambda)(36-17\lambda+\lambda^2)-(12-\lambda)-2(30-2\lambda)=\\ 144-133\lambda+23\lambda^2-\lambda^3 \]
Корените на равенката се:
lambdas = polyroot(z=c(144, -133, 23, -1))
print(lambdas)
[1] 1.401827+0i 7.071196-0i 14.526977+0i
За да ги најдеме сопствените вектори, потребно ни е да го решиме системот равенки:
\[ \begin{pmatrix}6-\lambda & 1 & -2\\1 & 13-\lambda & 4\\-2 & 4 & 4-\lambda\end{pmatrix} \begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}= \begin{pmatrix}0\\0\\0\end{pmatrix} \]
Во овој систем знаеме дека едната равенка е вишок. Затоа, претпоставувајќи дека \(x_3=1\), додавајќи ја последната равенка на првите две го добиваме системот:
\[ \begin{pmatrix} (6-\lambda)-2 & (1)+4\\ (1)-2 & (13-\lambda)+4 \end{pmatrix} \begin{pmatrix}x_1\\x_2\end{pmatrix}= \begin{pmatrix} -[(-2) + (4 - \lambda)]\\ -[(4)+(4-\lambda)] \end{pmatrix} \]
Овој систем го решаваме со кодот од домашната за Глава 2:
solve_equations <- function(a, b) {
a <- matrix(data=a, nrow=2, ncol=2, byrow=TRUE)
b <- matrix(data=b, nrow=2, ncol=1, byrow=FALSE)
sol <- solve(a, b)
nu <- c(sol[1], sol[2], 1)
nu_length <- sqrt(sum(nu ^ 2))
return(nu / nu_length)
}
solve_nu <- function(l) {
a <- c(
6 - l - 2, 1 + 4,
1 - 2, 13 - l + 4)
b <- c(
2 - (4 - l),
-4 - (4 - l)
)
return(solve_equations(a, b))
}
Сопствениoт вектор за \(\lambda_1\) со модул 1 e:
nu_1 = solve_nu(lambdas[1])
print(nu_1)
[1] 0.4358269+0i -0.3267970+0i 0.8386052-0i
Сопствениoт вектор за \(\lambda_2\) со модул 1 e:
nu_2 = solve_nu(lambdas[2])
print(nu_2)
[1] -0.8996077-0i -0.1296166-0i 0.4170197-0i
Сопствениoт вектор за \(\lambda_3\) со модул 1 e:
nu_3 = solve_nu(lambdas[3])
print(nu_3)
[1] 0.02758366+0i 0.93616414+0i 0.35047945-0i
Конечно ги добиваме \(C\) и \(D\) (оцде се користи %*% за множење матрици со цел да се провери дека \(CDC'\) е исто со почетната матрица):
C = matrix(
data=as.numeric(c(nu_1, nu_2, nu_3)),
nrow=3,
ncol=3,
byrow=FALSE
)
imaginary parts discarded in coercion
D = diag(x=as.numeric(lambdas), nrow=3, ncol=3)
imaginary parts discarded in coercion
C %*% D %*% t(C)
[,1] [,2] [,3]
[1,] 6 1 -2
[2,] 1 13 4
[3,] -2 4 4
Сега наоѓаме \(\boldsymbol{\Sigma}^{\frac{1}{2}}=\boldsymbol{C}\boldsymbol{D}^{\frac{1}{2}}\boldsymbol{C}'\). Истовремено и проверуваме дали е точно најдено со тоа што го креваме на квадрат и наоѓаме и инверзна матрица..
D_sr = diag(x=as.numeric(sqrt(lambdas)), nrow=3, ncol=3)
imaginary parts discarded in coercion
Sigma_sr = C %*% D_sr %*% t(C)
Sigma_sr
[,1] [,2] [,3]
[1,] 2.3798448 0.2398604 -0.5280208
[2,] 0.2398604 3.5114681 0.7823418
[3,] -0.5280208 0.7823418 1.7632740
Sigma_sr %*% Sigma_sr
[,1] [,2] [,3]
[1,] 6 1 -2
[2,] 1 13 4
[3,] -2 4 4
solve(Sigma_sr)
[,1] [,2] [,3]
[1,] 0.46496849 -0.06966936 0.1701484
[2,] -0.06966936 0.32645938 -0.1657086
[3,] 0.17014841 -0.16570861 0.6916013
Решението е:
\[ \boldsymbol{z}=(\boldsymbol{\Sigma}^{\frac{1}{2}})^{-1}(\boldsymbol{y}-\boldsymbol{\mu})=\begin{pmatrix} 0.46 & -0.07 & 0.17\\ -0.07 & 0.33 & -0.17\\ 0.17 & -0.17 & 0.69 \end{pmatrix}(\boldsymbol{y}-\boldsymbol{\mu}) \sim N_3(\boldsymbol{0},\boldsymbol{I}) \]
Дистрибуцијата на \((\boldsymbol{y}-\boldsymbol{\mu})'\boldsymbol{\Sigma}^{-1}(\boldsymbol{y}-\boldsymbol{\mu})\) е хи-квадратна со 3 степени на слобода, т.е. \((\boldsymbol{y}-\boldsymbol{\mu})'\boldsymbol{\Sigma}^{-1}(\boldsymbol{y}-\boldsymbol{\mu}) \sim \chi^2_3\).
\[ \boldsymbol{y} \sim N_4(\boldsymbol{\mu}, \boldsymbol{\Sigma}); \boldsymbol{\mu}=\begin{pmatrix}-2\\3\\-1\\5\end{pmatrix}; \boldsymbol{\Sigma}=\begin{pmatrix} 11 & −8 & 3 & 9\\ −8 & 9 & −3 & 6\\ 3 & −3 & 2 & 3\\ 9 & 6 & 3 & 9 \end{pmatrix} \]
Да се најде \(\boldsymbol{z}=(\boldsymbol{T}')^{-1}(\boldsymbol{y}-\boldsymbol{\mu}) \sim N_4(\boldsymbol{0},\boldsymbol{I})\)
Чолески декомпозиција со кодот од претходната задача:
Sigma = matrix(
c(11, -8, 3, 9,
-8, 9, -3, 6,
3, -3, 2, 3,
9, 6, 3, 9),
nrow=4,
ncol=4
)
T = cholesky(Sigma)
NaNs produced
T
[,1] [,2] [,3] [,4]
[1,] 3.316625 -2.412091 0.9045340 2.713602
[2,] 0.000000 1.783765 -0.4586825 7.033131
[3,] 0.000000 0.000000 0.9856108 3.826489
[4,] 0.000000 0.000000 0.0000000 NaN
Една од вредностите е NaN бидејќи \(\boldsymbol{\Sigma}\) не е позитивно дефинитна (веројатно има некоја грешка во задачата).
Да се најде \(\boldsymbol{z}=(\boldsymbol{\Sigma}^{\frac{1}{2}})^{-1}(\boldsymbol{y}-\boldsymbol{\mu}) \sim N_4(\boldsymbol{0},\boldsymbol{I})\)
Не може да се најде бидејќи \(\boldsymbol{\Sigma}\) не е позитивно дефинитна (веројатно има некоја грешка во задачата).
Дистрибуцијата на \((\boldsymbol{y}-\boldsymbol{\mu})'\boldsymbol{\Sigma}^{-1}(\boldsymbol{y}-\boldsymbol{\mu})\) е хи-квадратна со 4 степени на слобода, т.е. \((\boldsymbol{y}-\boldsymbol{\mu})'\boldsymbol{\Sigma}^{-1}(\boldsymbol{y}-\boldsymbol{\mu}) \sim \chi^2_4\).